Shatranj.ai proje müfredatı lms.shatranj.ai üzerinden erişilebilir. lms.shatranj.ai
Aşağıda müfredat konularının kısa birer özeti yer almaktadır
Modern satranç motorlarının nasıl geliştiğini ve açık kaynaklı motorların tarihsel varyantlara nasıl uyarlanabileceğini araştırıyor.
Kurallar tam olarak bilindiğinde küçük bir ızgara dünyasını çözerek takviyeli öğrenmeyi (RL) tanıtır, ardından bu “her şeyi bilen” yaklaşımın satranç gibi büyük oyunlar için neden kırıldığını gösterir.
Planlamadan öğrenmeye geçer: Temsilci haritasız başlar ve tablosal Q-öğrenme kullanarak deneme yanılma yoluyla bir politika öğrenir.
Q-öğrenmeyi küçük bir satranç oyun sonuna uygular ve deney defterini öğrenme ve eğitim modüllerinden ayırarak RL kod tabanını “gerçek” hale getirir.
Q-tablosunu bir sinir ağı (DQN) ile değiştirerek ve bunu birkaç küçük tahta oyununa uygulayarak RL için fonksiyon yaklaşımını tanıtır.
Tam bir Qirkat ortamı oluşturur ve ardından rastgele dağıtımlardan UCT seçimi ile tam Monte Carlo Ağaç Aramasına (MCTS) kadar ilerler.
Bir politika önceliği ve bir değer tahmini sağlayan bir sinir ağı ekleyerek MCTS'yi AlphaZero tarzı aramaya yükseltir, ardından kendi kendine oyun yoluyla eğitir.
Bir politika önceliği ve bir değer tahmini sağlayan bir sinir ağı ekleyerek MCTS'yi AlphaZero tarzı aramaya yükseltir, ardından kendi kendine oyun yoluyla eğitir.
Türk Denetleyicilerini uygular ve yeniden kullanılabilir bir eşleşme koşucusu ve toplu simülasyon günlükleri kullanarak klasik aramayı (alfa-beta) MCTS ile karşılaştırır.