موضوعات المناهج الدراسية

يمكن الوصول إلى منهج مشروع شطرنج. ai من خلال lms.shatranj.ai

فيما يلي ملخصات موجزة لمواضيع المنهج الدراسي.

الدرس 1 - نطاق المقرر الدراسي وأولوياته

التعريف بمشروع شطرنج للذكاء الاصطناعي ومؤسسات إيراسموس+ والمنظمات الشريكة والمنصات الرقمية.
رؤية المشروع، سياق مشروع إيراسموس KA2
المؤسسات الشريكة والتركيز على التراث الثقافي
نظرة عامة على المنصات (المحرر، ونظام إدارة التعلم الآلي، وأدوات التعليمات البرمجية)
أدوار المعلم ونتائج الطلاب
نظرة عامة على هيكل المنهج الدراسي
مقدمة بايثون/جوبيتر

الدرس 2 - مقدمة في الحوسبة وإعدادات بايثون

يتعلم الطلاب مفاهيم الحوسبة الأساسية وإعداد Python/Jupyter.
وحدة المعالجة المركزية، وذاكرة الوصول العشوائي، وأساسيات الإدخال/الإخراج
البت، والبايت، والتمثيل الثنائي
تثبيت JupyterLab
تنفيذ دفتر ملاحظات بايثون الأول
المتغيرات والتعبيرات البسيطة
الوصول إلى مجلدات محرك الأقراص

الدرس 3 - أنواع بيانات بايثون

يغطي أنواع بيانات بايثون المدمجة والعمليات الأساسية.
الأعداد الصحيحة والعائمة والسلاسل والمنطقيين
تحويل النوع
القوائم والفهرسة
مفاهيم القابلية للتغيير
تمارين قطع الشطرنج كخيوط الشطرنج

الدرس 4 - الشروط، والحلقات، وتدفق التحكم

يقدم المنطق والحلقات والبرامج التفاعلية.
منطق إذا/إذا/إذا/إلا
العمليات المنطقية
حلقات التكرار/إلى حين
استراحة/متابعة
برامج الإدخال البسيط

الدرس 5 - الدوال، والنطاق، والمعلمات

يُعلِّم التعليمات البرمجية المعيارية مع الدوال.
تعريف الوظائف
المعلمات والعوائد
النطاق المحلي/العالمي
لامبداس
مشروع وظيفي صغير (حاسبة قيمة القطعة)

الدرس 6 - الملفات، والاستثناءات، والمكتبات، والاختبارات

العمل مع الملفات والرموز البرمجية القوية.
قراءة/كتابة الملفات
جرب/باستثناء
استيراد المكتبات
اختبار بسيط
التعامل مع المدخلات غير الصالحة

الدرس 7 - العمليات التشغيلية المفتوحة، الفصول، تيك تاك تو

التعرض الأول لـ OOP.
الفئات والأشياء
السمات والطرق
نمذجة الألعاب
تطبيق TicTacToe
تصحيح كود OOP

الدرس 8 - الشطرنج وتمثيل لوحة الشطرنج والشطرنج

تمثيلات اللوحة للشطرنج والشطرنج
تنسيق الأنظمة واستراتيجيات الفهرسة
هياكل البيانات الداخلية لحالة اللوحة
UTF-8 والتصيير الرمزي للقطع
التكامل مع محرري اللوحة وأدوات التصور

الدرس 9 - حركة القطع، وتحديثات حالة اللعبة، والشروط النهائية

قواعد حركة القطعة في الشطرنج والشطرنج
توليد الحركة القانونية مقابل الحركة شبه القانونية
تحديث حالة اللعبة بعد الانتقال
كشف الشيك والتحقق الذاتي غير القانوني
الكشف عن الظروف النهائية: كش ملك والمأزق

الدرس 10 - مشكلات البحث واجتياز الرسم البياني

صياغة مشكلة البحث: الحالات والإجراءات والانتقالات والأهداف
الرسوم البيانية لفضاء الدولة والأشجار
البحث في العمق أولاً (DFS)
البحث على نطاق واسع أولاً (BFS)
البحث عن التكلفة الموحدة (UCS)
تمارين تتبع الرسوم البيانية والتصور البياني
أمثلة بسيطة للشطرنج والشطرنج الشبكي

الدرس 11 - البحث الاستدلالي وأشجار الألعاب العدائية

الوظائف الاستدلالية والبحث المستنير
المقبولية والاتساق
أ* بحث
البحث العدائي وأشجار الألعاب
وظائف التقييم لحالات اللعبة
بحث الحد الأدنى
Expectiminimimax للبيئات العشوائية وغير المؤكدة
تشذيب ألفا-بيتا وتحسينات الأداء
وظائف التقييم لحالات اللعبة
أمثلة على الخصومة القائمة على الشطرنج

الدرس 12 - جولة الخيل (جولة الفارس)

يستكشف جولة الفارس مع التكرار والاستدلال.
حركة الرسم البياني للفارس
الجولات المفتوحة/المغلقة
التراجع مع DFS
استدلال وارنسدورف
الاتصال ب TSP

الدرس 13 - لغز الملكات الثماني

إرضاء القيد بالتتبع العكسي.
منطق هجوم الملكة الهجوم
البحث التكراري
تقنيات التحسين
مراجع الملكة التاريخية
تطبيقات دفتر الملاحظات

الدرس 14 - مشكلة رقعة الشطرنج والقمح

الألغاز الرياضية والنمو الأسي.
المضاعفة على رقعة الشطرنج
قوى 2
ألغاز ألغاز الرياضيات التطبيقية من نوع ألغاز جبل فوجي المتحركة المستخدمة في المقابلات
المربعات السحرية
ألغاز سموليان المنطقية
مشاكل بلاط الفارس ومشاكل البلاط الأخرى على الشبكة

الدرس 15 - منطق الحد الأدنى، ألفا-بيتا ومنطق الشاه

البحث العميق في الخصومة العميقة ومباريات الشطرنج النهائية.
حساب الحد الأدنى
تشذيب ألفا-بيتا
المعارضة والتثليث
المصادر التاريخية (العادلي، ريتي)

الدرس 16 - ماسة سولي (دراسة نهاية اللعبة التاريخية)

التحليل التاريخي لنهاية لعبة الشطرنج التاريخية، وقواعد جدول نهاية اللعبة، والبرمجة الديناميكية، والتجزئة
السيرة الذاتية للسولي
إعادة بناء نهاية اللعبة
المعارضة والتثليث
نظرية المربعات المتناظرة
حل كود البرمجة الديناميكية لمعضلة الـ 1000 عام في C/C+++
فحص الحل في play.shatranj.ai وأيضًا عبر لوحات دفاتر الملاحظات ascii

الدرس 17 - تخصيص ستوك فيش للعب شاترانج، قصة ريبكا-أزرق-أزرق-ستوك فيش

يستكشف كيف تطورت محركات الشطرنج الحديثة وكيف يمكن تكييف المحركات مفتوحة المصدر مع المتغيرات التاريخية.

بحث أجهزة ديب بلو الغاشم بالقوة الغاشمة
ريبكا وظهور المحركات التي تركز على التقييم
ستوكفيش كمحرك مفتوح يحركه المجتمع
كيفية تمثيل ستوك فيش للقطع والحركات والقواعد
تعديل حركة القطعة (فيرز، وزير)، والتقييم، والقواعد الشرعية
بناء بحث وتقييم متوافق مع شطرنج متوافق مع شطرنج

الدرس 18 - أسس التعلم المعزز: عالم الشبكة والبرمجة الديناميكية والتعقيد

يقدم التعلم المعزز (RL) من خلال حل عالم شبكي صغير عندما تكون القواعد معروفة بالضبط، ثم يوضح سبب تعطل هذا النهج “المعرفة الكاملة” للألعاب الكبيرة مثل الشطرنج.

حلقة العامل والبيئة؛ الحالات والأفعال والمكافآت والحلقات؛ عامل الخصم γ.
تقييم السياسة (“الروبوت المنجرف”) وتكرار القيمة (“صائد الكنوز”) باستخدام نسخ بيلمان الاحتياطية.
نشر القيمة المرئية واستخلاص السياسة المثلى من دالة القيمة.
لعنة البُعدية: تعقيد فضاء الحالة مقابل تعقيد شجرة اللعبة؛ دافع رقم شانون.
“الألعاب العملاقة” التاريخية (مثل شطرنج تيمورلنك، وغو) كسياق لسبب الحاجة إلى التعلم.

الدرس 19 - الرخ المتجمد: جدولة Q-Learning على FrozenLake

الانتقال من التخطيط إلى التعلّم: يبدأ الوكيل بدون خريطة ويتعلّم سياسة عن طريق التجربة والخطأ باستخدام التعلّم الكمي المجدول.

قم بصياغة FrozenLake/Frozen Rook على هيئة MDP: S، A، R، P، الحالات النهائية، γ.
قاعدة تحديث تعلم Q-التعلم الكمي والاستكشاف الجريء ε-الاستكشاف (جدول الاستكشاف → الاستغلال).
تدريب وكيل في Gymnasium FrozenLake؛ قارن بين التحولات الحتمية مقابل التحولات الزلقة.
افحص ما تم تعلمه من خلال الخرائط الحرارية لجدول Q / أسهم السياسة؛ قم بضبط α و γ و ε وعدد الحلقات.
دروس التحجيم: المكافآت المتناثرة، والائتمان المتأخر، ولماذا الخرائط الأكبر حجماً أصعب.

الدرس 20 - كش ملك رخين مقابل ملك وحيد: تعلُّم الفرق الزمني في الممارسة العملية

يطبّق التعلّم الكمي على لعبة شطرنج صغيرة في نهاية اللعبة ويجعل قاعدة برمجة RL “حقيقية” من خلال فصل دفتر التجارب عن وحدات التعلّم والتدريب.

التعلّم بالفرق الزمني (TD): تحديد خطأ TD داخل تحديث التعلّم الكمي؛ لماذا يتم تحديث TD أثناء اللعب.
لماذا يكون تعلّم مونت كارلو بطيئاً للغاية في ألعاب الشطرنج الشبيهة بألعاب الشطرنج ذات المكافأة المتأخرة.
مكدس هندسي: rl.py (تحديث Q-memory + TD)، و trainer.py (حلقة حلقة، جدول استكشاف)، دفتر ملاحظات كمختبر.
قم بترميز مواقع الشطرنج كحالة يمكن قراءتها آليًا (FEN) وقم بتدريب عامل جدولي على فضاء حالة نهاية اللعبة/اللغز المحدود.
الحدود: سبب فشل الطرق الجدولية في الشطرنج الكامل (لعنة الأبعاد) والحاجة إلى تقريب الدالة.

الدرس 21 - الشبكات الكمية العميقة: من الجداول الكمية إلى الشبكات العصبية

يقدّم تقريب الدالة لـ RL من خلال استبدال جدول Q بشبكة عصبية (DQN) وتطبيقه على عدة ألعاب لوحية صغيرة.

لماذا لا تتوسع الجداول الكمية: الكثير من الحالات؛ يتطلب التعميم نموذجًا يمكنه “تخمين” قيمًا لمواقع غير مرئية.
حلقة تدريب شبكة Q-Network العميقة (DQN): مخزن إعادة التشغيل، الشبكة المستهدفة، تحديثات الدُفعات الصغيرة، ε-التحلل.
قم بتطبيق وتجربة DQN على ألعاب مثل Connect-4 (4Connect) وFox & Hounds وOthello/Reversi.
التشخيصات: منحنيات التعلم، ومشكلات الاستقرار (المبالغة في التقدير، والتباعد) والتخفيف العملي.
مقارنة الأساليب: تقييم على غرار DQN مقابل تقييم على غرار NNUE والتقييم اليدوي (HCE) لمناقشة المفاضلات بين البنيتين.

الدرس 22 - عمليات طرح مونت كارلو و MCTS على قيركات

يبني بيئة قيركات كاملة ثم يتدرج من الطرح العشوائي إلى بحث شجرة مونت كارلو الكامل (MCTS) مع اختيار UCT.

تطبيق العمود الفقري لقواعد قيركات (لوحة 5×5، C3 فارغة) وقاعدة الحد الأقصى للالتقاط التي تفرض تسلسلات الالتقاط.
توليد الحركة التي تعدد خطوط الالتقاط، وتفرض الالتقاط الإجباري، وتصفية عمليات الالتقاط بأقصى طول.
خطوط أساس مونت كارلو: الطرح العشوائي وتقييم حركة مونت كارلو المسطحة قبل إضافة إعادة استخدام الشجرة.
خط أنابيب MCTS: الاختيار، والتوسيع، والطرح/التقييم، والترحيل العكسي؛ اختيار الحركة النهائية للحركة النهائية لمرحلة ما بعد الحركة/عدد الزيارات.
سجلات اللعبة القابلة للتكرار وأدوات التدقيق للتشغيل خطوة بخطوة وتصحيح الأخطاء.

الدرس 23 - ألفا-زيرو على عطيل/ريفيرسي

يعمل على ترقية MCTS إلى بحث على غرار AlphaZero من خلال إضافة شبكة عصبية توفر سياسة مسبقة وتقدير قيمة، ثم تتدرب من خلال اللعب الذاتي.

جسر الحدس مع عرض ‘Connect2’ AlphaZero التجريبي الصغير "Connect2"، ثم نقل الأفكار إلى Othello.
استبدال UCT بـ PUCT: الجمع بين إحصاءات الزيارات وسياسة مستفادة قبل الاستكشاف الإرشادي.
رؤوس الشبكات العصبية: السياسة (احتمالات الحركة) والقيمة (تقييم الموقع) المستخدمة بدلاً من الطرح العشوائي.
حلقة AlphaZero: اللعب الذاتي ← أهداف التدريب (π، z) ← تحديث الشبكة ← التكرار؛ التقييم عبر مباريات/مدونات البطولة.
ترميز نقل مدرك للمسار لتسلسلات الالتقاط متغيرة الطول بحيث تظل مسارات الالتقاط المختلفة متميزة.

الدرس 24 - ألفا زيرو على قيركات: PUCT، وشبكات السياسة/القيمة، واللعب الذاتي

جسر الحدس مع عرض ‘Connect2’ ألفا زيرو الصغير، ثم نقل الأفكار إلى قيركات.
استبدال UCT بـ PUCT: الجمع بين إحصاءات الزيارات وسياسة مستفادة قبل الاستكشاف الإرشادي.
رؤوس الشبكات العصبية: السياسة (احتمالات الحركة) والقيمة (تقييم الموقع) المستخدمة بدلاً من الطرح العشوائي.
حلقة AlphaZero: اللعب الذاتي ← أهداف التدريب (π، z) ← تحديث الشبكة ← التكرار؛ التقييم عبر مباريات/مدونات البطولة.
ترميز نقل مدرك للمسار لتسلسلات الالتقاط متغيرة الطول بحيث تظل مسارات الالتقاط المختلفة متميزة.

الدرس 25 - لعبة الداما التركية (الداما):

ألفا-بيتا ، MCTS الموجهة من قبل PUCT، ألفا صفر

يطبق المدققات التركية ويقارن البحث الكلاسيكي (ألفا-بيتا) مع MCTS باستخدام عداء مطابقة قابل لإعادة الاستخدام وسجلات محاكاة دفعية.

محرّك اللعبة: تمثيل اللوحة، والحركات القانونية مع التقاط القفزات المتعددة، وترميز مسار الحركة.
دالة التقييم بالإضافة إلى عامل البحث Negamax/Alpha-Beta؛ مفاضلة العمق مقابل القوة.
وكيل MCTS للمدققات التركية ومقارنات وجهاً لوجه مع ألفا-بيتا.
عداء المطابقة العالمي (play_game) وأدوات المحاكاة المجمعة للتجارب القابلة للتكرار.
سجلات قابلة للتصدير (مضغوطة) لمراجعة الفصول الدراسية وتصحيح الأخطاء.