اذهب إلى المحتوى

البحث في الموقع

المحتوى عن 'مدخل للذكاء الاصطناعي'.

  • ابحث بالكلمات المفتاحية

    أضف وسومًا وافصل بينها بفواصل ","
  • ابحث باسم الكاتب

نوع المحتوى


التصنيفات

  • الإدارة والقيادة
  • التخطيط وسير العمل
  • التمويل
  • فريق العمل
  • دراسة حالات
  • التعامل مع العملاء
  • التعهيد الخارجي
  • السلوك التنظيمي في المؤسسات
  • عالم الأعمال
  • التجارة والتجارة الإلكترونية
  • نصائح وإرشادات
  • مقالات ريادة أعمال عامة

التصنيفات

  • مقالات برمجة عامة
  • مقالات برمجة متقدمة
  • PHP
    • Laravel
    • ووردبريس
  • جافاسكربت
    • لغة TypeScript
    • Node.js
    • React
    • Vue.js
    • Angular
    • jQuery
    • Cordova
  • HTML
  • CSS
    • Sass
    • إطار عمل Bootstrap
  • SQL
  • لغة C#‎
    • ‎.NET
    • منصة Xamarin
  • لغة C++‎
  • لغة C
  • بايثون
    • Flask
    • Django
  • لغة روبي
    • إطار العمل Ruby on Rails
  • لغة Go
  • لغة جافا
  • لغة Kotlin
  • لغة Rust
  • برمجة أندرويد
  • لغة R
  • الذكاء الاصطناعي
  • صناعة الألعاب
  • سير العمل
    • Git
  • الأنظمة والأنظمة المدمجة

التصنيفات

  • تصميم تجربة المستخدم UX
  • تصميم واجهة المستخدم UI
  • الرسوميات
    • إنكسكيب
    • أدوبي إليستريتور
  • التصميم الجرافيكي
    • أدوبي فوتوشوب
    • أدوبي إن ديزاين
    • جيمب GIMP
    • كريتا Krita
  • التصميم ثلاثي الأبعاد
    • 3Ds Max
    • Blender
  • نصائح وإرشادات
  • مقالات تصميم عامة

التصنيفات

  • مقالات DevOps عامة
  • خوادم
    • الويب HTTP
    • البريد الإلكتروني
    • قواعد البيانات
    • DNS
    • Samba
  • الحوسبة السحابية
    • Docker
  • إدارة الإعدادات والنشر
    • Chef
    • Puppet
    • Ansible
  • لينكس
    • ريدهات (Red Hat)
  • خواديم ويندوز
  • FreeBSD
  • حماية
    • الجدران النارية
    • VPN
    • SSH
  • شبكات
    • سيسكو (Cisco)

التصنيفات

  • التسويق بالأداء
    • أدوات تحليل الزوار
  • تهيئة محركات البحث SEO
  • الشبكات الاجتماعية
  • التسويق بالبريد الالكتروني
  • التسويق الضمني
  • استسراع النمو
  • المبيعات
  • تجارب ونصائح
  • مبادئ علم التسويق

التصنيفات

  • مقالات عمل حر عامة
  • إدارة مالية
  • الإنتاجية
  • تجارب
  • مشاريع جانبية
  • التعامل مع العملاء
  • الحفاظ على الصحة
  • التسويق الذاتي
  • العمل الحر المهني
    • العمل بالترجمة
    • العمل كمساعد افتراضي
    • العمل بكتابة المحتوى

التصنيفات

  • الإنتاجية وسير العمل
    • مايكروسوفت أوفيس
    • ليبر أوفيس
    • جوجل درايف
    • شيربوينت
    • Evernote
    • Trello
  • تطبيقات الويب
    • ووردبريس
    • ماجنتو
    • بريستاشوب
    • أوبن كارت
    • دروبال
  • الترجمة بمساعدة الحاسوب
    • omegaT
    • memoQ
    • Trados
    • Memsource
  • برامج تخطيط موارد المؤسسات ERP
    • تطبيقات أودو odoo
  • أنظمة تشغيل الحواسيب والهواتف
    • ويندوز
    • لينكس
  • مقالات عامة

التصنيفات

  • آخر التحديثات

أسئلة وأجوبة

  • الأقسام
    • أسئلة البرمجة
    • أسئلة ريادة الأعمال
    • أسئلة العمل الحر
    • أسئلة التسويق والمبيعات
    • أسئلة التصميم
    • أسئلة DevOps
    • أسئلة البرامج والتطبيقات

التصنيفات

  • كتب ريادة الأعمال
  • كتب العمل الحر
  • كتب تسويق ومبيعات
  • كتب برمجة
  • كتب تصميم
  • كتب DevOps

ابحث في

ابحث عن


تاريخ الإنشاء

  • بداية

    نهاية


آخر تحديث

  • بداية

    نهاية


رشح النتائج حسب

تاريخ الانضمام

  • بداية

    نهاية


المجموعة


النبذة الشخصية

تم العثور على 4 نتائج

  1. هذا المقال جزء من سلسلة «مدخل إلى الذكاء الاصطناعي»: الذكاء الاصطناعي: أهم الإنجازات والاختراعات وكيف أثرت في حياتنا اليومية الذكاء الاصطناعي: مراحل البدء والتطور والأسس التي نشأ عليها المفاهيم الأساسية لتعلم الآلة تعلم الآلة: التحديات الرئيسية وكيفية التوسع في المجال يمكنك قراءة السلسلة على شكل كتاب إلكتروني بالانتقال إلى صفحة الكتاب، مدخل إلى الذكاء الاصطناعي وتعلم الآلة. بعد كلّ ما تعرفنا عليه من إنجازات الذكاء الاصطناعي وإمكانياته منقطعة النظير في جميع جوانب حياتنا اليومية، لا بدّ لسائل أن يسأل؛ كيف بدأ الأمر كله؟ كيف وصلنا إلى ما وصلنا إليه؟ كيف استطاع الذكاء الاصطناعي التفوق على مُعلمه (الإنسان) في بعض المجالات (مثل الألعاب وغيرها)؟ كيف اكتسب هذه القوة الرياضية الهائلة؟ لفهم واضح وكامل لهذا المجال لا بدّ لنا من الغوص عميقًا في جحر الذكاء الاصطناعي ونبش تاريخه وأسراره لفهمه جيدًا، ومعرفة الأسس الّتي وضعَ عليها إلى أن تكتمل الصورة في أذهاننا ولنستطيعَ بعدها التعرف على تفاصيلٍ أعمق تمكننا من الدخول في هذا المجال الشيّق. في البداية من الضرورة بمكان المرور على تاريخ مجال الرياضيات المرتبط بالذكاء الاصطناعي، والّذي جعل من الذكاء الاصطناعي قابلًا للوجود، بالإضافة إلى ذلك تأتي أهمية الرياضيات من كونها العلم الّذي سيساعدنا في بناء ذكاء البرنامج. وما طرق الاستنتاج والاستنباط المستخدمة في معظم الخوارزميات إلا خير مثال على ذلك. لذا فإن أي تقدم علمي في الرياضيات سيُساعد في تقدم الذكاء الاصطناعي بطريقة أو بأخرى، وبالطبع الرياضيات ليس العلم الوحيد الّذي شارك في تقدم الذكاء الاصطناعي بل شاركت علوم أخرى مثل الفلسفة الّتي حاولت وصف عملية التفكير البشري على أنها معالجة ميكانيكية للرموز، وغيرها من العلوم مثل علم الإحصاء والاحتمالات. سنركز على أهم النقلات النوعية الّتي ترتبط ارتباطًا مباشرًا مع الذكاء الاصطناعي وسنحاول تجنب أي تفاصيل أخرى ليس تقليلًا من شأنها ولكن في نهاية المطاف هدفنا التركيز على تاريخ الذكاء الاصطناعي وليس تاريخ الرياضيات ككلّ. القرن التاسع عشر والبدايات شهد الربع الثاني من القرن التاسع عشر بداية ظهور بذور الذكاء الاصطناعي على الرغم من أن الحواسيب لم تكُ موجودة بعد، إلا أن الذكاء الاصطناعي -كمنطق رياضي- أوجد لنفسه المكان المناسب وشقّ طريقه في الوسط العلمي فعندما قدم لنا العالم جورج بول نظريته الخاصة في المنطق الجبري والّتي سميت لاحقًا بالجبر البولياني وهي نظرية تعتمد في أساسها على تمثيل أي متغيرات في أي عملية رياضية على قيمتين فقط وهما 1 و0، وتشكل مجموعة متغيرات عبارات منطقية. ويمكن كتابة هذه العبارات وإثبات صحتها بطريقة مماثلة تمامًا للطرق المستخدمة في الجبر العادي. وكانت هذه النظرية الأساس الّذي نشأت عليها علوم الحاسب أيضًا. التحديات الجديدة للرياضيات والآفاق المستقبلية في هذه الأثناء كانت الرياضيات غير واضحة المعالم وكانت هنالك جهود كبيرة في تنظيم الطرق الرياضية ومن بين هذه الجهود كان هنالك المؤتمر الدولي للرياضيات والّذي ساعد في توحيد الجهود المبذولة وفي النسخة الثانية من هذا المؤتمر وتحديدًا في عام 1900 عرض عالم الرياضيات الألماني ديفيد هيلبرت في ذلك المؤتمر الذي أقيم في باريس 23 مسألة رياضية عصية على الحلّ (والتي تسمى أيضًا معضلات هيلبرت). وقال هيلبرت إن هذه المسائل ستُحدد شكل الرياضيات في الـ100 سنة المقبلة، لأنه اختار مسائل ذات صلات وجذور بفروع متعددة في الرياضيات، بحيث أن السعي لحلها سوف يولد نظريات ونتائج جديدة. حُلّت حتى يومنا الحالي 16 مسألة. وأدى ذلك إلى بروز فروع رياضية جديدة. ويرى المتمعن في طريقة تطور رياضيات القرن العشرين أن سببها الرئيسي هو حلّ تلك المسائل مما أدى إلى حدوث ثورة عارمة في هذا العلم طيلة القرن الـ 20 وأعطته دفعة قوية ترتب عليها إنتاج غزير في جميع الاختصاصات الرياضية. الدرس الّذي يمكن أن نتعلمه من مسائل هيلبرت أو من العقلية الكامنة بطريقة تفكيره هو أنه قد يكون من الصعب جدًا تحديد جميع الافتراضات الّتي تستخدم في أي فرع من الرياضيات. ولكن هذا الأمر لم يرق إلى عالمين من علماء الرياضيات وهما برتراند راسل وألفريد نورث وايتهيد وإنما حثهم على اعتناق هذا التحدي ومحاولة تجميع كلّ الفرضيات والمسلمات الرياضية بناءً على المنطق الجبري لجوتلوب فريجه الّذي كان حاضرًا بشدة آنذاك، وذلك في ثلاثة مجلدات تحت اسم "مبادئ الرياضيات" (Principia Mathematica) نُشرت عام 1910-1912-1913 على التتالي جاءت محاولة هاذين العالمين لتمثيل مجموعة من البديهيات وقواعد الاستنتاج في منطق الرموز، لنستطيع من خلالها -من حيث المبدأ على الأقل- إثبات جميع الحقائق الرياضية، كما حاولا من خلال هذا الكتاب تحديد الأسس الرياضية بدقة ليكون بذلك أول كتاب يناقش المبادئ الرياضية بتلك الطريقة آنذاك. أحدث هذا الكتاب جلَبة كبيرة في الوسط العلمي لذا بدأت تظهر مجموعة من الأسئلة والتحليلات. وإحدى الأسئلة الّتي طرحت عمومًا في هذا الصدد وبعيدًا عن وضع البديهيات كحقائق منطقية عن أي منظومة رياضية، مثل مبادئ الرياضيات (Principia Mathematica): ماذا لو كان بإمكاننا استنتاج تناقض من البديهيات؟ (وهذا هو السؤال الّذي حفز العلماء على إيجاد مسألة عدم الاتساق). وماذا لو كان هناك بيان رياضي لا يمكن إثباته من خلال هذه المنظومة؟ (وهذا هو السؤال الّذي حفز العلماء على إيجاد مبرهنة عدم الاكتمال). وفي عام 1931، نشر عالم رياضيات نمساوي شاب يدعى كورت غودل ورقة بحثية أحدثت صدمة ترددت أصداؤها في أنحاء مجتمع الرياضيين وأجبرتهم على إعادة النظر في علمهم. كانت هذه الورقة تحتوي على مبرهنة عدم الاكتمال. والّتي تحثُّ على التشكيك في معنى افتراض أن أمرًا ما صحيح في الرياضيات. كان التغير الناتج في فهمنا للرياضيات مثيرًا بقدر التغيير الّذي حدث في إدراكنا للهندسة، عند اكتشاف الهندسة غير الإقليدية في القرن التاسع عشر. اشتمل هذان الاكتشافان الكبيران على نظمٍ بديهية، ولا يمكن فهم كليهما على نحو صحيح دون تقدير ما يعنيه الرياضيون بكلمة «بديهي» والدور الّذي تلعبه المسلمات في الرياضيات. أحدثت نظرية عدم الاكتمال ثورة في الرياضيات وألهمت أشخاص مثل جون فون نيومان، الّذي ابتكر نظرية الألعاب، وآلان تورنغ، الّذي يعد الأب الروحي للذكاء الاصطناعي وعلوم الحاسوب. في وقت لاحق، أصبحت نظريات غودل لا تقدر بثمن فيما يتعلق بمجال علوم الحاسوب، لأن الاعتراف بأن هناك أشياء لا يمكن إثباتها يضع حدًا لما يمكن للحواسيب حله، وتجنب ضياع الوقت في محاولة عمل المستحيل. الأخطاء في نص أحد المسائل يفتح آفاقًا جديدة بالعودة لعام 1928 أعاد العالم ديفيد هيلبرت عرض المسائل مرة أخرى، وكان من بين هذه المسائل مسألة إثبات أنه هل يمكن الحصول على منهج أو مجموعة إجراءات يمكننا من خلالها الحكم على عبارة رياضية بأنها صحيحة أو خاطئة (أطروحة التقرير أو الحكم). لفتت هذه المسألة نظر الشاب آلان تورنغ وقرر أن يعتنق هذا التحدي ويبدأ بحل هذه المسألة وفي إطار حله لهذه المسألة احتاج آلان لآلة ذكية تستطيع أن تقرأ وتتعامل مع مخرجاتها. كان هذا يعني أن تتعامل الآلة مع رموز وحركات محددة تمكنها من القيام بعملها آليًا. آلة كاملة قادرة على فهم لغة مكونة من الأرقام 1 و 0 للقيام بهذه المهمة. من خلال استعانته بعمل جورج كانتور (وهو العالم الّذي حاول حلّ هذه المسألة قبل تورنغ). توصل تورنغ إلى أن الآلة الّتي يفكر فيها والمطلوبة لإنجاز مسألة هيلبرت تحتاج لخطوات لا منتهية، وبالتالي فهي عاجزة عن إنتاج أي جواب. وإن وصول الآلة لجواب يعني أنها تتحرك في حلقة مغلقة بدايتها السؤال ونهايتها الجواب، وهذا يعني عدد منتهِ من الخطوات. آلة تيورينغ متورطة في خطوات لا منتهية وبالتالي فلا أمل من وصولها إلى جواب. واستنتج لاحقًا خطأ مسألة (معضلة) هيلبرت. وعندما عَمِلَ في محطة بليتشلي بارك (وهي حديقة خصصت في الحرب العالمية الثانية لتكون المقر الرئيسي لعمليات فك الشيفرة الألمانية)، تمكن من تحقيق خمسة إنجازات مهمة في مجال تحليل الشفرات، وأثناء الحرب العالمية الثانية استطاع بناء جهاز كهروميكانيكي للمساعدة في فك شفرة الإشارات الخاصة بجهاز إنجما الألماني (Enigma Machine).سمي هذا الجهاز لاحقًا بآلة تورينغ وساعدت هذه الآلة على اختصار مدة الحرب بمدة 2-4 سنوات على الأقل. حاول آلان تورنغ بهذه الآلة إيجاد حلّ لمعضلة هيلبرت. وكان لآلة تورنغ الإثبات الحقيقي لقدرة الآلة على العمل بالمنطق الرياضي بدون تدخل البشر وفقًا لمدخلات وأوامر مسبقة. على الرغم من أن تورنغ برهن بآلته خطأ مسألة هيلبرت وذلك بإثباته عدم قدرة الرياضيات على حلّ جميع المشاكل عدا المشاكل القابلة للحلّ بحد ذاتها، إلا أنه استطاع أن يركز فقط على ما يستطيع تحقيقه باستخدام آلته الفكرية، ووصلوا بذلك لاستنتاج بأن أي مسألة تخضع للمنطق الرياضي يمكن تمثيلها بالقيمتين 0 و1. أول شبكة عصبية اصطناعية لم يكن آلان تورينغ الوحيد في المضمار (مضمار تطور الذكاء الاصطناعي) وإنما انضم لمرافقته بعض العلماء الأخرين مثل: عالم الفيزيولوجيا العصبية وارن ماكولوتش وعالم الرياضيات الشاب والتر بيتس عندما نشرا ورقة علمية في عام 1943 تتحدث عن كيفية عمل الخلايا العصبية ونمذجوا للمرة الأولى شبكة عصبية بسيطة باستخدام دوائر كهربائية ولهما تنسب الفكرة الأساسية للخلايا العصبية الإصطناعية الّتي نستخدمها في أيامنا الحالية. وفي الخمسينيات بدأ علماء الحواسيب بتطبيق هذه الفكرة في عملهم. وكان من بينهم العالم الأمريكي أرثر سامويل عندما أنشأ برنامج يُعلّم نفسه بنفسه لعبة الداما (checkers)، كما أنه أول من أبتكر مصطلح تعلّم الآلة وكان ذلك في عام 1952. تكاتف الجهود ومحاولة توحيد المصطلحات في ورقة بحثية نشرها تورنغ عام 1950 أثناء عمله بقسم الحاسوب بجامعة مانشستر، عبّر تورنج عن تساؤلاته حول قدرة أي آلة أو برنامج أو حاسوب على القيام بأفعال وتصرفات تدل على وجود ذكاء حقيقي ووعي خاص بها. ولكن كان لا بدّ في البداية الإجابة على بعض الأسئلة مثل: ما هو الوعي؟ هل يمكن لآلة اصطناعية التفكير حقًا؟ هل يتألف العقل من خلايا عصبية في الدماغ فقط؟ أم أن هناك شرارة غير ملموسة في جوهره؟ كانت هذه الأسئلة أساسية للكثير من الناس من أجل تحديد ماهيّة الوعي والذكاء ولكن ألان تورنغ قرر التغاضي عن جميع الأسئلة واستبدالها بسؤال واحدٍ أبسط بكثير من تلك الأسئلة: وهو هل يمكن للحاسوب التحدث مثل البشر؟ ولمعرفة ذلك اقترح تورنج لعبة تجمع فردين أحدهما حاسوب ذكي، والآخر محقق أو حكم، وكلّ منهم في غرفة منفصلة ويتواصلون سويًا عبر شاشة حاسوب ولوحة مفاتيح بدون معرفتهم بالشخص المقابل الّذي يحدثونه. وتهدف اللعبة لأن يميز الحكم بين الإنسان والحاسوب وعرفت لاحقًا باختبار الذكاء، طوّر هذا الاختبار لاحقًا وقُصر على حكمٍ واحدٍ وحاسوبٍ واحد، ومن خلال توجيه أسئلة مباشرة لكلّ منهما وتحليل الإجابة سيُحاول الحكم استنتاج إن كان شخصًا حقيقيًا أم مجرد حاسب. أي بعبارة أخرى، سيُعدُّ الحاسوب ذكيًا إن كان يصعب تمييز محادثته عن محادثة الإنسان. ظهرت العديد من الاختبارات الأخرى لاحقًا، ومن الجدير بالذكر أنه لم يستطع أي حاسب اجتياز اختبار تورنغ حتى عام 2014 عن طريق حاسب يُدعى يوجين جوستمان (Eugene Goostman) إذ استطاع اقناع 33% من الحكام بأنه طفل روسي عمره 13 سنة. بالعودة إلى وقت طرح اختبار تورنغ لم يكن في ذلك الوقت حديث عن إعطاء المصطلحات المناسبة للمفاهيم الموجودة. في الحقيقة إن البداية الرسمية لظهور مصطلح الذكاء الاصطناعي (Artificial Intelligence) كانت في عام 1956 وتحديدًا في كلية دارتموث في ولاية هانوفر في الولايات المتحدة الأمريكية، وذلك بفضل ورشة عقدت حرم الكلية ناقش فيها مجموعة من العلماء معظمهم من شركة IBM -نتيجة ازدهار الشركة آنذاك- البرمجيات الذكية والبرمجيات القادرة على التفكير حتى أطلقوا في نفس الورشة المصطلح الرسمي وهو الذكاء الاصطناعي لهذا المجال العلمي الصاعد. بعدها توالى الاهتمام في هذا المجال وضخت الولايات المتحدة أموالًا طائلة لدعم المشاريع المتعلقة بهذا المجال، وبدى هناك تفائل كبير جدًا في هذا العلم الجديد، إذ في عام 1959 اطلق برنارد ويدرو ومارسيان هوف من جامعة ستانفورد نموذجًا لشبكة عصبية قادرة على إزالة صدى الصوت من المكالمات عبر خطوط الهاتف التقليدية لتكون بذلك أول شبكة عصبية تحلّ مشكلة في عالمنا الحقيقي، وأطلقوا عليها اسم مادلين (MADALINE) ولا تزال هذه الشبكة مستخدمة حتى يومنا الحالي. التطور السريع لأشباه الموصلات في هذه الأثناء كان العمل متواصلًا على تطوير تقنية أشباه الموصلات، وتحسين إمكانياتها التطبيقية مما جذب العديد من وسائل الإعلام على تغطية أخبار هذا المجال، ومن بين وسائل الإعلام كانت «مجلة إلكترونيكس» تجهز عددها 35 وعندما طلبت المجلة من الدكتور غوردون مور كتابة مقال مفصل يتناول فيه الحديث عن توقعاته حول ما سيحدث في صناعة مكونات أشباه الموصلات في الأعوام الـ10 القادمة. أحدثت هذه المقالة نقلة نوعية في طريقة تعامل العاملين في هذا القطاع مع آلية تطوير أشباه الموصلات مع العلم بأن هدف الدكتور غوردون من المقال لم يكن بناء الأساسات العلمية والمثبتة لطريقة تطوير هذه التقنية، وإنما فقط لقياس واستنباط طريقة تطورها في الماضي، وجعلها أوضح للعيان، ولكن اتخذت الأمور منعطفًا حادًا آخر بعد هذا المقال وأصبحت المقالة خارطة الطريق المستقبلية لهذا المجال. بدء حدوث شتاء الذكاء الاصطناعي ومن جانب آخر لم يكن على الصعيد الإعلامي العالمي سمعة قوية لمجال الذكاء الاصطناعي، إذ كان هذا المجال جديدًا وغير واضح المعالم إلى حد ما، ولكن تغيرت الأمور كثيرًا بعد أن زار المخرج السينمائي ستانلي كوبريك العالم مارفن مينسكي في مختبر الذكاء الاصطناعي التابع لمعهد ماساتشوستس للتكنولوجيا (MIT) وذلك للسؤال عما إذا كان الحاسب الذكي الّذي كان يتخيله سيكون موجودًا فعلًا بحلول عام 2001. أكد له مينسكي بتفاؤل أنه سيكون موجودًا. أدى ذلك ذلك لولادة فيلم جديد أطلق عليه اسم A Space Odyssey ناقش هذا الفيلم الذكاء ااصطناعي بطريقة مختلفة ممّا جعل من مجال الذكاء الاصطناعي موضوعًا عالميًا وحديث الساعة. في ذلك الوقت لم تكثر الأقاويل والمبالغات والشائعات من وسائل الإعلام فقط، وإنما تعدى ذلك إلى العلماء ليبالغوا في تفاؤلهم ونظرتهم المستقبلية. حتى أن أحد العلماء وهو هيربرت سايمون صرّح علانية بعام 1965 متحدثًا عن مستقبل الذكاء الاصطناعي فقال: لم يقتصر الأمر عليه فقط وإنما انضم إليه العالم مارفن مينسكي الّذي أدلى عام 1967 بالتصريح التالي: أضف إلى ذلك أنه في ذلك الوقت كانت الولايات المتحدة في خضم الحرب الباردة، وكانت سياسة أعضاء الكونجرس أن يستثمروا مبالغ كبيرة في الذكاء الاصطناعي بصفته جزءًا من إستراتيجية أمنية شاملة، وتركزت الاستثمارات في تلك الفترة على الترجمة، خصوصًا الترجمة بين اللغتين الروسية والإنجليزية، وكان ذلك في السنوات ما بين 1954 و1966، واعتقد الكثير من العلماء البارزين بحتمية تحقيق إنجازات هامة، كما فاض مجال الذكاء الاصطناعي بالتبرعات من المموِّلين الأثرياء غير أن الإنجازات لم تتحقق بسرعة كما كان يعتقدون. وفي عام 1966 نشر سبعة علماء من اللجنة الاستشارية حول المعالجة الآلية للغة تقريرًا بطلب من الحكومة، وخلُص هذا التقرير إلى أن الترجمة الآلية كانت أبطأ وأكثر تكلفة وأقل دقة من الترجمة البشرية، وبعدها فرض الكونجرس على وكالة المشاريع والأبحاث الدفاعية المتقدمة (داربا) أن تقتصر في تمويلها على المشاريع ذات التأثير المباشر على المجهود العسكري؛ مما أدى إلى انتهاء العمل على الكثير من المشاريع العلمية الاستكشافية والأساسية، بما في ذلك أبحاث الذكاء الاصطناعي، والّتي كانت داربا تمولها بسخاء. تنوعت العوائق الّتي تراكمت في طريق تطور الذكاء الاصطناعي ومع الأخذ بعين الاعتبار بأن الحواسيب كانت في ذلك الوقت غالية جدًا وبطيئة وغير قادرة على تحقيق ما يصبوا إليه أولئك العلماء. اتضح لاحقًا أن العلماء فشلوا في إدراك مدى صعوبة بعض المشاكل الّتي واجهتهم. وفي عام 1974، وردًا على انتقادات جيمس لايتهيل على تمويل أبحاث الذكاء الاصطناعي والضغط المستمر من الكونغرس لتمويل مشاريع أكثر إنتاجية، قطعت الحكومتين الأمريكية والبريطانية تمويلهما لمعظم الأبحاث الاستكشافية المتعلقة بمجال الذكاء الاصطناعي، وكانت تلك أول انتكاسة كبيرة تشهدها أبحاث الذكاء الاصطناعي. الشتاء الأول للذكاء الاصطناعي 1974-1980 شكّل هذا الزخم الإعلامي الهائل في ظل الإنجازات المتواضعة الّتي حققها العلماء في تقدم الذكاء الاصطناعي إلى إحباط كبير للمجتمع الداعم لهذا المجال، وأدى ذلك لانخفاض تمويل مشاريع الذكاء الاصطناعي ليدخل مجال الذكاء الاصطناعي في مرحلة رقود كبيرة امتدت بين العام 1974-1980 وكان ذلك أول شتاء يواجهه الذكاء الاصطناعي منذ بدايته. ومن بين المشاكل الّتي واجهها آنذاك هي: ضعف سرعة المعالجة الحاسوبية: نتيجة التقنيات القديمة المستخدمة في تركيب المعالجات. ذاكرة التخزين المحدودة: والّتي كانت عنصرًا أساسيًا في تخزين المعلومات الّتي ستتدربُ عليها خوارزميات الذكاء الاصطناعي. عدم وجود كمية بيانات كافية: نتيجة عدم وجود ذاكرة تخزين كافية. الخوارزميات الرياضية: كان هناك صعوبات عديدة في إيجاد حلول مناسبة للعمليات الرياضية الّتي تقود إلى إيجاد الحل الأمثل في خوارزمية معينة، وتم إيجاد العديد من هذه الحلول لاحقًا ومن بينها Stochastic Gradient Descent. أدت هذه المشاكل الرئيسية والكثير من المشاكل الأخرى إلى إعادة هيكلة مجالات متعددة متعلقة بمجال علم الحاسب والعمل على تطوير جوانب كثيرة مهمة رسمت لنا تاريخ تطور الحواسيب والذكاء الاصطناعي في آن واحد. فترة الإزدهار بعد الشتاء الأول الّذي مرّ به مجالة الذكاء الاصطناعي، وفقدِ الاهتمام من جميع الباحثين في هذا المجال تحولت الانظار إلى الأنظمة الخبيرة عندما أعادت الأمل في هذا المجال وكان بعض تطبيقاتها مثل أنظمة Xcon، والّتي حظت بشعبية كبيرة باعتبارها أنظمة متخصصة تحاكي عملية إتخاذ القرار مثل الخبراء المختصين، وقادرة على حلّ مشاكل محددة دقيقة مثل تشخيص الأمراض المعدية، أو تحديد المركبات الكيميائية، وذلك لأن المنطق الّتي تعتمد عليه هذه الأنظمة آنذاك هو الحلقات الشرطية "if-else" والّتي تخالف الفكرة الأساسية للذكاء الاصطناعي، ألا وهي القدرة على اتخاذ قرار من تلقاء نفسها أي بدون برمجة هذا القرار. ومع ذلك قفزت استثمارات المرتبطة بالذكاء الاصطناعي من بضعة ملايين من الدولارات في عام 1980 إلى مليارات الدولارات في عام 1987، ظهرت في تلك الفترة قفزة معتبرة عندما أعلن تيري سيجنوسكي وتشارلز روزنبرغ من جامعة هوبكنز عن تطويرهما لشبكة عصبية اصطناعية قادرة على تعليم نفسها نطق الكلمات الجديدة والّتي أسموها شبكة NetTalk، تتألف هذه الشبكة من ثلاثة طبقات، واستطاعت تعلّم كيفية نطق 20000 كلمة بطريقة صحيحة في أسبوع واحد. ومع استمرار تدريبها أصبحت طريقتها في نطق الكلمات أكثر وضوحًا، وكان ذلك انجازًا متميزًا في ذلك الوقت. ولكن الأجهزة المختصة بالذكاء الاصطناعي آنذاك لم تكن عملية إذ كانت مكلفة جدًا ومعقدة ومع ظهور الحواسيب المكتبية من تطوير شركة IBM وشركة آبل Apple، والّتي تفوقت بمراحل على جهاز ليسب (Lisp) الخصص للذكاء الاصطناعي والّذي صممه ريتشارد جرينبلات أحد أعضاء الفريق البحثي في الذكاء الاصطناعي الخاص بمعهد (MIT)، ونظرًا لتراكم المشاكل الخاصة بأجهزة الذكاء الاصطناعي بدءًا من تكلفتها العالية، وانتهاءً بصعوبة تحديثها، ولأن المستهلكين لم يعودوا بحاجة إلى شراء آلالات باهظة الثمن متخصصة فقط في تشغيل أجهزة الذكاء الاصطناعي أدى ذلك إلى انهيار في سوق هذه الأجهزة عام 1987 وبذلك انهار خط تصنيع كامل لتبدأ بذلك مرة أخرى فترة ركود ثانية يواجهها هذا المجال. دورة الذكاء الاصطناعي احترف برمجة الذكاء الاصطناعي AI وتحليل البيانات وتعلم كافة المعلومات التي تحتاجها لبناء نماذج ذكاء اصطناعي متخصصة. اشترك الآن الشتاء الثاني للذكاء الاصطناعي 1987-1993 امتدت الفترة الثانية من شتاء الذكاء الاصطناعي بين عامي 1987-1993 كما أن معظم الناس فقدت اهتمامها بهذا المجال، وكان ذلك جليًا من خلال انخفاض عدد الحاضرين في مؤتمر AAAI الخاص بالذكاء الاصطناعي إلى 2000 زائر في عام 1991 بينما بلغت نسبة الحضور للمؤتمر في عام 1986 حوالي 6000 زائر، وبالمثل يمكن ملاحظة الزيادة في المقالات المتعلقة بالذكاء الاصطناعي منذ عام 1987 والوصول إلى أدنى نقطة لها في عام 1995 في صحيفة نيويورك تايمز. وبالنظر إلى المخطط السابق الّذي يستعرض عدد تكرار الكلمات الدلالية الخاصة بالذكاء الاصطناعي والمتواجدة في 16625 ورقة بحثية علمية متعلقة بخوارزميات وتقنيات الذكاء الاصطناعي الموجودة آنذاك، نلاحظ أنه ظهرت العديد من الأوراق البحثية والخوارزميات الواعدة في تلك الفترة إلا أن الاهتمام الحقيقي ما زال منخفضًا بالموازنة مع السنوات الماضية وبهذا استمرت فترة الركود العلمي في مجال الذكاء الاصطناعي. عودة الذكاء الاصطناعي إلى الساحة في عام 1997 ولأول مرة في تاريخ البشرية تمكن جهاز حاسوب من التغلب على أقوى لاعب شطرنج في العالم وهو غاري كاسباروف في مباراته المشهورة مع حاسوب ديب بلو (Deep Blue)، كان هذا الحدث ما أشعل فتيل الاهتمام مرة أخرى ليتصدر الذكاء الاصطناعي في ذلك الوقت جميع عناوين الصحف والمجالات وليكون الحدث الأبرز في نشرات الأخبار. وبعد هذا الحدث ظهر في نفس العام قفزة جديدة أخرى تحسب للذكاء الاصطناعي، وهي ظهور أول نظام للتعرف على الكلام (Speech Recognition) وسمّي Dragon NaturallySpeaking ويستطيع هذا النظام أداء ثلاث مهام رئيسية وهي: التعرف على الكلام. تحويل النص إلى كلام (Text-To-Speech). التعرف على الأوامر المنطوقة. طورت هذا النظام شركة (Dragon Systems) والّذي أصبح لاحقًا جزءًا من نظام الويندوز Windows 95. كان هذا النظام حجر الأساس ومن الخطوات الكبيرة في مجال تفسير اللغة المنطوقة. وفي عام 1999 استطاع مجموعة من العلماء في جامعة شيكاغو في تطوير آلية للتشخيص بمساعدة الحاسب (Computer-Aided Diagnosis) والّتي تعرف اختصارًا (CAD)، استعرضت هذه الآلية 22000 صورة شعاعية لسرطان الثدي، واستطاعت الكشف عن السرطان بدقة بلغت نسبتها 52٪، وعبر الدكتور كيونو دوي أستاذ الأشعة في جامعة شيكاغو أنه يمكن اعتبار هذه الآلية كرأي ثانٍ لفحص الصور الشعاعية للثدي، وبهذا يمكننا التغلب على الأخطاء البشرية الناتجة عن قلة خبرة الأطباء، أو عندما يكونوا مرهقين جدًا وتستطيع مساعدتهم من خلال إظهار نتائج بيانية للصور. وآنذاك، بدأت العناصر الأساسية لتطوّر الذكاء الاصطناعي بالاكتمال وهي: التأثير النفسي لقانون مور تتمتَّع قلة قليلة من ظواهر الكون الرقمي بتأثيرٍ عميق على تكنولوجيا المعلومات والاتصالات مثلما يعادل تأثيرَ قانونِ مور. ويمكن صياغة هذا القانون بإيجازٍ: "يتضاعف عددُ الترانزستور على الدوائر المدمجة كلَّ عامين تقريبًا". يتناول د. ييل بات -عالِم حاسوب بجامعة تكساس في أوستن- قانونَ مور في محاضراته بطرحه السؤال التالي على الحضور: ما هو موضوع قانون مور؟ (أ) الفيزياء؟ (ب) تكنولوجيا معالجة الحاسوب؟ (جـ) المعمارية الدقيقة للحاسوب؟ (د) علم النفس؟ الإجابة الصحيحة بحسب د. بات هي (د) علم النفس. يستند رأي الدكتور بات على أن قانون مور أصبح نبوءة تتحقَّق من تلقاء نفسها (أيِ اعتقادًا يعتقده الكثيرون وينتظرون تحقُّقَه وينسبون إليه ما يحدث). فمصمِّمو الدوائر المدمجة (ومديروهم) بشركات إنتل وهيتاشي وإيه إم دي وغيرها من مصنِّعي الشرائح تأقلموا نفسيًّا مع توقُّع أنه سيوجد جيلٌ جديد من الشرائح كلّ ١٨–٢٤ شهرًا، يتمتع بضِعْف سعة الإصدارات السابقة. وإنْ لم تطرح شركةُ إنتل رقاقاتٍ جديدةً بسعة محسَّنة؛ فإن مسئوليها التنفيذيين يُدرِكون أن شركة إيه إم دي أو غيرها من المنافسين سيطرحون رقاقاتٍ جديدةً. المعالجات السريعة وظهور المعالجات المتخصّصة انعكس تطور في صناعة أشباه الموصلات على طريقة تصنيع المعالجات فأصبح لدينا معالجات سريعة جدًا، وكلّ سنة تتضاعف هذه السرعة بفضل قانون مور، بالإضافة إلى ذلك أدى ظهور وحدات معالجة الرسوميات (GPU) إلى تعظيم عمل البرامج على المعالجة المتوازية مما أعطى سرعة أكبر على تنفيذ خوارزميات الذكاء الاصطناعي، وكان التنافس بين شركتي نيفيديا (Nvidia) وشركة ATi المختصين في بناء بطاقات المعالجة الرسومية محتدًا جدًا في هذه الفترة، بل وازدادت كثيرًا في مطلع القرن الواحد والعشرين، وكان جهد كِلا الشركتين منصبًا على زيادة مميزات البطاقات الرسومية خاصتها من خلال زيادة قدرتها على المعالجة المتوازية، وإضافة مختلف المزايا الأخرى، وكان لهذه المنافسة فضل كبير على تسريع عجلة تطور الذكاء الاصطناعي. وشهد عام 2007 ظهور أول بطاقة معالجة رسوميات مخصصة للأغراض العامة والّتي استخدمت من أجل عمل أبحاث على البيانات الضخمة وفي مجال الذكاء الاصطناعي وتعلّم الآلة والتنقيب في البيانات، بالإضافة إلى ذلك تستخدم هذه البطاقات في يومنا الحالي في تعدين البتكوين. هل سبق وأن سمعت عن مزارع البتكوين؟. تطور طرق التخزين وظهور حلول التخزين السحابي لم يكن التطور الحاصل على مستوى رفع قوة المعالجة فقط، وإنما رافقه أيضًا تطورًا في طرق التخزين الموجودة ففي عام 1990 ظهر نوع جديد من الأقراص الصلبة بسعة تصل إلى 1.5 غيغابايت، ولم يكن هذا القرص الأول الّذي خرج إلى الساحة بل إن الأقراص الصلبة ظهرت منذ عام 1953، وطورت شركة ناسا في عام 1993 مكتبة تخزين كبيرة معتمدة على الأشرطة فقط تبلغ سعتها الإجمالية 1.2 تيرابايت، واستمر تطوّر السعات التخزينة بوَتيرة منخفضة إلى أن شهدنا انتشار شبكة الوِب الأمر الّذي دفع عجلة التطور للتقدم بسرعة كبيرة وبدأت تظهر آنذاك الحلول المتقدمة مثل الحلّ الّذي طرحته شركة أمازون للتخزين السحابي EC2، وخدمة التخزين البسيطة لأمازون (Amazon Simple Storage Service) وتدعى S3، وبذلك لم تعد سعة التخزين تشكل مشكلة كبيرة. انتشار شبكة الوِب عالميًا والبيانات الضخمة تزامنت بدايات القرن الواحد والعشرين مع انتشار شبكة الوِب (World Wide Web) انتشارًا عالميًا كبيرًا مما نتج عنه ظهور شركات ساعدت على تطويعه وتنظيمه (مثل: شركة أمازون وشركة غوغل) والّتي فتحت أفاقًا جديدة في طريقة تعامل الناس مع هذه الشبكة فأصبحت المعلومة بعيدة عنك بمقدار ضغطة زر واحدة كما احدثت تجارة جديدة سميت بالتجارة الإلكترونية. من الجدير بالذكر أنه عادة ما تختلط المفاهيم بالنسبة لعامة الناس بين مصطلحي الإنترنت والوِب لذا من الواجب علينا توضيح الفرق بينهم إذ أن الوب ما هو إلا طريقة للوصول وتبادل المعلومات عبر استخدام الإنترنت ومحركات البحث. و"الوِب" هو في الواقع تطبيق من تطبيقات الإنترنت مثل تطبيقات الدردشة الآنية والبريد الإلكتروني تمامًا. أي أنه مجرد خدمة من خدمات الإنترنت. ساعد هذا الانتشار الكبير على توليد بيانات كبيرة إذ قدرت كمية البيانات الّتي أُنشأت عام 2002 حوالي 5 إكسابايت (إكسابايت) وتقدر كمية البيانات المنشأة في وقتنا الحالي ب 33 زيتابايت (زيتابايت)، ويتوقع أن تنمو كمية البيانات المنشأة في عام 2025 إلى 175 زيتابايت. عودة اهتمام الباحثين في مجال الذكاء الاصطناعي والمجتمع ككُلّ من خلال المخطط الّذي استعرضنا فيه عدد تكرارات الكلمات الدلالية الخاصة بالذكاء الاصطناعي نلاحظ أن الزيادة الملحوظة في الاهتمام عادت من عام 2000 وليشهد المجال البحثي في هذا المجال أوج الاهتمام في عام 2005 الأمر الّذي ترافق مع تطور كبير في الخوارزميات فنلاحظ ظهور الخوارزمية التطورية وتطبيقاتها الكثيرة في مجالات عديدة والشبكات العصبية الاصطناعية وشبكات بايز وخوارزمية الدعم الآلي للمتجه. هل تذكر المشاكل الّتي عانى منها تطور الذكاء الاصطناعي؟ باختصار كانت أبرز المشاكل الأساسية هي: ضعف سرعة المعالجة الحاسوبية. ذاكرة التخزين المحدودة. عدم وجود كمية بيانات كافية. الخوارزميات الرياضية. لاحظ أن جميع المشاكل حُلّت بالفعل مع ذلك ظهرت العديد من المشاكل الأخرى، ولكن بالطبع ليست بضراوة المشاكل الأولى، ليشهد بذلك مجال الذكاء الاصطناعي صفحة جديدة في تاريخه وليعود بذلك إلى دائرة الضوء مرة أخرى، ولكن هذه المرة ستستمر طويلًا. ظهرت بعدها العديد من التطبيقات العملية مدعومة من تقنيات الذكاء الاصطناعي وتعلّم الآلة في المجالات الصناعية وتوالت الإنجازات والتطبيقات العملية تباعًا والتي ذكرنا بعضها في المقال السابق ومن بين أبرز الأحداث الّتي أحدثت ضجة آنذاك هو إعلان شركة نتفليكس (Netflix) في عام 2006 عن جائزة تبلغ قيمتها مليون دولار لكل من يستطيع أن يأتي بخوارزمية توصية لأقتراح الأفلام المناسبة على المشتركين بشرط أن تكون أفضل وأسرع من الخوارزمية الّتي لديهم. لم يكن إيجاد خوارزمية بهذه المواصفات مهمة سهلة أبدًا ولكن فريق صغير من علماء الحاسب في شركة AT&T اعتنق التحدي وعكف على إيجاد الخوارزمية المناسبة وتكللت محاولتهم بالنجاح ولكن تطلب الأمر منهم ثلاث سنوات كاملة! وبعدها انضمت جميع الشركات العملاقة مثل غوغل وفيسبوك إلى هذا المجال رسميًا الأمر الّذي شجع جميع الشركات الصغيرة الكبيرة الأخرى إلى التفكير جديًا في الأنضمام أيضًا ليصبح بذلك مجال الذكاء الاصطناعي مجالًا مزدهرًا وأساسيًا في أغلب شركات وادي السيليكون (Silicon Valley). الخلاصة بالطبع هنالك العديد من الأحداث الأخرى الّتي شاركت في تأسيس هذا المجال ولكننا حاولنا تسليط الضوء على أبرز المحطات الّتي شهدها مجال الذكاء الاصطناعي ومشتقاته مثل تعلم الآلة على مرّ السنوات، والآن بعد فهمنا إمكانياته وتطبيقاته وتاريخه الكامل نستطيع الآن الدخول فيه بخطوات واثقة وثابتة لمعرفته عن قرب وسبر أغواره بالمقالات الموالية. المراجع Analyzing the Prospect of an Approaching AI Winter A history of machine learning Timeline of Computer History كتاب الكون الرقمي: الثورة العالمية في الاتصالات - الفصل الثاني نظرة تأمُّلية لقانون مور اقرأ أيضًا تعلم الذكاء الاصطناعي المقال التالي: المفاهيم الأساسية لتعلم الآلة المقال السابق: الذكاء الاصطناعي: أهم الإنجازات والاختراعات وكيف أثرت في حياتنا اليومية إعداد شبكة عصبية صنعية وتدريبها للتعرف على الوجوه النسخة الكاملة لكتاب مدخل إلى الذكاء الاصطناعي وتعلم الآلة
  2. هذا المقال جزء من سلسلة «مدخل إلى الذكاء الاصطناعي»: الذكاء الاصطناعي: أهم الإنجازات والاختراعات وكيف أثرت في حياتنا اليومية الذكاء الاصطناعي: مراحل البدء والتطور والأسس التي نشأ عليها المفاهيم الأساسية لتعلم الآلة تعلم الآلة: التحديات الرئيسية وكيفية التوسع في المجال يمكنك قراءة السلسلة على شكل كتاب إلكتروني بالانتقال إلى صفحة الكتاب، مدخل إلى الذكاء الاصطناعي وتعلم الآلة. إن سبق وحاولت قراءة أي مقالٍ على الإنترنت يتحدث عن تعلّم الآلة، فلا بدّ من أنك عثرت على نوعين من المقالات؛ فإما أن تكون سميكة وأكاديمية ومليئة بالنظريات (عن نفسي لم أستطع حتى تجاوز نصف مقال)، أو عن القصص الخيالية المريبة حول سيطرة الذكاء الصنعي على البشر، أو منهم من يتحدث عن البيانات وتأثيرها الساحر على مجالات العلوم الأخرى أو البعض الآخر من المقالات يتحدث عن كيفية تغيّر وظائف المستقبل. لم يكن هنالك أي كتاب يضعني على بداية الطريق لكي أتعلم أبسط الأساسيات لأنتقل بعدها إلى المفاهيم المعقدة واثق الخطى. لذا كان لا بدّ لي من كتابة مقالٍ بسيط ومفهوم وواقعي لطالما تمنيت وجوده. سيكون هذا المقال مقدمة بسيطة لأولئك الّذين أرادوا دومًا فهم طريقة عمل مجال تعلّم الآلة. بتطبيق أفكاره على أمثلة من مشاكل العالم الحقيقي، والحلول العملية المطبقة، بلغة بسيطة ومفهومة، وتجنب النظريات الصعبة قدر الإمكان. ليستطيع الجميع فهم ماهيّة هذا العِلم سواءً أكانوا مبرمجين أو مدراء بل وحتى لأي شخص كان. فهرس المحتويات لماذا نريد من الآلات أن تتعلم؟ المكونات الرئيسية لتعلم الآلة 1. البيانات (Data) 2. الميّزات (Features) 3. الخوارزميات (Algorithms) الفرق بين التعلم (Learning) والذكاء (Intelligence) تعلم الآلة التقليدي التعلم الموجه (Supervised Learning) التصنيف (Classification) أشجار القرار (Decision Trees) الانحدار (Regression) التعلم غير الموجه (Unsupervised learning) التجميع (Clustering) خوارزمية K-mean خوارزمية DBSCAN تقليل الأبعاد (Dimensionality Reduction) تعلم قواعد الربط (Association Rule Learning) التعلم المعزز (Reinforcement Learning) طريقة المجموعات 1. طريقة التكديس (Stacking) 2. طريقة التعبئة (Bagging) 3. طريقة التعزيز (Boosting) الشبكات العصبية (Neural Networks) والتعلم العميق (Deep Leaning) الشبكات العصبية (Neural Networks) الشبكات العصبية التلافيفية (Convolutional Neural Networks) الشبكات العصبية المتكررة (Recurrent Neural Networks) التعلم العميق (Deep Learning) الفرق بين الشبكات العصبية والتعلم العميق الخلاصة المراجع وإليك المخطط الرئيسي للمواضيع التي سنتناولها في هذه المقالة ملخصة بالصورة التالية: لماذا نريد من الآلات أن تتعلم؟ هذا صديقنا أحمد يريد شراء سيارة ويحاول حساب مقدار مبلغ المال الّذي سيحتاجُ لتوفيره شهريًا. واستعرض عشرات الإعلانات على الإنترنت وعلم بأن السيارات الجديدة يبلغ سعرها حوالي 20000 دولار، والسيارات المستعملة لعام واحد يبلغ سعرها 19000 دولار، والمستعملة لعامين يبلغ سعرها 18000 دولار وهكذا دواليك. يبدأ أحمد -محللنا الرائع- بملاحظة نمط معين لسعر السيارات؛ إذ يعتمد سعر السيارة على مدة استخدامها، وينخفض سعرها بمقدار 1000 دولار مقابل كلّ عام من عمرها، لكن سعرها لن ينخفض أقل من 10000 دولار. في هذه الحالة وطبقًا لمصطلحات تعلّم الآلة يكون أحمد قد ابتكر ما يُعرفُ بالانحدار (Regression): وهي طريقة لتوقع قيمة (أو سعر) معيّن على أساس بيانات قديمة معروفة. أغلب الناس تؤدي هذا الأمر طوال الوقت دون أن تشعر به، فمثلًا عند محاولتنا لتقدير السعر المعقول لجهاز أيفون مستعمل على موقع eBay، أو أثناء محاولتنا معرفة وزن اللحوم المناسب والكافي لبلوغ حدّ الشبع لكلّ شخص من المدعوين على عزومة الغداء. فعندها سنبدأ بتقدير الأمر ونسأل أنفسنا، هل 200 غرام كافي للشخص؟ أم 500 غرام أفضل؟ سواءً اعترفنا بذلك أم لا، أغلبنا يؤدي هذه المهمة لا شعوريًا. دورة الذكاء الاصطناعي احترف برمجة الذكاء الاصطناعي AI وتحليل البيانات وتعلم كافة المعلومات التي تحتاجها لبناء نماذج ذكاء اصطناعي متخصصة. اشترك الآن سيكون من الجميل أن يكون لدينا صيغة بسيطة مثل هذه لحلّ كلّ مشكلة في العالم. وخاصة بالنسبة لعزومة الغداء. ولكن لسوء الحظ هذا مستحيل. لنعود إلى مثال السيارات. المشكلة الحقيقية في هذا المثال هو وجود تواريخ تصنيع مختلفة، وعشرات الأنواع من السيارات، والحالة الفنية للسيارة، بالإضافة لارتفاع الطلب الموسمي على سيارة معينة، والكثير من العوامل المخفية الأخرى الّتي تؤثر بسعر السيارة. وبالتأكيد لن يستطيع صديقنا أحمد الاحتفاظ بكلّ هذه البيانات في رأسه أثناء حسابه للسعر. معظم الناس كسالى بطبعهم ولذلك سنحتاج حتمًا لآلات لتأدية العمليات الرياضية. لذا لنجاري الوضع الحاصل ولِنتجه باتجاه توفير آلة تؤدي هذه المهمة الحسابية الّتي واجهناها. ولنُوفر لها بعض البيانات اللازمة وسنطلبُ منها العثور على جميع الأنماط المخفية المتعلقة بالسعر. الجميل في الأمر أن هذه الآلة ستُؤدي هذه المهمة بطريقة أفضل بكثير مما سيُؤديه بعض الناس عند تحليلهم بعناية لجميع التبعيات المتعلقة بالسعر في أذهانهم. في الحقيقة كان هذا النوع من المشاكل المحفز الأساسي لولادة تعلّم الآلة. المكونات الرئيسية لتعلم الآلة لو أردنا اختصار جميع الأهداف الكامنة وراء مجال تعلّم الآلة فسيكون الهدف الوحيد هو توقع النتائج معينة بناءً على البيانات المدخلة (أي التعلّم من البيانات المدخلة). وهذا خلاصة الأمر. إذ يمكن تمثيل جميع مهام تعلّم الآلة بهذه الطريقة. كلّما زاد تنوع البيانات (تسمى في بعض الأحيان بالعينات) المجمعة لديك، كلّما كان مهمة العثور على الأنماط ذات الصلة والتنبؤ بالنتيجة أسهل نسبيًا. لذلك، فإن أي نظام يستخدم تعلّم الآلة سيحتاجُ لثلاثة مكونات رئيسية وهي: 1. البيانات (Data) هل تريد الكشف عن رسائل البريد الإلكتروني المزعجة؟ احصل على عينات من الرسائل هذه الرسائل المزعجة. هل تريد التنبؤ بالتغيرات الّتي تطرأ على أسعار الأسهم؟ ابحث عن سجلات أسعار الأسهم. هل تريد معرفة ما هي تفضيلات المستخدم؟ حللّ أنشطته على الفيسبوك، واعتقد بأن مارك زوكربيرج ماهرٌ جدًا في ذلك. كلما كانت البيانات أكثر تنوعًا، كانت النتيجة أفضل. في بعض الأحيان تكون عشرات الآلاف من سجلات البيانات هي الحد الأدنى لاستنتاج معلومة معينة. وفي البعض الآخر نحتاج إلى ملايين العينات. هناك طريقتين رئيسيتين للحصول على البيانات: الطريقة اليدوية. الطريقة الآلية. تتميز البيانات المجمّعة يدويًا باحتوائها على أخطاء أقل بكثير بالموازنة مع نظيرتها الآلية، ولكنها بالمقابل تستغرق وقتًا أطول في التجميع مما يجعلها أكثر تكلفة عمومًا. أما الطريقة الآلية فتكون أرخص إذ كلّ ما سنفعله هو جمع كلّ ما يمكننا العثور عليه على أمل أن تكون جودة هذه البيانات مقبولة. تستخدم بعض الشركات مثل غوغل عملائها لتصنيف البيانات لهم مجانًا. هل تعلم لماذا طريقة التحقق البشري ReCaptcha (المستخدمة في أغلب المواقع) تجبرك على "تحديد جميع لافتات الشوارع الموجودة في صورة معينة"؟ في الحقيقة إن هذه الطريقة ما هي إلا وسيلة لتصنيف البيانات وتعظيم الاستفاد منها. إذ يستغلون حاجتك للتسجيل في الموقع معين ويسخّرونك مجبرًا للعمل لديهم وبالمجان. مدعين بأنهم بهذه الطريقة يختبرونك بأنك بشري! نعم هذا بالضبط ما يفعلونه! تبًا لهم الأشرار! أراهن لو أنك بمكانهم فستُظهر رمز التحقق البشري أكثر منهم بكثير. أليس كذلك؟ بيد أن من الصعوبة بمكان الحصول على مجموعة جيدة من البيانات -والتي تسمى عادةً مجموعة بيانات (Dataset). وهذه المجموعات مُهمّة للغاية بل إن مجموعة البيانات ذات الجودة العالية هي في الواقع كنز حقيقي لصاحبها لدرجة أن الشركات يمكن أن تكشف أحيانًا عن خوارزمياتها، إلا أنها نادرًا ما تكشف مجموعات البيانات الخاصة بها. 2. الميزات (Features) تُعرف أيضًا باسم المعاملات (Parameters) أو المتغيّرات (Variables). والتي يمكن أن تعبر عن المسافة المقطوعة بالسيارات، أو جنس المستخدم، أو سعر السهم، أو تكرار كلمة معينة في النص. بعبارة أخرى، هذه هي الميزات الّتي يجب أن تنظرَ لها الآلة. عندما تكون البيانات مخزنة في الجداول، يكون الأمر بسيطًا - فالميّزات هي أسماء الأعمدة. ولكن ماذا لو كان لديك 100 غيفابايت من صور القطط؟ بكلّ تأكيد لا يمكننا اعتبار كلّ بكسل ميزّة. هذا هو السبب بكون اختيار الميّزات الصحيحة يستغرق عادة وقتًا أطول من أي خطوة أخرى في بناء نظام يعتمد على تعلّم الآلة. وهذا أيضًا هو المصدر الرئيسي للأخطاء. ولذلك دائمًا ما تكون الاختيارات البشرية غير موضوعية. إذ يختارون فقط الميّزات الّتي يحبونها أو تلك الّتي يجدونها "أكثر أهمية". ولذا من فضلك تجنب أن تكون بشريًا! 3. الخوارزميات (Algorithms) وهو الجزء الأسهل والأكثر وضوحًا. إذ يمكن حلّ أي مشكلة بطرق مختلفة. بيد أن الطريقة الّتي تختارها ستُؤثر على دقة النموذج النهائي وأدائه وحجمه. هناك فارق بسيط واحد مهم: إذا كانت البيانات سيئة فلن تساعدك حتى أفضل خوارزمية موجودة. في بعض الأحيان يشار إليها بمصطلح "الدخل السيئ سيؤدي إلى نتائج سيئة". لذلك لا تهتم كثيرًا لنسبة الدقة، وحاول الحصول على المزيد من البيانات كبداية. من الجدير بالذكر أن مصطلح نموذج (Model) يشير إلى ما خلاصة ما تعلمته من البيانات، ويكمننا في بعض الأحيان استخدام نموذج جاهز وتمرير البيانات له أو تحسين نموذج حالي. الفرق بين التعلم (Learning) والذكاء (Intelligence) إن سبق ورأيت مقالًا بعنوان "هل ستحلّ الشبكات العصبية محل تعلم الآلة؟" أو على شاكلته من العناوين الّتي تنشرها بعض المواقع التابعة لوسائل إعلامية على الإنترنت. دائمًا ما يسمي رجال الإعلام هؤلاء أي انحدار خطي (Linear Regression) على أنه ذكاء اصطناعي، بل إن بعض وسائل الإعلام تضخم الأمور لدرجة يصعب تصديقها حتى أصبحنا نخاف من الذكاء الصنعي كما خاف أبطال فيلم Terminator من الروبوت SkyNet. وإليك صورة توضح المفاهيم وتفض الالتباس الموجود: علوم الحاسب (Computer Science): عمومًا هو دراسة أجهزة الحاسب بما فيها من أسس نظرية و حسابية، كما تشتمل على دراسة الخوارزميات، وبُنى المعطيات وأساسيات تصميم الشبكات ونمذجة البيانات ..وغيرها. الذكاء الصناعي (Artificial Intelligence): وهو فرع من فروع علوم الحاسب يهدف إلى تعزيز قدرة الآلات والحواسيب على أداء مهام مُعينة تُحاكي وتُشابه تلك الّتي تقوم بها الكائنات الذكيّة؛ كالقدرة على التفكير، أو التعلُم من التجارب السابقة، أو غيرها من العمليات الأُخرى الّتي تتطلب عمليات ذهنية. تعلم الآلة (Machine Learning): وهو جزء مهم من الذكاء الاصطناعي، وهو أحد فروع الذكاء الاصطناعي الّذي يُعنى بجعل الحاسوب قادرًا على التعلُم من تلقاء نفسه من أيّ خبرات أو تجارب سابقة، مما يجعله قادرًا على التنبؤ واتخاذ القرار المُناسب بصورة أسرع، ولكن تعلم الآلة ليس الفرع الوحيد الّذي يؤدي هذه المهمة. الشبكات العصبية الاصطناعية (Artificial Neural Networks): وهي من أحد أشهر الطرق الشعبية في مجال تعلّم الآلة، ولكن هناك طرق أخرى جيدة أيضًا. التعلم العميق (Deep Learning): هو طريقة حديثة لبناء وتدريب واستخدام الشبكات العصبية. وهي بالأساس هيكلية جديدة للشبكات العصبية. وحاليًا لا أحد يفصل التعلم العميق عن "الشبكات العصبية العادية". حتى أننا نستخدم نفس المكتبات لهم. من الأفضل دومًا تسمية نوع الشبكة وتجنب استخدام الكلمات الرنانة. من المهم دائمًا تذكر بأنه لا توجد طريقة واحدة أبدًا لحل مشكلة معينة في مجال تعلّم الآلة. بل هناك دائمًا العديد من الخوارزميات الّتي يمكنها حل نفس المشكلة، وتبقى مهمة اختيار الطريقة أو الخوارزمية الأنسب عائدة إليك. إذ يمكنك حلّ أيّ شيء باستخدام شبكة عصبية اصطناعية، ولكن من الّذي سيدفع لك ثمن استئجار (أو حتى شراء) بطاقة معالجة الرسوميات (GPU) من نوع GeForces؟ لنبدأ بنظرة عامة أساسية على الاتجاهات الأربعة السائدة حاليًا في مجال تعلّم الآلة. تعلم الآلة التقليدي جاءت الطرق الأولى لتعلّم الآلة من مجال الإحصاء البحت في خمسينات القرن الماضي. إذ اعتمد العلماء على حلّ معظم المهام الرياضية الرسمية من خلال البحث عن الأنماط في الأرقام، وتقييم قرب نقاط البيانات، وحساب اتجاه المتجهات. يعمل حاليًا نصف الإنترنت على هذه الخوارزميات. فعندما ترى قائمة بالمقالات المرشحة لك قراءتها في أحد المواقع، أو عندما يحظر البنك الّذي تتعامل معه بطاقتك عند تمريرك إياها على الآلة في محطة وقود عشوائية في مكان مجهول بعيدة عن سكنك، فعلى الأرجح هذه الأفعال ناتجة عن خوارزميات تعلّم الآلة. تعد الشركات التكنولوجيا الكبرى من أكبر المعجبين بالشبكات العصبية، إذ أنها تستطيع الاستفادة منها بقدر أكبر من الشركات الناشئة. فمثلًا يمكن لدقة صغيرة ولتكن 2٪ لإحدى خوارزمياتها الحساسة أن تعود بالنفع على إيرادات الشركة بمبلغ مالي ضخم يبلغ 2 مليار دولار. ولكن عندما تكون شركتك صغيرة وناشئة، فهذه النسبة ليست ذات فائدة كبيرة. فإذا أمضى المهندسين في فريقك البرمجي سنة كاملة يعملون على تطوير خوارزمية توصية جديدة لموقع التجارة الإلكترونية الخاص بك، مع معرفتهم بأن 99٪ من الزيارات تأتي من محركات البحث. عندها ستكون فائدة الخوارزمية قليل جدًا إذ لم عديمة الفائدة تمامًا وخصيصًا أن معظم المستخدمين لم يفتحوا الصفحة الرئيسية. فهذا سيكون أكبر هدر لطاقة فريقك البرمجي وبذلك سيكون أسوء استثمار لهذه العقول خلال هذه السنة. بصرف النظر عن ما يقال عن هذه الطرق إلا أنها سهلة سهولة كبيرة. بل إنها مثل أساسيات الرياضيات وأغلبنا يستخدمها يوميًا بدون أن يفكر بها. ينقسم تعلّم الآلة الكلاسيكي إلى فئتين وهما التعلّم الموجّه (ويسمى أيضًا التعلّم الخاضع للإشراف) و التعلّم غير الموجّه (ويسمى أيضًا التعلّم غير الخاضع للإشراف). التعلم الموجه (Supervised Learning) تحتوي الآلة على "مشرف" أو "مُعلّم" يزود الآلة بجميع الإجابات الصحيحة والدقيقة، مثل تحديد فيما إذا كان الشكل في الصورة لقطة أو كلب. قسّم (أو صنّف) المعلم بهذا الطريقة فعليًا البيانات إلى قطط وكلاب، ويستخدم الجهاز هذه الأمثلة الصحيحة للتعلم منها. واحدًا تلو الآخر. أما التعلم غير الموجّه فأن سيترك الآلة بمفردها مع كومة كبيرة من صور الحيوانات ومهمتها ستكون تصنيف هذه الصور. وذلك لأن البيانات غير مصنفة، ولا يوجد معلّم يحدد لنا ما الشكل الموجود في هذه الصور، ولذلك ستحاول الآلة بمفردها العثور على أي أنماط في الصور لتحديد الفوارق ومعرفة ما الموجود في الصور. سنتحدث عن هذه الطرق في التعرف على الأنماط لاحقًا. من الواضح أن الآلة ستتعلم أسرع بكثير مع معلّم، لذلك فالتعلّم الموجّه مستخدمٌ بكثرة في المهام الواقعية. هناك نوعين رئيسيين لطريقة التعلم الموجّه وهما: التصنيف (Classification): التنبؤ بصنف كائن معين. الانحدار (Regression): التنبؤ بنقطة معينة على محور رقمي. التصنيف (Classification) تقسيم الكائنات أو العناصر بناءً على إحدى السمات المعروفة مسبقًا. افصل الجوارب بحسب اللون، والمستندات بحسب اللغة، والموسيقى بحسب الأسلوب. وعمومًا يستخدم التصنيف من أجل: تصفية البريد الإلكتروني من الرسائل المزعجة. كشف عن اللغة المستخدمة. البحث عن وثائق مماثلة. تحليل المشاعر. التعرف على الحروف والأرقام المكتوبة بخط اليد. الكشف عن الغش. ومن بعض الخوارزميات الشائعة المستخدمة للتصنيف: خوارزمية بايز أو المصنّف المعتمد على قانون بايز في الاحتمالات Naive Bayes. خوارزمية شجرة القرار Decision Tree. خوارزمية الانحدار اللوجستي Logistic Regression. خوارزمية الجار الأقرب K-Nearest Neighbours. خوارزمية الدعم الآلي للمتجه Support Vector Machine. ويوجد أيضًا العديد من الخوارزميات الأخرى. غالبًا ما يعتمد مجال تعلّم الآلة على تصنيف الأشياء. إذ تكون الآلة في هذه الحالة مثل طفل يتعلم كيفية فرز الألعاب: فها هي الدمية، وهذه هي السيارة، وهذه هي الشاحنة …إلخ ولكن مهلًا. هل هذا الأمر صحيح؟ هل سيعرف الطفل المعنى الحقيقي للدمية أو للسيارة؟ ليستطيع بعدها تمييز أي دمية مهما اختلف شكلها ولونها وطريقة صنعها؟ أي بعبارة أخرى، هل سيستطيع أن يعمم ما تعلمه؟ في التصنيف سنحتاج دائمًا لمعلّم. ويجب تصنيف البيانات بميّزات (Features) حتى تتمكن الآلة من تعيين الأصناف المناسبة بناءً على هذه الميّزات. في الحقيقة يمكننا تصنيف كلّ شيئ تقريبًا ابتداءً من تصنيف المستخدمين بناءً على اهتماماتهم (كما تفعل خوارزمية فيسبوك)، والمقالات المستندة إلى اللغة أو الموضوع (وهذا أمر مهم لمحركات البحث)، والموسيقى المبنية على الأسلوب سواءً أكانت موسيقى جاز أو هيب هوب …إلخ (هذا الأمر نشاهده في قوائم تشغيل الخاصة بتطبيق Spotify)، وحتى تصنيف رسائل البريد الإلكتروني الخاصة بك. في تصفية الرسائل المزعجة وغير المرغوب بها، تستخدم خوارزمية بايز Naive Bayes على نطاق واسع. إذ تحسبُ الآلة عدد الكلمات الجيدة في الرسالة وعدد الكلمات الاحتيالية أيضًا بناءً على تصنيف سابق للكلمات موجود في قاعدة بيانات أو مجموعة بيانات (Dataset)، ومن ثمّ تضرب الاحتمالات باستخدام معادلة بايز، وتجمعُ النتائج النهائية وبهذه البساطة أصبح لدينا جهاز يستفيد من طرق تعلّم الآلة من أجل أن يزيد ذكائه ومعرفته. بعدها بفترة وجيزة تعلم مرسلو البريد العشوائي كيفية التعامل مع هذه المرشحات -إن صح التعبير- والّتي تعتمد على خوارزمية بايز فعكفوا على إضافة الكثير من الكلمات المصنّفة على أنها "جيدة" في نهاية البريد الإلكتروني لتُتضاف هذه الكلمات إلى العملية الحسابية الخاصة بحساب احتمالات كون الرسالة مزعجة أم لا. ومن المفارقة أن هذه الثغرة سمّيت لاحقًا بتسمم بايز. دخلت خوارزمية بايز التاريخ باعتبارها من أوائل الخوارزميات الأنيقة والمفيدة عمليًا في ترشيح رسائل البريد الإلكتروني، ولكن في وقتنا الحالي لا تستخدم هذه الخوارزمية وإنما تستخدم خوارزميات أكثر قوة وذكاءً معتمدًا على الشبكات العصبية الاصطناعية لتصفية رسائل البريد العشوائي المزعج. إليك مثال عملي آخر على تطبيقات خوارزميات التصنيف. لنفترض أنك بحاجة لاقتراض بعض المال عن طريق بطاقتك الائتمانية. كيف سيعرف البنك إذا كنت تريد فعلًا أن تسدد هذا القرض أم لا؟ وبالتأكيد لا توجد طريقة مباشرة لمعرفة ذلك، مثل أن يسألك مثلًا. ولكن لدى البنك الكثير من الملفات الشخصية لأشخاص اقترضوا مالًا في الماضي. في الواقع لدى البنك جميع البيانات المهمة حول أعمار الأشخاص المقترضين ومستوى تعليمهم ومهنهم ورواتبهم -والأهم من ذلك- حقيقة أن هل هؤلاء المقترضين سددوا القرض أم لا. وهذه البيانات مهمة جدًا إذ يمكننا تمريرها للنظام الداخلي للبنك الّذي يعتمد على تعلّم الآلة للعثور على الأنماط المحددة الموجودة في الأشخاص الّذين يسددون القروض، وبذلك يمكننا الحصول على الإجابة المبنية على هذه البيانات السابقة. في الواقع لا توجد مشكلة حقيقية في الحصول على إجابة من هذه البيانات. وإنما تكمن المشكلة في أنه لا يستطيع البنك أن يثق في إجابة الآلة ثقةً عمياء. فماذا لو حدث فشل في النظام أو في جزء منه مثل تعطل أحد الاقراص الصلبة المخزن عليها قواعد البيانات المطلوبة، أو أن أحد قراصنة الإنترنت هجم على الخادم وتلاعب بالخوارزميات أو البيانات. فما الّذي سيحدث في هذه الحالة؟ للتعامل مع هذه الحالة لدينا خوارزمية شجرة القرار. والتي ستقسّم جميع البيانات تلقائيًا إلى أسئلة أجوبتها نعم أو لا. قد يبدو الأمر غريبًا بعض الشيئ من منظور بشري، فمثلًا ما المشكلة إذا كان الدائن يكسب أكثر من 128.12 دولارًا أمريكيًا؟ بالرغم من ذلك تضع الآلة مثل هذه الأسئلة لتقسيم البيانات بشكل أفضل في كلّ خطوة. وهكذا تُصنعُ شجرة القرار. كلما كان الفرع أعلى كلما كان السؤال أعم. يمكن لأي محلل أن يأخذ ناتج الخوارزمية ويعلّم تمامًا ما هو القرار المناسب. يمكن ألا يشعر بأن كلّ تفاصيلها منطقية إلا أنه يستطيع أن يبني عليها قراره. أشجار القرار (Decision Trees) تستخدم خوارزمية شجرة القرار على نطاق واسع في المجالات ذات المسؤولية العالية مثل: التشخيص والطب وفي الأمور المالية. من أكثر الخوارزمات شيوعًا لتشكيل الأشجار هما خوارزمية CART وخوارزمية C4.5. ونادرًا ما تستخدم طريقة بناء أشجار القرار الأساسية الصرفة في وقتنا الحالي. إلا أنها غالبًا ما تضع حجر الأساس للأنظمة الكبيرة، بل إن المُجمّعات (Ensembles) المعتمدة على أشجار القرار تعمل بطريقة أفضل من المجمعات المعتمدة على الشبكات العصبية الاصطناعية (سنتحدث لاحقًا في هذا المقال عن كلّ جزء منهم بالتفصيل). عندما تبحث عن شيء ما في غوغل، فما يحدث بالضبط هو أن مجموعة من الأشجار ستبحث عن إجابة أو مجموعة من الإجابات المناسبة لك. وهذه الأشجار سريعة جدًا، ولذلك تحبها محركات البحث. تعدّ خوارزمية الدعم الآلي للمتجه (Support Vector Machines) والتي يشار إليها اختصارًا (SVM) هي الطريقة الأكثر شيوعًا للتصنيف الكلاسيكي. والمستخدمة لتصنيف كلّ شيئ موجود تقربيًا مثل: النباتات حسب مظهرها في الصور، والوثائق بحسب الفئات …إلخ. الفكرة وراء خوارزمية الدعم الآلي للمتجه بسيطة جدًا إذ تحاول رسم خطين بين نقاط البيانات الخاصة بك مع أكبر هامش بينهما. هناك جانب مفيد جدًا من خوارزميات التصنيف وهو الكشف عن البيانات الشاذة. فعندما لا تتناسب الميزة مع أيّ من الفئات، فإننا نبرزها. وتستخدم هذه الطريقة حاليًا في الطب وتحديدًا في أجهزة التصوير بالرنين المغناطيسي، تبرز الحواسيب جميع المناطق المشبوهة أو انحرافات الاختبار. كما تستخدم أيضًا في أسواق الأسهم للكشف عن السلوك غير الطبيعي للتجار لمعرفة ما يحدث وراء الكواليس. الجميل في الأمر أنه عندما نعلّم الحاسب الأشياء الصحيحة فنكون علمناه تلقائيًا ما هي الأشياء الخاطئة. القاعدة الأساسية هي كلّما زاد تعقيد البيانات، زاد تعقيد الخوارزمية. بالنسبة للنصوص والأرقام والجداول سنختار النهج الكلاسيكي. إذ النماذج الناتجة ستكون أصغر، وتتعلم أسرع وتعمل بوضوح أكبر. أما بالنسبة للصور ومقاطع الفيديو وجميع أنواع البيانات المعقدة الأخرى، سنتجه بالتأكيد نحو الشبكات العصبية. منذ خمس سنوات فقط كان بإمكانك العثور على مصنف للوجه مبني على خوارزمية الدعم الآلي للمتجه (SVM). حاليًا أصبح من السهل الاختيار من بين مئات الخوارزميات المعتمدة على الشبكات العصبية المدربة مسبقًا. أما بالنسبة لمرشحات البريد العشوائي فلم يتغير شيئ. فلا تزال بعض الأنظمة مكتوبة بخوارزمية الدعم الآلي للمتجه (SVM). الانحدار (Regression) وهو طريقة لرسم خط بين مجموعة نقاط. نعم، هذا هو التعلّم الآلة! يستخدم الانحدار حاليًا في تطبيقات متعددة، مثل: توقعات أسعار الأسهم. تحليل حجم الطلب والمبيعات. التشخيص الطبي. أي ارتباطات عددية. ومن الخوارزميات الشائعة نذكر: خوارزمية الانحدار الخطي Linear. خوارزمية االانحدار متعدد الحواف Polynomial. الانحدار هو في الأساس آلية للتصنيف ولكن هنا نتوقع رقمًا بدلًا من فئة. ومن الأمثلة على ذلك توقع سعر السيارة من خلال المسافة المقطوعة، وتوقع حركة المرور بحسب وقت محدد من اليوم، وتوقع حجم الطلب من خلال نمو الشركة، وما إلى ذلك. ويكون من الواجب استخدام الانحدار عندما تعتمد مشكلة معينة على الوقت. كلّ من يعمل في مجالات التمويل والتحليل المالي يحب خوارزميات الانحدار. حتى أن معظمها مدمج في برنامج مايكروسوفت إكسل (Excel). وطريقة استخدامها سلسة جدًا من الداخل إذ تحاول الآلة ببساطة رسم خط يشير إلى متوسط الارتباط (Average Correlation). على عكس الشخص الّذي يحاول رسم شكل الانحدار يدويًا على السبورة، فإن الآلة ترسم الشكل بدقة رياضية عالية جدًا، بحساب متوسط الفاصل الزمني لكل نقطة. عندما يكون خط الانحدار مستقيمًا فيكون هذا الانحدار خطيًا، أما عندما يكون خط الانحدار منحنيًا فيكون الانحدار متعدد الحواف (Polynomial). وهذه الأنواع الرئيسية من الانحدار. والبعض الآخر أكثر غرابة مثل الانحدار اللوجستي (Logistic Regression) وسيكون شكله مميز كتميز الخروف الأسود في قطيع غنم. ولكن لا تدعه يخدعك، لأنه مجرد طريقة تصنيف وليس انحدارًا. لا بأس في الخلط بين الانحدار والتصنيف. إذ يتحول العديد من المصنّفات لتنفيذ عملية انحدار بقليل من الضبط والإعداد. وعمومًا تستخدم طرق الانحدار عندما لا يمكننا تحديد فئة الكائن، وإنما يمكننا تحديد ومعرفة مدى قربه من هذه الفئة، وهنا بالضبط تأتي مهمته. في حال أردت التعمق أكثر في التعلم الموجّه، فراجع هذه السلسلة: Machine Learning for Humans. التعلم غير الموجه (Unsupervised learning) ظهر التعلّم غير الموجّه بعد ظهور التعلّم الموجّه بقليل، وتحديدًا في التسعينيات. ويستخدم أقل من التعلّم الموجّه، ولكن في بعض الأحيان لن يكون لدينا خيار آخر سوى استخدامه. تعدّ البيانات المصنّفة نوع فاخر من البيانات. ولكن ماذا لو كنت رغبت في إنشاء تصنيف مخصص للحافلات (الباصات)؟ هل يجب عليك التقاط صور يدويًا لمليون حافلة في الشوارع وتصنيف كلّ واحدةٍ منها؟ مستحيل، سيستغرق هذا الأمر عمرًا بأكمله. في هذا النوع من التعلم من منظورنا نحن نعطيها أومر معينة للتجميع أو تقليل الأبعاد وهي تؤدي هذه المهمة من خلال تحليلها لقيم الميّزات (Features) ومحاولة الربط بينها ومعرفة العلاقات أو الارتباط بين هذه البيانات. كما يمكن أن تكون البيانات معقدة للغاية، ولذلك لا يمكن لهذه الخوارزميات التكهن بالنتيجة المطلوبة بصورة صحيحة. في تلك الحالات نحاول تنظيم بياناتنا أو إعادة هيكلتها في صيغة منطقية أكثر من السابق من أجل معرفة فيّما إذا استطاعت هذه الخوارزميات استنتاج شيئ ما، وبذلك الأمر له عدة جوانب للحلّ ومتعلّق بنوعية البيانات وطريقة تنظيمها وجودتها. ولكن هناك بعض الأمل إذ لدينا الملايين من المنصات الّتي توفر خدمات رخيصة نسبيًا تبدأ من 5 دولار أمريكي، وغالبًا نعتمد عليها لمساعدتنا في تصنيف البيانات وهذه الطريقة المعتمدة الّتي تجري وفقها أمور تطوير البيانات في هذا المجال. بعض الأنواع للتعلّم غير الموجّه: التجميع (Clustering). تقليل الأبعاد أو التعميم (Dimensionality Reduction). تعلم قواعد الربط (Association rule learning). التجميع (Clustering) تُقسّم عملية التجميع الكائنات على أساس ميّزات غير معروفة. إذ تختار الآلة أفضل طريقة لفرز الميّزات الّتي تراها مناسبة. هذه بعض التطبيقات لعملية التجميع في وقتنا الحالي: تقسيم السوق (أو تقسيم أنواع العملاء، أو طريقة ولائهم للعلامة التجارية). دمج نقاط قريبة على الخريطة. ضغط الصورة. تحليل وتسمية البيانات الجديدة. الكشف عن السلوك غير الطبيعي. ومن بعض خوارزميات الشائعة للتجميع: خوارزمية K-mean_clustering. خوارزمية Mean-Shift. خوارزمية DBSCAN. تعدّ عملية التجميع فعليًا عملية تصنيف ولكن المفارقة هنا أنها لا تحتوي على فئات محددة مسبقًا. مشابهة جدًا لعملية تقسيم الجوارب في الدرج بحسب ألوانهم، وذلك عندما لا تتذكر كلّ الألوان الّتي لديك فعندها ستجلب الجورب الأول ذو اللون الأسود وتضعه جانبًا وتأخذ الجورب الثاني ..وهكذا. تحاول خوارزميات التجميع العثور على كائنات متشابهة (بحسب بعض الميزات) ودمجها في مجموعة. تُجمّع الكائنات الّتي لديها الكثير من الميزات المماثلة في فئة واحدة. وتسمح لنا بعض الخوارزميات حتى تحديد العدد الدقيق للمجموعات الّتي نريدها. من أحد أشهر الأمثلة على التجميع هي تجميع العلامات (أو المؤشرات) على خرائط الوِب. فمثلًا عندما تبحث عن جميع المطاعم النباتية المحيطة بك، سيجمّعُ محرك البحث الخاص بالخريطة جميع المطاعم على شكل أرقام. ولو أنه لم يجمّعها لك فحتمًا سيتجمد متصفحك بعد عملية البحث لأنه سيحاول رسم جميع المطاعم النباتية الموجودة على سطح الكرة الأرضية وعددهم سيكون كبير بكلّ تأكيد. ومن بعض الاستخدامات الأخرى لخوارزميات التجميع تطبيقات الهواتف المحمولة مثل: Apple Photos وGoogle Photos إذ كِلاهما يستخدمان خوارزميات تجميع معقدة أكثر من المثال السابق، وذلك لإنهم يبحثان عن الوجوه المميزة في الصور بهدف إنشاء ألبومات خاصة لأصدقائك. لا يعرف التطبيق عدد أصدقاؤك ولا حتى كيف تبدوا أشكالهم، ولكنه مع ذلك يحاول العثور على ميزات صريحة في وجوههم، والموازنة بينها لمعرفة عددهم، وعرض الألبومات وفقًا لذلك. ومن بعض الاستخدامات الأخرى هي ضغط الصورة فعند حفظ الصورة بلاحقة PNG، يمكنك ضبط مجموعة الألوان وليكن عددها 32 لونًا. هذا يعني أن آلية التجميع ستأخذ جميع البكسلات "المحمرة" وتحسب قيمة "المتوسط الأحمر" وتضبطه على جميع البكسلات الحمراء. وبذلك يكون لدينا ألوان أقل، مما يؤدي في نهاية المطاف إلى حجم ملف أقل، وبذلك تنخفضُ مصاريف التخزين المحلي أو السحابي. ومع ذلك يمكن أن نواجه بعض مشاكل في الألوان مثل الألوان القريبة من لونين بنفس الوقت مثل لون الأزرق السمائي (Cyan). إذ لا يمكننا تصنيفه فيما إذا كان أخضرًا أم أزرق؟ هنا يأتي دور خوارزمية K-Means. خوارزمية K-mean إذ تعيّن خوارزمية K-Means مجموعة من النقاط اللونية والبالغ عددها 32 نقطة لونية بطريقة عشوائية في مجموعة الألوان. وتسمى هذه النقاط (أو الألوان) بالنقاط المركزية (Centroids). وتُحدد النقاط المتبقية على أنها مخصصة لأقرب نقطة (لون) مركزي. وبعدها سنُلاحظ أننا حصلنا نوعًا ما على ما يشبه المجرات حول هذه الألوان 32. ثم ننقل النقطة المركزية إلى وسط مجرتنا، ونكرر ذلك حتى تتوقف النقطة المركزية عن التحرك. نفذنا جميع المهام بنجاح. ولدينا 32 مجموعة محددة ومستقرة. وإليك شرحًا كرتونيًا وتفصيليًا لما جرى: البحث عن الألوان المركزية مريح. إلا أن التجميعات في الحياة الواقعية ليست دائمًا على شكل دوائر. لنفترض أنك عالم جيولوجيا. وتحتاج للعثور على بعض المعادن المتماثلة على الخريطة. في هذه الحالة، يمكن تشكيل تجميعات بطريقة غريبة وحتى متشعبة. ولا يمكنك أيضًا أن تعرف عددهم فهل هم 10؟ أم 100؟ بكل تأكيد أن خوارزمية K-means لن تتناسب مع هذه الحالة، وإنما ستكون خوارزمية DBSCAN مفيدةً أكثر. خوارزمية DBSCAN لنفترض أن النقاط لدينا هم أناس في ساحة البلدة. اَبحث عن أي ثلاثة أشخاص يقفون بالقرب من بعضهم البعض واطلب منهم أن يمسكوا أيديهم. ثم اطلب منهم البدء في الإمساك بأولئك الجيران الّذين يمكنهم الوصول إليهم. وهكذا دواليك. إلى أن نصل لشخص لا يستطيع الامساك بأي شخص آخر. هذه هي مجموعتنا الأولى. كرر هذه العملية ليُجمعُ كلّ الناس بمجموعات. ملاحظة: الشخص الّذي ليس لديه من يمسك يده - هو فعليًا مجرد بيانات شاذة. إليك رسم توضيحي يبين لك كيف سيبدو الحل: وإن كنت مهتم بخوارزميات التجميع؟ يمكنك الاطلاع على هذه المقالة The 5 Clustering Algorithms Data Scientists Need to Know. نلاحظ أن التجميع مشابه تمامًا للتصنيف، إذ يمكن استخدام المجموعات للكشف عن الحالات الشاذة. هل لاحظت بأن المستخدم يتصرف بطريقة غير طبيعية بعد اشتراكه بموقعكK أو بخدمتك؟ دع الآلة تحجبه مؤقتًا، وتنشئ تذكرة للدعم الفني لفحص هذا النشاط المريب لاتخاذ القرار المناسب. فربما يكون روبوت آلي يحاول إشغال الخادم الّذي تحجزه لموقعك. في الحقيقة لن نحتاج حتى لمعرفة ماهيّة "السلوك الطبيعي" للمُستخدم وإنما سنأخذ جميع أفعال ونشاطات المستخدم ونحملها إلى نموذجنا ونترك الآلة تقرر ما إذا كان هذا المستخدم "نموذجيًا" أم لا. يمكن أن لا يعمل هذا النهج بطريقة جيد بالموازنة مع التصنيف، ولكن القرار النهائي سيُبنى على المحاولة والتجربة. تقليل الأبعاد (Dimensionality Reduction) وتعرف أيضًا بالتعميم (Generalization) وهي عملية تجميع ميّزات محددة بداخل ميّزات ذات مستوى أعم وأعلى. ومن بعض التطبيقات العملية لهذه الطريقة نجد: أنظمة التوصية. التصورات (المحاكاة) الجميلة. نمذجة الموضوعات والبحث عن وثائق مماثلة. تحليل الصور المزيفة. إدارة المخاطر. ومن بعض الخوارزميات الشائعة لتطبيقها: خوارزمية تحليل المكونات الرئيسية Principal Component Analysis ويشار لها اختصارًا (PCA). خوارزمية تحليل القيمة المفردة Singular Value Decomposition ويشار لها اختصارًا (SVD). خوارزمية Latent Dirichlet allocation. خوارزمية التحليل الدلالي الكامن Latent Semantic Analysis ويشار إليها اختصارًا (LSA أو pLSA أو GLSA). خوارزمية t-SNE (التي تستخدم في مجال الرؤية الحاسوبية). استخدم علماء البيانات المتعصبون سابقًا هذه الأساليب، وكان عليهم العثور على "شيئ مثير للاهتمام" في أكوام ضخمة من الأرقام. وعندما لم تساعدهم مخططات إكسل بهذه المهمة أجبروا الآلات على العثور على الأنماط. حتى حصلوا على طريقة تقليل الأبعاد أو ميّزة تعلّم كيفية تقليل البعد. من الأفضل دائمًا استخدام التلخيص أو التجريد (Abstractions)، عوضًا عن مجموعة من الميزات المجزأة. فمثلًا، يمكننا دمج كلّ الكلاب ذات الآذان مثلثية الشكل والأنوف الطويلة والذيل الكبير ليصبح لدينا تلخيص لشكل كلب لطيف وهو كلب "شبيرد". نعم فقدنا بعض المعلومات حول الصفات المميزة الخاصة بالكلب شبيرد، إلا أن التلخيص الجديد يعدّ أكثر فائدة لتسمية الأغراض وتوضيحها. بالإضافة إلى ذلك، إن النماذج المُلخAصة تتعلّم بطريقة أسرع، ولا تظهر لديها مشكلة "فرض التخصيص" (Overfitting) -الّتي سنتحدث عنها بالتفصيل لاحقًا- بكثرة وهي تستخدم عددًا أقل من الميّزات. أصبحت هذه الخوارزميات أداة مذهلة "لنمذجة المواضيع". إذ يمكننا تلخيص مواضيع من كلمات محددة لمعانيها. هذا ما تفعله خوارزمية التحليل الدلالي الكامن. تعتمد على عدد مرات تكرار كلمة معينة في موضوع محدد. مثل: استخدام كلمة "تقنية" بكثرة في المقالات التقنية، وبالتأكيد سنعثر على أسماء الأشخاص السياسيين بكثرة في الأخبار السياسية وهكذا. كما يمكننا بكل تأكيد إنشاء مجموعات من جميع الكلمات في المقالات، ولكننا سنفقد جميع الروابط المهمة بين معاني الكلمات خصيصًا العلاقة بين الكلمات ذات المعنى نفسه مثل البطارية (Battery) والبطارية المقصود بها المدخرات الكهربائية - (Accumulator) الموجودة في مستندات مختلفة. إلا أن خوارزمية التحليل الدلالي الكامن ستتعامل معها بالطريقة الصحيحة، ولهذا السبب تحديدًا سمّيت "بخوارزمية التحليل الدلالي الكامن". لذلك نحن بحاجة إلى ربط الكلمات والمستندات في ميزة واحدة للحفاظ على هذه الاتصالات الكامنة واتضح لنا بأن خوارزمية التفكيك المفرد (Singular decomposition) تؤدي هذه المهمة بقوة، مما يشفُ عن فائدة المجموعات المجمعة بحسب الموضوع الّتي تحدثنا عنها سابقًا. من الاستخدامات الشائعة الأخرى هي أنظمة التوصية (Recommender Systems) والتصفية التعاونية (Collaborative Filtering) من أجل تقليل الأبعاد. مما يبدو أنه إذا كنت تستخدمه في تلخيص تقييمات المستخدمين، فستحصل على نظام رائع للتوصية بالأفلام والموسيقى والألعاب بل وحتى أي شيئ تريده. للمزيد من المعلومات حول هذا الموضوع نوصيك بالكتاب الرائع "برمجة الذكاء الجمعي" Programming Collective Intelligence. بالكاد سنتمكن من فهم فهمًا كاملًا لفكرة التلخيص (أو التجريد) الآلي، ولكن من الممكن رؤية بعض الارتباطات عن قرب. إذ يرتبط بعضها بعمر المستخدم فمثلًا يلعب الأطفال لعبة ماين كرافت (Minecraft) ويشاهدون معها الرسوم المتحركة بكثرة، ويرتبط بعض المستخدمين الآخرين بنوعية فيلم معينة أو بهوايات مخصصة وهكذا. تستطيع الآلات الحصول على هذه المفاهيم التجريدية عالية المستوى من دون حتى فهم ماهيتها، بناءً فقط على معرفة تقييمات المستخدم. تعلم قواعد الربط (Association Rule Learning) وهي طريقة للبحث عن الأنماط في تدفق الطلبات. حاليا تستخدم في عدد من المجالات مثل: التنبؤ بالمبيعات والخصومات. تحليل البضائع المشتراة معًا. معرفة كيفية وضع المنتجات على الرفوف. تحليل أنماط تصفح الإنترنت. الخوارزميات الشائعة لها هي: خوارزمية Apriori. خوارزمية Eclat. خوارزمية FP-growth. وتستخدم هذه الطريقة لتحليل عربات (سلّات) التسوق الإلكترونية أو الواقعية، كما تستخدم أيضًا لأتمتة استراتيجية التسويق، والمهام الأخرى المتعلقة بمثل هذه الأحداث. وتحديدًا عندما يكون لديك تسلسل لشيئ معين وترغب في إيجاد أنماط فيه - جرب هذه الأشياء. لنفترض أن العميل سيأخذ ستة عبوات من العصائر ويذهب إلى طاولة المحاسبة ثم إلى باب الخروج. هل يجب أن نضع الفول السوداني بجانب الطريق المؤدي إلى طاولة المحاسبة؟ وفي حال وضعناها، كم مرة سيشتريها الناس بالمجمل؟ لربما تتماشى العصائر مع الفول السوداني، ولكن ما هي التسلسلات الأخرى الّتي يمكننا التنبؤ بها اعتمادًا على البيانات؟ هل يمكن لتغييرات بسيطة في ترتيب البضائع أن تؤدي إلى زيادة كبيرة في الأرباح؟ وينطبق نفس الشيء على التجارة الإلكترونية. إذ المهمة هنا أكثر حماسية وإثارة للاهتمام، فما الّذي سيشتريه العميل في المرة القادمة؟ هل سيشتري المنتجات النباتية؟ أم الحيوانية؟ تعتمد الأساليب الكلاسيكية لتعلم الآلة على نظرة مباشرة على جميع السلع المشتراة باستخدام الأشجار أو المجموعات. يمكن للخوارزميات البحث عن الأنماط فقط، ولكن لا يمكنها تعميمها أو إعادة إنتاجها بما يتوافق مع الأمثلة الجديدة. أما في العالم الحقيقي فإن كلّ متجر تجزئة كبير يبني حلًا خاصًا ومناسبًا له، لذلك لا نرى تطورات كبيرة في هذا المجال. وعلى المستوى التقني فإن أعلى مستوى من التقنيات المستخدمة هي أنظمة التوصية (أو تسمى أحيانًا الأنظمة الناصحة). التعلم المعزز (Reinforcement Learning) وهو عملية رمي روبوت في متاهة وتركه بمفرده ليجد طريق الخروج بنفسه. من بعض التطبيقات العملية المستخدمة حاليًا: السيارات ذاتية القيادة. روبوت تنظيف الأرضية. الألعاب. أتمتة التداول. إدارة موارد المؤسسة. من أبرز الخوارزميات الشائعة لها: خوارزمية التعلم المعزز وفق النموذج الحر Q-Learning. خوارزمية خطة ماركوف للتعلّم المعزز لاتخاذ القرار SARSA. خوارزمية التعلم المعزز العميق وفق النموذج الحر DQN. خوارزمية الناقد المميز غير المتزامن A3C. الخوارزمية الجينية Genetic algorithm. أخيرًا وليس آخرًا، نصل إلى شيئ يشبه الذكاء الحقيقي. في كثير من المقالات نرى خطأ شائعًا بأن يصنف التعلّم المعزز تحت قسم التعلّم الموجّه أو أحيانًا في قسم التعلّم غير الموجّه. لذا وجب التنويه إلى كونه طريقة تعلّم منفصلة. يستخدم التعلّم المعزز في الحالات الّتي لا تتعلق فيها مشكلتك بالبيانات على الإطلاق، وإنما لديك بيئة افتراضية تتعامل معها. مثل عالم ألعاب الفيديو أو مدينة افتراضية للسيارات ذاتية القيادة. إن معرفة جميع قواعد الطرقات الجوية في العالم لن تعلّم الطيار الآلي كيفية القيادة على بأحد الطرق الجوية. بغض النظر عن مقدار البيانات الّتي نجمعها، لا يزال يتعذر علينا توقع جميع المواقف المحتملة. وهذا هو السبب الأساسي لهدف التعلم المعزز وهو ** تقليل الخطأ، وليس التنبؤ بجميع التحركات المحتملة**. إن البقاء على قيد الحياة في البيئة الافتراضية هي الفكرة الأساسية للتعلم المعزز. إذ سنعتمد على ترك الروبوت الصغير الفقير يتجول في الحياة الافتراضية ونُعاقبه على الأخطاء ونُكافؤه على الأفعال الصحيحة. بنفس الطريقة الّتي نعلم بها أطفالنا، أليس كذلك؟ الطريقة أكثر فعالية لتدريب الروبوت هي بناء مدينة افتراضية والسماح للسيارة ذاتية القيادة بتعلم كلّ طرق القيادة وحيلها فيها أولًا. في الحقيقة هذه هي الطريقة المعتمدة في تدريب الروبوت الموجودة في السيارات ذاتية القيادة. إذ ننشئ في البداية مدينة افتراضية استنادًا لخريطة المدينة الحقيقية، ونضيف إليها أناس افتراضيين يمشون في الشوارع (لمحاكاة الواقع) ونترك السيارة تتعلم بمفردها وذلك بوضع هدف نصب أعيننا وهو "تقليل العدد الّذي تقتله من الناس بأقل ما يمكن" وهكذا يستمر الروبوت في التدرب إلى أن يصل لمرحلة لا يقتل بها أحد. عندما يؤدي الروبوت أداءً جيدًا في لعبة GTA عندها سنُحرره ونختبره في الشوارع الحقيقية. قد يكون هناك نهجان مختلفان للتعلم المعزز وهما: نهج قائم على نموذج (Model-Based). نهج غير قائم على نموذج أو النهج الحر (Model-Free). إن النهج القائم على نموذج يعني أن السيارة بحاجة لحفظ كامل الخريطة أو أجزائها. هذا نهج قديم جدًا لأنه من المستحيل بالنسبة للسيارة الفقيرة ذاتية القيادة أن تحفظ الكوكب بأكمله. أما في النهج غير القائم على نموذج فلا تحفظ السيارة كلّ حركة ولكنها تحاول تعميم المواقف، ومحاولة التصرف بعقلانية إلى جانب محاولتها الحصول على أقصى مكافأة. هل تذكر الأخبار المتداولة حول خسار بطل العالم بلعبة Go أمام الذكاء الصنعي؟ هل تعلم بأن عدد التركيبات القانونية المحتملة للعبِ بهذه اللعبة أكبر من عدد الذرات الموجودة في الكون كلّه؟ حتى أن العلماء أثبتوا ذلك لاحقًا. ولكن هل سنطلب من هذا الروبوت المسكين حفظ كلّ ذلك؟ في الواقع أن الآلة لم تتذكر جميع التركيبات المحتملة للعب ومع ذلك فازت بلعبة Go، إذ حاولت تطبيق أفضل حركة في كلّ دور على حدة (تمامًا كما فعلت في لعبة الشطرنج عندما هزمت غاري كاسباروف في المباراة الشهيرة سنة 1997 والّتي سميت بمباراة القرن). هي فعليًا اختارت ببساطة أفضل حركة (من ناحية المكسب) لكلّ حالة، وقد فعلت ما يكفي للتغلب على البشر. يعد هذا النهج مفهومًا أساسيًا أدى لظهور التعلّم المعزز وفق النموذج الحرّ (Q-learning) وهو فرع من فروع التعلّم المعزز بل وظهور الخوارزميات مثل خوارزمية خطة ماركوف للتعلّم المعزز لاتخاذ القرار (SARSA) وخوارزمية التعلّم المعزز العميق وفق النموذج الحرّ (DQN). ومن الجدير بالذكر أن حرف "Q" يشير إلى "الجودة" (Quality) إذ يتعلم الروبوت أداء الفعل الأكثر "نوعية" في كلّ حالة ويحفظ جميع المواقف على أنها سلسلة ماركوفية بسيطة. يمكن للآلة اختبار مليارات المواقف والحالات في البيئة افتراضية، ويمكنها تذكر جميع الحلول الّتي أدت لمكافأة أكبر. ولكن كيف يمكنها أن تميز المواقف الّتي رأتها مسبقًا عن المواقف الجديدة كليًا؟ فمثلًا إذا كانت السيارة ذاتية القيادة في إحدى التقاطعات بين الشوارع وكانت إشارة المرور حمراء وتحولت فجأة الإشارة الخضراء فهل هذا يعني أنها يمكن أن تسير مباشرة؟ ماذا لو كانت هناك سيارة إسعاف تسير في شارع قريب وتطلب من السيارات الأخرى إفساح الطريق لها؟ الإجابة الحالية على هذا السؤال وفق المعطيات المتاحة إلى يومنا هذا هو "لا أحد يعرف ما الّذي ستفعله هذه السيارة ذاتية القيادة". فعليًا لا توجد إجابة سهلة. لطالما استمر الباحثون في المحاولة للعثور على إجابة، ولكن في الوقت نفسه لا يجدون سوى الحلول المؤقتة لبعض الحالات. إذ يعتمد البعض على محاكاة جميع المواقف يدويًا الّتي تنتج حلًا للحالات الاستثنائية، مثل: مشكلة العربة. والبعض الآخر يتعمق أكثر من ذلك ويترك للشبكات العصبية مهمة اكتشافها. وهذا قادنا لتطور التعلم المعزز وفق النموذج الحر (Q-learning) إلى شبكات التعلم المعزز العميق (Deep Q-Network). لكنها ليست بالحل المثالي أيضًا. طريقة المجموعات وهو مجموعة أشجار غبية تتعلّم تصحيح أخطاء بعضها البعض. من بعض تطبيقاتها العملية في وقتنا الحالي: جميع التطبيقات الّتي تعمل على الخوارزميات الكلاسيكية (الفارق هنا أنها تقدم أداء أفضل). أنظمة البحث. الرؤية الحاسوبية. الكشف عن الأغراض. من أبرز الخوارزميات الشائعة لها: خوارزمية الغابات العشوائية (Random Forest). خوارزمية التدرج المعزز (Gradient Boosting). حان الوقت للأساليب الحديثة والكبيرة. تعدّ المجمعات والشبكات العصبية مقاتلان رئيسيان يمهدان طريقنا نحو التفرد في عملية التعلّم. واليوم ينتجون أكثر النتائج دقة ويستخدمون على نطاق واسع في جميع الأحداث. على الرغم من فعاليتها العالية إلا أن الفكرة الكامنة وراءها بسيطة للغاية. إذ تعتمد على أخذ مجموعة من الخوارزميات ذات الفعالية العادية، وتجبرها على تصحيح أخطاء بعضها بعضًا، فستكون الجودة الإجمالية للنظام أفضل من أفضل خوارزميات تعمل بطريقة منفردة. ستحصل على نتائج أفضل إذا أخذت أكثر الخوارزميات تقلبًا في النتائج، والّتي تتوقع نتائج مختلفة تمامًا في حالة حدوث ضوضاء صغيرة على بيانات الدخل. مثل خوارزميات أشجار القرار وأشجار الانحدار. هذه الخوارزميات حساسة للغاية، حتى أنه يمكن لقيمة شاذة واحدة خارجية مطبقة على بيانات الدخل أن تجعل النماذج يجن جنونها. في الحقيقة هذا بالضبط ما نحتاجه. هنالك ثلاث طرق لبناء المجمعات: طريقة التكديس (Stacking). طريقة التعبئة (Bagging). طريقة التعزيز (Boosting). سنشرح كلّ واحدٍ منهم على حدة: 1. طريقة التكديس (Stacking) تُمرر مجموعة من النماذج المتوازية كمدخلات للنموذج الأخير والّذي سيتخذ القرار النهائي. تَنتجُ هذه النماذج من تطبيق خوارزميات مختلفة وكلمة "مختلفة" تعني أي أن خلط تكديس نفس الخوارزميات على نفس البيانات لن يكون له أي معنى أو أهمية. وإن عملية اختيار الخوارزميات أمر متروك لك مطلق الحرية في اختباره. إلا أنه بالنسبة للنموذج المعني باتخاذ القرار النهائي، عادة ما يكون الانحدار خيارًا جيدًا لخوارزميته. 2. طريقة التعبئة (Bagging) وهي معروفة أيضًا باسم Bootstrap Aggregating. في هذه الطريقة نستخدم نفس الخوارزمية، ولكن ندربها على مجموعات فرعية مختلفة من البيانات الأصلية. في النهاية نحسب متوسط الإجابات فقط. يمكن أن تتكرر البيانات في مجموعات فرعية عشوائية. فمثلًا، يمكننا الحصول على مجموعات فرعية من المجموعة "1-2-3" مثل: "2-2-3" و"1-2-2" و"3-1-2" وما إلى ذلك. نستخدم مجموعات البيانات الجديدة هذه لتعليم الخوارزمية نفسها عدة مرات، ثمّ نتوقع الإجابة النهائية عن طريق خوارزمية البسيطة التصويت بالأغلبية. أشهر مثال على استخدام طريقة التعبئة هي خوارزمية الغابات العشوائية (Random Forest) والتي ببساطة تعبأ باستخدام أشجار القرار (الّتي سبق وأن وتحدثنا عنها في الفقرات السابقة). فمثلًا عند فتحك لتطبيق الكاميرا الخاص بهاتفك ورؤيتك لمربعات مرسومة حول وجوه الأشخاص فيجب أن تسأل نفسك، كيف حدث ذلك؟ في الحقيقة من المحتمل أن تكون هذه النتيجة بفضل خوارزمية الغابات العشوائية. وذلك لأن الشبكات العصبية بطيئة جدًا عند تشغيلها في الزمن الحقيقي (Real-time)، وبالمقابل تكون طريقة التعبئة مثالية بهذه الحالات لأنه يمكنها أن تبني أشجار القرار على جميع البطاقات الرسومية الضعيفة والقوية بل وحتى على المعالجات الجديدة الفاخرة الخاصة بتعلّم الآلة! في بعض المهام، تكون الاستراتيجية المتبعة هي التركيز على قدرة الغابة العشوائية على العمل بالتوازي مثلما يحدث عند استخدام الشبكات العصبية الاصطناعية أما طريقة التجميع لا تستطيع العمل بالتوازي، والبعض الآخر من التطبيقات تتطلب السرعة الّتي تستطيع تحققها طرق المجموعات بغض النظر عن أسلوب تطبيقها وتحديدًا في المهام الّتي تتطلب معالجة بالزمن الحقيقي. ولكنها في النهاية مسألة مفاضلة بين خياري الدقة أو السرعة وذلك بحسب كلّ مهمة. 3. طريقة التعزيز (Boosting) وهي الطريقة الّتي تعتمد على تدريب الخوارزميات واحدةً تلو الآخرى. وكلّ خوارزمية لاحقة تولي معظم اهتمامها لنقاط البيانات الّتي أخطأت الخوارزمية السابقة في تفسيرها. وتكرر هذه العملية إلى أن تصبح النتيجة مرضية. كما هو الحال في طريقة التعبئة، تستخدم الخوارزمية مجموعات فرعية متنوعة من بياناتنا ولكن هذه المرة لن نُنشئها بطريقة عشوائية. وإنما في كلّ عينة فرعية، نأخذ جزءًا من البيانات الّتي فشلت الخوارزمية السابقة في معالجتها. وبذلك نُنشئ خوارزمية جديدة لتتعلم كيفية إصلاح الأخطاء الموجودة في الخوارزمية السابقة. الميزة الرئيسية في طرق التجميع هي الدقة الممتازة بالموازنة مع الوقت المأخوذ، وتعد أسرع بكثير من الشبكات العصبية. تقريبًا الأمر أشبه ما يمكن بسباق بين سيارة وشاحنة على المضمار. يمكن للشاحنة أن تؤدي المزيد من الأفعال، ولكن في حال أردت أن تسير بسرعة فحتمًا ستأخذ السيارة. لالقاء نظرة على مثال حقيقي لاستخدام طرق التجميع (وتحديدًا طريقة التعزيز) افتح موقع فيسبوك أو موقع غوغل واكتب أي استعلام في مربع البحث. هل يمكنك سماع جيوش من الأشجار تزأر وتتحطم معًا لفرز النتائج حسب الصلة؟ ذلك بسبب أن هذه الشركات يستخدمون طريقة التجميع باستخدام التعزيز. حاليًا هناك ثلاث أدوات شائعة لتطبيق طريقة التعزيز، يمكنك قراءة هذا التقرير المفصل الّذي يوازن بينها CatBoost مقابل LightGBM مقابل XGBoost. الشبكات العصبية (Neural Networks) والتعلم العميق (Deep Leaning) الشبكات العصبية (Neural Networks) الشبكات العصبية: وهي عبارة عن مجموعة من الخلايا العصبية الاصطناعية الموجودة في طبقاتٍ متوضعةٍ فوق بعضها بعضًا، ولها طبقة أولية، وطبقة النهائية، تتلقى الطبقة الأولية المعلومات الخام، وتعالجها لتُمررها لاحقًا للطبقة الّتي تليها وهكذا إلى أن نحصل على الخرج من الطبقة النهائية. بعض أشهر تطبيقاتها العملية المستخدمة في وقتنا الحالي: تحديد الكائن في الصور ومقاطع الفيديو. التعرف على الكلام والتراكيب اللغوية. معالجة الصور وتحويل التنسيق. الترجمة الآلية. بالإضافة إلى أنه يمكنها أن تعمل عوضًا عن جميع تطبيقات طرق تعلّم الآلة السابقة. من بعض الهيكليات الشائعة للشبكات العصبية: الشبكات العصبية بيرسيبترون (Perceptron). الشبكات العصبية التلافيفية (CNN). الشبكات العصبية المتكررة (RNN). الشبكات العصبية ذات الترميز التلقائي (Autoencoders). إن أي شبكة عصبية اصطناعية هي في الأساس مجموعة من الخلايا العصبية الاصطناعية (Neurons) و الاتصالات (Connections) الّتي بينهم. وإن الخلية العصبية الاصطناعية: هي مجرد تابع لديه مجموعة من المدخلات وخرج وحيد. وتتمثل مهمة الخلية العصبية الاصطناعية في أخذ جميع الأرقام من مدخلاتها، وأداء الوظيفة المنوطة إليها وإرسال النتيجة للخرج. الاتصالات تشبه إلى حدٍ ما القنوات بين الخلايا العصبية الحقيقية. إذ تربط مخرجات خلية عصبية معينة لمدخل خلية عصبية أخرى حتى يتمكنوا من إرسال الأرقام والنتائج لبعضهم بعضًا. وكلّ اتصال له وسيط واحد فقط وهو الوزن (Weight). وهو مشابه لقوة الاتصال للإشارة. فعندما يمر الرقم 10 من خلال اتصال بوزن 0.5 يتحول إلى 5. هذه الأوزان تطلب من الخلية العصبية الاصطناعية أن تستجيب أكثر للدخل ذو الوزن الأكبر، وأقل للدخل ذو الوزن الأقل. تُعدل هذه الأوزان عند التدريب وهكذا تتعلّم الشبكة العصبية الاصطناعية. فيما يلي مثال لخلايا عصبية اصطناعية بسيطة ولكنها مفيدة في الحياة الواقعية: ستجمع جميع الأرقام من مدخلاتها وإذا كان هذا العدد أكبر من N فستُعطي النتيجة 1 وإلا ستعطي النتيجة 0. لمنع حدوث فوضى في الشبكة، ترتبط الخلايا العصبية بطبقات، وليس بطريقة عشوائية. لا ترتبط الخلايا العصبية داخل الطبقة الواحدة، وإنما تتصل بالخلايا العصبية للطبقات التالية والسابقة (الأعلى والأسفل). تتحرك البيانات في الشبكة العصبية الاصطناعية تحركًا صارمًا باتجاه واحد من مدخلات الطبقة الأولى إلى مخرجات الطبقة الأخيرة. إذا وضعت عددًا كافيًا من الطبقات ووضعت الأوزان بطريقة صحيحة، فستحصل على النتيجة المرجوة وإليك مثلًا يوضح الأمر، تريد أن تكتشف ما هو الرقم المكتوب بخط اليد في الصورة الممررة، ستمرر الصورة إلى الشبكة عن طريق مدخلات الطبقة الأولى، وبعدها فإن البكسلات السوداء ستُنشّط الخلايا العصبية المرتبطة بها، وهي بدورها ستُنشّط الطبقات التالية المرتبطة بها، وهكذا حتى يضيء أخيرًا المخرج المسؤول عن الرقم أربعة. إذا هكذا وصلنا للنتيجة المرجوة (سنأخذ هذا المثال بوضوح أكبر وبكلّ تفاصيله الدقيقة في الجزء الثاني من هذه السلسلة). في الواقع عند برمجة الخلايا العصبية على الحاسب لا نكتب عمليًا الخلايا العصبية والوصلات المرتبطة بها. وإنما يمثل كلّ شيء كمصفوفات وتحسب النتيجة بناءً على ضرب المصفوفات ببعضها بعضًا للحصول على أداء أفضل. يبسط هذا الفيديو كيف تحدث عملية التعلّم في الخلايا العصبية الاصطناعية، وكيف تحدد عملية الضرب دقة الشبكة العصبية الّتي لدي (لا تنس أن تغعّل خيار التعليقات التوضيحية لأن الفيديو مترجم إلى اللغة العربية). تحتوي الشبكة على طبقات متعددة لها روابط بين كلّ خلية عصبية تسمى الشبكات العصبية بيرسيبترون المتعددة (Multilayer Perceptron) وتسمى اختصارًا (MLP) وتعد أبسط بنية مناسبة للمبتدئين. بعد إنشاء الشبكة، ستكون مهمتنا هي تعيين الطرق المناسبة لتتفاعل الخلايا العصبية مع الإشارات الواردة بطريقة صحيحة. وسنُعطي الشبكة بيانات الدخل أو "مدخلات الشبكة العصبية" صورة الرقم المكتوب بخط اليد وبيانات الخرج أو "مخرجات الشبكة العصبية" ستكون الرقم الموافق للصورة المُمررة عبر مدخلات الشبكة. أي سنقول للشبكة "عدلي أوزانك بالطريقة الصحيحة حتى تستطيعين معرفة الصورة الممررة لك على أنها صورة للرقم 4". في البداية تُسند جميع الأوزان بطريقة عشوائية. بعد أن نعرض لها رقمًا معينًا، إذ تنبعث منها إجابة عشوائية لأن الأوزان ليست صحيحة حتى الآن، ونوازن مدى اختلاف هذه النتيجة عن النتيجة الصحيحة. ثم نبدأ في بالرجوع للخلف عبر الشبكة من المخرجات إلى المدخلات ونخبر كلّ خلية عصبية، لقد تنشطت هنا وأديت عملًا رهيبًا وهكذا. بعد مئات الآلاف من هذه الدورات "الاستدلال ثمّ التحقق ثمّ التغيير" المتتالية هناك أمل في أن تُصحح الشبكة العصبية أوزانها وتجعلها تعمل على النحو المنشود. الاسم العلمي لهذه المنهجية هي "منهجية الانتشار العكسي" (Backpropagation). يبسط هذا الفيديو كيف تَحدثُ عملية التعلّم بالتفاصيل الدقيقة في الطبقات المخفية وكيف تتعلم من أخطائها (مرة أخرى لا تنسَ أن تغعّل خيار التعليقات التوضيحية لأن الفيديو مترجم إلى اللغة العربية). يمكن للشبكة العصبية المدربة تدريبًا جيدًا أن تنوب عن عمل أي من الخوارزميات الموضحة في هذا الفصل (بل وغالبًا ما يمكنها أن تعمل بدقة أكثر منهم). وهذا ما جعلها شائعة الاستخدام على نطاق واسع. اتضح لاحقًا أن الشبكات الّتي تحتوي على عدد كبير من الطبقات تتطلب قوة حسابية لا يمكن تصورها آنذاك (عند بداية ظهور الشبكات العصبية). أما حاليًا فأي حاسوب مُخصص للألعاب يتفوق بالأداء على أداء مراكز البيانات الضخمة آنذاك. لذلك لم يكُ لدى الناس أي أمل في أن تصبح هذه القدرة الحسابية متوفرة ذلك الحين، وكانت فكرة الشبكات العصبية مزعجة بضخامتها. سنتاول في شرحنا أهم الهياكل المشهورة للشبكات العصبية في الوقت الحاضر. الشبكات العصبية التلافيفية (Convolutional Neural Networks) أحدثت بنية الشبكات العصبية التلافيفية والتي تدعى اختصارًا (CNN) ثورة في عالم الشبكات العصبية حاليًا. إذ تستخدم للبحث عن الكائنات في الصور وفي مقاطع الفيديو، كما تستخدم أيضًا للتعرف على الوجوه، وتحويل التنسيق، وتوليد وتحسين الصور، وإنشاء تأثيرات مثل التصوير البطيء وتحسين جودة الصورة. باختصار تستخدم بنية الشبكات العصبية التلافيفية في جميع الحالات الّتي تتضمن صورًا ومقاطع فيديو. يمكنك ملاحظة كيف استطاعت تقنيات تعلم الآلة الّتي طورتها شركة فيسبوك من تحديد الكائنات الموجودة في الصورة بدقة ممتازة. من أبرز المشاكل الرئيسية الّتي تواجهنا عند التعامل مع الصور هي صعوبة استخراج الميزات منها. على عكس سهولة الّتي نجدها عند التعامل مع النصوص، إذ في النصوص يمكنك ببساطة تقسيم النص بحسب الجمل، والبحث عن الكلمات ذات سمات معينة، وما إلى ذلك. ولكن في الصور الأمر أعقد من ذلك بكثير إذ يجب تصنيف الصور تصنيفًا يدويًا لكي تتمكن برامج تعلّم الآلة من معرفة مكان آذان القطط أو ذيولها في هذه الصورة المحددة والمنصفة. سميت هذه المنهجية لاحقًا باسم "صناعة الميزات يدويًا" وكان يستخدمها الجميع تقريبًا. ولكن الأمر لم يتوقف إلى هذا الحد فحسب وإنما ظهرت العديد من المشاكل مع منهجية صناعة الميزات يدويًا.فمثلًا في البداية إذا كانت تعرفت الشبكة العصبية على أذني القطة وأبعدت هذه القطة عن الكاميرا فنحن في مشكلة لأن الشبكة لن ترى شيئًا (بسبب تغيّر حجم أذن القطة). ثانيًا لنحاول تسمية 10 ميزات مختلفة تميّز القطط عن بقية الحيوانات الأخرى (في الحقيقة أنا أول من فشل في هذه المهمة)، ولكن مع ذلك عندما أرى نقطة سوداء تُسرعُ من جانبي أثناء تجولي في الشارع عند منتصف الليل - حتى لو لمحتها فقط في زاوية عيني - سأستطيع أن أحدد بأنها قطة وليست فأر. والسبب بسيط جدًا إذ لا شعوريًا يصنف دماغنا العديد من الميزات الخاصة بالقطط ولا ينظر إلى شكل الأذن أو عدد الأرجل فقط وذلك بدون أي جهد مني ولا حتى تفكير. وبناءً على ذلك سيصعب الأمر جدًا عند محاولتي لنقل هذه المعرفة إلى الآلة. لذا فهذا يعني أن الآلة ستحتاج إلى تعلّم هذه الميزات بمفردها، وإنشاء هذه الميزات اعتمادًا على الخطوط الأساسية للصورة. سننفذ ما يلي: سنقسم الصورة بأكملها إلى كتل ذات حجم 8×8 بكسل. سنخصص لكل نوع من أنواع الخطوط على الصورة رمزًا معينًا - سواء أكان الخط أفقيًا سيكون الرمز [-] أو رأسيًا سيكون الرمز [|] أو قطريًا سيكون الرمز [/]. يمكن أيضًا أن يكون العديد منها مرئيًا للغاية - وهذا يحدث ولذلك لسنا دائمًا على ثقة تامة. سيكون الناتج عدة جداول من الخطوط الّتي هي في الواقع أبسط الميزات الّتي تمثل حواف الكائنات على الصورة. إنها صور بمفردها ولكنها مبنية من الخطوط. وهكذا نستمر في أخذ كتلة ذات حجم 8×8 ونرى كيف تتطابق معًا. ونعيدها مرارًا وتكرارًا. تسمى هذه العملية بعملية الإلتفاف أو الطيّ (Convolution)، مستمدة هذا الاسم من تابع الطيّ المطبق فيها. يمكن تمثيل عملية الطيّ كطبقة من الشبكة العصبية، لأنه في نهاية الأمر يمكن لكلّ خلية عصبية أن تكون بمثابة تابع يؤدي أي وظيفة أريدها. عندما نغذي ونزود شبكتنا العصبية بالكثير من صور القطط، فإنها ستعيّن تلقائيًا أوزانًا أكبر لمجموعات الخطوط الّتي تتكرر كثيرًا في هذه النوع من الصور. لا تهتم الآلة ما إذا كان ظهر القطة خطًا مستقيمًا أو جسمًا هندسيًا معقدًا مثل وجه القطة، وبالمجمل ستكون بعض مجموعات الخطوط ستكون نشطة دائمًا. كمخرجات ستنظر هذه الشبكة العصبية الاصطناعية ذات البنية التلافيفية لأكثر المجموعات نشاطًا في هذه الصور وستبني عليها قرارها فيما إذا كانت الصور لقطة أو لكلب. يكمن جمال هذه الفكرة في أن الشبكة العصبية ستبحث عن الميزات الأكثر تميزًا للكائنات بمفردها. لسنا بحاجة لاختيارها يدويًا. يمكننا تزويد الشبكة بكمية كبيرة من الصور لأي كائن فقط من خلال البحث في غوغل عن مليارات من الصور المشابهة وهكذا سوف تنشئ شبكتنا خرائط مميزة من الخطوط وتتعلم كيفية تمييز أي كائن بمفردها. الشبكات العصبية المتكررة (Recurrent Neural Networks) تعدّ الشبكات العصبية المتكررة والتي يشار لها اختصارًا (RNN) من أكثر البُنى الهيكلية للشبكات العصبية الاصطناعية شيوعًا في وقتنا الحاضر. وذلك لفوائدها الجمّة إذ أعطتنا الكثير من الأشياء المفيدة مثل: الترجمة الآلية، والتعرف على الكلام، وتركيب صوت مميز للمساعد الشخصي مثل المساعد سيري (Siri). وعمومًا تعدّ هذه البنية من أفضل الخيارات الموجودة للبيانات التسلسلية مثل: الصوت أو النص أو الموسيقى. هل تذكر القارئ الصوتي الخاص الموجود في نظام التشغيل ويندوز إكس بي (Windows XP)؟ هذا الرجل المضحك يبني الكلمات حرفًا بحرف، محاولًا لصقها معًا. الآن وازن بين صوته وصوت المساعد الشخصي أليكسا الخاص بشركة أمازون، أو المساعد الشخصي الخاص بغوغل، فرق كبير بينهم، أليس كذلك؟ إنهم لا ينطقون الكلمات بوضوح فقط وإنما يضيفون لكنة خاصة مناسبة لهم! إليك هذا الفيديو اللطيف لشبكة عصبية تحاول أن تتحدث. كلّ ذلك لأن المساعدين الصوتيين الحديثين مدربون على التحدث على عبارات كاملة دفعة واحدة وليس حرفًا بحرف، يمكننا أخذ مجموعة من النصوص الصوتية وتدريب شبكة عصبية لإنشاء تسلسل صوتي أقرب إلى الكلام الأصلي. بمعنى آخر، سنستخدم النص كمدخل للشبكة العصبية الاصطناعية وصوت الشخص المجرّد كخرج لهذه الشبكة. نطلب من الشبكة العصبية إنشاء بعض الأصوات لنص محدد، ثم موازنته بالصوت الأصلي ومحاولة تصحيح الأخطاء للاقتراب قدر الإمكان من الصوت الأصلي المثالي. تبدو عملية التعلم بسيطة وكلاسيكية أليس كذلك؟ حتى الشبكات العصبية ذات التغذية المُسبقة تستطيع فعل ذلك. ولكن كيف يجب تعريف مخرجات هذه الشبكة؟ هل سيكون بلفظ كلّ عبارة ممكنة موجودة في اللغة الإنكليزية؟ بالتأكيد هذا ليس خيارًا جيدًا. هنا ستساعدنا حقيقة أن النص أو الكلام أو حتى الموسيقى؛ ما هي إلا تسلسلات من المعلومات. تتكون من وحدات متتالية (مثل المقاطع اللفظية للكلمات الإنكليزية). تبدو جميعها فريدة من نوعها ولكنها تعتمد على مقاطع سابقة. ألغِ هذا الاتصال بين هذه المقاطع وستحصل على مقطع موسيقي من نوع دبستيب (Dubstep). يمكننا تدريب الشبكة العصبية بيرسيبترون لتوليد هذه الأصوات الفريدة، ولكن كيف ستتذكر الإجابات السابقة؟ لذا تكمن الفكرة في إضافة ذاكرة خاصة لكلّ خلية عصبية اصطناعية، واستخدامها كمدخل إضافي عند تشغيل المقطع التالي. يمكن للخلايا العصبية أن تدون ملاحظات لنفسها مثل اكتشافها لحرفٍ متحرك، ولذلك يتوجب عليها أن تُظهر المقطع الصوتي التالي بنبرة أعلى (في الحقيقة إنها مجرد مقاربة بسطية للغاية). بهذه الطريقة ظهرت الشبكات المتكررة. كان لهذا النهج مشكلة كبيرة وهي عندما تتذكر جميع الخلايا العصبية نتائجها السابقة، يصبح عدد الاتصالات في الشبكة ضخمًا جدًا لدرجة أنه من المستحيل -من الناحية الفنية- ضبط جميع الأوزان. لذلك عندما لا تستطع الشبكة العصبية نسيان بعض الأشياء غير الهامّة فلن تتمكن من تعلّم الأشياء الجديدة (حتى نحن البشر لدينا نفس المشكلة نسيان بعض المعلومات غير الهامة، أو لعلّها ميزة؟ وخصيصًا إذا كانت هذه الأشياء هي ذكريات مؤلمة!). كان التحسين الأول بسيطًا جدًا وذلك بتحديد حجم معين لذاكرة الخلية العصبية الاصطناعية. لنقل بأن الشبكة ستحفظ آخر 5 نتائج فقط. ولكن أليست هذه الفكرة مناقضة للفكرة الأساسية الّتي انطلقنا منها (وهي تذكر ما تعلمته الشبكة بالكامل)؟ بعد تحديثاتٍ وتطويرات كثيرة جاء لاحقًا نهج أفضل بكثير، والّذي سيستخدم خلايا خاصة، تشبه إلى حدٍ ما ذاكرة الحاسوب. يمكن لكلّ خلية إمكانية تسجيل رقم معين أو قراءته أو إعادة تعيينه. وسميت هذه الخلايا بخلايا الذاكرة طويلة وقصيرة الأجل (LSTM). والآن عندما تحتاج الخلية العصبية إلى تعيين منبه لتذكر هذا المقطع، فإنها ستضع راية (Flag) في تلك الخلية. مثل "كان الحرف ساكنًا في الكلمة، استخدم المرة التالية قواعد نطق مختلفة". عندما لا تستدعي الحاجة لاستخدام الرايات، سيُعاد ضبط الخلية تاركة فقط الاتصالات "طويلة الأجل" للشبكة العصبية. وبعبارة أخرى، ستُتدربُ الشبكة العصبية ليس فقط لكي تتعلّم كيفية ضبط الأوزان وإنما لتتعلّم أيضًا كيفية ضبط الرايات (وهي أشبه ما يمكن بالمنبهات) في الخلايا العصبية. قد يبدو الحل بسيط جدًا ومع ذلك يعمل بكفاءة عالية. لكن ماذا لو دمجنا إمكانية تعديل مقاطع الفيديو باستخدام الشبكات العصبية التلافيفية (CNN) مع إمكانية تعديل الصوت باستخدام الشبكات العصبية المتكررة (RNN) على ماذا سنحصل؟ هل حقًا سنحصل على الرئيس السابق للولايات المتحدة الأمريكية؟ إليك هذا الفيديو لتكتشف الأمر. التعلم العميق (Deep Learning) إذا أردنا أن نختصر التعلم العميق بجملة واحدة وواحدة فقط ستكون حتمًا: "التعلّم العميق هو شبكة عصبية اصطناعية كبيرة". من بعض التطبيقات العملية للتعلم العميق: التعرف على الصور والأصوات. تحليل بيانات الأرصاد الجوية. تحليل بيانات الأبحاث البيولوجية. مجال التسويق واختيار الجمهور المستهدف من الإعلانات. من بعض الهيكليات الشبكة العصبية الاصطناعية المستخدمة بكثرة في التعلّم العميق نجد: شبكات بيرسيبترون متعددة الطبقات (Multilayer Perceptron Networks). الشبكات العصبية التلافيفية (Convolutional Neural Networks). الشبكات العصبية المتكررة ذات الذاكرة قصيرة وطويلة الأمد (Long Short-Term Memory Recurrent Neural Networks). والعديد من البنى الأخرى للشبكة. بعد بناء العلماء والباحثين للعديد من البُنى (المعماريات) الخاصة بالشبكات العصبية في محاولة منهم للعثور على البنية الأنسب لاكتشاف الأنماط في البيانات، ومن بين أبرز هذه البُنى (المعماريات) كانت البنية الخاصة بالشبكة التعلم العميق، ويذكر أن أول مرة ظهر فيها مفهوم التعلم العميق كان في عام 2006، وعرفت في ذلك الوقت على أنها مجال فرعي من مجالات تعلّم الآلة (مع أنها تندرج تحت نفس فئة الشبكات العصبية)، إلا أنها لاقت الاهتمام الواسع عندما طبق جيفري هينتون وزملائه بنية الشبكة الخاصة بالتعلّم العميق في مسابقة ImgNet وحققوا آنذاك نتائج مبهرة، إذ استطاعوا تحقيق دقة أفضل بـ10% من البُنى القديمة في التعرف على الصور. بعد هذا النجاح المدوّي استطاعت بجدارة لفت الأنظار حولها وبدأت بالظهور العديد من التطبيقات والأبحاث الجديدة الخاصة بالتعلم العميق، مما أدى إلى تطورها تطورًا كبيرًا، كما أنها أثببت جودتها بتحقيقها نتائج مذهلة في العديد من التطبيقات، وبذلك أوجدت لنفسها مكانة لا يستهان بها في مجال الذكاء الصنعي عمومًا ومجال تعلم الآلة خصوصًا. يعتمدُ مفهوم التعلم العميق في أساسه على طريقة تعلّم مؤلفة من عدّة طبقات من التمثيلات المقابلة لبنيةٍ هرمية من السمات، ويتم تعريفُ السِّمات والمفاهيم عالية المستوى نزولًا إلى المفاهيم ذات المستوى الأدنى، وهي تعمل أيضًا نمط التعلم الموجه وغير الموجه إلا أنها تعمل عملًا ممتازً مع البيانات المصنفة (أي مع التعلّم الموجّه). إن للتعلم العميق علاقة وطيدة مع البيانات إذ لا بدّ من الحصول على كميات كبيرة من البيانات إذا أردنا استخدام هذا النوع من التعلّم. ومع ازدياد البيانات سوف تتحسن الدقة تحسنًا كبيرًا مما سيؤدي لنتائج أفضل في نهاية المطاف. الفرق بين الشبكات العصبية والتعلم العميق في الحقيقة إن التعلم العميق ما هو إلا بنية مخصصة من الشبكات العصبية، ولكنها سميت بالتعلم العميق نسبة إلى عدد الطبقات الّتي تحتويها هذه البنية الشبكية، وبما أنها أكبر من عدد الطبقات الخاصة بالشبكات العادية آنذاك فلذلك سُميت بهذا الإسم. تكمن قوة التعلم العميق في إمكانيته في تعلّم الميزات (Features) بطريقة هرمية، أي تتعلّم التسلسل الهرمي للميزات انطلاقًا من ميزات من مستوى عالٍ مرورًا بميزات بمستوى أخفض وهكذا إلى أن نصل لآخر الميزات ذات المستوى الأدنى، مما يعطي لأسلوب التعلم هذا مستوًى جديدًا من التجريد للنظام وخصوصًا مع الوظائف والمفاهيم المعقدة من خلال بنائها من المفاهيم الأبسط فالأبسط. من الشكل السابق نلاحظ كيف أن التعلم العميق يستطيع تعلم التمثيلات الهرمية للبيانات. الّتي تربط المدخلات مع المخرجات مباشرة من البيانات دون الاعتماد على الميزات الّتي حددها الإنسان. أي تستطيع استنتاج كميات كبيرة من الميزات ومحاولة تحليلها وبطها بالصورة الكاملة للمشكلة. يطلق على هذا النوع من طريقة تعلّم الميزات الخاصة بالبيانات بتعلم الميزات (Feature learning). ومن بين أبرز الطفرات العلمية الّتي شهدها التعلم العميق كان على يد شركة ديب مايند (والتي استحوذت عليها شركة ألفابت)، إذ استطاعت شركة ديب مايند أن تدمج بين التعلم العميق مع التعلم المعزز من أجل حلّ المشاكل المعقدة مثل لعب الألعاب. أطلقوا لاحقًا على طريقتهم هذه اسم شبكات التعلم المعزز العميق (Deep Q-Network)، بعدها اصبح التعلّم العميق في أغلب البنى الخاصة بالشبكات العصبية. ومن الملاحظ مما سبق أن طريقة التعلم العميق تتطلب أجهزة حاسب قوية جدًا، وذلك لأنها تتعامل مع كميات كبيرة من البيانات. هنالك العديد من البنى الخاصة بالشبكات العصبية لدرجة أننا نحتاج لكتاب كامل لتغطية كافة أنواعها ومميزاتها وسلبياتها وطرق عملها ..إلخ، إلا أنه وبما أنك استطعت تعلم الأساسيات فحتمًا ستستطيع تعلم أصعب البنى الشبكية، ولإعطاء نظرة دقيقة للأمر إليك الصورة التالية: كما يمكنك ايضًا الرجوع إلى هذا المقال لمزيد من المعلومات. دورة تطوير التطبيقات باستخدام لغة Python احترف تطوير التطبيقات مع أكاديمية حسوب والتحق بسوق العمل فور انتهائك من الدورة اشترك الآن الخلاصة بعد تعرفنا على أهم الأساسيات الخاصة بتعلّم الآلة، وكيف تختلف عن بعضها بعضًا، وما هي النقاط الّتي يجب علينا التركيز عليها عند اختيارنا لطريقة ما على حساب الأخرى، وتعرفنا أخيرًا على الشبكات العصبية والتعلم العميق، لا بدّ لنا من أن نسأل أنفسنا، ما هي المشاكل الّتي يُواجهنا هذا المجال؟ ما نوع هذه المشاكل؟ وكيف نستطيع تجاوزها؟ في مقالنا القادم سنحاول الإجابة على هذه الأسئلة ونتعلم أيضًا بعض الأمور المهمة والّتي ستساعدنا في المضي قدمًا في هذا المجال. المراجع مقال Machine Learning for Everyone. كتاب Hands on Machine Learning with Scikit Learn Keras and TensorFlow الطبعة الثانية. مقال What is Deep Learning?. اقرأ أيضًا المقال التالي: تعلم الآلة: التحديات الرئيسية وكيفية التوسع في المجال المقال السابق: الذكاء الاصطناعي: مراحل البدء والتطور والأسس التي نشأ عليها النسخة الكاملة من كتاب مدخل إلى الذكاء الاصطناعي وتعلم الآلة
  3. هذا المقال جزء من سلسلة «مدخل إلى الذكاء الاصطناعي»: الذكاء الاصطناعي: أهم الإنجازات والاختراعات وكيف أثرت في حياتنا اليومية الذكاء الاصطناعي: مراحل البدء والتطور والأسس التي نشأ عليها المفاهيم الأساسية لتعلم الآلة تعلم الآلة: التحديات الرئيسية وكيفية التوسع في المجال يمكنك قراءة السلسلة على شكل كتاب إلكتروني بالانتقال إلى صفحة الكتاب، مدخل إلى الذكاء الاصطناعي وتعلم الآلة. لا يكاد يمضي يوم إلا ونسمع فيه ظهور اختراع جديد من هنا، وقفزة علمية من هناك، أمسى عالم الذكاء الاصطناعي والآلات المتثِّملة بالتكنولوجيا عنصرًا أساسيًا في حياتنا تُشاركنا يومياتنا وتساعدنا في معظم أعمالنا ومهامنا سواء السهلة منها أو الصعبة بل أصبحت جزءًا لا يتجزّأ من شخصيتنا وذواتنا إلى درجة أنه يصعب علينا تخيل الحياة من دونها. لم يقتصر الأمر على ذلك فقط، وإنما تعدى الأمر لأبعد من ذلك بكثير إذ أضحت هذه التكنولوجيا تعرِفُ عنا أضعاف ما نعرفهُ عنها. وفي حضرة هذا الإنغماس التقني تتلاشى حدود الخصوصية، وتتكسر جدارن التفرّد الإنساني بقوة أمواج التطفل التكنولوجي، مُمثّلة بتطبيقات مثل فيسبوك وغوغل -وما شابهها- تراها من وجهها المُعلن مفيدة ولطيفة إلا أن لها وجهًا مخفيًا آخر يصعب تصديقه. لتتحول بذلك جميع معلوماتنا وصورنا واهتماماتنا وقائمة أصدقائنا لمجرد قيم رقمية محصورة بين الصفر أو الواحد! ولكن دعونا لا نركز على الجوانب السلبية فقط ولنأخذ نصف الكأس الممتلئة، فمن المعيب أن نحسب كل تقنية علينا هي عدوٌ محتمل أو براثن احتلال فكري أو اقتصادي وما إلى ذلك. وهنا ستطفوا أسئلة لا يمكننا التغاضي عنها أو تجاوزها. من بين هذه الأسئلة، هل استطعنا حقًا الاستفادة من كلّ هذه التكنولوجيا؟ هل طغت الجوانب السلبية للتكنولوجيا على جوانبها الإيجابية؟ وإلى أي مدى استطاعت هذه التكنولوجيا أن تساعدنا؟ وهل يمكن للآلة أن تزيد من ذكائها بما يُعرفٌ بتقنيات الذكاء الاصطناعي وتعلّم الآلة وما إلى ذلك من هذه المصطلحات الرنانة؟ بل السؤال الأهم هنا هل حقًا يمكننا بناء الثقة في قراراتها واستنتاجاتها؟ أم أن الآلة هي الأخر تخطئ مثلما يخطئ أي إنسان؟ وأخيرًا هل نحن نشهد حاليًا إتحاد قوة الآلات مع الإنسان في أبهى حلّة لتشكيل ما يُعرفُ في بعض الأفلام سايبورغ؟ أم أننا نشهد تجريد الإنسان من خصوصيته وبعضًا من حقوقه الأساسية وتخميد أفكاره وتهميشها وجعلها مجرد منشور عابر تتحكم فيه خوارزميةٌ ماديةٌ بحتة تُعلي من قيمة الإعجاب أو التعليق أكثر من قيمة المنشور بحد ذاته أو الفكرة الكامنة وراءه؟ في الحقيقة وعلى الرغم من كثرة الأخطار المترتبة على خصوصية الفرد بكلّ تقنية جديدة، إلا أنه لا بدّ لنا بأن نعترف أن لهذه التكنولوجيا فضلًا كبيرًا في تطور الكثير من المجالات والعلوم المادية والنظرية وأثرها الّذي سيمتدُ لأجيال وأجيال وتحقيقها لأشياءً كثيرة لم نكن لنحلم بها أو نتخيّلها من قبل. ومع هذه المميزات الرائعة لا بد أن يكون لها وجه آخر وجهٌ سيء تتشارك به هذه التكنولوجيا مع كل الاختراعات القديمة كانت أو الحديثة وجهٌ نابع من الشرّ الإنساني الموجود فينا لبسطِ سيطرتنا ونفوذنا على أقراننا من البشر، وما هذه التكنولوجيا أو التقنيات الحديثة إلا مجرد أدوات جديدة بإمكانيات مذهلة نستطيع من خلالها خدمة البشرية أو تدميرها، وأما هي بحد ذاتها فليس لها أي نية خبيثة للنيل منا أو للسيطرة علينا ففي نهاية المطاف نحن من برمجناها! وفي إطار سعينا للاستفادة بأكبر قدرٍ من الإمكان من أي تقنيةٍ أو اختراعٍ جديد سنتجاهلُ الجانب السلبي وسنحاول التركيز فقط على الجانب الإيجابي. ولذلك سنسلطُ الضوء في هذه السلسلة على فرع جديد -نسبيًا-من العلوم الحديثة ألا وهو الذكاء الاصطناعي وتحديدًا تعلّم الآلة لما له من فوائد كبيرة وإمكانيات هائلة ومذهلة، والّتي شهِدناها في السنوات السابقة وسنشهدُ حتمًا أكثر منها في السنوات اللاحقة. ولكي لا نُطيل في المقدمات إليكم أهم التطبيقات الإنجازات العلمية والعملية للذكاء الاصطناعي وتعلّم الآلة وكيف لهذه التقنيات أن تساعدنا في مجالات حياتنا اليومية. جدول المحتويات إنجازات الذكاء الاصطناعي في مجال مهام الحياة اليومية اكتشاف الكائنات في الصور الترجمة بين اللغات باستخدام الذكاء الاصطناعي التحدث بصوت خام وحقيقي التعرف على المشاعر من خلال الصوت التعرف على المشاعر من خلال الصور اختيار جزء من فقرة تجيب على سؤالك إنجازات الذكاء الاصطناعي في مجال السفر والتجوال تصفح خريطة مترو أنفاق لندن قدرة الآلة على قيادة سيارة بالاستعانة تطيير طائرات الدرون باستخدام الذكاء الاصطناعي توقع ازدحام مواقف السيارات بحسب المنطقة إنجازات الذكاء الاصطناعي في المجال الطبي والخدمات الصحية تقنية جديدة تمكن البكم من الكلام تزويد المكفوفين بأعين اصطناعية التعرف على اعتلال الشبكية السكري (سبب رئيسي للعمى) من صور الشبكية الكشف عن أمراض السرطان بالاستعانة بالذكاء الاصطناعي تصنيع أدوية جديدة بالكامل بالاعتماد فقط على الذكاء الاصطناعي تتبع حالتك الصحية وأنت في المنزل بتقنيات الذكاء الاصطناعي لا حدود لإمكانيات الذكاء الاصطناعي الخلاصة دورة الذكاء الاصطناعي احترف برمجة الذكاء الاصطناعي AI وتحليل البيانات وتعلم كافة المعلومات التي تحتاجها لبناء نماذج ذكاء اصطناعي متخصصة. اشترك الآن إنجازات الذكاء الاصطناعي في مجال مهام الحياة اليومية اكتشاف الكائنات في الصور لطالما شاهدنا السباق المتسارع بين الشركات على أتمتة مهامها وخطوط انتاجها في سعي حثيث منها للاعتماد على الآلة بدلًا من البشر نظرًا للفوائد الكبيرة الّتي ستجنيها من هذا الاعتماد، إذ لا تتطلب الآلة زيادة أجر سنوية، ولا تتذمر من كثرة العمل الإضافي، بل مع كلّ ذلك تستمر بالحفاظ على جودة الإنتاج ودقته، وكلّ متطلبات هذه الآلات جرّاء ما تقدمه هو عملية صيانة دورية بسيطة لتستمر فيها بخدمة تلك الشركات. إنها حقًا الموظف المثالي الّذي يحلم به جميع اصحاب المشاريع. إلا أن الدور الّذي تقدمه هذه الآلات بسيط للغاية، ويعود السبب في ذلك لقصورها من عدة نواحي إذ لا يمكنها فهم أو تمييز ما تراه، ولا تستطيع أن تتخذ قرار من تلقاء نفسها بناءً على ما رأته، عدا عن الأسباب الأخرى التي لا حصر لها الّتي تساعد على تشكل الوعي لدى هذه الآلة، وقد لاحظ كثير من الباحثين أنه إذا أردنا أن نؤتمت مهامًا كثيرة لا بد لنا من تطوير النظام البصري الخاص بالآلات (والّذي يعرف حاليًا بالرؤية الحاسوبية). شهد مجال الرؤية الحاسوبية (computer vision) كثيرًا من التطورات النوعية كما أضاف الذكاء الاصطناعي المزيد على هذا التطور كان من أبرزها أمكانيته في أكتشاف الكائنات في الصور، أي أن تجعل الآلات قادرة على معرفة ماهيّةَ ما تشاهده. إنه في الحقيقة لشيئ رائع لأننا نستطيع بذلك معرفة تصرفات هذا الكائن، وهل يقوى هذا الكائن الّذي تراه الآلة على الحركة أم أنه مجرد شجرة؟ أم أنه إنسان يستطيع الحركة؟ أم أنه مجرد آلة آخرى؟ وهنا لا بدّ لنا من تغيير تسمية الآلة إلى روبوت -إنسان آلي- وذلك بسبب كمية الحواس البشرية الّتي استطعنا تزويده بها فلذلك استحق هذه التسمية عن جدارة. ولكن كيف سيستطيعُ هذا الروبوت أن يعرف أن أمامه إنسان وهو يراه مجرد بكسلات تحوي قيم لونية معينة؟ فأين يبدأ جسم الكائن بين كلّ هذه البكسلات وأين ينتهي؟ ولنفرض أننا استطعنا أن نجعل الروبوت يتعرف على هذا الكائن؟ ماذا لو غيرنا حجم الصورة المدروسة أو ألوانها أو درجة حتى درجة سطوعها هل يا تُرى سيستمرُ هذا الروبوت في تمييز هذا الكائن أم لا؟ تعتمد معظم أنظمة اكتشاف الكائنات في الصور على الشبكات العصبية الاصطناعية والّتي تحتوي على الكثير من الطبقات الداخلية المخفية، وتختص كلّ طبقة من هذه الطبقات بمهمة معينة، فمثلًا تختص الطبقة الأولى بتحديد الحواف والهياكل الهندسية الخارجية للكائن، ومن ثمّ تُمرّرُ هذه الطبقة نتائجها إلى الطبقة التالية، والّتي تعمل على مستوى آخر من التفاصيل، مثل أن تكون مختصة بتحديد الألوان والتدرجات اللونية ومقارنتها بما تعلمته وما تدربت عليه سابقًا، ومن ثمّ تُمرّرُ هي الأخرى نتائجها إلى الطبقة التالية، وهكذا دواليك إلى أن تكتمل المعلومات الخاصة بالصورة، ويصل النظام إلى نتيجة نهائية مع الطبقة الأخيرة، وبذلك يستطيع تحديد ما هو الكائن الموجود في الصورة بدقة معينة. كانت شركة مايكوسوفت من أوائل الشركات الّتي دخلت هذا المجال وأنجزت فيه ولكن ما لبثت إلى أن لحقتها جميع الشركات، بل وبعض الشركات سبقتها بمراحل مثل شركة فيسبوك. في يومنا الحالي لا يكاد يخلو أي روبوت من منظومة الرؤية الحاسوبية بمختلف تطبيقاتها، من بينها نظام اكتشاف الكائنات، ولم يقتصر الأمر على ذلك فحسب بل وأصبحت نظامًا مدمجًا بالكاميرات الحديثة في الهواتف النّقالة لننتقل بذلك إلى خطوة جديدة متقدمة في عالم الرؤية الحاسوبية ومزيدًا من الإمكانيات للروبوتات والذي سيؤدي في نهاية المطاف إلى كثرة الاعتماد عليها مستقبلًا. الترجمة بين اللغات باستخدام الذكاء الاصطناعي لطالما كان نقل المعرفة من لغة إلى أخرى عملية شاقة ومجهدة، وتحتاج إلى جيوش من المترجمين والمدققين والكتّاب أيضًا، ولطالما كان حاجز اللغة هو الحاجز الأساسي الموجود في جسر التواصل بين الشعوب، بل وغالبًا ما يرتبط عدد اللغات المحكية في دولةٍ ما بمستوى انغلاق ثقافة هذه الدولة أو انفتاحها. ولطالما حاولت بعض الشركات مثل غوغل وفيسبوك في تطوير أنظمة الترجمة في إطار سعيها لهدم هذا الحاجز، إلا أن معظم هذه المحاولات كانت خجولة ولا ترتقي إلى الترجمة البشرية. ولكن هذا الحال لم يدم طويلًا فمع تقدم الذكاء الاصطناعي وإمكانياته غير المحدودة فكان لا بد من هذه الشركات من إعادة النظر في الحلول أُتيحت من خلال الذكاء الاصطناعي ومحاولة تعظيم الاستفادة منها. وفعلًا كان ذلك، بفضل طريقة التعلّم العميق (Deep Learning) -وهي جزء من طرق تطبيق الذكاء الاصطناعي- إذ أحدثت هذه الطريقة نقلة نوعية في الترجمة. ساهم تطبيق طرق التعلّم العميق في الترجمة الّتي تقدمها عملاقة الانترنت شركة غوغل (التابعة للشركة الأم ألفابت) في خفض معدل الخطأ بمقدار 60% بحسب تصريح الشركة. كما أوضحت أنها ستعتمدُ على هذه التقنية بالكامل في ترجمتها. أطلقَ عليه لاحقًا اسم نظام الترجمة الآلية العصبية (Neural Machine Translation system) ويدعى اختصارًا NMTS وصرح كوك لي -عالم حاسوب وأحد مطوري نظام NMTS - أن عمليات الدخل والخرج للنظام بأكمله تكون عبر شبكة عصبية واحدة. يتعلم هذا النظام الترجمة من خلال تحليل الترجمات الموجودة في خطابات الأمم المتحدة والبرلمان الأوروبي، وعند تمريرها عبر الشبكة العصبية تتعدل الاتصالات الموجودة بين الخلايا العصبية الاصطناعية بهدف تحسين الترجمة النهائية. وهي تحلل الجمل عن طريق تقسيم كلّ كلمة فيها إلى أجزاء مقطعية (أجزاء الكلمة باللغة الإنكليزية)، وتتحد هذه الأجزاء بطريقة ما داخل الشبكة العصبية مشكلةً المعنى، وهي طريقة مستمدة من طريقة اكتشاف الكائنات في الصور من خلال تقسيم الصورة لبكسلات وتحليل هذه البكسلات بطريقة معقدة جدًا لاستخراج ميزات معقدة (complex features) مثل الحواف والأنماط الهندسية وما إلى ذلك. يسلط هذا النجاح الضوء على أهمية تقنيات التعلّم العميق ونجاحه في مساعدتنا في التغلب على مشاكل أنظمة الترجمة الّتي عانينا منها لسنوات. ويعتقد شميد هوبر -عالم حاسوب في جامعة لوغانو- أن الآلات ستستطيعُ محاكاة طريقة البشر في الترجمة أو حتى هزيمتهم في حال تمكنها من الجمع بين المدخلات الحسية المختلفة، فمثلًا في المستقبل لن يرى الحاسوب جملة "سقطت القطة من الشجرة" وإنما سيُشاهد فيديوهات لقططٍ تسقط من الأشجار، وسيتحكمُ في روبوتات آلية آخرى يمكنها رؤية القطط وسماعها والشعور بالألم من خلال أجهزة استشعار الألم، لتنقل هذه التجارب إلى النظام ويعالجها ويربطها جميعًا بالنصوص المترجمة. التحدث بصوت خام وحقيقي إن السماح للأشخاص بالتحدث مع الآلات هو حلمٌ لطالما راودنا لكثير من الوقت حلمُ التفاعل بين الإنسان والحاسوب بالصوت. وعندما ظهرت قدرة الحواسيب على فهم الكلام الطبيعي من خلال استخدام الشبكات العصبية العميقة (مثل تقنية البحث من خلال الصوت في غوغل) أحدث ذلك ثورة في السنوات القليلة الماضية، إلا أن توليد الكلام من خلال الحاسوب (أو عملية تحويل النص إلى كلام والّتي يرمّز إليها عادةً TTS) لم يشهد تطورًا كبيرًا، وذلك بسبب ضعف قدرته على نقل المشاعر أثناء الكلام وهو من أجمل الميّزات التي يمكن للمرء أن يفكر بها عند سماعه لصوت طبيعي، وتكمن المشكلة في الاعتماد على توليد الكلام من خلال تقنية تحويل النص إلى كلام بطريقة تسلسلية، إذ تعتمد هذه التقنية على تسجيل قاعدة بيانات كبيرة جدًا من أجزاء الكلام القصيرة المكونة من وِحدة واحدة، وثمّ إعادة تركيبها لتكوين كلمات متكاملة مما سيُصعبُ مهمة تعديل الصوت بدون تسجيل قاعدة بيانات جديدة كاملة وهذا ما شكلّ مشكلة حقيقة في هذا التقنية. ولكن كان لشركة ديب مايند (المملوكة من قِبل شركة غوغل) رأي آخر، إذ استطاعت هذه الأخيرة من بناء نظام قادر على توليد صوت خام وحقيقي ليحاكي أي صوت بشري، وبذلك يكون الصوت الناتج عن هذا النظام أفضل من أفضل أنظمة تحويل النصوص إلى كلام (Text-to-Speech) الحالية. مما يقلل الفجوة بين أداء صوت الآلة والصوت الطبيعي بمقدار 50%. أن الطريقة التي اتبعتها شركة ديب مايند كانت أكثر تقدمًا من الطرق القديمة إذ اعتمدت على على نمذجة الصوت الخام، وهو أمر لطالما تجنبه الباحثون في هذا المجال بسبب سرعة تدفق الكلام (عادة 16000 عينة في الثانية أو أكثر). كما أنها اعتمد على الشبكات العصبية التلافيفية بالكامل (Fully Convolutional Neural Network). ومن أجل استخدام الصوت الذي يولده نظام WaveNet كان لا بد من تحويل النص إلى كلام، إذ تحول النصوص إلى سلسلة من الميّزات اللغوية والصوتية (الّتي تحتوي على معلومات حول الصوت الحالي، والمقطع اللفظي، والكلمة، وما إلى ذلك من مميزات الكلمات بحسب اللغة) وتدخلُ هذه المعلومات إلى نظام WaveNet. وبالتالي إن تنبؤات الشبكة ليست مشروطة فقط بالعينات الصوتية السابقة، وإنما بالنص الذي نريد أن تنطقه. كما أن هذا النظام استطاع توليد ميزات إضافية للصوت مثل: التنفس أثناء الحديث، ومحاكاة حركات الفم مما يعطي مرونة أكبر لنموذج الصوت الخام بل وحتى أيضًا يمكنه محاكاة اللهجات واللكنات والعواطف. يفتح نظام WaveNets الكثير من الفرص والأفكار حول طريقة استغلال هذه التقنية لتحقيق أقصى درجة من الأستفادة المالية للشركات الكبيرة وحتى للشركات الناشئة أيضًا، فمثلًا إن فكرة استبدال المعلقين الصوتيين (Voice Over) بنظرائهم الآليين ستكون فكرة رائعة ومستدامة ومستقرة أكثر من استئجار معلقيين بشريين، أو ميزة قراءة الأخبار لبعض الأشخاص الّذين يعانون من عسر القراءة أو للأشخاص المشغولين بقيادة السيارة أو للنساء المشغولات بالأعمال المنزلية، كما يمكننا استخدامها أيضًا لقراءة النصوص للأشخاص الّذين يتعلمون لغاتٍ جديدة ليحاكي طريقة النطق البشري مضيفًا بذلك سهولة ملحوظة برحلة التعلم ونقطة إضافية في رصيد هذا النظام. وبذلك سيفتحُ بابٌ جديدٌ للشركات بخفض تكاليفها، وزيادة شعبيتها، وتعظيم إيراداتها وهو الهدف الرئيسي والمشترك لكلّ الشركات. التعرف على المشاعر من خلال الصوت مع تزايد الأجهزة القابلة للارتداء وانتشار إنترنت الأشياء (Internet of Things)، وحقيقة أن الهواتف المحمولة أصبحت من الأمور الأساسية لكلّ شخص، والانتشار المتزايد لمختلف الأجهزة الأخرى الّتي تستطيع التواصل مع البشر من خلال الصوت، كالمساعدين الشخصيين في الهواتف مثل: المساعد الشخصي سيري (Siri) الخاص بأجهزة أبل، والمساعد الشخصي أليكسا (Alexa) الخاص بأجهزة أمازون، والمساعد الشخصي كورتانا (Cortana) الخاص بأجهزة مايكروسوفت، فكان لا بدّ من جعل الأنظمة الصوتية أذكى ليس فقط على مستوى فهم الكلام المنطوق فحسب؛ وإنما لفهم المشاعر المترابطة مع هذا الكلام لكي تستطيع تحليل ردات فعل من تتحدث معه وقياسها ومعرفة ما هو التصرف الصحيح المناسب لكلّ ردة فعل وبناء أنظمة ذكية تستفيد من ذلك. تسابقت العديد من الشركات للدخول في هذا المجال وكان أبرزها شركة Empath اليابانية وشركة أمازون الأمريكية وشركة Affectiva الأمريكية المنبثقة من معهد ماساتشوستس للتكنولوجيا، واستطاعت هذه الأخيرة إطلاق شبكة عصبية قادرة على تحليل الغضب من البيانات الصوتية في أقل من 1.2 ثانية متجاوزة بذلك قدرة البشر على إدراك الغضب من الصوت وسمي هذا النظام لاحقًا SoundNet. يعتمد هذا النظام على الشبكات العصبية التلافيفية بالكامل (Fully Convolutional Neural Networks) لتصنيف الأصوات من خلال تحليل التغيرات في تماثل الكلام ونبرة الصوت وإيقاعه وجودته لتمييز حالات الكلام والمشاعر وجنس المتكلم. إن العناصر الأساسية والمعيارية المتبعة في هذا النظام هو القدرة على تمكين التطبيقات والأجهزة لإدراك مشاعر البشر في الزمن الحقيقي (Real-time) للحدث. إن التطبيقات العملية كثيرة لمثل هذه الأنظمة إذ يمكنها مساعدتنا في اكتشاف العلامات المبكرة للخرف أو النوبات القلبية، وإمكانية جعل المساعدين الشخصيين أكثر جاذبية واستجابة بمعرفتها مشاعر للمتحدث، ومن خلال تعلم هذه الأنظمة من أخطائها ستضيف بذلك ميزة جميلة أرى في رصيد هذه الأنظمة، كما يمكن لهذه الأنظمة مساعدة مندوبي خدمة العملاء في معرفة مشاعر الزبائن بل إن شركة Empath اختبرت ذلك إذ نشرت خدماتها في مراكز خدمة العملاء (call centers) وصرحت الشركة بأنها خفّضت بهذه التقنية وقت العمل الإضافي للعاملين في المركز بمقدار 20% مع تعزيز معدل تحويل المبيعات (Sales Conversion) -والّذي يشير إلى معدل تحول الزوار أو العملاء المحتملين إلى عملاء حقيقيين- بمقدار يقارب 400%، كما أن شركة Empath دخلت في شراكة مع شركة الألعاب بوكو (Bocco) لإنشاء رسائل متحركة تفاعلية للكشف عن مشاعر اللاعبين الأطفال، كما دخلت نفس الشركة أيضًا في شراكة أخرى مع شركة Utaka لإنتاج مصباح يتدرج ألوانه بطريقة تتوافق مع المشاعر الأشخاص. على الرغم من هذا التقدم الحاصل في هذا المجال إلا أنه ماتزال الآلات تواجه صعوبة في الكشف عن المشاعر الحقيقية بدقة عالية ولم يرقَ أيّ نظام آلي إلى مستوى أداء المتخصصين البشر في اكتشاف جميع المشاعر الإنسانية، إلا أنه وبكل الأحوال مهما تكن الخطوة التالية لهذه التقنية فحتمًا ستكون مثمرة فوفقًا لدراسة نشرتها شركة الأبحاث Allied Market Research يمكن أن تصل قيمة هذا السوق إلى 33.9 مليار دولار على مستوى العالم في عام 2023 مدفوعًا بارتفاع شعبية الأجهزة المدارة بالصوت. التعرف على المشاعر من خلال الصور كانت الكاميرات لسنوات عديدة جزءًا من حياتنا وساعدتنا كثيرًا في مجال الحماية والآمن، ولا زالت حتى الآن تساعدنا. إذ يمكننا من خلالها مراقبة الموظفين في الشركة، ومراقبة المصانع لحمايتها من السارقين، ورصد المخالفات المرورية في الطرقات، ومراقبة المنزل أثناء غياب أصحابه، ومراقبة المدارس، والعديد من الأستخدامات الأخرى المفيدة جدًا لهذه التقنية، ولكن بعد بزوغ عصر الذكاء الاصطناعي لوحظ أن هذا المنجم الذهبي من المعلومات القادم من هذه الكاميرات والمتاح منذ عشرات السنين لم يستثمر على النحو الصحيح من أجل تحقيق أقصى استفادة منه، وهنا تضافرت الجهود لتعزيز دور تقنيات الذكاء الصنعي وتحديدًا تعلّم الآلة ولسد هذه الفجوة من خلال تحليل ما تشاهده هذه الآلات بنفسها واستخلاص المعلومات المفيدة والهامة، والتي نستطيع من خلالها دعم عملية اتخاذ القرار بالاعتماد على الأدلة المناسبة. وبما إن قدرة تعلّم الآلة تعدت عن كونها قادرة على اكتشاف الكائنات في الصور بل تجاوزت الحدود واصبحت قادرة على رصد مشاعر الناس. على الرغم من أنها ليست قادرة على رصد المشاعر بدقة ممتازة، إلا أن دقتها معقولة ومنطقية إذا اعتبرنا أنها مجرد البداية في هذا المجال "مجال اكتشاف ورصد المشاعر من خلال الصور"، تعتمد معظم هذه النظم في عملها على خوارزميات تتعرف على تفاصيل الوجه من العينين والحاجبين إلى الشفاه والعضلات المرتبطة بها ثم تنشئ خوارزمية قادرة على التنبؤ بما تعنيه تعابير الوجه المختلفة وذلك بحسب تفاصيل الوجوه الخاصة بكلّ عِرق معين. إذ تستطيع هذه الخوارزميات تعلم شعور الإنسان بالفرح من خلال مشاهدة ملايين الأشخاص يضحكون بطرق مختلفة ومع تحليل كلّ صورة من هذه الصور على حدة تستطيع هذه الخوارزميات أن تصل لاستنتاج قريب جدًا من الحقيقة، بل وأحيانًا تصل إلى الحقيقة الكاملة لمشاعر الشخص. نظام اكتشاف المشاعر أقوى وأدق ولا يحلل الصور فقط، وإنما جميع هذه المعلومات استخلصت من خلال تحليل الصور فقط فما بالك إذا كان النظام يحلل الصوت والصورة ليصبح بذلك مشهدًا متكاملًا لدى الخوارزميات تترابط فيه كلّ التفاصيل لنصل في نهاية الأمر لاستنتاجات أكثر دقة وموثوقية بمشاعر الفرح أو الحزن، والّتي استطعنا تحقيقها بفضل خوارزميات التعلم العميق. ولكن هل حدث ذلك فعلًا؟ هل استطاعت إحدى الشركات أن تطبق هذا الأمر؟ في الحقيقة نعم استطاعت تطبيقها وأيّما تطبيق فها هي الدكتور رنا القليوبي -حاصلة على دكتوراه علوم الحاسب من جامعة كامبريدج- تطلُ علينا بتأسيسها مع مجموعة من الأشخاص من معهد ماساتشوستس للتكنولوجيا شركة ناشئة سمتها أفكتيفا (Affectiva) والّتي تقدم خدمات الكشف عن المشاعر من خلال الصوت والصورة وهي من أول من سوّقت لمُصطلح الذكاء العاطفي الاصطناعي. تقيس أنظمة هذه الشركة تعابير الوجه غير المفلترة وغير المنحازة باستخدام مستشعر ضوئي أو بمجرد كاميرات وبِ قياسية، إذ تحدد في البداية جنس هذا الوجه سواء في الصور أو الفيديو وتحدد الخوارزميات المعتمدة بصورة رئيسية على مجال الرؤية الحاسوبية معالم الوجه الرئيسية، مثل: زوايا الحواجب وأطراف الأنف وزوايا الفم، ومن ثم تحلل خوارزميات التعلّم العميق وِحدات البكسل في الصور عند تلك المناطق لتصنيف تعابير الوجه ومعرفة ما هو الشعور الأنسب لهذا التعبيرات. وتقيس 7 أنواع فريدة للمشاعر وهي: الغضب والازدراء والاشمئزاز والخوف والفرح والحزن والمفاجأة. وتتدرب هذه الخوارزميات على قاعدة بيانات كبيرة جدًا تصل إلى 6 ملايين صورة من 87 دولة مُقدمةً بذلك مقاييس دقةٍ تصل إلى 90% بحسب التصريح الرسمي للشركة. وصلت قيمة الاستثمارات الحالية في الشركة إلى 26 مليون دولار مع تسجيل أكثر من 7 براءات اختراع غير أن هذه الشركة ليست الوحيدة في هذا المضمار وإنما هنالك العديد من الشركات الأخرى مثل: شركة إيموتينت (Emotient) والتي استحوذت عليها لاحقًا شركة آبل وشركة إنرسكوب (Innerscope) وهي الأخرى استحوذ عليها أيضًا من قِبل شركة نيلسن (Nielsen)، ويبقى هذا المجال واعدًا للعديد من شركات التسويق والدعاية لما له من فوائد جمّة وتطبيقات تعزز من قيمة الاعلانات وإمكانيات وصولها إلى الجمهور بالطريقة المُخطط لها. يمكنك الاطلاع على تطبيق عملي بسيط حول كيفية التعرف على الوجوه وملامحها وبعض خصائصها مثل العمر والمشاعر من مقال تصنيف الصور والتعرف على الوجه في مجال الذكاء الاصطناعي. اختيار جزء من فقرة تجيب على سؤالك عبر الذكاء الاصطناعي في ظل الزخم الهائل والمتواصل من المعلومات المنتشرة في جميع الأنواع من المواقع الموجودة على الإنترنت سواءً المواقع التعليمية أو المدونات أو حتى في مواقع التواصل الاجتماعي. وفي كثير من الأوقات نجد أن عملية البحث على المعلومة الصحيحة والدقيقة والمناسبة أصبح كمن يبحث عن إبرة في كومة من القش، وفي ظل هذا الكم الهائل من المعلومات تتلاشى أي قيمة للوقت فتصبح رحلة البحث عن إجابة لسؤال معين رحلة مليئة بمعلومات -لن نقول أنها ضارة ولكنها غير مفيدة في الوقت الحالي- وغالبًا ما نشاهد جميع المواقع تحاول بشتى الطرق تشتيت تركيزك وتشدك للانغماس في منجم المعلومات بل وهي تفهم تمامًا ما تحبه وتكرهه أكثر من معظم الأشخاص الّذين تعرفت عليهم خلال حياتك وذلك فقط من خلال خوارزمياتها (كما تفعل شركة فيسبوك). كما أنها تعرف بالضبط كيف تُشد إنتباهك وتحرك مشاعرك في محاولة منها لإشباع فضولك الّذي لا يعرف الشبع. وفي حضرة هذه الأحداث تتنامى الحاجة الملحة للإجابة على الأسئلة بأقصر مدة زمنية وبدقة عالية أو مقبولة وبسهولة معقولة وهنا جاءت شركة غوغل لتقدم لنا الحلول، ولتعطينا الإجابة المناسبة للسؤال على طبقٍ من ذهب. هل صدف وأن سألت محرك البحث غوغل عن أمر ما وجاءك بمقطع من مقالة معينة تجيبك عن هذا السؤال بالضبط؟ كيف حدث ذلك؟ هل وظفت شركة غوغل أحد الأشخاص ليُحدد ما هي الفقرة المناسبة التي تجيب سؤالك؟ بالتأكيد لا، إذًا كيف لها معرفة ذلك؟ ببساطة أنها من فِعلِ الشبكات العصبية الاصطناعية العميقة -وهي إحدى طرق تعلّم الآلة- إذ عمدت الشركة على عرض الإجابات المناسبة لك بدلًا من عرضها لنتائج ذاتُ صلة بالموضوع فقط. مختصرةً بذلك الوقت ومضيفة لها ميزة جديدة تزيد من إعجابك بها أكثر من ذي قبل. تعتمد هذه الطريقة على تدريب الشبكات العصبية الاصطناعية العميقة من خلال خوارزمية تدعى خوارزميات ضغط الجمل (Sentence Compression Algorithms). على الرغم من كون الإجابة عن الأسئلة المباشرة إجابة مباشرة ودقيقة من المهام السهلة -نسبيًا- على الإنسان إلا أن الأمر معقد جدًا من وجهة نظر الخوارزميات، إذ لا بدّ لها في البداية من فهم اللغة الطبيعية للسؤال فهمًا كاملًا بالإضافة إلى فهم الكلام الطبيعي العاميّ لإيجاد الرد المناسب مهما تغيّرت الصياغة. تتعلمُ الشبكات العصبية الاصطناعية من خلال التعلم الموجّه. إذ لا بدّ للبشر في البداية من تحديد كيف يمكن أن يُقتطع الجواب من مقال أو بحث معين، لتتشكل لاحقًا قاعدة بيانات لا بأس بها تعتمد عليها خوارزميات التعلّم الخاصة بالشبكات العصبية، لذا عمدت شركة غوغل على توظيف فريق من اللغويين (الّذين يسمونهم Pygmalion) قوامه أكثر من 100 لغوي من جميع أنحاء العالم يتحدثون أكثر من 30 لغة مختلفة، ويحاول هذا الفريق تصنيف أجزاء معينة من الكلام بطريقة دقيقة ليساعدوا الخوارزميات على فهم كيف تعمل اللغات البشرية من أجل أن تتمكن هذه الخوارزميات في نهاية المطاف من استخراج الأجوبة بمفردها، وهذا تمامًا ما تصبو إليه شركة غوغل وهو أن تجعل هذه الخوارزميات تعمل بمفردها أي بطريقة "التعلّم غير الموجّه". ولكن السؤال المشروع هنا ماذا لو أضيف هذه الميزة إلى جميع حقول البحث الموجودة ببعض المواقع الّتي نثق حقًا بجودة محتواها؟ بكل تأكيد ذلك سيعزز من محبة الناس لهذه المواقع وهذا بدوره سيُعزز شعبيتها وإجمالي إيراداتها في نهاية المطاف وهذا من أبرز التطبيقات لهذه الأنظمة. إنجازات الذكاء الاصطناعي في مجال السفر والتجوال تصفح خريطة مترو أنفاق لندن رأينا قدرة الذكاء الاصطناعي على تنفيذ مهام رائعة مثل التعرف على الصور والترجمة بين اللغات والتعرف على المشاعر ولكن ماذا عن قدرة الذكاء الاصطناعي في تمثيل العلاقات المعقدة بين البيانات أو المتغيرات والتي تتطلب قدرًا جيدًا من التفكير المنطقي مثل تعلّم كيفية التنقل عبر الخريطة في مترو أنفاق لندن، فهل يستطيع الذكاء الاصطناعي النجاح في هذه المهمة؟ كشفت شركة ديب مايند (DeepMind) المملوكة لشركة ألفابت (الشركة الأم لمحرك البحث لغوغل) في ورقة بحثية نشرتها أنها استطاعت التغلب على هذه العقبة من خلال بناء شبكة عصبية اصطناعية ذات ذاكرة خارجية، مستفيدةً بذلك من قدرة الشبكات العصبية على التعلم وتخزين هذا العلم الممثل بحقائق في الذاكرة لاستخدامه لاحقًا لتشكيل استنتاجات مثل خوارزميات البرمجة التقليدية تمامًا، وبذلك ستتمكن من التنقل في مترو أنفاق لندن باستخدام خريطة النفق وبدون أيّ معرفة مسبقة بها وبدون معرفة طريقة حلّ الألغاز المنطقية أيضًا. في الحقيقة إن حلّ هذه المشاكل سيكون مثيرًا للإعجاب لخوارزمية نظام هجين قادر على تحقيق ذلك وبدون أي قواعد محددة مسبقًا. يمكن لهذا النظام فهم خريطة لم ترها من قبل. إذ تتدرب هذه الشبكة العصبية على هياكل شبيهة بالخريطة بصورة عشوائية (والّتي يمكن أن تمثل محطات متصلة بخطوط وما شابه ذلك)، وذلك من أجل تعلّم كيفية تخزين أوصاف هذه العلاقات في ذاكرة الشبكة الخارجية، ومحاولة الإجابة على الأسئلة المتعلقة بها وفي حال عرض خريطة جديدة على النظام سيتمكن النظام من كتابة هذه العلاقات الجديدة (الاتصالات بين مترو الأنفاق) في الذاكرة واستدعائها لتخطيط الطريق. وصرح أليكس جريفز -عالم الحاسب والمؤلف المشارك في الورقة البحثية- أنه على الرغم من أن هذه التقنية أثبتت نفسها في حلّ المشاكل الاصطناعية فقط، إلا أنه يمكننا تطبيقها في المهام الواقعية الّتي تنطوي على عمليات استدلال من كميات هائلة من البيانات. كما يمكن أن يحلُّ هذا النظام الأسئلة الّتي لم تحدد إجاباتها بطريقة واضحة في مجموعة البيانات. إن هذه التقدم سيمنح قرارات أذكى بطريقة تنقلنا وذلك لأن الحاسب يستطيع ربط الكثير من المعلومات مع بعضها بعضًا وسيعرف تمامًا كيفية التنقل في المدن مع الحفاظ على توفير وقود أكثر في السيارة وهذا سيشكل ميزة من ميزات السيارات ذاتية القيادة والعديد من التطبيقات الأخرى المشابهة. قدرة الآلة على قيادة سيارة بالاستعانة بالذكاء الاصطناعي كم مرةً سمعنا عن حوادث سيارات سببها الرئيسي نوم السائق؟ أو سرعته؟ أو إنشغاله بالهاتف؟ هل تعلم بأن 1.24 مليون شخص حول العالم يموتون سنويًا بسبب أخطاء السائقين؟ ما ذنب هذا المواطن المسكين ليموت بسبب رعونة سائق؟ هل فعلًا يتسبب جهل السائقين بطرق المدينة وشوارعها بحدوث الازدحامات المرورية؟ هل تستطيع الآلة أن تقلل من نسبة الانبعاثات الكربونية الّتي تسببها المنظومة الحالية للمرور (أي الاعتماد على البشر في قيادة السيارات)؟ هل تعتقد بأن المبلغ الّذي تدفعه للتأمين على سيارتك كبيرًا جدًا؟ هل ستخفف السيارات ذاتية القيادة من استخدام الوقود الأحفوري؟ هل تعتقد بأن جميع هذه المشاكل التي ذكرناها يمكننا التغلب عليها باستخدام السيارات ذاتية القيادة؟ إذا كان جوابك لا على جميع الأسئلة السابقة فاسمح لي أن أخالفك الرأي وأبشّرك بأن هذا النظام المروري الواعد، والّذي سيعتمد في مجمله على السيارات ذاتية القيادة سيغير رأيك بالكامل حول كلّ مشاكل النظام الحالي. إن التطور السريع الّذي حدث لأنظمة الرؤية الحاسوبية، وزيادة قوة المعالجات على معالجة المعلومات في الصور بسرعات كبيرة كان له أثر كبير على مجالات حياتية عديدة، فها نحن نلاحظ كيف ساعد هذا التطور المجال الطبي سواءً في تشخيص الأمراض أو حتى في علاجها. والتطور الهائل الذي حصل في عالم الروبوتات كان أحد مسبباته هذا التطور، لم يتوقف الأمر إلى هذا الحد فحسب بل تعدى ليفتتح مجالات وأسواق جديدة مثل أسواق السيارات ذاتية القيادة. تسارعت معظم شركات السيارات إلى الدخول في تطوير هذا النوع من السيارات، من أبرزهم منهم شركة جنرال موتورز وتويوتا وآبل وغوغل وإنتل وأودي وبي أم دبليو وتسلا وأوبر وفورد، وغيرها الكثير من الشركات. تعتمد السيارات ذاتية القيادة على العديد من التقنيات مثل: خوارزميات رسم الخرائط والبيانات الّتي تحصل عليها من أجهزة الاستشعار الموصولة بها وأنظمة الرؤية المجسمة ونظام تحديد المواقع ونظام اكتشاف الكائنات في الصور. إن معظم هذه التقنيات -إن لم يكن جميعها- تعتمد على الذكاء الاصطناعي وتحديدًا تعلم الآلة، ونظرًا لاختلاف السيناريوهات الّتي تتدرب عليها السيارات ذاتية القيادة بين العالم الافتراضي والعالم الحقيقي تظهر حاجتنا إلى نظام يستطيع اتخاذ قرار عقلاني في اللحظة المناسبة اعتمادًا على خبراته القديمة، وهنا يتدخل الذكاء الاصطناعي ليكون همزة الوصل بين العالمين وليدفع عجلة تطوّر السيارات ذاتية القيادة إلى الأمام. من أبرز المتضررين من السيارات ذاتية القيادة هي شركات التأمين فمع قلة الحوادث المرورية لن تظهر الحاجة لتأمين السيارة، كما إن عدد سائقي الحافلات وسيارات الأجرة سينخفض كثيرًا بسبب هذا التغيّر في النظام المروري، بلغت الاستثمارات في هذا المجال خلال السنوات القليلة الماضية 16 مليار دولار كانت وراءها أكثر من 30 شركة عالمية، وإلى الآن مازالت تتزايد الاستثمارات في هذه التقنية، على الرغم من عدم وجود أي عوائد مالية مباشرة لهذه الاستثمارات، إلا أن هذه الشركات متفائلة جدًا من المستقبل. ومن يدري قد يأتي يوم وتثق بالسيارة ذاتية القيادة أكثر من ثقتك بسائق الحافلة لتوصيل ابنتك إلى المدرسة! تطيير طائرات الدرون باستخدام الذكاء الاصطناعي لطالما عانت عمليات البناء والتنقيب من أخطار كثيرة وفي كثير من الأحيان شكلت عملية التحقق من سير المشروع بنجاح تحديًا كبيرًا وخطيرًا بنفس الوقت إذ إن البناء ليس مكتملًا بعد، واحتمالية أن يظهر عيب ما في المشروع كبير جدًا، وبالتأكيد لا نريد أن نخاطر بأرواح المشرفين أو العمال القائمين على المشروع، كما إن عمليات التنقيب تحتوى هي الأخرى على نفس الكم من المخاطرة الشديدة بأرواح العاملين، وفي كِلا الحالتين لن نستطيع المراهنة على حياة المشرفين أو العمال بكلّ تأكيد، ونظرًا لكون المشروع جديد فليس لدينا خريطة ثلاثية الأبعاد نستطيع من خلالها تطييّر الطائرات بدون طيار مثل طائرات الدرون وإن مهمة التحكم المباشر فيها أثناء طيرانها -أي بالزمن الحقيقي- يحتاج لأناس ماهرين جدًا عدا عن صعوبة المترافقة عند اكتشاف أماكن فيها الإضاءة ضعيفة ومعتمة ولو توفر كلّ المقومات فلن تخلو هذه المهمة من الأخطاء البشرية، فما الّذي يجب علينا فعله في هذه النوع من الحالات؟ وماذا أيضًا عن الكوارث الطبيعية مثل الزلازل أو الأعاصير هل سنستطيع تطييّر طائرات الدرون يدويًا ومعرفة أماكن وجود الناجين وإنقاذ أرواحهم بأقصى سرعة؟ كشفت شركة Exyn عن برنامج جديد يعتمد على الذكاء الاصطناعي يستطيع تطييّر طائرات الدرون بمفردها في المناطق المظلمة وذات الطبيعة غير المستقرة وفي الأمكان الخارجة عن ميزة التعقب الجغرافي (GPS)، أي الطيران بمجال مجهول وبدون أي خريطة مساعدة سامحة بذلك للطائرات بخلق وعي خاص بها يُمكنُها من اتخاذ قرارات في الزمن الحقيقي، وصرح المؤسس الشركة فيجاي كومار -عالم الروبوتات المخضرم وعميد كلية الهندسة في جامعة بن- إن الذكاء الاصطناعي المستخدم لتطيير الطائرات بمفردها أكثر تعقيدًا من الذكاء المستخدم في السيارات ذاتية القيادة أو الروبوتات الأرضية وذلك عائدٌ على قدرة الطائرات على الطيران في جميع المسارات بالابعاد الثلاثة المتاحة على عكس السيارات، كما أن الطائرات لا تستطيع حمل بطاريات كبيرة لذا يجب أن تُعالجُ المعلومات بسرعة قبل نفاذ البطاريات ومعرفة الاتجاه الصحيح الواجب سلكه وبالطبع يمكننا أيضًا المعالجة باستخدام المعالجة السحابية لتجنب استهلاك البطارية. تعتمد هذه التقنية على بناء خريطة ثلاثية الأبعاد من خلال المعلومات الواردة من مستشعراتها في الزمن الحقيقي، وكلّما اكتشفت كائنًا جديدًا سواء حاجز اسمنتي أو أي كائن آخر، تُحدث خريطتها بما يتوافق مع ذلك لتحقيق هدف تحليقها الأساسي. مستفيدةً بذلك من مجال الذكاء الاصطناعي وتعلم الآلة في عمليات اتخاذ القرارات المناسبة بالاعتماد على الخبرات السابقة وبدون أي تدخل بشري، ويحاول الروبوت الإجابة على ثلاث أسئلة جوهرية قبل بدئها بأي عملية ملاحة جوية وهي: أين أنا في هذه البيئة المحيطة؟ أين الموقع الذي أحاول الذهاب إليه؟ كيف سأصل إلى هناك على النحو الأمثل؟ بعد محاولة الآلة الإجابة على هذه الأسئلة سيتضح لها الخطوة الأولى وتتعلم بعدها من المستشعرات والكاميرات لكي تستطيع اتخاذ القرار المناسب بما يتوافق مع سلوك الكائن الّذي أمامها. وتوفر هذه الشركة أيضًا البنية الهندسية لهذه التقنية لتستطيع تركيبها على نوع محدد من الطائرات لتجنب زيادة الحمل عليك بجعلك تدفع ثمن الطائرة أيضًا لذا فهي تصنف نفسها بأنها شركة برمجيات معتمدة على الذكاء الاصطناعي لتمكين الطائرات من الطيران بدون تدخل بشري. إن التطبيقات العملية لهذه التقنية مفيدة جدًا وفريدة من نوعها ولا بدّ بأنها ستجعل من العمليات الخطرة والصعبة أكثر أمانًا ودقة وموثوقية وستُضيف إنجازًا جديدًا يحققه الذكاء الاصطناعي. في الحقيقة وصلت إجمالي الاستثمارات الحالية في شركة Exyn إلى 16 مليون دولار وتحاول الشركة تعزيز وجودها أكثر بدخولها إلى إدخال هذا النوع الروبوتات في المخازن مما يفتح أفاقًا جديدة وفرص رائعة أمام هذه الشركة. توقع ازدحام مواقف السيارات بحسب المنطقة بعد أن أمضيت الكثير من الوقت في تجهيز نفسك للاجتماع المرتقب، وبعد أن حضرت جميع الأوراق والمستندات اللازمة أصبحت على تمام الاستعداد للذهاب للاجتماع، فتركب سيارتك الخاصة وتذهب لموقع الاجتماع وعندما تصل وتحاول ركن سيارتك في أقرب موقفٍ للسيارات تجده ممتلئ تمامًا، تحاول البحث عن موقف آخر، ولكنك لا تجد أي موقفٍ قريبٍ فارغ، فتمضي أكثر من ساعة كاملة في محاولتك للبحث عن موقف مناسب، ولكن تفشل جميع محاولاتك. هل هذا السيناريو مألوف بالنسبة لك؟ إن كنت من سكان المملكة المتحدة -أو أحد المدن ذات التعداد السكاني الكبير- فحتمًا أنك تواجه هذا السيناريو يوميًا، فوفقًا لموقع التلغراف يمضي السائق في المملكة المتحدة ما مجموعه 2549 ساعة في محاولة منه لإيجاد موقف للسيارة أي 106 يوم من الوقت الضائع! إنه حقًا وقت طويل لمهمة ركن السيارة. لاحظت شركة غوغل هذا الأمر وسارعت بإطلاق ميزة جديدة في تطبيق الخرائط خاصتها (Google Maps) تساعدنا على معرفة أماكن ازدحام مواقف السيارات في خطوة منها لمساعدتنا على التخطيط الأنسب لرحلاتنا. إن المنهجية التي تعتمد عليها هذه الميزة هي المساهمات الجماعية من قبل المستخدمين (Crowdsourced) وبعض خوارزميات تعلم الآلة البسيطة للمساعدة في تحديد صعوبة وجود موقف للسيارة. كما توفر هذه المنهجية دقةً أعلى من طريقة السابقة وهي من معلومات المتوفرة من عدد السيارات المتواجدة في المواقف والتي تكون متاحة على الإنترنت، لأنه غالبًا ما تقدم هذه الطريقة معلومات غير كاملة أو خاطئة بسبب المتنزهين غير القانونيين أو الأشخاص الّذين غادروا مبكرًا من أماكنهم. هذا النوع من المشاكل تجاوزتها المنهجية الجديدة الّتي اعتمدت عليها غوغل كما راقبت شركة غوغل حركة السيارات قبل عثورها على موقف فإذا دارت السيارات حول مواقع مواقف للسيارات فهذا يدل على أن المواقف مزدحمة، كما اعتمدت على موازنة الوقت المتوقع للوصول مع وقت توقف السيارة واستخدمت غوغل نموذج الانحدار اللوجستي (Logistic Regression) البسيط لتدريب الخوارزمية في إشارة -غير مباشرة- منها بأنه لا داعي لاستخدام الشبكات العصبية الاصطناعية في كلّ حالة وإنما يمكن للخوارزميات البسيطة أن تفي بالغرض في بعض المهام. لاحظت شركة غوغل بأن هذه الميزة أدت لزيادة كبيرة في النقرات على وضع النقل العام (transit travel) مما يشير إلى أن المستخدمين الذين لديهم معلومات إضافية حول صعوبة إيجاد موقف للسيارة كانوا أكثر ميلًا للتفكير في الذهاب بالمواصلات العامة بدلًا من الذهاب بسياراتهم الشخصية، وهذا بدوره يمكن أن يخفف مشكلة من مشاكل المرور ويساعد الناس في حفظ أوقاتهم المهدرة سدى. إنجازات الذكاء الاصطناعي في المجال الطبي والخدمات الصحية تقنية جديدة تمكن البكم من الكلام عانى المجال الطبي في زمن من الأزمان على كثير من المشاكل والتحديات، ودائمًا ما كانت القفزات النوعية في هذا المجال من أصعب القفزات لأنها تحتوي على مراهنة بأرواح بشرية وهذا ما يشكل عبءً مضاعفًا على كاهل الباحثين والمختصين، وعلى الرغم من التقدم الملحوظ الّذي شهده المجال في القرن التاسع عشر والعشرين إلا أنه كان للذكاء الاصطناعي دور مميز في تسريع عجلة تقدمه العلمي واختصار العديد من سنوات البحث والتجريب، لنستطلع الآن ما هي أبرز هذه الإنجازات الرائعة. في دراسة جديدة نشرتها جامعة كاليفورنيا-سان فرانسيسكو حول إمكانية إعطاء صوت للأشخاص الذين فقدوا قدرتهم على الكلام سواءً أكان سبب هذا الفقد إصابات في الدماغ أو بسبب الاضطرابات العصبية مثل: الصرع أو الزهايمر أو التصلب المتعدد أو باركنسون …إلخ. تعتمد هذه التقنية على استخدام الأقطاب الكهربائية والذكاء الاصطناعي لإنشاء جهاز يمكنه ترجمة إشارات الدماغ إلى كلام وبحسب الباحثين فقد يتمكن هؤلاء الأشخاص ليس من استعادة قدرتهم على الكلام فحسب وإنما سيتمكنون من نقل المشاعر المترافقة مع الكلام والتي تعكس شخصية المتحدث. عندما يحاول أي شخص الكلام يرسل الدماغ إشارات من القشرة الحركية إلى عضلات الفك والشفاه والحنجرة لتنسيق حركتها وإصدار الصوت المخصص لكلّ حرف من الحروف. ومن خلال قراءة البيانات المولّدة من الأقطاب الموصولة بهذه المراكز يمكن للخوارزميات المعتمدة على تعلّم الآلة من فهم الارتباط بين الإشارات العصبية والكلام المنطوق بطريقة تمكنها من الاستفادة من الإشارات وتحويلها لكلام منطوق. على الرغم من ذلك لا تزال هذه التقنية غير دقيقة بما يكفي لاستخدامها واعتمادها خارج المختبرات، كما أنها بطيئة أيضًا إذ أقصى سرعة للتحدث يمكن بلوغها هي 10 كلمات في الدقيقة بينما سرعة التكلم الطبيعية تكون 150 كلمة في الدقيقة في أقل تقدير. إلا أن المستقبل واعدٌ حتمًا لهذه التقينات ويمكن جدًا أن تصبح مشاكل عديدة من بينها مشكلة فقدان القدرة على الكلام شيئًا من الماضي. تزويد المكفوفين بأعين اصطناعية في آخر إحصائية أجرتها منظمة الصحة العالمية أعلنت فيها أن أعداد المكفوفين تقدر بأكثر من 39 ميلون شخص حول العالم، ومن بين أبرز المشاكل الّتي يعاني منها المكفوفين هي الصعوبة الكبيرة في التنقل والحركة بدون مرافق، ولكن الأمور تغيرت كثيرًا مع تطور أنظمة الرؤية الحاسوبية والذكاء الاصطناعي وبفضل إمكانية دمج أنظمة اكتشاف الكائنات في الصور والكثير من التقنيات الأخرى التي مكنت فريق بحثي من جامعة ميغيل هيرنانديز (University of Miguel Hernandez) من تطوير آلية جديدة للرؤية عبر إرسال إشارات الرؤية البصرية مباشرة إلى القشرة البصرية الموجودة في الدماغ. تعتمد هذه الطريقة على تسجيل الكاميرات ما تشاهده أمامها ومن ثم ترسله إلى الحاسب فيترجم الحاسب هذه المعلومات المرئية إلى نبضات كهربائية بالاعتماد على مجموعة معقدة من خوارزميات الذكاء الاصطناعي وتعلم الآلة لتُرسل أخيرًا إلى الدماغ عن طريق كابل متصل بمنفذ مباشر إلى الجمجمة ليحفز بدوره الغرسة الموجودة في القشرة البصرية في الدماغ. على الرغم من التعقيدات الموجودة في هذا النظام إلا أنه يعدّ قفزة نوعية، وتبلغ دقة الصورة التي تستطيع هذه التقنية تغذية الدماغ بها هي 10×10 بكسل. إلا أن أحد الباحثين في هذا المشروع وهو فيرنانديز يتصور إمكانية زرع 6 غرسات في الدماغ على كلّ جوانبه وبذلك سترتفع الدقة إلى 60×60 بكسل. من الجدير بالذكر أيضًا أن هذه التقنية لا تسمح للأشخاص المولودين بدون حاسة البصر باستعادة بصرهم وإنما فقط تسمح للناس الّذين فقدوا بصرهم بسبب مرض ما أو بسبب حادث معين. بالتأكيد إن هذا الحل لن يعوض الكفيف بصره بالمعنى الحرفي للكلمة، ولكن يعدّ هذا الحل خطوة كبيرة في تعزيز استقلالية المكفوفين وتمكينهم من استعادة جزء كبير مفقود من حياتهم. ولذلك يجب علينا أن نبقى متفأئلين من هذه الإمكانيات الجديدة للتكنولوجيا وأن نجهز أنفسنا ليس لشراء هذه التقنيات الجديدة فقط وإنما لنكون جزءًا من ماصطناعيها ومطوريها أيضًا. التعرف على اعتلال الشبكية السكري (سبب رئيسي للعمى) من صور الشبكية تعرفنا في الفقرة الماضية على طريقة جيدة لتعويض المكفوفين عن نظام الرؤية الخاص بهم، ولكن ماذا لو استطعنا أن نسبق المرض بخطوة، وأن نكتشفه ونعالجه قبل أن يتطور ويتسبب بفقدان المريض بصره بالكامل؟ ولكن مهلًا هل حقًا نستطيع فعل ذلك؟ نعم نستطيع فقط إذا كان سبب العمى هو مضاعفات مرض السكري أو التنكس (الضمور) البقعي المرتبط بالتقدم في العمر. وهذا الأخير يصيب أكثر من 25% من الأشخاص الذين تزيد أعمارهم عن 60 عامًا في أوروبا وما يصل إلى 11 مليون شخص في الولايات المتحدة الأمريكية. إذ أعلنت شركة ديب مايند عن تطويرها نظامًا يعتمد على الذكاء الاصطناعي قادر على التنبؤ بالتنكس البقعي والاعتلال في شبكية العين وذلك لأن كِلا المرضين يمكن تشخيصهما من خلال رؤية صور المسح ثلاثية الأبعاد الخاصة بالعين المريضة، وبما أن الذكاء الاصطناعي وتحديدًا تعلم الآلة ماهر جدًا في التعامل مع الصور بطريقة رائعة وسلسلة فإن أداؤه سيكون مقبولًا جدًا في هذا تشخيص مثل هذا النوع من الأمراض. في البداية يتدرب النموذج على العديد من الصور المشخصة بأن لديها هذه الأمراض ومن ثم يحاول أن يحدد بعض الميزات (features) الّتي ترتبط مع هذه الأمراض ومن ثم تُعرضُ صور جديدة لهذا النظام ليطبق عليها ما تعلمه من الصور السابقة ويستنتج فيما إذا كان المريض سيتعرض للتنكس البقعي خلال الأشهر الستة القادمة أم لا. وبهذا الانجاز تثبت شركة ألفابت أنها قادرة على تطوير أنظمة لا تكشف الفرق بين صور القطط والكلاب فحسب وإنما قادرة على تطويع مجال الذكاء الاصطناعي ليخدم مجال الطبي والرعاية الصحية في جميع تطبيقاته، ويأمل الباحثون في مجال الذكاء الاصطناعي في أن يساعد هذا التقدم العلمي على تسهيل العمليات الطبية وأتمتتها بأفضل طريقة للنهوض في مستوى الرعاية الصحية لأقصى حدّ ممكن في جميع دول العالم. الكشف عن أمراض السرطان بالاستعانة بالذكاء الاصطناعي يعدّ مرض السرطان من أكثر الأمراض فتكًا بين سائر الأمراض التي عانتها البشرية لأن انتشاره واسع ونسب الشفاء منه قليلة نسبيًا فبحسب إحصائية صدرت من مجلة أبحاث السرطان في المملكة المتحدة جاء فيها أن في عام 2018 شخصت أكثر من 17 مليون حالة في جميع أنحاء العالم توفي منهم حوالي 9.6 مليون حالة، وكما أشارت الإحصائية إلى أنه بحلول عام 2040 سيُكون كلّ عام حوالي 27.5 مليون حالة سرطان جديدة. تكمن خطورة هذا المرض في صعوبة التعرف عليه أو تشخيصه في مراحله الأولى، فهو لا يُظهرُ على جسم المريض أي أعراض في بدايته، ولا يُكتشفُ غالبًا إلا عندما تظهر أعراضٌ متقدمة أي في مراحل تطور المرض الأخيرة، وبعد فوات الأوان. كما أن الأعراض الخاصة بمرض السرطان بمختلف أنواعه تتشابه مع أعراض كثير من الأمراض الأخرى مما يضفي حاجزًا آخر يحول بيننا وبين الاكتشاف المبكر للسرطان. إلا أن هذه الأمور تغيرت كثيرًا بعد التقدم التكنولوجي، إذ يمكن للحواسيب تحليل كميات كبيرة من البيانات وبفضل الذكاء الاصطناعي استطعنا أن نستنتج الارتباطات والأنماط الخفية في البيانات ونحللها ونصنفها وهذا الأمر من المستحيل أن يحققه البشر مثلما تحققه خوارزميات تعلّم الآلة. كما يمكن اكتشاف الأنماط الخفية في صور الأشعة السينية أيضًا والّتي يمكن أن تكون غير مرئية للبشر نظرًا من إمكانية العين المتواضعة على تمييز الفروقات الصغيرة والدقيقة في الصور الشعاعية، كما أن خوارزميات تعلم الآلة قادرة أيضًا على معالجة العديد من هذه الأنماط، والأهم من ذلك قدرتها على تقليل نسبة الخطأ الّتي يمكن أن تحدث بسبب البشر. تعتمد هذه الطريقة في التشخيص على الشبكات العصبية الاصطناعية، إذ في البداية نزود هذه الشبكات بالصور لأشخاص مصابين بالسرطان وتبدأ الخوارزميات بتحليل وتصنيف الصور واكتشاف وتحديد الميّزات (features) فيها لمعرفة ماهيّة الصور الّتي يكون أصحابها مصابين بالمرض، وبما أن لدينا سجلات طبية هائلة تحتوي على الحالات المصابة وبكامل معلوماتها وتفاصيلها ستستطيعُ خوارزميات التعلّم العميق من التعلّم بدقة أكبر واستنتاج أنماط أعم وأشمل. فعلى سبيل المثال أظهر فريق من الباحثين من مركز بيث الطبي في كلية الطب بجامعة هارفارد أن تحليل البيانات من خلال خوارزميات التعلّم العميق يمكن أن تقلل من معدل الخطأ في تشخيص سرطان الثدي بنسبة 85٪. وعلق الدكتور بيك -أحد الباحثين على هذا البحث قائلًا: وحتى أن هذه الخوارزميات تستطيع تشخيص مختلف أنواع السرطان مثل: سرطان الثدي وسرطان الرئة وسرطان الجلد وسرطان القولون والمستقيم وسرطان الجينوم وسرطان البروستات وسرطان الرأس والعنق وسرطان الغدة الدرقية. غير أنه لا يمكننا بالتأكيد الاستغناء عن إشراف الدكاترة المختصين على هذه الخوارزميات بل سيقتصر دورها على كونها مساعد شخصي للدكاترة ذكي ومفيد جدًا يحسن دقة عملية التشخيص ويسرعها. تصنيع أدوية جديدة بالكامل بالاعتماد فقط على الذكاء الاصطناعي يعدّ مجال صناعة وتطوير الأدوية الجديدة من المجالات الصعبة وذات التكاليف المرتفعة، إذ في دراسة نشرت على موقع جامانيتورك (jamanetwork) في الشهر مارس من عام 2020 جاء فيه أن تكلفة إدخال دواء جديد إلى السوق يبلغ 985 مليون دولار كما أن متوسط زمن وصول هذا الدواء لأيدي الناس سيكون من 10 إلى 12 سنة، ويعود ارتفاع هذه التكليف إلى المراحل الإجبارية الّتي يجب أن يمر بها أي دواء حتى يصل إلى السوق، فمثلًا يجب أن يُختبر على جميع الحالات الخاصة مثل: كبار السن والأطفال والحوامل والمرضعات وعلى مختلف الأعراق البشرية لمعرفة التأثيرات الجانبية المحتملة، ولذلك تجد الكثير من التحذيرات والتعليمات في نشرة التوصيف الخاصة بكلّ دواء تتحدث عن كافة التأثيرات المحتملة على المريض. ولطالما حاولت شركات الدواء تخفيض هذه التكاليف ولكنها لم تحقق نجاحات كبيرة إلا عندما تدخل الذكاء الصنعي في الأمر. في الحقيقة سبق وأن ساعدت خوارزميات الحاسب عملية تطوير الدواء بصورة كبيرة إلا إن آخر الطرق الّتي توصل إليها الباحثين من جامعة فليندرز في جنوب أستراليا كانت ملفتة للنظر إذ استطاعوا بناء دواء مناعي يعالج الانفلونزا باستخدام برنامج يعتمد على الذكاء الاصطناعي فقط أي لوحده وبدون أي تدخل بشري، ليكون بذلك أول مساعدة يقدمها لنا الذكاء الاصطناعي من هذا النوع. يعتمد هذا البرنامج على خوارزمية تدعى "خوارزمية البحث عن روابط" (Search Algorithm for Ligands) وتدعى اختصارًا SAM، إذ تبحث هذه الخوارزمية عن جميع المركبات التي يمكن تصورها في الكون للعثور على دواء جديد. وعلّق أحد الباحثين قائلًا: وعلق بتروفسكي وهو أحد الباحثين في هذا البحث على الأمر "إن قدرات هذا البرنامج ليست محصورة فقط في قدرته على تحديد العقاقير الجيدة فحسب، بل إنه في الحقيقة توصل إلى أدوية مناعية بشرية أفضل من الموجودة حاليًا". وأردف أيضًا "لذا أخذنا هذه العقاقير الّتي ابتكرها البرنامج بغية تجربتها على الحيوانات للتأكد من فعاليتها، وتحديدًا اللقاح المخصص لعلاج الإنفلونزا". وختم كلامه قائلًا: "إن هذا من شأنه أن يقصر عملية اكتشاف العقاقير وتطويرها على مدار عقود ويخفض تكلفة إنتاجها بمئات الملايين من الدولارات". تتبع حالتك الصحية وأنت في المنزل بتقنيات الذكاء الاصطناعي تحدثنا عن طرق كثيرة التي تساعد الأطباء في تشخيص بعض الأمراض، ولكن مشكلة هذه الطرق أنها متواجدة فقط عند الأطباء، وبالنظر إلى حقيقة أن أغلبية المرضى في جميع أرجاء العالم لا يذهبون للطبيب من أجل التشخيص عن حالتهم إلا بعد ظهور علامات مؤكدة عن المرض. كانت معظم محاولاتنا مهدورة ولفئة قليلة من المجتمع (غالبًا ما تكون من المتعلمين). ولكن ماذا لو تمكنّا من الكشف عن الأمراض مبكرًا إنها حقًا ستؤدي إلى فرصة أكبر وأفضل للشفاء، لأن ذلك سيقطع طريق انتشار المرض قبل أن يتمكن من التفشي بكامل الجسم. إذا ما الحلّ المقترح؟ هل سنستأجرُ غرفة في المشفى ونعيش بها لنضمن حصولنا على الإشراف الطبي المناسب؟ أم نستأجر طبيبًا ونحضره معنا إلى البيت ليشرف على حالتنا الصحية؟ في الواقع وبغض النظر عن حقيقة قلة عدد الأطباء حول العالم فإن هذه الفكرة مكلفة جدًا وغير عملية. إذا ما الحلّ؟ ما رأيك بأن نحضر طبيبًا صغيرًا جدًا بالتأكيد لا أقصد هنا أن يكون صغيرٌ بالعمر وإنما صغير بالحجم ليكون مثلًا بحجم الراوتر اللاسلكي تقريبًا ونضعه في البيت ليراقب حالتنا الصحية؟ هل برأيك أنه يوجد لدينا حقًا طبيب بهذه المواصفات؟ إذا كان جوابك لا فلا مشكلة أنا مثلك ظننت بأنه لا يوجد طبيب بهذه المواصفات ولكن تفاجأت حقًا عند قراءتي أن هنالك فعلًا طبيب بهذه المواصفات ولكن نسيت أن أخبرك بأنه ليس بشريًا وإنما آلة. تستطيع هذه الآلة تتبع جميع أنواع الإشارات الفيزيولوجية الخاصة بك أثناء حركتك من غرفة إلى غرفة أخرى مثل: التنفس، ومعدل نبضات القلب، والنوم وطريقة المشي والكثير من الأمور الأخرى الّتي تحدد حالتك الصحية بدقة. هل فعلًا استطاع الإنسان اختراع مثل هذه الآلة؟ نعم استطاع، إذ تزعم البروفيسورة دينا قتابي -وﻫﻲ ﺑﺮوﻓﻴﺴﻮرة ﻣﺨﺘﺼﺔ في ﻋﻠﻮم اﻟﻬﻨﺪﺳﺔ اﻟﻜﻬرﺑﺎﺋﻴﺔ واﻟﺤﺎﺳﻮﺑﻴﺔ في جامعة إم آي تي- أنها استطاعت بناء هذه الآلة في مختبرها، وكما تعتقد بأن هذا الاختراع قد يحل محلَّ مجموعة كبيرة ومكلفة من المعدات الطبية والتي نستخدمها في المستشفيات للحصول على البيانات السريرية حول الجسم البشري. تعتمد هذا الآلة على مراقبة تغيّر الحقل الكهرطيسي المحيط بنا كلّما تحركنا مهما كانت الحركة صغيرة (مثل التنفس)، إذ تبث هذه الآلة إشارة لاسلكية منخفضة الاستطاعة تغطِّي مساحة شقة بغرفة نوم أو اثنتين، وتستطيع هذه الأمواج الانتشار في البيت إذ تنعكس الإشارة عن أجسام الأشخاص الموجودين ضمن نطاقها، ومن ثم تستخدم هذه الآلة تقنيات تعلّم الآلة في تحليل الإشارات المنعكسة، واستخلاص البيانات الفيزيولوجية. وقد رُكِّبت الآلة حتى الآن -وفقاً لقتابي- في أكثر من 200 منزل، وذلك لأشخاص أصحاء وآخرين يعانون من بعض الأمراض (مثل باركنسون، وألزهايمر والاكتئاب، والأمراض الرئوية). كما شاركت قتابي في تأسيس شركة ناشئة أسمتها إيميرالد إينوفيشنز من أجل استثمار هذه التقنية تجاريًا، وقدمت الآلة إلى شركات الأدوية والتقانة الحيوية من أجل دراستها واختبارها. وحتى تثبت قتابي فائدة هذه الآلة، استعرضت البيانات الّتي جُمعت على مدى ثمانية أسابيع في منزل مريض مصاب بداء باركنسون، مشيرةً إلى أن مِشيته كانت تتحسن ما بين الساعة الخامسة والسادسة من كلّ صباح، بشكل يتواقت مع أخذه للدواء، وتقول: "هذا الجهاز لا يساعدك على فهم حياة المريض فحسب، بل يساعدك على فهم تأثير الدواء أيضًا"، وهو ما قد يمكِّن الأطباء من تحديد السبب وراء إفادة بعض الأدوية لبعض المرضى دونًا عن البعض الآخر. ويستعين كثيرٌ منا بالعديد من أجهزة الرصد الشخصي، سواءً ما يتعلق بمحتوى ما نتناوله من سعرات غذائية أو ما نخطوه من خطوات يومية، وبإمكان الذكاء الصنعي تأدية دور مهم في ترجمة تلك البيانات بطريقة تنعكس بالإيجاب على صحتنا. وتتجلى أهمية رصد التغيرات المبكرة مع ازدياد أعداد المسنين حول العالم، إذ تقول الأمم المتحدة أن عدد المسنين الذين تتجاوز أعمارهم 60 سنة يبلغ 13% من عدد سكان العالم أي ما يقارب المليار نسمة. وتقول قتابي إن الكثير من المسنين باتوا يعيشون بمفردهم، وهم يعانون من أمراض مزمنة تشكل تهديدًا حقيقيًا على حياتهم، وتعتقد أن ابتكارها سيُمكن الأطباء من التدخل المبكر بالمريض تفاديًا لمحاولة إسعاف المرضى بشكل طارئ لاحقًا وجعله ينتظر في طوابير المشافي. لا حدود لإمكانيات الذكاء الاصطناعي لم يقتصر دور الذكاء الاصطناعي على المجالات التي ذكرناها فقط بل لا يوجد حاليًا مجال إلا وقد دخل فيه الذكاء الاصطناعي وأصبح جزءًا أساسيًا من أجزائه بدءًا من مجال الزراعة، وحتى مجال الأمن والحماية ومجال المال والأعمال والألعاب والبرمجة وغيرها من مختلف مجالات الحياة. هل كثرة الإنجازات جعلته يتوقف ويستريح؟ بالطبع لا، وإنما واصل أيضًا سلسلة اقتحاماته لتشمل أيضًا المجال الفني والإبداعي ليستطيع في البداية تقليد طريقة رسم الفنان فان جوخ للوحاته تقليدًا احترافيًا، كما استطاع كتابة قصائد اجتازت مرحلة الاختبارات المؤهلة للنشر، كما تمكن أيضًا من تصميم الشعارات (Logo) بنفسه، واستطاع أيضًا كتابة مقالات وتقارير رياضية لوكالة أسوشيتد برس، واستطاع كتابة سيناريو فيلم سينمائي. إن جميع هذه الانجازات الرائعة الواعدة والّتي استطعنا تغطيتها فقط وهنالك العديد من الإنجازات الأخرى والتي اعتقدنا في زمن من الأزمان أنها ضرب من الخيال ما هي سوى البداية فحسب، وما سنكتشفهُ لاحقًا سيكون أكثر دهشة وأكثر فائدة في عديد من جوانب حياتنا، وبالتأكيد كلّ انجاز جديد يرافقه ظهور تهديدات جديدة، وهذا الأمر لا يمكننا إيقافه ولكن يمكننا حتمًا جعل التهديدات أخف وذلك بتطبيق كافة التعليمات الأمنية المُوصى بها، وهذه المسؤولية تقع على عاتق كلّ فرد منا سواء استطعنا الاستفادة من هذه القنيات أم لا. والآن هل ما زلت مترددًا في دخول مجال الذكاء الاصطناعي وتحديدًا تعلّم الآلة؟ في المقال التالي من هذه السلسلة ستتعرف على معلومات جديدة عن تاريخ هذا المجال والّتي ستساعدك في اتخاذ هذا القرار حتمًا. اقرأ أيضًا تعلم الذكاء الاصطناعي النسخة الكاملة من كتاب مدخل إلى الذكاء الاصطناعي وتعلم الآلة المرجع الشامل إلى تعلم لغة بايثون
  4. هذا المقال جزء من سلسلة «مدخل إلى الذكاء الاصطناعي»: الذكاء الاصطناعي: أهم الإنجازات والاختراعات وكيف أثرت في حياتنا اليومية الذكاء الاصطناعي: مراحل البدء والتطور والأسس التي نشأ عليها المفاهيم الأساسية لتعلم الآلة تعلم الآلة: التحديات الرئيسية وكيفية التوسع في المجال يمكنك قراءة السلسلة على شكل كتاب إلكتروني بالانتقال إلى صفحة الكتاب، مدخل إلى الذكاء الاصطناعي وتعلم الآلة. كما هو الحال مع جميع المجالات العلمية لا بدّ من وجود بعض المشاكل والعقبات في رحلة الوصول إلى المعلومة الصحيحة والكاملة، ومجال تعلّم الآلة ليس استثناءً وانطلاقًا من كون أن مهمتنا الرئيسية عند مواجهتنا أي مسألة تنحصر بين شيئين أساسيين وهما: اختيار البيانات المناسبة. اختيار الخوارزمية (الطريقة) المناسبة. نجد أن أغلب المشاكل الّتي تواجه هذا المجال إما أن تكون بسبب الخوارزمية السيئة أو البيانات السيئة، في البداية لنبدأ باستعراض أهم التحديات الّتي تواجهنا مع البيانات. كمية غير كافية من بيانات التدريب تتجلى إحدى إمكانيات قوة العقل البشري على قدرته على التعلّم من خلال بيانات قليلة جدًا، فمثلًا لكي يتعلم الطفل الصغير معنى التفاح، كلّ ما عليك فعله هو تحضر أمامه تفاحة، وأن تشير إلى تفاحة وتقول "هذه تفاحة" (وربما تكرر هذه العملية أكثر من مرة حتى يتعلم الطفل). إلا أنه من المفاجئ -من وجهة نظر الآلة- أن الطفل سيكون قادرًا على التعرف على جميع أنواع وألوان وأشكال التفاح من خلال تعلمه شكل تفاحة واحدة فقط، وفي بعض الأحيان من زاوية رؤية واحدة (مثلما يحدث عندما تعرض صورة ما على طفلك وتعلمه ما يوجد بها). طفلٌ عبقري! هذا حتمًا ما ستقوله الآلة عن طفلك. إن الميزات التلقائية الموجودة في طفلك (وفي كلّ أطفال العالم)، والقادرة على تعميم التعلّم، واستنباط النموذج الخاص بأي كائن (مثل استنباط شكل التفاح في مثالنا السابق)، والعديد من الميزات الأخرى الّتي لم يسبق لنا تعلمها وإنما وجدناها مثبتة تلقائيًا في عقولنا للأسف لا تكون موجودة تلقائيًا في تعلّم الآلة. بل إن معظم خوارزميات تعلّم الآلة تحتاج للكثير من البيانات حتى تستطيع العمل بصورة صحيحة. وحتى بالنسبة لأبسط المشكلات على العقل، ستحتاج خوارزميات تعلّم الآلة عادةً لآلاف الأمثلة الصحيحة كي تتعلّم، أما بالنسبة للمشكلات المعقدة مثل التعرف على الصور أو الكلام المنطوق، فغالبًا ما ستحتاج لملايين الأمثلة الصحيحة (باستثناء الحالات الّتي نستطيع فيها إعادة استخدام أجزاء من نموذج موجود). من الجدير بالذكر أنه للقاعدة السابقة بعض الاستثناءات إذ في بعض الحالات تكون كمية بيانات صغيرة نوعًا ما ولكن فعاليتها قوية وهذا يعود إلى عدة ميزات لهذه البيانات مثل: شمولية البيانات لكافة الحالات الممكنة للشيئ المدروس. عدم وجود ضجيج أو قيم فارغة أو شاذة. في الحقيقة إن هذه البيانات هي حلم لكل مهندسي تعلّم آلة. في بحث مشهور نشر في عام 2001، أظهر باحثا مايكروسوفت ميشيل بانكو وإريك بريل أن خوارزميات تعلّم الآلة المختلفة جدًا ببنيتها وصعوبتها وطريقة تعاملها مع البيانات، ووحتى الخوارزميات البسيطة إلى حد ما، كان أداؤها متطابقًا تقريبًا عند حلها لمشكلة معقدة تنتدرج تحت مسائل معالجة اللغة الطبيعية (المحكية) وتوضيحها، وذلك بمجرد إعطاء هذه الخوارزميات البيانات الكافية فقط. نلاحظ من خلال الشكل السابق أهمية البيانات مقابل الخوارزميات. على حد تعبير المؤلفين: "تشير هذه النتائج إلى أننا قد نرغب في إعادة النظر في هذه المفاضلة بين إنفاق الوقت والمال على تطوير الخوارزمية مقابل إنفاقها على طريقة تطوير وتحسين البيانات". بيانات التدريب المتحيزة من الأهمية بمكان استخدام مجموعة تدريب تمثل جميع الحالات الّتي تريد التعميم عليها. غالبًا ما يكون هذا أصعب مما يبدو: وخصيصًا إذا كانت العينة صغيرة جدًا، فسيكون لديك ضوضاء في أخذ العينات (أي البيانات متحيّزة نتيجة للصدفة البحتة)، ولكن حتى العينات الكبيرة جدًا يمكن أن تكون متحيزة أيضًا إذا كانت المشكلة في طريقة تجميع البيانات (أخذ العينات). هذا يسمى تحيز آخذ العينات. من أحد الأمثلة المشهورة في تحيز البيانات (العينات) وهو ما حدث أثناء الانتخابات الرئاسية الأمريكية عام 1936، والّتي تنافس فيها لاندون مقابل روزفلت: إذ أجرت مجلة The Literary Digest استطلاعًا كبيرًا جدًا، إذ أرسلت بريدًا لحوالي 10 ملايين شخص. تطلب منهم رأيهم في المرشح المناسب للرئاسة حصل هذا الاستطلاع على 2.4 مليون إجابة، وتوقع بثقة عالية أن لاندون سيحصل على 57٪ من الأصوات. ولكن كانت المفارقة عندما فاز روزفلت بنسبة 62٪ من الأصوات. ولكن كيف حدث ذلك؟ في الحقيقة وبعد التدقيق في حيثيات الموضوع تبين أن العيب كان في طريقة تجميع البيانات (وتسمى أحيانًا طريقة أخذ العينات) وكانت المشاكل على الشكل التالي: البيانات (أو العينات) محصورة بفئة محددة من الشعب: حصلت المجلة على العناوين الأشخاص الّذين سترسل لهم الاستطلاع من خلال أدلة الهاتف، وقوائم المشتركين في المجلات، وقوائم عضوية الأندية، وما شابه من ذلك. ولكن من المُلاحظ أن جميع الأشخاص يندرجون تحت الطبقة الغنية من المجتمع، والّذين هم أكثر عُرضة للتصويت على المرشح الجمهوري (ومن هنا لاندون كان المرشح المثالي). نسبة عدد المشاركين: في الحصيلة الكلية للاستطلاع أجاب أقل من 25٪ من الناس الذين أرسل لهم الاستطلاع. وهذا تحيز في طريقة جمع البيانات، من خلال استبعاد الأشخاص الّذين لا يهتمون كثيرًا بالسياسة، والأشخاص الّذين لا يحبون الاشتراك في المجلة وما إلى ذلك. هذا هو نوع خاص من التحيز لأخذ العينات يسمى تحيز عدم الاستجابة. ولكن من ناحية أخرى، كيف يمكننا الحصول على مجموعة بيانات تدريب كبيرة وصحيحة وشاملة لكلّ الحالات؟ لا بد أن ذلك سيكلفنا الكثير من الوقت والجهد والمال! البيانات ذات جودة ضعيفة في حال كانت بيانات التدريب الخاصة بك مليئة بالأخطاء، والقيم المتطرفة، والضوضاء (التي يمكن أن تحدث بسبب القياسات ذات الجودة الضعيفة والمنخفضة)، فسيصعب على النظام اكتشاف الأنماط الأساسية، لذلك من غير المرجح أن يعمل نظامك بصورة جيدة. غالبًا ما يستثمر مهندسي وعلماء البيانات جهدهم ووقتهم في تنظيف بيانات التدريب في محاولة منهم للحصول على بيانات نستطيع من خلال تعليم الآلة. فمثلًا: إذا كانت بعض الأمثلة واضحة بأنها شاذة، فقد يكون من الأفضل تجاهلها أو محاولة إصلاح الأخطاء الموجودة بها يدويًا. إذا كانت بعض الحالات تفتقد بعض الميزات (على سبيل المثال، لم يحدد 5٪ من عملائك أعمارهم)، فيجب عليك أن تقرر ما إذا كنت تريد تجاهل هذه السمة تمامًا، أو تجاهل هذه الحالات بالمجمل، أو تريد ملء القيم المفقودة (بقيم مثل: متوسط أعمار العملاء، أو بأي طريقة أخرى تراها مناسبة لاستبدال القيم الفارغة)، أو يمكنك أيضًا تدريب نموذج واحد مع هذه الميزة ونموذج آخر بدونها والموازنة بين النتائج، وهكذا. الميزات التي لا علاقة لها بالموضوع يشاع قول في مجتمع العلمي لتعلم الآلة وهو: "المدخلات الخاطئة تؤدي حتمًا لمخرجات خاطئة" وهذه نقطة دقيقة جدًا. في الحقيقة إن الميزات الّتي لا علاقة لها بموضوع المسألة أو المشكلة لن توصلنا إلى النتائج المرجوة أبدًا، ولن يكون نظامك قادرًا على التعلّم إلا إذا كانت بيانات التدريب تحتوي على ميزات كافية وذات صِلة، وليس الكثير من الميزات الّتي لا علاقة لها بالموضوع. هذه الجزئية مهمة جدًا في نجاح مشروع التعلّم الآلة. ومن كثرة أهميتها أوجد بعض الباحثين مسمى خاص يتضمن كافة العمليات الّتي تندرج في هذا السياق وهي هندسة الميزات، وغالبًا ما تتضمن عمليات هذه الهندسة على ما يلي: اختيار الميزة: اختيار أكثر الميزات المفيدة والتي لها علاقة بالموضوع لتدريب الخوارزمية عليها من بين جميع الميزات الأخرى الموجودة. استخراج الميزات: دمج بعض الميزات الموجودة لإنتاج ميزة أكثر فائدة. إنشاء ميزات جديدة: إنشاء ميزات جديدة من خلال جلب بيانات جديدة. والآن بعد أن اطلعنا على العديد من الأمثلة على التحديات الّتي تواجهنا في طريقة التعامل مع البيانات، لنلقِ نظرة على بعض التحديات الّتي تواجهنا في طريقة تعاملنا مع الخوارزميات. فرط تخصيص بيانات التدريب لنفترض أنك تزور بلدًا أجنبيًا، واقدم سائق سيارة الأجرة على سرقتك. فغالبًا ما ستميل للقول بأن جميع سائقي سيارات الأجرة في ذلك البلد لصوص. في الواقع إن التعميم المفرط هو شيئ نقوم به نحن معشر البشر في كثير من الأحيان، وللأسف يمكن أن تقع الآلات في نفس الفخ إذا لم نكن حذرين. في تعلّم الآلة، يُطلق على هذه المشكلة اسم فرط التخصيص (Overfitting): وتشير هذه المشكلة إلى أن النموذج يؤدي عملًا جيدًا مع بيانات التدريب، ولكنه لا يستطيع أن يعمّم التعلّم على البيانات الجديدة. يحدث فرط التخصيص عندما يكون النموذج معقدًا جدًا بالنسبة لكمية بيانات التدريب وضجيجها. بعض الحلول الممكنة في هذه الحالة هي: تبسيط النموذج عن طريق تحديد نموذج بمعلمات أقل (فمثلًا، نختار نموذج خطي بدلًا من نموذج متعدد الحدود عالي الدرجة)، عن طريق تقليل عدد السمات في بيانات التدريب أو عن طريق تقييد النموذج. جمع المزيد من بيانات التدريب. تقليل الضوضاء في بيانات التدريب (مثل إجراء عملية إصلاح أخطاء البيانات وإزالة القيم المتطرفة وما إلى ذلك). قلة تخصيص بيانات التدريب إن قلة التخصيص (Underfitting) هو عكس فرط التخصيص: ويحدث ذلك عندما يكون نموذجك بسيطًا جدًا في طريقة تعرفه على البنية المخفية في البيانات. وإليك بعض الطرق الّتي تساعدنا على إصلاح هذه المشكلة هي: اختيار نموذج أكثر قوة، مع المزيد من الوسطاء (Parameters). تغذية النموذج بميزات أفضل لخوارزمية التعلّم (الاستعانة بمختص هندسة الميزات). تقليل القيود على النموذج. هناك موضوع آخر مهم جدًا وهو أنه بمجرد قيامك بتدريب نموذج، هذا لا يعني بأن النموذج سيتمكن حتمًا من التعميم على كافة الحالات الجديدة. إذ يجب علينا أن نفحصه واختباره وتقييمه لمعرفة ذلك وأحيانًا سنحتاج لإعادة ضبطه إذا لزم الأمر. لنرى كيف سننفذ ذلك. عملية الاختبار والتحقق إحدى الطرق المستخدمة لمعرفة مدى تعميم نموذج على الحالات الجديدة هي بتجربته مباشرة على الحالات الجديدة. وذلك بنشر النموذج للمستخدمين ومراقبة مدى جودة أدائه. يمكن أن يكون هذا الخيار جيدًا، ولكن تعسفيًا جدًا لأنه إذا كان النموذج الخاص بك سيئًا للغاية، فحتمًا سيشتكي المستخدمون منه - لذا فهذا الخيار مستبعد. الخيار الأفضل هو تقسيم بياناتك إلى مجموعتين: مجموعة للتدريب ومجموعة للاختبار. كما تلاحظ من الأسماء، يتدرب النموذج الخاص بك من خلال مجموعة التدريب، ويختبر ما تعلمه على مجموعة الاختبار. يسمى معدل الخطأ في الحالات الجديدة خطأ التعميم، ومن خلال تقييم نموذجك في مجموعة الاختبار، تحصل على تقدير لهذا الخطأ. تخبرك هذه القيمة بمدى جودة أداء نموذجك في الحالات الّتي لم يراها من قبل. من الشائع استخدام 80٪ من البيانات لمجموعة بيانات التدريب (Training) و20٪ لمجموعة بيانات الاختبار (Testing). كما أنه يوجد العديد من الطرق الأخرى للتقسيم مثل طريقة تقسيم البيانات إلى ثلاث مجموعات: مجموعة للتدريب، مجموعة للاختبار، ومجموعة للتحقق (Validation) والّتي تستخدم لاختيار أفضل الإعدادات لخوارزميات تعلّم الآلة. (مثلًا لاختيار hyper-parameters). ولكي لا يخرج الكتاب عن عنوانه الرئيسي سنكتفي بهذه الطرق مبدأيًا وسنحاول التطرق لها لاحقًا بالتفاصيل الكاملة عند ورودها. المفاهيم الضرورية للتوسع بمجال تعلم الآلة إلى الآن لا نزال في طور الحديث عن مدخل بسيط لمجال تعلّم الآلة ولا بدّ أنك تسأل نفسك ماذا لو أردت أن أحترف هذا المجال؟ ما الّذي يتوجب علي تعلمه من المجالات الأخرى مثل الإحصاء والرياضيات؟ هل فعلًا يمكنني إكمال طريقي في هذا المجال بدون أن أتعلم المفاهيم الأساسية في الإحصاء والرياضيات؟ في الحقيقة لا يوجد إجابة موحدة لهذا السؤال لنستطيع فيها تعميم الأمر على كلّ المتعلمين، وذلك لأن الأمر مرهون بمدى سرعتك في التعلم وخلفيتك العلمية السابقة، فبعض المتعلمين يستطيعون الدخول في هذا المجال إذا كانوا قادمين من هندسة علوم الحاسب بسهولة نسبية وبدون أن يطلعوا على المفاهيم الرياضية والإحصائية؛ لأنهم غالبًا تعلموها أثناء دراستهم للهندسة، والبعض الأخر من المتعلمين لديهم سرعة بديهة عالية وشغف قوي لهذا المجال فيتعلمون الفكرة الإحصائية أو الرياضية بمجرد تطبيقهم لها في مثال ما. لذا فإن الأمر يعتمد اعتمادًا كليًا عليك، ولكن ولكي لا نبقِ للكسول أية حجة سنستعرض أهم الأفكار الرئيسية الّتي يتوجب عليك معرفتها قبل إكمال رحلتك التعليمية. سنعتمد على نفس الركائز الّتي تتبناها شركة غوغل أثناء عند تعليمها للمبتدئين في هذا المجال. ملاحظة: أغلب المراجع باللغة الإنكليزية. المتطلبات المعرفية الأساسية عمومًا يفضل أن يكون لديك معرفة جيدة للمتغيرات والمعادلات الخطية والرسوم البيانية (Graphs) للدوال والتوابع والمخططات أو المُدجات البيانية (Histograms) والوسائل الإحصائية. بالإضافة إلى ذلك من الناحية المثالية يجب أن تكون إمكانياتك البرمجية جيدة إلى حد ما. كما يفضل أن تكون لك معرفة بلغات البرمجة الخاصة بتعلم الآلة (مثل لغة البايثون ولغة R). إلا أنه إذا لم يكن لديك معرفة بها فلا بأس بذلك إذ يمكنك تعلم الأساسيات فقط وإكمال طريقك في تعلّم الآلة. الجبر المتغيرات الرياضية، المعاملات الرياضية والدوال الرياضية. المعادلات الخطية. اللوغاريتمات، والمُعادلات اللوغاريتمية. الدالة السينية. الجبر الخطي الموتر (tensor)، ورتبة الموتر. ضرب المصفوفات. علم المثلثات دالة الظل الزائدية tanh، نتعرف عليها باعتبارها دالة التنشيط ولا حاجة لمعرفة متعمقة بها. الإحصاء المتوسط، والوسيط، والقيم المتطرفة أو الشاذة، والانحراف المعياري. القدرة على قراءة المخططات والتدرجات البيانية. أساسيات البرمجة ولتكن بلغة بايثون عمومًا يجب أن نتعلم المفاهيم الأساسية لأي لغة برمجة وسنضرب مثلًا عن لغة البايثون: كتاب البرمجة بلغة بايثون. توثيق لغة بايثون. فالمواضيع الأساسية التي يجب أن تتقنها (والمشمولة بالمرجعين السابقين) هي: تعريف التوابع وكيفية استدعائها، وكيفية استخدام الطرق المختلفة للمعاملات. أنواع البيانات وأهمها القواميس Dictionaries، القوائم Lists، المجموعات Sets، وطرق (إنشائها والوصول إليها وكيفية المرور عليها). الحلقات التكرارية بأنواعها. الكتل الشرطية، والتعابير الشرطية. تنسيق السلاسل النصية. المتغيرات، وطرق الإسناد، وأنواع البيانات الأساسية. فهم كيفية استعمال list comprehensions (متقدم واختياري). التعامل مع الطرفية المحلية والسحابية لتشغيل تمارين البرمجة على جهازك المحلي أو في وحدة تحكم سحابية، يجب أن تتعلم كيفية العمل مع كلّ طرفية: توثيق الطرفية Bash. مدخل إلى طرفية لينكس. سلسلة مدخل إلى كتابة سكربتات الصدفة. حساب التفاضل والتكامل (اختياري) للمواضيع المتقدمة مفهوم الاشتقاق (لن تضطر إلى حسابه وإنما لفكرته). التدرج أو الانحدار. الاشتقاق الجزئي (التي ترتبط ارتباطًا وثيقًا بالتدرجات أو الإنحدار). قاعدة السلسلة Chain rule (من أجل فهم كامل وشامل لخوارزمية backpropagation المختصة بتدريب الشبكات العصبية). دورة الذكاء الاصطناعي احترف برمجة الذكاء الاصطناعي AI وتحليل البيانات وتعلم كافة المعلومات التي تحتاجها لبناء نماذج ذكاء اصطناعي متخصصة. اشترك الآن الخلاصة والآن بعد أن تعرفنا على الكثير من الأفكار حول تعلّم الآلة. قد يراودك شعور بأنك مشوشٌ بعض الشيء وهذا أمر طبيعي جدًا يفضل أن تراجع الفقرات الّتي تعتقد بأنك لم تركز عليها كثيرًا أو يمكنك ببساطة التركيز على ما يهمك من هذا الكتاب فقط، وعمومًا لنراجع أبرز ما تحدثنا عنه، ونلقي نظرة على الصورة الكاملة للأمر، عمومًا تكون خطوات بناء أي نظام يعتمد على تعلّم الآلة على الشكل التالي: جمع البيانات وإعدادها: كلّ شيء بدءًا من اختيار مكان الحصول على البيانات، مع التركيز على مدى نظافتها وشموليتها. اختيار الميزات المناسبة: وتعرف أيضًا بهندسة الميزات وهي جميع التغييرات الّتي تطرأ على البيانات من لحظة تنظيفها وإعادة بنائها في بعض الحالات إلى حين إدخالها في نموذج تعلّم الآلة. اختيار خوارزمية تعلّم الآلة المناسبة وتدريب نموذجنا الأول. اختبار وتقييم نموذجنا: ويشمل ذلك اختيار المقاييس المناسبة إلى جانب التقييم الفعلي. التغيير والتبديل للنماذج وضبطها: تشمل عملية تحسين النموذج إلى أقصى حد ممكن. ولا ننسَ أيضًا بعض الملاحظات الأخرى المهمة: تعلّم الآلة يتعلق بجعل الآلات تتحسن بأداء بعض المهام من خلال تعلّمها من البيانات، بدلًا من الاضطرار إلى ترميز القواعد بشكل صريح. هناك العديد من الأنواع المختلفة لأنظمة تعلّم الآلة لا يمكننا أبدًا الإدعاء بأنه يوجد طريقة أفضل من جميع الطرق الأخرى في جميع الحالات، فهذا الإدعاء خاطئ تمامًا. إذ يعتمد الأمر كله على الحالة الّتي تواجهها فمثلًا يمكنك الأخذ بعين الاعتبار على البيانات أولًا، وعلى ما نريد من الآلة أن تتعلمه منها ثانيًا والسرعة المطلوبة للخوارزمية ثالثًا وما إلى ذلك من المحددات. من الأفضل دومًا أن تناقش كيفية التغلب على التحديات الموجودة في البيانات والخوارزميات لأن ذلك سوف يختصر عليك الكثير من الوقت والجهد، والمال! إلى هنا نكون انتهينا من جميع الأفكار الأساسية لهذا المجال، الذكاء الاصطناعي وتعلم الآلة، فأرجو أنك حظيت برحلة ممتعة وشيّقة، وأسأل الله أن أكون قد وفقت في نقل المعلومات الأساسية والكاملة لهذا المجال بطريقة سهلة ومبسطة، وأتمنى بأن تساعدك هذه السلسلة على تحديد وجهتك القادمة. وأخيرًا قد تكون هذه هي النهاية بالنسبة لهذه السلسلة، ولكنها حتمًا بداية الرحلة بالنسبة لك : ) المراجع كتاب Hands on Machine Learning with Scikit Learn Keras and TensorFlow الطبعة الثانية. الدورة التدريبية لتعلم الآلة المقدمة من غوغل اقرأ أيضًا المقال السابق: المفاهيم الأساسية لتعلم الآلة النسخة الكاملة من كتاب مدخل إلى الذكاء الاصطناعي وتعلم الآلة
×
×
  • أضف...