التعلم المعزز للذكاء الاصطناعي لليتعلم من أخطائه

فيزيون مصر للأخبار:- “الأمر يشبه تعلم دليل السائق قبل تشغيل السيارة، فمن خلال هذه الخطوة، يبني النظام الذكي قاعدة معرفية للاعتماد عليها كي لا يبدأ من نقطة عمياء بحثا عن الإجابة الصحيحة”.

فيزيون مصر للأخبار:- تمهيد الطريق لاستخدام الذكاء الاصطناعي في تطبيقات واقعية وحساسة ومتعددة
Source de l'image: - google

هذا ما أوضحه بيير جين أليت، رئيس أبحاث أنظمة الطاقة الذكية والذي يشارك مهندسين في المركز السويسري للإلكترونيات والتقنيات الدقيقة في تطوير طريقة جديدة لتعلم الآلة تمهد الطريق لاستخدام الذكاء الاصطناعي في تطبيقات حساسة متعددة.

وتم اختبار الطريقة بتشغيل عمليات المحاكاة على نظام تحكم في المناخ لمبنى مكون من مئة غرفة، لتوفير الطاقة بنحو 20 في المئة.

وطور مهندسو المركز نهجا للتغلب على هذه المشكلة بتدريب الكمبيوترات أولا على نماذج نظرية مبسطة قبل ضبطها للتعلم على أنظمة الحياة الواقعية. أولا، دربوا الكمبيوتر على نموذج افتراضي مبني من معادلات بسيطة تمثل الأعمال في المبنى ، ثم أدخلوا بيانات المبنى الفعلية (درجة الحرارة، ومدة فتح الستائر، والظروف الجوية، وما شابه ذلك) في الكمبيوتر، لجعل التدريب أكثر دقة، ثم سمحوا للكمبيوتر بتشغيل خوارزمياته للتعلم المعزز للعثور على أفضل طريقة لإدارة نظام التدفئة والتهوية والتكييف.

لكن العيب الرئيسي في التعلم المعزز أنه غير قابل للاستخدام في بعض تطبيقات الحياة الواقعية، إذ إن النظام يختبر في البداية جميع الاحتمالات خلال عملية تدريب ذاته، إلى أن يعثر على المسار الصحيح.

وتمثل مرحلة التجربة والخطأ الأولية هذه مشكلة في بعض التطبيقات، مثل أنظمة التحكم في درجة حرارة بيئة معينة إذ يجب ألا تحدث فيها تقلبات مفاجئة في درجات الحرارة.

وهذا يعني أنه عندما يبدأ الكمبيوتر عملية تعلم الآلة على أنظمة الحياة الواقعية، فإنه يعتمد على ما تعلمه سابقا من النماذج، ما يمكنه من اختيار المسار الصحيح بسرعة دون المرور بمرحلة التقلبات.

ويفتح هذا الاكتشاف آفاقا جديدة لتعلم الآلة من خلال توسيع استخدامه ليشمل التطبيقات التي يكون للتقلبات الكبيرة للتشغيل فيها تكاليف مالية أو أمنية باهظة.