The Emergence of Flexibility: Towards a Comprehensive Theory for Transferring Experience in Context-Dependent Learning

Project: General ResearchGeneral Research 2013

Project Details

Abstract Arabic

كثيرا ما استخدم "المرونة السلوكية" في الأيام الأولى من عصر الذكاء الاصطناعي للدلالة على قدرة نظام تقني (روبوت أو برنامج كمبيوتر) محدود الخبرة لاكتساب خبرة من خلال التعلم في بيئة ثابتة إلى حد ما اليوم، وبعد أن أصبحت نظم الذكاء الاصطناعي تستلهم على نحو متزايد نظيرتها البيولوجية (الطبيعية)، ومع اتساع رقعة البحث العلمي لتشمل أيضا التعلم والأداء في بيئات متغيرة، فقد أضاف تعبير "المرونة السلوكية" إلى معناة قدرة نظام تقني ذي خبرة واضحة على استغلال خبرته لتحسين أدائه في بيئة غير ثابتة. غاية المشروع أن يوظف مبادئ الذكاء الموجودة في الطبيعة لتصميم أنظمة تعلم وتعليم الكترونية. وبصورة أدق، نود أن يبحث سبل وكيفية الاستفادة من المعلومات المنبثقة من السياق في نقل الخبرة المتعلمة في بيئة أبرز حيثياتها أن اللايقين وحده هو اليقين. ضمن هذه الظروف تنمو قيم بعض المؤشرات المرتبطة بالسياق لتلعب بمرور الوقت دوراً حاسما في صياغة أداء مرن. فعلى سبيل المثال، يمكن لنظام تعلم إلكتروني ذكي أن يرفع من أدائه إذا اعتمد على الفروق الفردية (المستندة إلى اعتبارات ثقافية، بيئية، أو جينية) لدى مستخدميه أثناء عملية التعلم التفاعلي. إدراج الفروق الفردية للمستخدم يزيد من فاعلية نظام التعليم الإلكتروني لما يضيفه عليه من مرونة في الأداء. تحقيقاً لهذه الغاية نطمح إلى إجراء بحث متعدد التخصصات نجمع فيه بين مقاربات معرفية وتقنية. بكلام أدق، قمنا بتطوير نموذج تعلم بالربط يمكن المتعلمين ابتداء من تعلم ثم لا حقا استذكار علاقات حسية حركية على ضوء سياقات متكررة التغير على نحو مفاجئ. وفق نموذج التعلم هذا يمكن للخبراء أن تكون مؤثرة حين انتقالها ضمنياً عبر سياق التسلسل الزمني للأحداث المتعاقبة أثناء عملية التعلم. استنادا إلى نتائج تحليل البيانات المستقاة من التجارب المزمع إجراؤها، سنقوم بتوظيف الشبكات العصبية الاصطناعية مع نظرية تعزيز التعلم لاستحداث نماذج حسابية تخدم تصميم نظم تقنية مرنة تستقي مرونتها من الذكاء المصاحب لسلوك الطبيعة.

Abstract English

In the early days of artificial intelligence, the term ‘behavioural flexibility’ was frequently used to denote the ability of an inexperienced agent to acquire experience through learning in a, more or less, stationary environment. Today, as artificial systems are becoming increasingly inspired by their biological (natural) counterparts and research is considering also changing environments, ‘behavioural flexibility’ connotes the ability of an already experienced agent to exploit experience, so as to navigate a non-stationary environment. We investigated how contextual information helps transfer experience within environments, where uncertainty is the only certainty. In such environments, initially irrelevant environmental cues may well, over time, prove vitally important for flexible performance. To this end, we extended an associative learning paradigm and based our implementation on the theory of reinforcement learning. A core feature of this type of learning is to balance the scale between exploitation and exploration mechanisms, so as to achieve optimal action control in a non-stationary environment. We solved this dilemma by designing a controller model that compares predictions of two simultaneously running learning algorithms: one learns an overt classification task and the other acquires covert contextual temporal information of the sequentially occurring events. Our implementation showed that experience was retained, implicitly, via the temporal sequence of the occurring events, suggesting a role of temporal sequence information in the generalisation and transfer of experience. Our findings contribute directly to the design of artificial intelligent systems in various fields (e.g. e-learning systems in education and technical analysis systems in financial markets). Moreover, through combining aspects of natural intelligence (e.g. the idea of cooperative/competitive brain systems) in the design of artificial systems, our results motivate multidisciplinary r
StatusFinished
Effective start/end date1/04/141/04/15

Fingerprint

Explore the research topics touched on by this project. These labels are generated based on the underlying awards/grants. Together they form a unique fingerprint.