МЕТОД ФОРМУВАННЯ ПОСЛІДОВНОСТІ ДІЙ ІНТЕЛЕКТУАЛЬНИХ АГЕНТІВ
DOI:
https://doi.org/10.17721/2519-481X/2020/66-07Ключові слова:
інтелектуальний агент, планування, модель, Q-навчання, емоційні стани, навчання з підкріпленнямАнотація
У статті запропоновано підхід, де реалізація формування послідовностей дій інтелектуальних агентів виконується по аналогії з діяльністю біологічних організмів з використанням механізму емоцій для динамічного налаштування організму на виконання дій. Таким чином імітуються функції лімбічної системи в організації рухів на основі мотиваційної поведінки. При плануванні в першу чергу визначається загальний стан агенту. Використовуючи отриманий стан формується послідовність дій. Такий підхід дасть можливість динамічно переналаштовувати послідовність і реагувати на небезпечну ситуацію або на зміну внутрішнього стану агенту.
Інтелектуальний агент отримує з сенсорів і рецепторів ознаки початкової умови по ній визначається ціль та формується послідовність дій. Елементами послідовності дій є елементарні дії. Елементарна дія характеризується набором вхідних параметрів для функціонування. Ознаки передумови відповідають першій дії в послідовності, остання дія в послідовності прив’язана до ознаки цілі.
Послідовність дій агенту представляється орграфом, де вершини визначають елементарні дії, а ребра визначають ступінь сили зв’язку між ними. Початкові умови відповідають першій дії в послідовності, з неї розпочинається реалізація послідовності дій. Ознаки цілі відповідають останній вершині в послідовності дій
Ваги зв’язків змінюються при встановлені змінних загального стану, що дає змогу виконати послідовність дій в реальному масштабі часу з динамічним переналаштуванням і вибрати серед характерних для конкретного стану послідовностей дій. Метод формує послідовність дій, яка ініціюється емоційними станами, і переводить її в послідовність автоматичних дій на основі досягнення цілі і яка в майбутньому буде виконуватись в нормальному стані. Для перевірки функціонування методу реалізований симулятор агенту-роботу в середовищі програми V-REP. Отримані результати можуть бути використані для інтелектуального планування на основі підкріплення при керуванні агентами, роботами на виробничих підприємствах, військовими агентами, потоками міського руху, логістичними системами, соціальними явищами.