DC Field | Value | Language |
dc.contributor.author | Protsenko, Y. | - |
dc.contributor.author | Paramonov, A. | - |
dc.contributor.author | Paramonov, A. I. | - |
dc.date.accessioned | 2022-01-17T09:35:08Z | - |
dc.date.available | 2022-01-17T09:35:08Z | - |
dc.date.issued | 2020 | - |
dc.identifier.citation | Protsenko, Y. Agent communication method in cooperative environment based on the artificial neural networks / Yaroslav Protsenko, Anton Paramonov // Інформаційні технології та автоматизація : монографія / З. В. Бондаренко [та ін.] ; за заг. ред. С. В. Котлика. – Одеса, 2020. – С. 111–120. | ru_RU |
dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/46562 | - |
dc.description.abstract | The problem of communication between cooperating agents in multiagent environments is
considered in this paper. An algorithm is proposed that is based in reinforcement learning and
recurrent neural networks. Main idea behind the algorithm is to use an additional recurrent network that translates information from internal state of one agent to internal state of another agent. Experimental evaluation is performed on model environment. Experimental results have shown that proposed method is potentially useful but requires additional investigation. | ru_RU |
dc.language.iso | en | ru_RU |
dc.publisher | Астропринт | ru_RU |
dc.subject | публикации ученых | ru_RU |
dc.subject | recurrent neural networks | ru_RU |
dc.subject | multiagent environments | ru_RU |
dc.subject | рекуррентные нейронные сети | ru_RU |
dc.subject | многоагентные среды | ru_RU |
dc.title | Agent communication method in cooperative environment based on the artificial neural networks | ru_RU |
dc.type | Глава из книги | ru_RU |
local.description.annotation | В роботі розглядається проблема комунікації кооперуючих агентів у мультиагентних середовищах. Запропоновано алгоритм на основі підходів навчання з підкріпленням з використанням рекурентних нейронних мереж. Головна ідея алгоритму – це використання додаткової рекурентної мережі, яка виконує обмін інформацією між внутрішніми станами двох агентів під час комунікації. Обраний підхід заснований на застосуванні алгоритму A3C, рекурентної нейронної мережі Long Short-Term Memory (LSTM) для керування агентом та додаткової рекурентної мережі (мережі комунікації). Досліджено два варіанта архітектури нейронної мережі. За першою версією агенти спочатку «спілкуються», а потім використовується результат у якості додаткових даних про середовище. Друга версія спочатку аналізує дані про середовище, а потім реалізує «спілкування» агентів, обмінюючись високорівневою інформацією. Проведено експериментальну оцінку запропонованого алгоритму на прикладі модельної задачі. Результати експерименту довели, що запропонований підхід покращує ефективність кооперуючих агентів. Перевагою алгоритму є те, що він не потребує наявності складних та структурованих обчислювальних систем та може бути фізично реалізованим за допомогою дуже маленьких об’єктів, таких, як наприклад макромолекули. В работе рассматривается проблема коммуникации кооперирующих агентов в мультиагентной среде. Предлагается алгоритм на основе подходов обучения с подкреплением с использованием рекуррентных нейронных сетей. Главная идея алгоритма – использование дополнительной нейронной сети, которая выполняет обмен информацией между внутренними состояниями двух агентов во время коммуникации. Предлагаемый подход основан на применении алгоритма A3C, рекуррентной нейронной сети Long Short-Term Memory (LSTM) для управления агентом и дополнительной рекуррентной сети (сети коммуникации). Исследовано два варианта построения архитектуры нейронной сети. Первая версия сначала организовывает взаимодействие агентов, а затем использует результат в качестве дополнительных данных о среде. Вторая версия сначала анализирует данные о среде, а потом коммуницирует, обмениваясь высокоуровневой информацией. Проведена экспериментальная оценка предложенного алгоритма на примере модельной задачи. Результаты эксперимента показали, что предложенный алгоритм улучшает эффективность кооперирующих агентов. Преимуществом алгоритма можно считать то, что он не требует наличия сложных и структурированных вычислительных систем и может быть физически реализован с помощью очень маленьких объектов, таких, как например макромолекулы. | - |
Appears in Collections: | Публикации в зарубежных изданиях
|