Армия США хочет управлять роем беспилотников для достижения превосходства в бою

Машинное обучение Робототехника Искусственный интеллект Транспорт
Армейская исследовательская лаборатория США (ARL) рассказала о попытках разработки алгоритма, который позволит военным управлять крупными скоплениями дронов в реальном времени. Армия США надеется, что это поможет ей добиться превосходства на поле боя. Кроме того, метод может быть полезен в разведке или при защите важных военных и гражданских объектов. «Поиск оптимального способа наведения в режиме реального времени для этих машин — это ключевое требование для повышения тактической ситуационной осведомленности бойцов. Это позволит армии США доминировать в сложной обстановке», — считает Джемин Джордж, сотрудник Командования по развитию боевых возможностей США. Джемин Джордж и его коллеги разработали метод управления большими скоплениями дронов на основе иерархического обучения с подкреплением (HRL). Как указывает издание The Register , скопление обученных беспилотных аппаратов можно будет отправлять в определенные области, снабдив их набором инструкций. При этом «стая» дронов будет автоматически поддерживать «строй» и выполнять приказы. Таким образом, диспетчерам-людям не придется беспокоиться об отдельных дронах и наземных транспортных средствах — достаточно будет указать группе роботов определённое место на карте. Машины, как команда, отправятся туда, куда им прикажут, и будут работать вместе как одна боевая единица. «Использование иерархического обучения с подкреплением позволит нам контролировать скопления беспилотных летательных и наземных транспортных средств, чтобы они могли оптимально выполнять различные виды миссий», — указал Джемин Джордж. Сотрудники лаборатории надеются, что в будущем автономные наземные роботы и летающие дроны смогут без вмешательства человека работать вместе и исследовать землю и небо. «Скопления роботов могут использоваться для постоянного наблюдения и разведки в густонаселенной городской местности, а также для защиты периметра военной базы или ценных активов», — отметил эксперт. Обучение с подкреплением представляет собой один из способов машинного обучения, в ходе которого ИИ обучается, взаимодействуя со средой. Иерархическое обучение с подкреплением позволяет ИИ использовать не только элементарные действия, но и подпоследовательности, выученные ранее, при работе с предыдущей задачей. «У каждого агента свой собственный цикл обучения с соответствующим вознаграждением. Мы смогли значительно сократить время обучения, запустив эти циклы обучения параллельно», — заявил Джемин Джордж. В лаборатории отмечают, что рассчитывают при помощи нового алгоритма управлять скоплениями от десятков до сотен машин. Однако пока что команда испытала свой метод только на четырёх квадрокоптерах в пределах одного помещения, и применять алгоритм в условиях реального боя ещё рано. «Прежде чем алгоритм можно будет применить в реальных условиях, необходимы обширные испытания в смоделированной и в настоящей среде с использованием физических ресурсов», - заключил Джемин Джордж. Новый метод подробно описан в статье на arXiv.)
Теги:
Хабы: