Обучение роботов для более надежной работы в команде для американской армии

Категория: Роботы

Исследователи из Лаборатории исследований армии США и Института робототехники в Университете Карнеги-Меллона разработали новую технологию, позволяющую быстро обучить роботов новому общему поведению с минимальным контролем со стороны людей. Эта технология позволяет мобильным роботам автономно перемещаться при выполнении действий, которые человек ожидает от них в данной ситуации.

Результаты исследования были недавно опубликованы и представлены на Международной конференции инженеров электротехники и электроники для робототехники и автоматизации в Брисбене, Австралия. Исследователи ARL, доктора Мэгги Вигнесс (Maggie Wigness) и Джон Роджерс (John Rogers) участвовали в личных беседах с сотнями участников конференции в течение двух с половиной часов интерактивной презентации.

Согласно Wigness, одной из целей группы, исследующей автономные системы, является обеспечение того, чтобы автономный робот стал надежным товарищем по команде солдату. «Если робот действует как товарищ по команде, задачи могут быть выполнены быстрее, и может быть достигнуто большая ситуационная осведомленность», - сказала Вигнесс. «Кроме того, товарищи роботы могут быть использованы в качестве дозорного для потенциально опасных сценариев, тем самым оберегая солдат».

Вигнесс сказала, что чтобы достичь этого, робот должен иметь возможность использовать собственные возможности для восприятия, обоснования и принятия решений. «В этом исследовании основное внимание уделяется тому, как интеллект робот-может пополниться за счет нескольких демонстраций человеческого поведения», - сказал Вигнесс. «Процесс обучения протекает быстро и требует минимального человеческого вмешательства, что делает его идеальным методом для обучения на лету в полевых условиях, когда постановка задачи меняется быстро».

Исследователи ARL и CMU сфокусировали свое первоначальное исследование на обучении роботов порядка обхода препятствий с использованием визуального восприятия местности и объектов на ней. В частности, робота научили, как перемещаться между разными точками, находясь вблизи края дороги, а также как скрыватся, используя здания в качестве прикрытия.

По мнению исследователей, при выполнении различных задач, наиболее подходящий сценарий поведение может быть активирован во время работы робота. Это достигается за счет использования обратного оптимального управления, также обычно называемого обратным обучением, которое представляет собой класс машинного обучения, который стремится восстановить функцию вознаграждения с учетом известной оптимальной политики.

В этом случае человек демонстрирует оптимальную политику, управляя роботом по траектории, которая отражает поведение, наилучшим образом подходящее к ситуации. Эти образцы траектории затем привязываются к визуальным объектам ландшафта, таким как трава, дороги и здания, чтобы изучить функцию вознаграждения в отношении этих особенностей среды.

Хотя подобные исследования и ранее проводились в области робототехники, то, что делает ARL, особенно уникально. «Проблемы и сценарии работы, которые мы делаем здесь, в ARL, чрезвычайно уникальны по сравнению с другими исследованиями», - сказала Вигнесс. «Мы стремимся создавать интеллектуальные роботизированные системы, которые надежно работают в условиях боевых действий, что означает, что сцена очень неструктурирована, возможно, шумная, и нам нужно сделать это с относительно небольшим априорным знанием текущего состояния окружающей среды. Тот факт, что наша постановка проблемы настолько отличается от многих других исследователей, позволяет ARL оказывать огромное влияние на исследования автономных систем. Наши методы, по самому определению проблемы, должны быть устойчивыми к шуму и иметь возможность обучаться с относительно небольшим количеством данных».

Согласно Вигнесс, это предварительное исследование помогло продемонстрировать возможность быстрого изучения кодирования поведения при обходе препятствий. «Когда мы подталкиваем это исследование к следующему уровню, мы начнем фокусироваться на более сложном поведении, которое может потребовать обучения не только визуальных функций восприятия», - сказала Вигнесс. «Наша система обучения достаточно гибкая, чтобы использовать априорную информацию, которая может быть доступна о среде. Это может включать в себя информацию о областях, которые могут просматриваться противником или областями, о которых известно, что они имеют надежную связь. Эта дополнительная информация может иметь отношение к определенным сценариям решения задач, и обучение в отношении этих функций улучшит интеллект мобильного робота».

Исследователи также изучают, как этот тип обучения влияет на передачу данных между различными мобильными платформами. Их оценка на сегодняшний день была выполнена с помощью небольшого беспилотного робота Husky от Clearpath, который имеет визуальное поле зрения, которое находится относительно близко к земле.

«Обучение кодированию поведения, которое может быть легко перенесено между различными платформами, было бы чрезвычайно ценным для команды гетерогенных роботов. В этом случае поведение может быть изучено на одной платформе, а не на каждой платформе отдельно », - сказала Вигнесс.

Это исследование финансируется с помощью Объединенного технологического альянса робототехники RCTA (Robotics Collaborative Technology Alliance) армии СЩА, в котором участвуют правительственные, промышленные и академические учреждения с целью проведения исследований и разработок, необходимых для развертывания будущих военных беспилотных сухопутных машин.

Сергей Вэй
12.07.2018

www.army-guide.com

Clearpath Robotics предлагает ROS-совместимый манипулятор для робота от Universal Robots
10.08.2018

Глобальный рынок беспилотных сухопутных машин - анализ и прогноз на 2016-2023 годы
14.08.2017

Арабские страны заказывают машину для обнаружения мин Husky
07.04.2017

Navistar Defense впервые представила ремонтный вариант MXT на выставке DVD 2013
28.07.2013

Clearpath Robotics Inc.

Husky (Ремонтно-эвакуационная машина)

Husky (Робот)

TSV Husky (Тактический автомобиль)