Одним из самых больших препятствий в обучении роботов новым навыкам является преобразование сложных, многомерных данных, таких как изображения со встроенных RGB-камер, в действия, направленные на достижение конкретных целей. Существующие методы обычно полагаются на трехмерные представления, требующие точной информации о глубине, или используют иерархические прогнозы, которые работают с планировщиками движения или дискретными политиками.
Исследователи из Имперского колледжа Лондона и Лаборатории обучения роботов Дайсона представили новый подход, который может решить эту проблему. Метод «Рендеринг и диффузия» (НИОКР) направлен на устранение разрыва между многомерными наблюдениями и низкоуровневыми действиями робота, особенно когда данных недостаточно.
Исследования и разработки, описанные в статье, опубликованной на сервере препринтов arXiv, решают проблему с помощью виртуальных представлений 3D-модели робота. Отображая низкоуровневые действия в пространстве наблюдения, исследователи смогли упростить процесс обучения. (Изображение предоставлено Восилиусом и др.)
Визуализируйте свои действия в изображении
Одна из визуализаций, к которой исследователи применили эту технику, заключалась в том, чтобы заставить роботов сделать то, что мужчины считают невозможным – по крайней мере, по мнению женщин –: опустить сиденье унитаза. Задача состоит в том, чтобы взять высокомерное наблюдение (видеть, как сиденье унитаза поднято) и объединить его с роботизированным действием низкого уровня (опускание сиденья).
TechXplore объясняет: «В отличие от большинства роботизированных систем, осваивая новые ручные навыки, люди не выполняют обширных вычислений, чтобы определить, насколько сильно нужно двигать конечностями. Вместо этого они обычно пытаются представить, как должны двигаться их руки, чтобы эффективно решать конкретную задачу».
Виталис Восилиус, последний курс Ph.D. Студент Имперского колледжа Лондона и ведущий автор статьи сказал: «Наш метод Render and Diffuse позволяет роботам делать нечто подобное: «представлять» свои действия внутри изображения, используя виртуальные представления своего собственного воплощения. Действия роботов и отображение наблюдений вместе, поскольку изображения RGB позволяют нам обучать роботов различным задачам с меньшим количеством демонстраций и с улучшенными возможностями пространственного обобщения».
Важной частью НИОКР является процесс распространения полученных знаний. Это итеративно уточняет виртуальные представления, обновляя конфигурацию робота до тех пор, пока его действия не будут точно соответствовать обучающим данным.
Подпишитесь на информационный бюллетень Ny Breaking и получайте все лучшие новости, мнения, функции и рекомендации, необходимые вашему бизнесу для успеха!
Исследователи провели обширные оценки, протестировав различные варианты исследований и разработок в смоделированных средах и шести реальных задачах, включая снятие крышки со сковороды, размещение телефона на зарядной станции, открытие коробки и поддвижение блока к цели. Результаты были многообещающими, и по мере продолжения исследований этот подход может стать краеугольным камнем в разработке более умных и адаптируемых роботов для повседневных задач.
«Способность представлять действия роботов в изображениях открывает захватывающие возможности для будущих исследований», — сказал Восилиус. «Мне особенно нравится сочетать этот подход с мощными моделями на основе изображений, обученными на огромных данных из Интернета. Это может позволить роботам использовать общие знания, полученные с помощью этих моделей, и в то же время иметь возможность рассуждать о действиях роботов на низком уровне». (Изображение предоставлено Восилиусом и др.)
Другие работы из Нью-Йорка Брейкинга
Статья добавлена ботом, с использованием машинного перевода : https://nybreaking.com/category/tech/