Для того, щоб роботи могли компенсувати витрати на їх розроблення та виготовлення, вони, природно, повинні працювати. Але перед цим хтось повинен навчити їх виконувати необхідну роботу. Зараз це роблять групи програмістів, які цілими днями розробляють програми для промислових роботів, але уявіть собі, що робот може навчитися виконанню будь-якої роботи, просто спостерігаючи за людиною, яка виконує цю ж саму роботу. Саме таку можливість реалізували дослідники відділу штучного інтелекту компанії NVidia, вони створили систему, яка після нетривалих доопрацювань і випробувань вже може бути використана для управління універсальними роботами наступних поколінь, передає Ukr.Media.
Технології навчання роботів деякий час розвиваються досить швидкими темпами. Роботи вже мають можливість навчатися за допомогою словесних інструкцій, навчатися, буквально читаючи думки людини, накопичувати досвід, виправляючи власні помилки, і ділитися своїм досвідом і знаннями через спеціалізовані хмарні сервіси.
Основою нової системи, як і інших систем штучного інтелекту, є штучна нейронна мережа, точніше кілька нейронних мереж, які спільно працюють над вирішенням однієї задачі. Ці нейронні мережі працюють на графічних процесорів NVidia Titan X GPU, куди подаються потоки відеоданих від камер, які спостерігають за діями людини і діями робота, який намагається наслідувати людину.
Зараз ця система працює на досить примітивному рівні, вона здатна розпізнавати кольорові кубики, іграшкові автомобілі, які людина-вчитель спочатку розставляє в певному порядку, а потім перемішує їх, порушуючи цей порядок. І робот повинен самостійно вибудувати всі ці предмети так, як показала йому людина.
Для того, щоб впоратися з цієї нескладним, на перший погляд, завданням, кожна з нейронних мереж виконує свою власну задачу. Одна з мереж ідентифікує, визначає місцеположення та просторову орієнтацію кожного з об'єктів. Наступна мережа визначає, в якому порядку розташовані ці об'єкти відносно один одного, і остання мережа розраховує порядок дій, які необхідно виконати роботу, для того, щоб впорядкувати об'єкти заданим чином.
Робот також має деякі інтелектуальні здібності, він може вчитися і здобувати досвід на своїх власних помилках. Коли він псує що-небудь на якому-небудь етапі процесу, він пробує зробити це ще раз, але вже не повторюючи попередньої помилки. Крім цього, робот "розписує" план своїх дій, це дозволяє спостерігачам перевірити правильність розуміння роботом поставленої задачі. І в разі потреби людина може провести повторний процес навчання робота.
Дана робота була представлена увазі громадськості в рамках Міжнародної конференції IEEE з питань робототехніки та автоматизації (IEEE International Conference on Robotics and Automation, ICRA), яка проходила минулого тижня у Брісбені, Австралія. А на наведеному відеоролику ви можете побачити весь процес навчання робота і його самостійні дії.