Нейромережа створила комп'ютерну візуалізацію для гри

Вона була навчена на безлічі записів поїздок на автомобілях.

Нейромережа створила комп'ютерну візуалізацію для гри. Вона була навчена на безлічі записів поїздок на автомобілях.

Розробники з NVIDIA створили гру, в якій за розрахунок структури ігрового світу відповідає ігровий рушій, а рендеринг графіки виробляє нейромережа, навчена на множині відеозаписів реального світу. Розробка була представлена на конференції NIPS 2018, а її опис опубліковано на сайті компанії, інформує UkrMedia.

В останні кілька років безліч дослідницьких груп домоглися великого успіху в області нейромережевого перенесення стилю і деталей між зображеннями. Приміром, нейромережі вже вміють перетворювати намальовані портрети в реалістичні фотографії людей. Але на цьому дослідники не зупинилися і приступили до більш складної задачі - перенесення між відеороликами. Ця задача більш складна не просто тому, що нейромережі потрібно обробляти більший обсяг даних. Головна відмінність полягає в тому, що алгоритм повинен працювати не тільки з одним кадром, а відразу з кількома сусідніми, інакше підсумковий ролик буде «смиканим».

Влітку 2018 року група розробників з NVIDIA представила алгоритм vid2vid, здатний виконувати перенесення між відеороликами різних стилів, і при цьому створювати плавні переходи між кадрами підсумкового ролика. Алгоритм являє собою генеративно-змагальну нейромережу, що складається з генератора, який створює зображення, і дискримінатора, що прагне відрізнити створені генератором «підробки» від об'єктів з навчального датасета. Розробники створили кілька нейромережевих моделей і одну з них вони навчили перетворювати семантично сегментовані відеозаписи (на яких кожен кадр розбитий на області, що відповідають об'єктам певних класів) поїздок автомобілем в реалістичні ролики.

У своїй новій розробці дослідники об'єднали алгоритм vid2vid з ігровим рушієм і створили на їх базі комп'ютерну гру. В якості движка вони вибрали Unreal Engine 4, застосовується у багатьох популярних іграх. Під час роботи рушій створює тривимірну модель віртуального світу, а користувач керує пересуванням автомобіля в цьому світі. При цьому, оскільки, всі об'єкти у віртуальному світі належать до строго певного класу, розробники реалізували висновок семантично сегментованої послідовності кадрів. Після синтезу ця послідовність передається на нейромережу, яка перетворює її в досить реалістичний відеоролик, який вже відображається на екрані перед користувачем.

В кінці 2017 року дослідники з NVIDIA створили іншу генеративно-змагальну нейромережу для перенесення між відеороликами. Вони навчили її на різних типах виконувати різні завдання. Наприклад, алгоритм зміг перетворити запис зимової поїздки автомобілем в поїздку по річних дорогах, а також зумів змінити породу собак.