У часи, коли машинне навчання і технології на базі нейромереж активно розвиваються, прогресує і апаратне забезпечення для цих сфер, передає Ukr.Media.
Але кожен розробник підходить до питання по-своєму: виробники графічних процесорів покладаються на початку масивний паралелізм своїх розробок, такі компанії як Google розробляють порівняно прості чіпи, все в яких підпорядковане єдиному завданню, що виконується максимально швидко, ну а такі компанії, як Intel адаптують існуючі процесорні архітектури. Так, нещодавно "сині" розкрили деякі секрети, що стосуються спадкоємців серії Knights Landing — процесорів Knights Mill.
Звичайно, компанія досліджує й інші напрямки, наприклад, рішення на базі FPGA Altera, а також розробляє співпроцесори Lake Crest та Knights Crest, які, швидше за все, будуть нагадувати Google TPU. Однак і спадкоємець серії Knights Landing — чіп Knights Mill — отримає змінену з урахуванням популярності технологій машинного навчання архітектуру.
Основа залишиться колишньою, але кожен модуль (VPU) отримає замість двох "великих" блоків FPU (32/64 біт) менший блок обчислень з плаваючою комою і чотири блоки Vector Neural Network Instruction (VNNI). Останні будуть підтримувати операції з плаваючою точкою одинарної точності, а також отримають здатність працювати зі змішаними цілочисельними форматами (16 біт на вході, 32 на виході). Схожі ядра є в складі NVIDIA V100, але вони підтримують більш традиційні формати FP32/64.
Кінцевий результат можна передбачити досить точно: Knights Mill буде вдвічі поступатися Knights Landing на операціях подвійної точності, але вдвічі ж перевершувати на операціях одинарної точності. А поява блоків VNNI з підтримкою цілочисельних форматів може підняти продуктивність Knights Mill в чотири рази в задачах, пов'язаних з глибинним машинним навчанням.
Таким чином, процесор вийде більш спеціалізованим, але в своїх областях спеціалізації він перевершить попередника вельми істотно. Чіпи Knights Mill не будуть страждати від нестачі ПСП, оскільки отримають 16 Гбайт MCDRAM, що доповнює 6-канальний контролер DDR4. Загальна кількість ядер залишиться колишнім — 72, з урахуванням 256 операцій на такт у блоках VPU, Knights Mill зможе продемонструвати 27 трильйонів операцій в секунду при частотах близько 1,5 ГГц. Це менше, ніж 92 трильйона операцій у Google TPU, але рішення Intel виглядає більш універсальним і збалансованим. З'явиться на ринку вже в четвертому кварталі цього року.