Чергова перемога Deep Mind: після шахів та го штучний інтелект підкорив StarCraft

У листопаді 2017 року, тобто трохи більше року тому ми писали, що штучний інтелект поки що не в силах здолати професійних гравців в StarCraft. Але не пройшло і року, як і цей бар’єр виявився взято. Минулого місяця в Лондоні команда з англійської підрозділу дослідження штучного інтелекту DeepMind тихо заклала новий наріжний камінь у протистоянні людей і комп’ютерів. У четвер вона розкрила це досягнення в тригодинному стриме на YouTube, в ході якого люди і роботи билися не на життя, а на смерть.

DeepMind переміг людей в StarCraft

Трансляція DeepMind показала, що її робот з штучним інтелектом AlphaStar перемагає професійного гравця в складній стратегії в реальному часі (RTS) StarCraft II. Чемпіон людства, 25-річний Гжегож Коминц з Польщі, відлетів з рахунком 5:0. Схоже, програмне забезпечення для машинного навчання виявило стратегії, невідомі професіоналам, які змагаються за мільйони доларів призових, які видаються щорічно в одній з найбільш прибуткових для світу кіберспорту ігор.

«Це не було схоже ні на один StarCraft, в який я грав», заявив Коминц, відомий професіонал під ніком MaNa.

Подвиг DeepMind є найскладнішим в довгому ланцюжку змагань, які комп’ютери нав’язували кращим з світу людей в іграх і в яких перемагали. Шашки впали в 1994, шахи 1997, у 2016 році AlphaGo підкорив гру го. Робот для StarCraft — самий потужний гравець зі світу штучного інтелекту; і його прихід чекали.

AlphaStar з’явився приблизно шість років тому в історії машинного навчання. Хоча перемога AlphaGo в 2016 році була приголомшливою — експерти го вважали, що цей момент настане як мінімум десятьма роками пізніше — перемога AlphaStar здається більш-менш прибула за розкладом. До теперішнього часу ясно, що при достатній кількості даних і обчислювальної потужності машинне навчання може впоратися зі складними, але конкретними проблемами.

Читайте також  Перевірка пунктуації онлайн - Як перевірити пунктуацію онлайн

Марк Рідл, доцент Технологічного інституту Джорджії, знайшов новини четверга захоплюючими, але не приголомшливими. «Ми вже дійшли до цієї точки, так що це був тільки питання часу. У певному сенсі, перемагати людей в іграх стало нудно».

Відеоігри начебто StarCraft математично складніше, ніж грати в шахи чи го. Кількість дійсних позицій на дошці го являє собою одиницю з 170 нулями, а еквівалент в StarCraft оцінюється як 1 до 270 нулями, не менше. Створення і управління військовими юнітами в StarCraft вимагає від гравців вибору і виконання багатьох інших дій, а також прийняття рішення без можливості бачити кожен крок опонента.

DeepMind предолел ці круті бар’єри за допомогою потужних чіпів TPU, які Google винайшов для підвищення потужності машинного навчання. Компанія адаптувала алгоритми, розроблені для обробки тексту під задачу визначення дій на полі битви, які приводять до перемоги. AlphaStar навчався в StarCraft на записах півмільйона ігор між людьми, потім грав з постійно улучшающимися клонами самого себе у віртуальній лізі, що являє собою свого роду цифрову еволюцію. Кращі боти, що з’явилися в цій лізі, накопичували досвід, еквівалентний геймплею 200 років.

AlphaStar, який здолав MaNa, далеко не всесильний. На даний момент робот може грати тільки за одну з трьох рас, доступних в StarCraft. На додаток до нелюдськи довгого досвіду гри, DeepMind також по-іншому сприймає цю гру. Він бачить все, що відбувається в грі, однвоременно, тоді як MaNa потрібно було переміщатися по карті, щоб побачити, що відбувається. AlphaStar також володіє більш високою точністю управління і націлювання юнітів, ніж людина, яка володіє комп’ютерною мишею, хоча час реакції комп’ютера і менше, ніж у професійного геймера.

Читайте також  Дим палаючого лісу може бути небезпечніше радіації

Незважаючи на ці огріхи, Рідл та інші експерти цілком вітали роботу DeepMind. «Це було дуже вражаючою», говорить Цзе Тан, дослідник незалежного дослідницького інституту ІІ OpenAI, що працює над ботами, які грають в Dota 2, саму прибуткову для кіберспорту гру в світі. Такі трюки з відеоіграми можуть мати потенційно корисні побічні ефекти. Алгоритми і код, які OpenAI використовував для освоєння Dota в минулому році, з перемінним успіхом були адаптовані, щоб зробити руки роботів більш спритними.

Тим не менш, AlphaStar ілюструє обмеження сучасних вузькоспеціалізованих систем машинного навчання, каже Джуліан Тогелиус, професор Нью-Йоркського університету і автор нещодавно виданої книги про ігри та штучному інтелекті. На відміну від свого людського противника, новий чемпіон DeepMind не може грати в повну силу на різних ігрових картах або за різні раси інопланетян у грі без тривалого додаткового навчання. Також він не може грати в шашки, шахи або більш ранні версії StarCraft.

Ця нездатність впоратися навіть з невеликими сюрпризами є проблемою для багатьох очікуваних додатків ІВ, таких як автономні автомобілі або адаптуються боти, які дослідники називаються загальним штучним інтелектом (AGI, ОІІ). Більш значуща битва між людиною і машиною може бути свого роду десятиборством, з настільними іграми, відеоіграми та фіналом у Dungeons and Dragons.

Обмеження вузькоспеціалізованого штучного інтелекту, здавалося, проявилися, коли MaNa грав у показову гру проти AlphaStar, який був обмежений переглядом карти за типом людини, по одному квадрату за раз. Дані DeepMind показали, що він майже так само гарний, як і той, що обіграв MaNa в п’яти іграх.

Новий бот швидко зібрав армію, достатньо міцну, щоб знищити свого суперника-людини, але MaNa використовував розумні маневри і досвід поразок, щоб стримати сили ІІ. Затримка дала йому час, щоб зібрати власні війська і перемогти.

Читайте також  Програма Tampermonkey: призначення, особливості експлуатації та специфіка видалення

Степан Лютий

Обожнюю технології в сучасному світі. Хоча частенько і замислююся над тим, як далеко вони нас заведуть. Не те, щоб я прям і знаюся на ядрах, пікселях, коллайдерах і інших парсеках. Просто приходжу в захват від того, що може в творчому пориві вигадати людський розум.

Вам також сподобається...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *