AlphaZero самостійно вчиться грати в ігри на найвищому рівні

Група вчених з групи DeepMind і Університетського коледжу в Лондоні розробила систему штучного інтелекту, здатну до самонавчання грі та вдосконалення в трьох складних настільних іграх. У своїй роботі, опублікованій в журналі Science, вчені описують свою нову систему і пояснюють, чому вважають, що вона являє собою великий крок в напрямку розвитку майбутніх систем ШІ.

Минуло понад 20 років з тих пір, як суперкомп’ютер Deep Blue переміг чемпіона світу з шахів Гарі Каспарова і показав світу, як далеко просунулися обчислення у сфері ІІ. З тих пір комп’ютери ставали все розумнішими і сьогодні перемагають людей в таких іграх, як шахи, сьоги і го. Однак кожна з подібних програм налаштовувалася спеціально, щоб стати майстром в окремій грі. У своїй новій роботі вчені описали створення штучного інтелекту, який не тільки гарний у декількох іграх, але і навчається цьому вдосконалення самостійно.

AlphaZero: новий майстер

Нова система під назвою AlphaZero являє собою систему навчання з підкріпленням, тобто навчається, багаторазово граючи в гру і навчаючись на своєму досвіді. Це, зрозуміло, дуже схоже на процес навчання людей. Визначається базовий набір правил і комп’ютер грає в гру — сам з собою. Йому навіть партнери не потрібні. Він грає сам з собою багато разів, відзначаючи хороші і переможні ходи. З часом він стає все краще і краще, перевершує не тільки людей, але й інші системи штучного інтелекту, розроблені для настільних ігор. Дана система також використовувала метод пошуку «дерева пошуку Монте-Карло». Поєднання двох технологій дозволило системі навчитися вдосконалення в грі. Вчені випробували сили програми, забезпечивши її великою потужністю — 5000 тензорних процесорів, що працюють в парі з великим суперкомп’ютером.

Читайте також  Facebook буде платити користувачам за перегляд реклами

На поточний момент AlphaZero освоїв шахи, сьоги і го. Наступним кроком стануть популярні відеоігри. Що стосується продуктивності ІІ, то в го, наприклад, AlphaZero обіграв легендарного AlphaGo вже через 30 годин.

Як думаєте, коли буде вибух штучного інтелекту?

Степан Лютий

Обожнюю технології в сучасному світі. Хоча частенько і замислююся над тим, як далеко вони нас заведуть. Не те, щоб я прям і знаюся на ядрах, пікселях, коллайдерах і інших парсеках. Просто приходжу в захват від того, що може в творчому пориві вигадати людський розум.

You may also like...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *