© unsplash.com/veryinformed У дослідників з’явився новий спосіб оцінити інтелект моделі ШІ: помістити її в гру Minecraft без інформації про її оточення та подивитися, наскільки добре вона грає.
Minecraft – це не тільки найпродаваніша відеогра в історії, вона також може стати ключем до створення адаптивних моделей штучного інтелекту (ШІ), які зможуть вирішувати різні завдання практично так само, як це роблять люди, пише New Scientist.
Стівен Джеймс з Вітватерсрандського університету в Південній Африці та його колеги розробили еталонний тест у Minecraft для вимірювання загального інтелекту моделей ШІ. MinePlanner оцінює здатність ШІ ігнорувати несуттєві деталі при вирішенні складного завдання, що складається з багатьох етапів.
Джеймс каже, що в багатьох випадках при навчанні ШІ “шахрують”, надаючи моделі всі дані, які їй потрібні для того, щоб навчитися виконувати роботу, і нічого зайвого. Такий підхід цілком виправданий, якщо ви хочете створити програмне забезпечення для виконання конкретного завдання – наприклад, прогноз погоди або згортання білків, але не в тому випадку, якщо ви намагаєтеся створити універсальний штучний інтелект (AGI).
Майбутні моделі ШІ повинні будуть вирішувати складні завдання, і Джеймс сподівається, що MinePlanner стане керівництвом для цих досліджень. ШІ, що працює над вирішенням проблеми у грі, бачитиме ландшафт, сторонні об’єкти та інші деталі, які не обов’язково потрібні для вирішення проблеми та мають бути проігноровані. Йому доведеться вивчити навколишнє оточення і самостійно розібратися, що потрібно, а що не потрібно.
MinePlanner складається з 15 будівельних завдань, кожне з яких має легкий, середній та важкий рівні – всього 45 завдань. Щоб виконати кожне завдання, ШІ може знадобитися зробити проміжні кроки – наприклад, побудувати сходи, щоб розмістити блоки на певній висоті. Це вимагає від ШІ вміння відволікатися від проблеми та планувати подальші дії для досягнення мети.
Тим часом в експериментах із сучасними моделями плануючого ШІ ENHSP та Fast Downward – програмами з відкритим вихідним кодом, призначеними для виконання послідовних операцій для досягнення спільної мети – жодна з моделей не змогла вирішити жодного складного завдання. Fast Downward змогла вирішити лише одне із завдань середнього рівня та п’ять легких завдань, у той час як ENHSP показала дещо кращі результати, вирішивши всі легкі завдання, крім одного, та всі завдання середнього рівня, крім двох.
Раніше кандидат юридичних наук Сергій Козьяков розповідав у статті для ZN.UA, якою має бути державна політика щодо розвитку та небезпеки ШІ.