AI независимо се научи да играе шах на свръхчовешко ниво за ден - Алтернативен изглед

Видео: AI независимо се научи да играе шах на свръхчовешко ниво за ден - Алтернативен изглед

Видео: Как се редят фигурите в шаха 2024, Април

2024 Автор: Keith Bush | [email protected]. Последно модифициран: 2023-12-16 14:04

Алгоритъмът AlphaZero, без човешки учител, овладя шах и играта на шоги за 24 часа, така че побеждава други шампионски програми, които преди това безусловно са побеждавали хората.

Deep Mind, компания, разработваща алгоритми за изкуствен интелект (AI), публикува данни за резултатите от преквалификацията на алгоритъма AlphaGo за игра на шах и шоги. Преди това AlphaGo успя да победи световните шампиони в играта go. Изкуственият интелект успя да овладее нови игри още по-бързо. Съответната работа е публикувана на сървъра за предпечат на университета Cornell.

AlphaZero използва метод на обучение за подсилване. Това е подтип на дълбоко машинно обучение, който не използва човешки учител, а изключително игри между два ИИ. Въпреки че в началото и двамата ИИ играят много слабо, поради високата си скорост (в сравнение с човешки учител) те могат да играят огромен брой игри за кратък период от време и да избират добре доказани ходове и техните последователности в определени позиции на дъската, което дава способността на алгоритмите да повишат нивото си изключително бързо.

В този случай AlphaZero постигна ниво на игра по-високо от всеки играч на хора само за 24 часа. Тогава й беше позволено да играе със Stockfish, най-добрият шахматист на разположение, и Elmo, най-добрият играч на шоги (силно модифициран шах, определен в ранната средновековна Япония).

Въпреки много краткия тренировъчен период, AlphaZero победи Stockfish 28 пъти и изтегли още 72 пъти. Тя успя да спечели срещу Елмо 90 пъти, загуби 8 пъти и равен 2 пъти. Това са изключително високи резултати. И шахът, и шогите са много различни от хода, за който първоначално е създаден AlphaGo, както и един от друг. Например „японският шах“предполага изключително екзотични възможности, като например да играете някое от „изядените“парчета на врага. Победата на алгоритъм, създаден за Go, само чрез игра с напълно идентичен алгоритъм, който собствените му средства могат да постигнат човешкият учител

IVAN ORTEGA