reinforcement learning

Na Go, heeft AI nu de sterkste schaakcomputers overwonnen

AlphaZero, het nieuwste algoritme uit de keuken van Google, heeft in 4 uur trainen het schaakspel onder de knie gekregen.

Aan het eind van het vorige millenium had IBM met DeepBlue de primeur van een schaakcomputer die de mens overstijgt. Deze schaakcomputer won in 1997 van Gary Kasparov, de toenmalige wereldkampioen.

In tegenstelling tot DeepBlue heeft AlphaZero geen openingen of eindspel database om te gebruiken. Met alleen de regels van het schaakspel heeft dit machine learning algoritme in 4 uur een niveau bereikt dat alle andere schaakcomputers lijkt te overtreffen. Van de 100 keer dat AlphaZero tegen Stockfish (de huidige wereldkampioen) speelde, won AlphaZero 25 keer met wit, 3 keer met zwart en de overgebleven keer eindigde het spel in gelijkspel. Read More

> Read full Na Go, heeft AI nu de sterkste schaakcomputers overwonnen post