Google: Τεχνητή νοημοσύνη της DeepMind νίκησε εξειδικευμένο λογισμικό στο σκάκι

Πέμπτη, 07 Δεκεμβρίου 2017 17:52
SHUTTERSTOCK

Η Google ανέφερε πως το πρόγραμμα τεχνητής νοημοσύνης της AlphaZero (ή AlphaGo Zero) νίκησε εξειδικευμένο σκακιστικό λογισμικό παγκόσμιας κλάσης, έχοντας πρώτα μάθει μόνο του το παιχνίδι μέσα σε λίγες ώρες.

Όπως αναφέρει το BBC, η DeepMind (δημιουργός του προγράμματος) λέει ότι η τεχνητή νοημοσύνη της έπαιξε 100 παιχνίδια εναντίον του Stockfish 8 και πέτυχε νίκη ή ισοπαλία σε όλα τους.

Υπενθυμίζεται πως το πρόγραμμα της DeepMind είχε προηγουμένως νικήσει κορυφαίους ανθρώπους παίκτες του κινεζικού παιχνιδιού «Γκο», ενώ είχε εκπαιδεύσει τον εαυτό του να παίζει βιντεοπαιχνίδια όπως το Pong και το Space Invaders. Επίσης, οι ερευνητές της προσπαθούν να αναπτύξουν ένα σύστημα που θα είναι σε θέση να νικήσει ανθρώπους στο παιχνίδι στρατηγικής Starcraft- μία πρόκληση που θεωρείται ακόμα μεγαλύτερη.

Η Google δεν προβαίνει σε σχόλια σχετικά με τη συγκεκριμένη έρευνα, μέχρι αυτή να δημοσιευτεί σε journal. Ωστόσο, λεπτομέρειες που δημοσιοποιήθηκαν από το CornellUniversity αποκαλύπτουν πως ο αλγόριθμος AlphaZero ήταν σε θέση να επικρατήσει επί του Stockfish μόλις τέσσερις ώρες αφού του δόθηκαν οι κανόνες του σκακιού, μαζί με την οδηγία να παίξει παιχνίδια με τον εαυτό του.

Στα 100 παιχνίδια που ακολούθησαν, στο κάθε πρόγραμμα δόθηκε χρόνος σκέψης ενός λεπτού ανά κίνηση. Το AlphaZero κέρδισε 25 παιχνίδια στα οποία έπαιξε με τα λευκά (έχοντας την πρώτη κίνηση) και άλλα τρία στα οποία έπαιξε με τα μαύρα. Στα υπόλοιπα 72 παιχνίδια τα δύο προγράμματα ήρθαν ισοπαλία, με την DeepMind να χαρακτηρίζει τις επιδόσεις του AlphaZero ως «υπεράνθρωπες».

Το Stockfish 8 είχε κερδίσει το Top Chess Engine Championship του 2016. Το λογισμικό αυτό είχε κυκλοφορήσει αρχικά το 2008 και έκτοτε εξελίσσεται από εθελοντές.

Σημειώνεται πως, σύμφωνα με το paper, το AlphaZero σημείωσε επιτυχία και στο ιαπωνικό επιτραπέζιο «Σόγκι» εναντίον ενός προγράμματος τεχνητής νοημοσύνης ονόματι Elmo, αφού πρώτα εκπαίδευσε τον εαυτό του για δύο ώρες: Ο αλγόριθμος κέρδισε 90 παιχνίδια, ήρθε ισοπαλία σε δύο και έχασε οκτώ. Επιπλέον, μετά από οκτώ ώρες αυτο-εκπαίδευσης ήταν σε θέση να κερδίσει μια παλαιότερη έκδοση του εαυτού του στο Γκο, κερδίζοντας 60 παιχνίδια και χάνοντας 40.