Η τεχνητή νοημοσύνη κέρδισε τους καλύτερους παίκτες Gran Turismo στον κόσμο

Η Sony και η Polyphony Digital παρουσίασαν αυτό που αποκαλούν “μια σημαντική ανακάλυψη στην τεχνητή νοημοσύνη παιχνιδιών”, το Gran Turismo Sophy. Πρόκειται για έναν αλγόριθμο τεχνητής νοημοσύνης που όχι μόνο κατέκτησε με επιτυχία το Gran Turismo, αλλά φιλοδοξεί μέσα σε ένα δεκαπενθήμερο, να μάθει να παίζει καλύτερα από τους ανθρώπους

Μια ομάδα ερευνητών χρησιμοποίησε βαθιά ενισχυτική μάθηση (deep reinforcement learning) για να διδάξει έναν πράκτορα (agent) τεχνητής νοημοσύνης να παίζει Gran Turismo σε παγκόσμιο επίπεδο. Ενώ σε προηγούμενα πειράματα είδαμε την τεχνητή νοημοσύνη να μαθαίνει να οδηγεί πολύ γρήγορα, αυτή είναι η πρώτη φορά που μαθαίνει να αγωνίζεται πραγματικά.

Και για να το αποδείξει, η Gt Sophy (η τεχνητή νοημοσύνη του παιχνιδιού) κέρδισε μερικούς από τους καλύτερους παίκτες GT ​​στον κόσμο στον ανταγωνισμό head-to-head, όπως περιγράφεται σε μια νέα εργασία που δημοσιεύτηκε στο περιοδικό Nature.

«Οι αγώνες αυτοκινήτου είναι ένα παραδοσιακό είδος παιχνιδιού που έγινε πολύ δημοφιλές στη σκηνή των eSports τα τελευταία χρόνια. Οποιαδήποτε επιτυχημένη προσπάθεια εκπαίδευσης πρακτόρων τεχνητής νοημοσύνης να οδηγούν σε αγωνιστικά παιχνίδια (όπως το Gran Tourismo, η σειρά Forza ή η σειρά Grand Theft Auto) μπορεί να ωφελήσει την έρευνα και την καινοτομία στην αυτόνομη οδήγηση αυτοκινήτου. Αξίζει να σημειωθεί ότι το σύστημα Drivatar της Forza είναι ο μακροβιότερος αλγόριθμος AI σε ένα εμπορικό παιχνίδι. Το Drivatar μιμείται τους τρόπους με τους οποίους οι άνθρωποι παίζουν το Forza από το 2005 και συνεχίζει να βελτιώνεται καθώς η σειρά Forza επεκτείνεται», σχολιάζει ο Καθηγητής Γεώργιος Ν. Γιαννακάκης που ηγείται του Ινστιτούτου Ψηφιακών Παιχνιδιών του Πανεπιστημίου της Μάλτας.

Παίζοντας το τελευταίο παιχνίδι  Gran Turismo Sport στο PlayStation 4, η GT Sophy έπρεπε να μάθει όχι μόνο τον χειρισμό των αυτοκινήτων βάσει των νόμων της Φυσικής, αλλά και τις συνθήκες της πίστας, τις τακτικές των αγώνων και τις κυρώσεις που βασίζονταν σε παραβιάσεις όπως τα χτυπήματα και τα γωνιακά κοψίματα

Η GT Sophy σημείωσε τις καλύτερες διαδρομές ακόμη και από τους καλύτερους παίκτες στην ανταγωνιστική σκηνή του Gran Turismo και τη δεύτερη ημέρα του αγώνα μπόρεσε να συντρίψει απόλυτα τους αντιπάλους της, αποχωρώντας με όλους τους καλύτερους χρόνους γύρου και τις κορυφαίες θέσεις.

«Είναι αξιοσημείωτο ότι η παραλλαγή του deep RL αλγορίθμου που παρουσιάζεται στο Nature μπόρεσε να νικήσει τους ταχύτερους παίκτες στο Gran Turismo (GT). Το GT είναι ένα παιχνίδι με πολλούς παίκτες, με έλεγχο σε πραγματικό χρόνο, γρήγορο και μη ντετερμινιστικό. Αυτά τα χαρακτηριστικά το καθιστούν συλλογικά ένα αρκετά απαιτητικό παιχνίδι για εμάς (και την τεχνητή νοημοσύνη)»,  συμπληρώνει ο Έλληνας καθηγητής, ο οποίος συγκαταλέγεται στο 0.5% των επιστημόνων με την μεγαλύτερη επιρροή στο πεδίο της Τεχνητής Νοημοσύνης παγκοσμίως.

Σύμφωνα με τον ίδιο, κρίσιμοι παράγοντες για αυτό το εντυπωσιακό αποτέλεσμα φαίνεται να είναι οι τρόποι επικοινωνίας των μοντέλων deep RL με το Playstation,  η διαθεσιμότητα υπολογιστικών πόρων (μεταξύ 10 και 25 ημερών εκπαίδευσης), ο πολύ έξυπνος σχεδιασμός χαρακτηριστικών του παιχνιδιού που ενίσχυσε τη GT Sophy και η προσεκτική επιλογή παραμέτρων, συναρτήσεων ανταμοιβής και αλγοριθμικών στοιχείων, όπως ο αλγόριθμος soft actor-critic quantile regression (QR-SAC).

«Τα εντυπωσιακά αποτελέσματα της GT Sophy εξαρτώνται σε μεγάλο βαθμό από λεπτομερείς παραμέτρους και από συγκεκριμένα χαρακτηριστικά για το παιχνίδι. Αυτή η προσέγγιση φαίνεται να είναι συνδεδεμένη με συγκεκριμένες γνώσεις και πληροφορίες σχετικά με το παιχνίδι, και όχι τόσο γενική όσο θα ήλπιζε κανείς. Ωστόσο, το αποτέλεσμα είναι αξιοσημείωτο ακόμα κι αν ισχύει μόνο για το συγκεκριμένο παιχνίδι», τονίζει ο ίδιος.

Τα παραπάνω είναι σημαντικά τόσο ως μια επιστημονική ανακάλυψη όσο και ως εξέλιξη στο gaming, αλλά ο στόχος είναι ωστόσο να διασφαλιστεί ότι αυτή η ανάπτυξη τεχνητής νοημοσύνης μπορεί να βοηθήσει στην οικοδόμηση πιο αξιόπιστων και πιο απαιτητικών αντιπάλων τεχνητής νοημοσύνης για επερχόμενα παιχνίδια Gran Turismo.

Και μπορεί η τεχνητή νοημοσύνη να μην κατάφερε να μπει εγκαίρως στο Gran Turismo 7, το οποίο έρχεται στις αρχές Μαρτίου, αλλά η Polyphony Digital επιβεβαιώνει ότι στοχεύει να φέρει την GT Sophy στο επόμενο.

«Η προσέγγιση δείχνει ότι η βαθιά ενισχυτική μάθηση (deep RL), εάν σχεδιαστεί σωστά, μπορεί να μας δώσει εντελώς νέες λύσεις σε μη ντετερμινιστικό, συνεχή έλεγχο και σε σύνθετα προβλήματα όπως αυτό των ανταγωνιστικών αγώνων αυτοκινήτων. Η GT Sophy προάγει τον τομέα του deep RL από αυτή την άποψη, αλλά μας υπενθυμίζει επίσης ότι η επιτυχία τέτοιων αλγορίθμων εξαρτάται από πολλούς κρίσιμους παράγοντες», καταλήγει ο διακεκριμένος Έλληνας επιστήμονας.

 

Μάθετε πρώτοι τα τελευταία νέα
Ακολουθήστε μας στο Google News και μάθετε πρώτοι όλες τις ειδήσεις