Το Google Gemini «μπλόκαρε» παίζοντας Pokémon – Ένα απλό παιχνίδι που «λύγισε» ένα ισχυρό AI

Το μεγάλο γλωσσικό μοντέλο (LLM) φάνηκε να «καταρρέει» σε συνθήκες πίεσης και να λαμβάνει ακατανόητες ή επιβλαβείς αποφάσεις, σαν να «πανικοβαλλόταν»

Newsroom
3'
Μπορεί το Pokémon να μοιάζει με ένα απλό παιχνίδι, αλλά αποδείχθηκε πολύ πιο περίπλοκο για το Google Gemini απ’ ό,τι θα περίμενε κανείς. Σύμφωνα με δημοσίευμα του Times of India και δημοσίευση της Google DeepMind, το μεγάλο γλωσσικό μοντέλο (LLM) φάνηκε να «καταρρέει» σε συνθήκες πίεσης όταν συμμετείχε σε δοκιμές που προσομοίωναν κανονικό gameplay του Pokémon.
Το περιστατικό περιγράφεται από ερευνητές ως «πανικός υπό πίεση» (panic-like behavior), καθώς το μοντέλο άρχισε να εκτελεί παράλογες ή βιαστικές εντολές, εγκαταλείποντας τη δομημένη στρατηγική που είχε αναπτύξει.
Κατά τη διάρκεια της δοκιμής, το Gemini 1.5 Pro κλήθηκε να παίξει το Pokémon Red ως αυτόνομος agent — δηλαδή χωρίς άμεσες οδηγίες από ανθρώπους. Χρησιμοποιώντας μόνο κείμενο και εικόνα (text + vision input), έπρεπε να πάρει αποφάσεις σε πραγματικό χρόνο για να νικήσει στο παιχνίδι.
Όπως αναφέρουν οι αναλυτές της Google DeepMind, το μοντέλο εμφάνισε εξαιρετική απόδοση σε τομείς που απαιτούνται λογική και επίλυση γρίφων. Ωστόσο, όταν οι μάχες έμπαιναν σε κρίσιμο στάδιο — με τα Pokémon να έχουν χαμηλή υγεία — το μοντέλο άρχισε να λαμβάνει ακατανόητες ή επιβλαβείς αποφάσεις, σαν να «πανικοβαλλόταν».
Οι ερευνητές διαπίστωσαν ότι το Gemini έχανε τη συνέπεια της στρατηγικής του και σταματούσε να χρησιμοποιεί τα εργαλεία πλοήγησης που είχε αναπτύξει. Στο ίδιο μοτίβο, το Claude της Anthropic — αντίπαλο μοντέλο AI — παρουσίασε παρόμοιες δυσκολίες: σε κρίσιμη στιγμή, θυσίασε όλα τα Pokémon του σε μια λανθασμένη απόπειρα να επιστρέψει στο PokéCenter, αποτυγχάνοντας στον στόχο του.
Αυτά τα περιστατικά έχουν χαρακτηριστεί από την ερευνητική ομάδα ως παραδείγματα «ευθραυστότητας της λογικής» όταν η τεχνητή νοημοσύνη έρχεται αντιμέτωπη με περίπλοκα και γρήγορα μεταβαλλόμενα περιβάλλοντα.
Το ότι «έσπασε» κάτω από την πίεση αποδεικνύει ότι ακόμα και τα πιο εξελιγμένα LLMs παραμένουν ευάλωτα σε καταστάσεις που απαιτούν συναισθηματική ψυχραιμία, εμπειρική κρίση και προσαρμοστικότητα — όλα χαρακτηριστικά που, προς το παρόν, διατηρεί αποκλειστικά ο ανθρώπινος νους.
Το περιστατικό αυτό είναι κάτι περισσότερο από ένα τεχνικό «παραστράτημα». Φέρνει στο φως μια θεμελιώδη αλήθεια: τα LLMs δεν έχουν πραγματική κατανόηση του περιβάλλοντος στο οποίο λειτουργούν. Αντλούν τη «συμπεριφορά» τους από στατιστικά μοντέλα πρόβλεψης και μεγάλα σύνολα δεδομένων, χωρίς να διαθέτουν συνείδηση ή συναισθηματική αντίληψη.
Η αποτυχία τους σε ένα παιχνίδι όπως το Pokémon, όπου συνδυάζονται στρατηγική, εμπειρική μάθηση και γρήγορες αποφάσεις, δείχνει ξεκάθαρα ότι η ανθρώπινη ευφυΐα δεν μπορεί (ακόμα) να αναπαραχθεί πλήρως με υπολογιστικά μέσα.
Μοιραστείτε αυτό το άρθρο
ΑπόNewsroom
Ακολουθήστε
Tο πρώτο ειδησεογραφικό πόρταλ στην Ελλάδα για τις startups, που αναδεικνύει τα νέα και τη δυναμική του ελληνικού οικοσυστήματος. Εκτός από την καταγραφή του ελληνικού οικοσυστήματος καλύπτει τα τεκταινόμενα και τις διεθνείς τάσεις σε ό,τι αφορά στις startups, τις επενδύσεις, τις νομικές και φορολογικές ρυθμίσεις που αφορούν στα επιχειρηματικά οικοσυστήματα της Ευρώπης και του κόσμου.