Το Google Gemini «μπλόκαρε» παίζοντας Pokémon – Ένα απλό παιχνίδι που «λύγισε» ένα ισχυρό AI STARTUPPER

Το μεγάλο γλωσσικό μοντέλο (LLM) φάνηκε να «καταρρέει» σε συνθήκες πίεσης και να λαμβάνει ακατανόητες ή επιβλαβείς αποφάσεις, σαν να «πανικοβαλλόταν»

Τελευταία ενημέρωση: 19/06/2025 11:00

Newsroom

Μπορεί το Pokémon να μοιάζει με ένα απλό παιχνίδι, αλλά αποδείχθηκε πολύ πιο περίπλοκο για το Google Gemini απ’ ό,τι θα περίμενε κανείς. Σύμφωνα με δημοσίευμα του Times of India και δημοσίευση της Google DeepMind, το μεγάλο γλωσσικό μοντέλο (LLM) φάνηκε να «καταρρέει» σε συνθήκες πίεσης όταν συμμετείχε σε δοκιμές που προσομοίωναν κανονικό gameplay του Pokémon.

Το περιστατικό περιγράφεται από ερευνητές ως «πανικός υπό πίεση» (panic-like behavior), καθώς το μοντέλο άρχισε να εκτελεί παράλογες ή βιαστικές εντολές, εγκαταλείποντας τη δομημένη στρατηγική που είχε αναπτύξει.

Κατά τη διάρκεια της δοκιμής, το Gemini 1.5 Pro κλήθηκε να παίξει το Pokémon Red ως αυτόνομος agent — δηλαδή χωρίς άμεσες οδηγίες από ανθρώπους. Χρησιμοποιώντας μόνο κείμενο και εικόνα (text + vision input), έπρεπε να πάρει αποφάσεις σε πραγματικό χρόνο για να νικήσει στο παιχνίδι.

Όπως αναφέρουν οι αναλυτές της Google DeepMind, το μοντέλο εμφάνισε εξαιρετική απόδοση σε τομείς που απαιτούνται λογική και επίλυση γρίφων. Ωστόσο, όταν οι μάχες έμπαιναν σε κρίσιμο στάδιο — με τα Pokémon να έχουν χαμηλή υγεία — το μοντέλο άρχισε να λαμβάνει ακατανόητες ή επιβλαβείς αποφάσεις, σαν να «πανικοβαλλόταν».

Οι ερευνητές διαπίστωσαν ότι το Gemini έχανε τη συνέπεια της στρατηγικής του και σταματούσε να χρησιμοποιεί τα εργαλεία πλοήγησης που είχε αναπτύξει. Στο ίδιο μοτίβο, το Claude της Anthropic — αντίπαλο μοντέλο AI — παρουσίασε παρόμοιες δυσκολίες: σε κρίσιμη στιγμή, θυσίασε όλα τα Pokémon του σε μια λανθασμένη απόπειρα να επιστρέψει στο PokéCenter, αποτυγχάνοντας στον στόχο του.

Αυτά τα περιστατικά έχουν χαρακτηριστεί από την ερευνητική ομάδα ως παραδείγματα «ευθραυστότητας της λογικής» όταν η τεχνητή νοημοσύνη έρχεται αντιμέτωπη με περίπλοκα και γρήγορα μεταβαλλόμενα περιβάλλοντα.

Το ότι «έσπασε» κάτω από την πίεση αποδεικνύει ότι ακόμα και τα πιο εξελιγμένα LLMs παραμένουν ευάλωτα σε καταστάσεις που απαιτούν συναισθηματική ψυχραιμία, εμπειρική κρίση και προσαρμοστικότητα — όλα χαρακτηριστικά που, προς το παρόν, διατηρεί αποκλειστικά ο ανθρώπινος νους.

Το περιστατικό αυτό είναι κάτι περισσότερο από ένα τεχνικό «παραστράτημα». Φέρνει στο φως μια θεμελιώδη αλήθεια: τα LLMs δεν έχουν πραγματική κατανόηση του περιβάλλοντος στο οποίο λειτουργούν. Αντλούν τη «συμπεριφορά» τους από στατιστικά μοντέλα πρόβλεψης και μεγάλα σύνολα δεδομένων, χωρίς να διαθέτουν συνείδηση ή συναισθηματική αντίληψη.

Η αποτυχία τους σε ένα παιχνίδι όπως το Pokémon, όπου συνδυάζονται στρατηγική, εμπειρική μάθηση και γρήγορες αποφάσεις, δείχνει ξεκάθαρα ότι η ανθρώπινη ευφυΐα δεν μπορεί (ακόμα) να αναπαραχθεί πλήρως με υπολογιστικά μέσα.

Must Read

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

CapsuleT: Ο «επιταχυντής» που αλλάζει το DNA του ελληνικού τουρισμού

Το ελληνικό «Made in Space»: Η ICEYE Hellas, ο mega-γύρος του 1 δισ. και οι δορυφόροι εθνικής ασφάλειας

6G-VERSUS: Πώς δίκτυα επόμενης γενιάς, drones και Τεχνητή Νοημοσύνη «βλέπουν» τις πυρκαγιές πριν εξαπλωθούν

Το Google Gemini «μπλόκαρε» παίζοντας Pokémon – Ένα απλό παιχνίδι που «λύγισε» ένα ισχυρό AI

Το μεγάλο γλωσσικό μοντέλο (LLM) φάνηκε να «καταρρέει» σε συνθήκες πίεσης και να λαμβάνει ακατανόητες ή επιβλαβείς αποφάσεις, σαν να «πανικοβαλλόταν»

Must Read

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

CapsuleT: Ο «επιταχυντής» που αλλάζει το DNA του ελληνικού τουρισμού

Το ελληνικό «Made in Space»: Η ICEYE Hellas, ο mega-γύρος του 1 δισ. και οι δορυφόροι εθνικής ασφάλειας

Σχετικά Άρθρα

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

CapsuleT: Ο «επιταχυντής» που αλλάζει το DNA του ελληνικού τουρισμού

Το ελληνικό «Made in Space»: Η ICEYE Hellas, ο mega-γύρος του 1 δισ. και οι δορυφόροι εθνικής ασφάλειας

Τελευταία Νέα

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

CapsuleT: Ο «επιταχυντής» που αλλάζει το DNA του ελληνικού τουρισμού

Δημοφιλή Εβδομάδας

Grand Seiko Evolution 9: Η εξέλιξη της ιαπωνικής τελειότητας

Δημήτρης Τσίγκος: Από τη Virtual Trip στα Scaleups των 500+ ατόμων – Το «DNA» της κρίσης και το στοίχημα της εξωστρέφειας

Newsletter

Επικοινωνία

Πολιτική Προστασίας | Πολιτική Cookies | Όροι Χρήσης

Stock images by Depositphotos

© 2024 - Startupper. All Rights Reserved.

Αριθμός Πιστοποίησης Μ.Η.Τ.242865