Η Google ανακοίνωσε την κυκλοφορία του Gemini 2.5 Computer Use, ενός εξειδικευμένου μοντέλου τεχνητής νοημοσύνης που επιτρέπει την πλοήγηση στο διαδίκτυο με τρόπο που μιμείται τη συμπεριφορά ανθρώπου — π.χ. συμπληρώνοντας φόρμες, κάνοντας scroll, ανοίγοντας dropdown μενού, κλικ, πληκτρολόγηση και συνδυασμούς πλήκτρων.
Τεχνολογική υπεροχή και γρήγορη ανταπόκριση
Το Gemini 2.5 βασίζεται στο Gemini 2.5 Pro και ενσωματώνει διεπαφή («virtual browser») η οποία του επιτρέπει να αλληλεπιδρά με διεπαφές χρήστη (user interfaces) — μια ικανότητα που έως πρότινος παρέμενε περιορισμένη ή πειραματική σε άλλα συστήματα AI.
Σύμφωνα με τη Google, το μοντέλο ξεχωρίζει σε επιδόσεις έναντι ανταγωνιστών, τόσο σε benchmarks για web & mobile διεργασίες όσο και στην γρήγορη ανταπόκριση (latency). Ωστόσο, μέχρι στιγμής υποστηρίζει μόλις 13 ενέργειες — παρά το δυναμικό του — και δεν είναι ακόμη βελτιστοποιημένο για άμεσο έλεγχο επιτραπέζιων συστημάτων (desktop OS).
O χρήστης μπορεί να δώσει στο μοντέλο μια φυσική εντολή (π.χ., «Οργάνωσε αυτόν τον πίνακα στο web app») και το AI θα εκτελέσει όλα τα απαραίτητα βήματα: κλικ, πληκτρολόγηση, scrolling, χρήση αναπτυσσόμενων μενού, ακριβώς όπως θα έκανε ένας άνθρωπος.
Η διάθεσή του προς το παρόν απευθύνεται κυρίως σε προγραμματιστές, μέσω των πλατφορμών Google AI Studio και Vertex AI.
Η Google έχει ήδη αρχίσει να αξιοποιεί το Gemini 2.5 εσωτερικά, για παράδειγμα σε εργασίες δοκιμών διεπαφών (UI testing) — κάτι που μπορεί να επιταχύνει δραστικά τη διαδικασία ελέγχων λογισμικού.
Επιπλέον, παραλλαγές του μοντέλου ενσωματώνονται σε άλλες λειτουργίες της Google: στο AI Mode της αναζήτησης (Search), σε εργαλεία Firebase Testing Agent και στο Project Mariner — όπου οι χρήστες μπορούν να εκχωρούν διαδοχικά πράξεις σε AI agents, π.χ. για έρευνα, σχεδιασμό ή εισαγωγή δεδομένων.
Η κυκλοφορία του Gemini 2.5 Computer Use ενισχύει τη θέση της Google στην κούρσα της τεχνητής νοημοσύνης, προσφέροντας στους προγραμματιστές και επιχειρήσεις ένα εργαλείο που συνδέει την ευκολία χρήσης με την υψηλή απόδοση, και υπόσχεται να επιταχύνει σημαντικά διαδικασίες που μέχρι σήμερα απαιτούσαν την ανθρώπινη παρέμβαση
