Σε μια εντυπωσιακή επίδειξη στρατηγικού timing, μια κίνηση που μόνο τυχαία δεν μπορεί να θεωρηθεί, η Google ανακοίνωσε μια ανανεωμένη έκδοση του Gemini Deep Research, του πιο προηγμένου AI research agent που έχει παρουσιάσει μέχρι σήμερα. Η ανακοίνωση συνέπεσε με το πολυαναμενόμενο λανσάρισμα του GPT-5.2 “Garlic” από την OpenAI, στέλνοντας σαφές μήνυμα για την ένταση του ανταγωνισμού στην κορυφή της generative AI.
Ο νέος Gemini Deep Research βασίζεται στο Gemini 3 Pro, το κορυφαίο foundation model της Google, και έχει σχεδιαστεί ώστε να λειτουργεί ως πλήρως αυτόνομος ερευνητικός συνεργάτης. Δεν πρόκειται μόνο για ένα εργαλείο παραγωγής αναφορών· πλέον, μέσω του νέου Interactions API, οι developers μπορούν να ενσωματώσουν τις ερευνητικές του δυνατότητες απευθείας σε δικές τους εφαρμογές.
Παράλληλα, η Google ετοιμάζεται να “κουμπώσει” αυτόν τον agent σε βασικά προϊόντα της, όπως το Google Search, το Google Finance, η εφαρμογή Gemini και το NotebookLM, οδηγώντας την εταιρεία σε ένα μοντέλο όπου η αναζήτηση δεν γίνεται πλέον από τον χρήστη, αλλά από τον προσωπικό του agent.
Μείωση hallucinations: το μεγάλο στοίχημα των agentic workflows
Μεγάλη έμφαση δίνεται στην αξιοπιστία. Η Google χαρακτηρίζει το Gemini 3 Pro ως το «πιο factual» μοντέλο της, ειδικά εκπαιδευμένο για να περιορίζει τα hallucinations — ένα κρίσιμο ζήτημα για agentic σενάρια μεγάλης διάρκειας, όπου μια λάθος απόφαση μπορεί να εκτροχιάσει ολόκληρη την αλυσίδα reasoning.
Για να αποδείξει την πρόοδο, η εταιρεία παρουσίασε το νέο benchmark DeepSearchQA, το οποίο αξιολογεί agents σε πολύπλοκες, multi-step αναζητήσεις. Το benchmark έχει διατεθεί ως open source.
Η Google δοκίμασε επίσης τον agent σε δύο απαιτητικά τεστ:
Humanity’s Last Exam – ανεξάρτητο benchmark γεμάτο εξειδικευμένες ερωτήσεις.
BrowserComp – αξιολόγηση agentic συμπεριφοράς μέσα σε browser περιβάλλον.
Το Gemini Deep Research κατέγραψε κορυφαίες επιδόσεις στο DeepSearchQA και στο Humanity’s Last Exam. Ωστόσο, το ChatGPT 5 Pro της OpenAI βρέθηκε σε πολύ μικρή απόσταση και μάλιστα πέρασε τη Google στο BrowserComp, δείχνοντας ότι η μάχη παραμένει ανοικτή.
OpenAI GPT-5.2 “Garlic”: η απάντηση που αλλάζει πάλι τα δεδομένα
Την ίδια μέρα, η OpenAI ανακοίνωσε το GPT-5.2, το οποίο —όπως υποστηρίζει— ξεπερνά τους ανταγωνιστές του σε μια ευρεία γκάμα benchmarks, συμπεριλαμβανομένων και αυτών που έχει δημιουργήσει η ίδια.
Η ταυτόχρονη ανακοίνωση και από τις δύο εταιρείες δεν ήταν σύμπτωση, αλλά μια ξεκάθαρη επίδειξη δύναμης σε μια αγορά όπου τα AI agents εξελίσσονται πλέον στο πιο κρίσιμο και στρατηγικό κομμάτι του οικοσυστήματος.
