Ντέρμπι Google - OpenAI: Λάνσαραν την ίδια μέρα Gemini Deep Research και GPT-5.2 - Ποια θα επικρατήσει;

Πρόκειται ίσως για επίδειξη στρατηγικού timing, καθώς η Google ανακοίνωσε μια ανανεωμένη έκδοση του Gemini Deep Research, που συνέπεσε με το πολυαναμενόμενο λανσάρισμα του GPT-5.2 “Garlic” από την OpenAI, στέλνοντας σαφές μήνυμα για την ένταση του ανταγωνισμού στην κορυφή της generative AI.

Τελευταία ενημέρωση: 12/12/2025 14:03

Newsroom

Σε μια εντυπωσιακή επίδειξη στρατηγικού timing, μια κίνηση που μόνο τυχαία δεν μπορεί να θεωρηθεί, η Google ανακοίνωσε μια ανανεωμένη έκδοση του Gemini Deep Research, του πιο προηγμένου AI research agent που έχει παρουσιάσει μέχρι σήμερα. Η ανακοίνωση συνέπεσε με το πολυαναμενόμενο λανσάρισμα του GPT-5.2 “Garlic” από την OpenAI, στέλνοντας σαφές μήνυμα για την ένταση του ανταγωνισμού στην κορυφή της generative AI.

Ο νέος Gemini Deep Research βασίζεται στο Gemini 3 Pro, το κορυφαίο foundation model της Google, και έχει σχεδιαστεί ώστε να λειτουργεί ως πλήρως αυτόνομος ερευνητικός συνεργάτης. Δεν πρόκειται μόνο για ένα εργαλείο παραγωγής αναφορών· πλέον, μέσω του νέου Interactions API, οι developers μπορούν να ενσωματώσουν τις ερευνητικές του δυνατότητες απευθείας σε δικές τους εφαρμογές.

Παράλληλα, η Google ετοιμάζεται να “κουμπώσει” αυτόν τον agent σε βασικά προϊόντα της, όπως το Google Search, το Google Finance, η εφαρμογή Gemini και το NotebookLM, οδηγώντας την εταιρεία σε ένα μοντέλο όπου η αναζήτηση δεν γίνεται πλέον από τον χρήστη, αλλά από τον προσωπικό του agent.

Μείωση hallucinations: το μεγάλο στοίχημα των agentic workflows

Μεγάλη έμφαση δίνεται στην αξιοπιστία. Η Google χαρακτηρίζει το Gemini 3 Pro ως το «πιο factual» μοντέλο της, ειδικά εκπαιδευμένο για να περιορίζει τα hallucinations — ένα κρίσιμο ζήτημα για agentic σενάρια μεγάλης διάρκειας, όπου μια λάθος απόφαση μπορεί να εκτροχιάσει ολόκληρη την αλυσίδα reasoning.

Για να αποδείξει την πρόοδο, η εταιρεία παρουσίασε το νέο benchmark DeepSearchQA, το οποίο αξιολογεί agents σε πολύπλοκες, multi-step αναζητήσεις. Το benchmark έχει διατεθεί ως open source.

Η Google δοκίμασε επίσης τον agent σε δύο απαιτητικά τεστ:

Humanity’s Last Exam – ανεξάρτητο benchmark γεμάτο εξειδικευμένες ερωτήσεις.

BrowserComp – αξιολόγηση agentic συμπεριφοράς μέσα σε browser περιβάλλον.

Το Gemini Deep Research κατέγραψε κορυφαίες επιδόσεις στο DeepSearchQA και στο Humanity’s Last Exam. Ωστόσο, το ChatGPT 5 Pro της OpenAI βρέθηκε σε πολύ μικρή απόσταση και μάλιστα πέρασε τη Google στο BrowserComp, δείχνοντας ότι η μάχη παραμένει ανοικτή.

OpenAI GPT-5.2 “Garlic”: η απάντηση που αλλάζει πάλι τα δεδομένα

Την ίδια μέρα, η OpenAI ανακοίνωσε το GPT-5.2, το οποίο —όπως υποστηρίζει— ξεπερνά τους ανταγωνιστές του σε μια ευρεία γκάμα benchmarks, συμπεριλαμβανομένων και αυτών που έχει δημιουργήσει η ίδια.

Η ταυτόχρονη ανακοίνωση και από τις δύο εταιρείες δεν ήταν σύμπτωση, αλλά μια ξεκάθαρη επίδειξη δύναμης σε μια αγορά όπου τα AI agents εξελίσσονται πλέον στο πιο κρίσιμο και στρατηγικό κομμάτι του οικοσυστήματος.

Must Read

Ελισάβετ Νίκα (Covariance): «Ο σοφός δρόμος για την Ελλάδα είναι η εξειδίκευση στην Τεχνητή Νοημοσύνη»

GovTech: Η αρχιτεκτονική του έξυπνου Κράτους, οι παγκόσμιες επενδύσεις και το ελληνικό οικοσύστημα καινοτομίας (Part1)

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

CapsuleT: Ο «επιταχυντής» που αλλάζει το DNA του ελληνικού τουρισμού

Ντέρμπι Google – OpenAI: Λάνσαραν την ίδια μέρα Gemini Deep Research και GPT-5.2 – Ποια θα επικρατήσει;

Must Read

Ελισάβετ Νίκα (Covariance): «Ο σοφός δρόμος για την Ελλάδα είναι η εξειδίκευση στην Τεχνητή Νοημοσύνη»

GovTech: Η αρχιτεκτονική του έξυπνου Κράτους, οι παγκόσμιες επενδύσεις και το ελληνικό οικοσύστημα καινοτομίας (Part1)

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

Σχετικά Άρθρα

Ελισάβετ Νίκα (Covariance): «Ο σοφός δρόμος για την Ελλάδα είναι η εξειδίκευση στην Τεχνητή Νοημοσύνη»

GovTech: Η αρχιτεκτονική του έξυπνου Κράτους, οι παγκόσμιες επενδύσεις και το ελληνικό οικοσύστημα καινοτομίας (Part1)

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Eλληνικό “Made in Space”: 350 εκατ. ευρώ για εθνικούς δορυφόρους, startups και αποστολή στον ISS

Τελευταία Νέα

Ελισάβετ Νίκα (Covariance): «Ο σοφός δρόμος για την Ελλάδα είναι η εξειδίκευση στην Τεχνητή Νοημοσύνη»

GovTech: Η αρχιτεκτονική του έξυπνου Κράτους, οι παγκόσμιες επενδύσεις και το ελληνικό οικοσύστημα καινοτομίας (Part1)

Πώς ένας freelancer στην Ελλάδα μπορεί να μειώσει τα έξοδα αυτοκινήτου με leasing

Δημοφιλή Εβδομάδας

Δημήτρης Τσίγκος: Από τη Virtual Trip στα Scaleups των 500+ ατόμων – Το «DNA» της κρίσης και το στοίχημα της εξωστρέφειας

Γιατί οι επενδυτές σαρώνουν (απελπισμένα;) το ελληνικό IT: Το ντόμινο των εξαγορών, τα GovTech deals και οι «χρυσές» φήμες

Newsletter

Επικοινωνία

Πολιτική Προστασίας | Πολιτική Cookies | Όροι Χρήσης

Stock images by Depositphotos

© 2024 - Startupper. All Rights Reserved.

Αριθμός Πιστοποίησης Μ.Η.Τ.242865

Must Read

More Read

Must Read

Σχετικά Άρθρα

Δημοφιλή Εβδομάδας

Newsletter