Τα πάντα για την ελληνική Startup Σκηνή

Αφιέρωμα ΑΙ: Ένας χρόνος ChatGPT ΑΙ, που άλλαξε τον ρου της Ιστορίας – Part 1

Θα παρουσιάσουμε τους βασικούς παίκτες στο χώρο της δημιουργικής AI (Generative AI), τα πιο σημαντικά προϊόντα και υπηρεσίες και τις μεγαλύτερες προκλήσεις για τις επιχειρήσεις, την κοινωνία αλλά και το ηθικό και νομικό μας σύστημα. 

Για την ακρίβεια ο Νοέμβριος του 2022 δεν άλλαξε τα δεδομένα στον κόσμο της τεχνολογίας ή των επιχειρήσεων, αλλά όπως όλα δείχνουν είναι μια ημερομηνία η οποία θα σηματοδοτήσει ένα σημείο μετεξέλιξης του ανθρώπινου είδους! Με το ChatGPT να έχει εγκαινιάσει μια νέα εποχή συνεργασίας ανθρώπου-τεχνητής νοημοσύνης, υπερβαίνοντας τα όποια όρια και επαναπροσδιορίζοντας τις δυνατότητες αξιοποίησης της επικοινωνίας με τη «μηχανή» σε κλίμακα.

Και ο λόγος για όλα τα παραπάνω είναι ότι η νέα τεχνητή νοημοσύνη θα επιταχύνει εκθετικά τομείς όπως η ιατρική, η ρομποτική, οι επιστήμες υλικών, η ενέργεια, οι δημιουργικές-καλλιτεχνικές εργασίες, ακόμα και τη φιλοσοφία και την ηθική, ενώ άλλες πιο ακραίες φωνές αναφέρουν ότι όση εξέλιξη είδε ο άνθρωπος τα τελευταία χιλιάδες χρόνια, τόση θα συμβεί μέσα στα επόμενα δέκα χρόνια. Αφού οι όποιοι ειδικοί και επαγγελματίες θα έχουν χρόνο να ασχοληθούν με πιο παραγωγικές εργασίες και τα ChatGPTs θα ασχολούνται με τις πιο «καθημερινές» εργασίες. Το απόλυτο Scaleup της ανθρωπότητας δηλαδή!

Και όλα αυτά χάρη σε μια επιστημονική εργασία με τίτλο «Attention Is All You Need», οκτώ ερευνητών της Google οι οποίοι περιέγραψαν το μοντέλο Deep Learning, Transformers, και η οποία δημοσιεύτηκε στις 12 Ιουνίου του 2017.

Σήμερα οι Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin έχουν συστήσει τις δικές τους AI Startups όντας μέρος της παραπάνω μετεξέλιξης. 

Και το ενδιαφέρον στην υπόθεση είναι ότι η Google δεν έβαλε στη σωστή προτεραιότητα την εμπορευματοποίηση των δικών της αποτελεσμάτων, με συνέπεια η OpenAI, ο Sam Altman (αλλά και η Microsoft) να λανσάρουν το ChatGPT στο τέλος του 2022, διακινδυνεύοντας ακόμα και την ίδια της ύπαρξη αν δεν κινηθεί γρήγορα και σωστά. Βέβαια, η Google προφανώς δούλευε το δικό της μοντέλο και παρουσίασε γρήγορα τον ανταγωνιστή του ChatGPT στα AI Chatbots, αλλά πλέον στον χώρο της αναζήτησης Internet υπάρχει εκτός από το ChatGPT 4.0 και η Startup Perplexity, η οποία σηκώνει εκατομμύρια των εκατομμυρίων και από το πουθενά γίνεται άμεσος ανταγωνιστής της. Και μην ξεχνάμε και τη Microsoft με το Bing που ενσωμάτωσε γρήγορα το ChatGPT. 

Στις επόμενες σελίδες θα παρουσιάσουμε τους βασικούς παίκτες στο χώρο της δημιουργικής AI (Generative AI), τα πιο σημαντικά προϊόντα και υπηρεσίες και τις μεγαλύτερες προκλήσεις για τις επιχειρήσεις, την κοινωνία αλλά και το ηθικό και νομικό μας σύστημα. 

Ειδικευμένη, δημιουργική και γενική τεχνητή νοημοσύνη 

Η τεχνητή νοημοσύνη δεν κάτι καινούργιο αφού η ειδικευμένη τεχνητή νοημοσύνη χρησιμοποιείται εδώ και πολλά χρόνια σε διάφορους τομείς, χωρίς ο χρήστης να έχει άμεση επαφή μαζί της αλλά απολαμβάνει τις όποιες συναρπαστικές λειτουργικότητες. Σε κάθε περίπτωση, βρίσκεται παντού σχεδόν στην καθημερινότητά μας. Όταν κάνουμε μια αναζήτηση στο Google, στις μεταφράσεις online, στην αυτόνομη οδήγηση, στην αναγνώριση προσώπων, στις προτάσεις προϊόντων σε μεγάλα sites αγορών, ακόμα και στην πρόβλεψη διαθεσιμότητας ραντεβού ή στις κεραίες κινητής τηλεφωνίας.

Το ChatGPT είναι ο ορισμός της δημιουργικής – αλληλεπιδραστικής τεχνητής νοημοσύνης, η οποία εκ τεχνολογικής φύσεως ειδικεύεται στον γραπτό λόγο, επιτρέποντάς μας για πρώτη φορά να έχουμε πρόσβαση σε ένα chatbot  που αλληλεπιδρά μαζί μας, μέσω κειμένου και prompts, απαντώντας γραπτώς σε όλες σχεδόν τις ερωτήσεις μας, γνωρίζοντας τα «πάντα» ή παράγοντας εικόνες και video.

Οι μετασχηματιστές (Transformers) και τα μοντέλα διάχυσης (Diffusion models) είναι δύο τύποι μοντέλων δημιουργικής τεχνητής νοημοσύνης (Generative AI) που έχουν φέρει επανάσταση στον χώρο. Οι μετασχηματιστές είναι στην ουσία υπολογιστικά νευρωνικά δίκτυα (τα οποία μιμούνται τη λειτουργία του εγκεφάλου μας), που μαθαίνουν τις σχέσεις με βάση τα συμφραζόμενα μεταξύ λέξεων σε μια πρόταση ή ακολουθία κειμένου και παράγουν σχετικές απαντήσεις βάσει των δεδομένων που έχουν πρόσβαση, ενώ τα μοντέλα διάχυσης είναι δημιουργικά μοντέλα με διαφορετικό τρόπο λειτουργίας.

Τα μεγάλα γλωσσικά μοντέλα όπως λέγονται (LLMs), για παράδειγμα τα ChatGPT, Llama, Gemini κ.ά., εκπαιδεύονται με κάθε είδους ψηφιακή γνώση, τεράστια σύνολα πραγματικών δεδομένων ή ακόμα και συνθετικών, και πλέον βασίζονται στη νέα γενιά μετασχηματιστών, (από την ομάδα των ερευνητών της Google) για να επικοινωνήσουν με τον χρήστη με γραπτό λόγο αρχικά και μέσω φωνής προσεχώς.

Οι μετασχηματιστές είναι ζωτικής σημασίας στη σύγχρονη επεξεργασία φυσικής γλώσσας (NLP), τροφοδοτώντας εργαλεία τεχνητής νοημοσύνης όπως το ChatGPT, ενώ τα μοντέλα διάχυσης είναι εξέχοντα στη δημιουργία εικόνων υψηλής ποιότητας, βίντεο, εικόνων και ήχου.

Πώς λειτουργούν το ChatGPT και το Stable Diffusion

Όπως προαναφέραμε οι μετασχηματιστές έχουν σχεδιαστεί για να μαθαίνουν τις σχέσεις με βάση τα συμφραζόμενα μεταξύ λέξεων σε μια πρόταση ή ακολουθία κειμένου, χρησιμοποιώντας έναν μηχανισμό που ονομάζεται αυτο-προσοχή, ο οποίος επιτρέπει στο μοντέλο να σταθμίζει τη σημασία διαφορετικών λέξεων σε μια ακολουθία με βάση τις σχέσεις τους.

Τα μοντέλα διάχυσης λειτουργούν προσθέτοντας θόρυβο στα διαθέσιμα δεδομένα εκπαίδευσης και στη συνέχεια μαθαίνοντας να ανακτούν τα δεδομένα αντιστρέφοντας αυτή τη διαδικασία θορυβοποίησης.
Σε κάθε περίπτωση πρόκειται για προηγμένους αλγόριθμους μηχανικής μάθησης που παράγουν μοναδικά δεδομένα (εικόνες, video και ήχο) υψηλής ποιότητας!

Μερικά γνωστά παραδείγματα υπηρεσιών σε αυτή την κατηγορία είναι τα Dall-E της OpenAI, Stable Diffusion αλλά και το Midjourney για εικόνες, Amper και MuseNet για ήχο, Runaway και Synthesia για video και digital avatars αλλά και το GitHub CoPilot για παραγωγή κώδικα προγραμματισμού. 

Η γενική τεχνητή νοημοσύνη ή Skynet ή Hal 9000

Πρόκειται για το ιερό δισκοπότηρο της τεχνητής νοημοσύνης! Mε τη γενική τεχνητή νοημοσύνη (Artificial General Intelligence – AGI) να είναι ο «φόβος και ο τρόμος» πολλών γνωστών τεχνολογικών γκουρού και επιστημόνων αλλά και ο λόγος για τις σχετικά ταχείες ενέργειες κανονιστικού ελέγχου της AI σε επίπεδο κρατών. 

H γενική τεχνητή νοημοσύνη (AGI) θα μπορεί να σκέφτεται, να αναρωτιέται και να ψάχνει τρόπους να μάθει πράγματα, με παρόμοιο τρόπο που το κάνει ο άνθρωπος και απεριόριστη πρόσβαση σε γνώση, χωρίς να υπάρχει προγενέστερη εκπαίδευση, (τo ChatGPT χρειάζεται εκπαίδευση).  Μια τόσο εξελιγμένη τεχνητή νοημοσύνη μπορεί να είναι η υλοποίηση ενός ονείρου επιστημονικής φαντασίας για πολλούς, ειδικά αν συνδυαστεί με κάποιο ανθρωπόμορφο ρομπότ, αλλά αντιλαμβανόμαστε τις τεράστιες επιπλοκές που ενδέχεται να φέρει και τα όποια ζητήματα ασφάλειας και ηθικής, αν δεν καταφέρουν οι ειδικοί φιλόσοφοι και ψυχολόγοι αλλά και τεχνολόγοι να οριοθετήσουν την «προσωπικότητά» της. Από την άλλη, όμως, θα έχουμε δίπλα μας μια ΑΙ του επιπέδου της σειράς Beacon 23 για παράδειγμα με ό,τι εξαιρετικό αυτό συνεπάγεται.

Σε κάθε περίπτωση, βρισκόμαστε τουλάχιστον 5 χρόνια  μακριά από την AGI, με δοκιμές και πρωτότυπα να είναι ήδη σε εξέλιξη και προς υλοποίηση, ενώ ενδέχεται πιο αυστηρά κανονιστικά πλαίσια να περιορίσουν ή να καθυστερήσουν την εμφάνισή της, όπως για παράδειγμα αυτά της Ευρώπης, με τις φωνές αντιλόγου να αναφέρουν ότι οι όποιοι περιορισμοί στην ουσία είναι εμπόδια στην τεχνολογική εξέλιξη. 

Αναστάσης Γερμανίδης, ο πρωτοπόρος στην «καλλιτεχνική» ΑΙ

Η ιστορία δημιουργίας της RunwayML, (www.runway.ml), μιας από τις πιο γνωστές Startups στο χώρο της δημιουργίας video μεσω AI, είναι η συνηθισμένη: οι ιδρυτές της διαπίστωσαν την ζήτηση για ένα συγκεκριμένο αντικείμενο και έτσι αποφάσισαν να στήσουν τη δική τους Startup, η οποία έχει σηκώσει πάνω από 140 εκατ. δολάρια μέχρι σήμερα και βρίσκεται μέσα στις 100 πιο επιδραστικές εταιρείες παγκοσμίως σύμφωνα με τους Times. 

Ο συνιδρυτής, της RunwayML, Αναστάσης Γερμανίδης, έχει διαδραματίσει καθοριστικό ρόλο στην ανάπτυξη και την επιτυχία της εταιρείας, αξιοποιώντας την εμπειρία του ως καλλιτέχνης, μηχανικός και ερευνητής.

Η εταιρεία προσφέρει εργαλεία βίντεο που υποστηρίζονται από AI, παραγωγής κειμένου σε εικόνα, βίντεο σε βίντεο και κειμένου σε βίντεο, όλα τροφοδοτούμενα από ένα σύνολο ιδιόκτητων μοντέλων.

Η Runway έχει επίσης επικεντρωθεί στον εκδημοκρατισμό της πρόσβασης στη μηχανική μάθηση, αφού συνεργάζεται με εκατοντάδες φοιτητές, καλλιτέχνες και τεχνολόγους από όλο τον κόσμο.

Οι μεγάλοι παίκτες της δημιουργικής τεχνητής νοημοσύνης

OpenAI – Microsoft
https://chat.openai.com
https://copilot.microsoft.com

Η Microsoft και ειδικά ο Bill Gates άδραξαν την ευκαιρία επενδύοντας στην OpenAI, η οποία είναι η εταιρεία με την πιο περίπλοκη εταιρική δομή και με το πρόσφατο δράμα απόλυσης και επαναπρόσληψης του CEO της Sam Altman αλλά και εκείνη που έφτιαξε το περίφημο ChatGPT. H Microsoft με αυτή τη κίνηση έχει καταφέρει να προχωρήσει γοργά και να προσφέρει πρόσβαση στο ChatGPT 4 από τον πλοηγό Edge, τη μηχανή αναζήτησης Bing αλλά και το Office πλέον. 

Google
https://bard.google.com

H Google παρουσίασε αρχικά το δικό της μοντέλο PaLM-2, πάνω στο οποίο βασίζεται το chatbot Bard, το οποίο θα αντικατασταθεί από το Gemini, από την ομάδα του Έλληνα Demis Hassabis και την DeepMind. Αναμένουμε επίσης με μεγάλο ενδιαφέρον την ενσωμάτωση του Gemini στη μηχανή αναζήτησης της Google, με το Search Generative Experience (SGE) το οποίο προσφέρεται ήδη σε μεγάλο μέρος του κόσμου, αλλά όχι ακόμα στην Ευρώπη λόγω αυστηρότερου κανονιστικού πλαισίου. 

Meta
https://ai.meta.com/genai

H Meta παρουσίασε το μερικώς ανοικτό και δωρεάν προσφερόμενο μάλιστα LLaMA, το οποίο χρησιμοποιείται από πολλούς τρίτους ενδιαφερόμενους και Startups δημιουργικής τεχνητής νοημοσύνης, ενώ αναμένεται να το δούμε σύντομα σε AI Avatars στο Facebook – Messenger, στα κράνη VR της Oculus και στο Metaverse.  

Apple
Η Apple δεν έχει αποφασίσει ακόμα τι θα κάνει με τη νέα γενιά ΑΙ, αλλά έχει τα πάντα έτοιμα τόσο στα iPhone, με το ενσωματωμένο τσιπ neural engine, όσο και στο λειτουργικό, στο επερχόμενο iOS 18. Το μόνο σίγουρο είναι ότι θα δούμε μια εξελιγμένη Siri η οποία θα τρέχει τοπικά στο Smartphone και όχι κάπου κεντρικά. Το ίδιο θα συμβεί και στον κόσμο του Android αφού και τα νέα High-end κινητά με επεξεργαστές της Qualcomm για παράδειγμα θα μπορούν να τρέχουν τοπικά «ChatGPT».

Anthropic
https://www.anthropic.com

Πρόκειται για μια Startup η οποία έχει αναπτύξει το μεγάλο γλωσσικό μοντέλο Claude 2 το οποίο εμφανίζεται αρκετά ανταγωνιστικό με το ChatGPT. Αναμένει και αυτή τις εγκρίσεις της Ε.Ε. για να εισέλθει στην Ευρώπη. 

Inflection
https://inflection.ai

Άλλη μια Startup η οποία έχει δημιουργήσει ένα πιο «ανθρώπινο» chatbot, το pi, που έχει τον χαρακτήρα ενός φίλου ο οποίος βρίσκεται πάντα δίπλα μας. 

 

Hugging Face
https://huggingface.co

Η γαλλική Startup Hugging Face, είναι alumni του StationF, είναι μονόκερος και επίσης είναι μια εξέχουσα εταιρεία στον χώρο της ΑΙ γενικά και ειδικά της νέας γενιάς, μια και προσφέρει μια πλατφόρμα – τεχνολογική κοινότητα ΑΙ, όπου οι ενδιαφερόμενοι developers κυρίως μπορούν να αναπτύσσουν και να δοκιμάζουν μοντέλα ΑΙ και εφαρμογές. 

StabilityAI

Η Stability AI ειδικεύεται στη δημιουργία εικόνων, video και ήχου μέσα από γραπτές συνομιλίες με τον χρήστη, ενώ προσφέρει και μεγάλα γλωσσικά μοντέλα για εταιρικές και μη υλοποιήσεις τύπου ChatGPT.

Η υψηλή τέχνη των γραπτών προτροπών ΑΙ

Οι προτροπές-prompts διαδραματίζουν κρίσιμο ρόλο στην καθοδήγηση των δημιουργικών μοντέλων AI για την παραγωγή επιθυμητών αποτελεσμάτων. Χρησιμεύουν ως αρχική εισαγωγή πληροφορίας που δίνεται σε ένα γλωσσικό μοντέλο, παρέχοντας πλαίσιο και οδηγίες για την καθοδήγηση της δημιουργίας περιεχομένου.

Η αποτελεσματική μηχανική προτροπών είναι απαραίτητη για την προσαρμογή των αποκρίσεων του κάθε μοντέλου AI για συνάφεια, σαφήνεια και βάθος, αποτελώντας ακρογωνιαίο λίθο της συνολικής απόδοσης της AI.

Με την προσεκτική δημιουργία προτροπών, οι χρήστες μπορούν να επηρεάσουν τον τύπο των πληροφοριών που δημιουργούνται από το μοντέλο, όπως το ρόλο που μπορεί να πάρει η ΑΙ, (Marketing στελεχος, copywriter, δημοσιογράφος κ.α.) τη μορφή του περιεχομένου, το ύφος, τη γραφή κ.ά. Οι καλά σχεδιασμένες προτροπές μπορούν να ελέγξουν την απόκριση του μοντέλου, διασφαλίζοντας ακρίβεια και αποτελέσματα σχετικά με τα συμφραζόμενα.

Επιπλέον, οι προτροπές μπορούν να χρησιμοποιηθούν για μια ποικιλία εργασιών, συμπεριλαμβανομένης της δημιουργίας κειμένου, της παραγωγής φωτογραφιών, της μετάφρασης, της σύνταξης διαφορετικών ειδών δημιουργικού περιεχομένου και της απάντησης σε ερωτήσεις με ενημερωτικό τρόπο.
Μια νέα κατηγορία εργαζομένων-ειδικών έχει ήδη δημιουργηθεί, οι οποίοι αναλαμβάνουν να γράψουν τις βέλτιστες προτροπές με τεράστιες απολαβές μάλιστα.

AI στο gov.gr: Από τις πρώτες ευρωπαϊκές υλοποιήσεις AI

Ο ψηφιακός βοηθός, που έχει τη μορφή chatbot, είναι μια νέα προσθήκη στο gov.gr αφού βοηθά εκατομμύρια επισκέπτες καθημερινά να βρουν εύκολα την υπηρεσία που αναζητούν, απαντώντας σε απλές αλλά και σύνθετες ερωτήσεις τους, με σαφώς καλύτερη απόδοση σε σχέση με την υπάρχουσα αναζήτηση. Αποτελεί την πρώτη εφαρμογή που αξιοποιεί τεχνητή νοημοσύνη στο Δημόσιο και μία από τις πρώτες ανάλογες υπηρεσίες στην Ευρώπη, συμβάλλοντας στον ευρύτερο εκσυγχρονισμό του κρατικού μηχανισμού, ειδικά στο σκέλος της αλληλεπίδρασης με τους πολίτες για τη διευκόλυνσή τους και την απλοποίηση της καθημερινότητάς τους.

Στο έργο του ο νέος βοηθός, o οποίος βασίζεται στην πλατφόρμα AI της Microsoft, θα αντλεί πληροφορίες από τον κατάλογο των 1.600+ ψηφιοποιημένων υπηρεσιών που έχουν ενταχθεί έως σήμερα στο gov.gr και 3.270 ψηφιοποιημένων διοικητικών διαδικασιών που έχουν ενσωματωθεί στο μητρώο ΜΙΤΟΣ, προκειμένου να κατευθύνει κάθε συνομιλητή του, δίνοντας παράλληλα πληροφορίες για τις ενέργειες στις οποίες χρειάζεται να προβεί ο πολίτης για την ταχεία διεκπεραίωση του αιτήματός του. Στα επόμενα βήματα εξέλιξης ο ψηφιακός βοηθός AI του gov.gr θα μπορεί να ολοκληρώνει τις όποιες αιτήσεις πολιτών σε πραγματικό χρόνο, ακόμα και για την υπογραφή συμβολαίων με δίκτυα κινητής τηλεφωνίας. 

 

Το άρθρο δημοσιεύτηκε για πρώτη φορά στο Startupper MAG #45

Μάθετε πρώτοι τα τελευταία νέα
Ακολουθήστε μας στο Google News και μάθετε πρώτοι όλες τις ειδήσεις