Τα πάντα για την ελληνική Startup Σκηνή

Stability AI: Νέο μοντέλο AI για τη δημιουργία εικόνων

υπόσχεται να είναι ταχύτερο και πιο ισχυρό από τον κορυφαίο προκάτοχό του, το Stable Diffusion, το οποίο αποτελεί τη βάση πολλών άλλων εργαλείων AI μετατροπής κειμένου σε εικόνα.

Το νεότερο μοντέλο της Stability AI για τη δημιουργία εικόνας είναι το Stable Cascade, που υπόσχεται να είναι ταχύτερο και πιο ισχυρό από τον κορυφαίο προκάτοχό του, το Stable Diffusion, το οποίο αποτελεί τη βάση πολλών άλλων εργαλείων AI μετατροπής κειμένου σε εικόνα.

Το Stable Cascade μπορεί να δημιουργήσει φωτογραφίες και να δώσει παραλλαγές της ακριβούς εικόνας που δημιούργησε ή να προσπαθήσει να αυξήσει την ανάλυση μιας υπάρχουσας εικόνας. Άλλες δυνατότητες μετατροπής κειμένου σε εικόνα περιλαμβάνουν το inpainting και το outpainting, όπου το μοντέλο θα γεμίσει την επεξεργασία μόνο ενός συγκεκριμένου τμήματος της εικόνας, καθώς και το canny edge, όπου οι χρήστες μπορούν να κάνουν μια νέα φωτογραφία χρησιμοποιώντας μόνο τις άκρες μιας υπάρχουσας εικόνας. όπου το μοντέλο θα επεξεργάζεται μόνο ένα συγκεκριμένο μέρος της εικόνας, καθώς και το canny edge, όπου οι χρήστες μπορούν να φτιάξουν μια νέα φωτογραφία.

Το νέο μοντέλο είναι διαθέσιμο στο GitHub για ερευνητές αλλά όχι για εμπορική χρήση και φέρνει περισσότερες επιλογές ακόμη και όταν εταιρείες όπως η Google και η Apple κυκλοφορούν τα δικά τους μοντέλα παραγωγής εικόνας.

Το Stable Cascade δεν είναι ένα μεγάλο γλωσσικό μοντέλο, είναι τρία διαφορετικά μοντέλα που βασίζονται στην αρχιτεκτονική Würstchen. Το πρώτο στάδιο, το στάδιο C, συμπιέζει τα μηνύματα κειμένου σε μικρότερα κομμάτια κώδικα που στη συνέχεια περνούν στα στάδια Α και Β για να αποκωδικοποιήσουν το αίτημα.

Η διάσπαση των αιτημάτων σε μικρότερα bit έχει ως αποτέλεσμα το αίτημα να απαιτεί λιγότερη μνήμη και λιγότερες ώρες εκπαίδευσης σε αυτές τις δυσεύρετες GPU και να τρέχει πιο γρήγορα. ενώ αποδίδει καλύτερα τόσο στην άμεση ευθυγράμμιση όσο και στην αισθητική ποιότητα. Χρειάστηκαν περίπου 10 δευτερόλεπτα για να δημιουργηθεί μια εικόνα σε σύγκριση με 22 δευτερόλεπτα για το μοντέλο SDXL που χρησιμοποιείται αυτήν τη στιγμή.

Η Stability AI βοήθησε στη διάδοση της μεθόδου σταθερής διάχυσης και έχει επίσης αποτελέσει αντικείμενο αρκετών αγωγών που ισχυρίζονται ότι το Stable Diffusion εκπαιδεύτηκε σε δεδομένα που προστατεύονται από πνευματικά δικαιώματα χωρίς άδεια από τους κατόχους δικαιωμάτων, με μια αγωγή στο Ηνωμένο Βασίλειο από την Getty Images κατά της Stability AI να έχει προγραμματιστεί να δικαστεί τον Δεκέμβριο.

Μάθετε πρώτοι τα τελευταία νέα
Ακολουθήστε μας στο Google News και μάθετε πρώτοι όλες τις ειδήσεις