Τα πάντα για την ελληνική Startup Σκηνή

Η Apple φέρνει το MGIE, το AI μοντέλο επεξεργασίας εικόνων με γραπτή περιγραφή

Το MGIE, το οποίο σημαίνει MLLM-Guided Image Editing, μπορεί να εφαρμοστεί σε απλές και πιο σύνθετες εργασίες επεξεργασίας εικόνας.

Οι ερευνητές της Apple κυκλοφόρησαν ένα νέο μοντέλο AI, το MGIE, που επιτρέπει στους χρήστες να περιγράφουν σε απλή γλώσσα τι θέλουν να αλλάξουν σε μια φωτογραφία χωρίς ποτέ να αγγίξουν το λογισμικό επεξεργασίας φωτογραφιών.

Το μοντέλο MGIE, για το οποίο η Apple συνεργάστηκε με το Πανεπιστήμιο της Καλιφόρνια στη Σάντα Μπάρμπαρα, μπορεί να περικόψει, να αλλάξει το μέγεθος, να αναστρέψει και να προσθέσει φίλτρα σε εικόνες μέσω μηνυμάτων κειμένου.

Το MGIE, το οποίο σημαίνει MLLM-Guided Image Editing, μπορεί να εφαρμοστεί σε απλές και πιο σύνθετες εργασίες επεξεργασίας εικόνας, όπως η τροποποίηση συγκεκριμένων αντικειμένων σε μια φωτογραφία για να τους αλλάξει σχήμα ή να βγουν πιο φωτεινά. Το μοντέλο συνδυάζει δύο διαφορετικές χρήσεις πολυτροπικών γλωσσικών μοντέλων. Πρώτον, μαθαίνει πώς να ερμηνεύει τις προτροπές των χρηστών. Στη συνέχεια, “φαντάζεται” πώς θα μοιάζει η επεξεργασία. Για πάρα, ζητώντας έναν πιο μπλε ουρανό σε μια φωτογραφία γίνεται αύξηση της φωτεινότητας στο τμήμα του ουρανού μιας εικόνας.

Η Apple έκανε το MGIE διαθέσιμο μέσω του GitHub για λήψη, αλλά κυκλοφόρησε επίσης και ένα web demo στο Hugging Face Spaces, όπως αναφέρει το VentureBeat. Η εταιρεία δεν αποκάλυψε ποια είναι τα σχέδιά της για το μοντέλο πέρα από την έρευνα.

Μάθετε πρώτοι τα τελευταία νέα
Ακολουθήστε μας στο Google News και μάθετε πρώτοι όλες τις ειδήσεις