OpenAI SORA: Το Α.Ι. Εργαλείο Δημιουργίας Βίντεο Τώρα Διαθέσιμο στο Ευρύ Κοινό
OpenAI SORA: Το Α.Ι. Εργαλείο Δημιουργίας Βίντεο Τώρα Διαθέσιμο στο Ευρύ Κοινό
Στις 10 Δεκεμβρίου 2024, η OpenAI ανακοίνωσε την πολυαναμενόμενη δημόσια διάθεση του “Sora”, της πλατφόρμας Τεχνητής Νοημοσύνης που είχαμε γνωρίσει αρχικά μέσα από κλειστά demo και επιδείξεις. Μέχρι τώρα, είχαμε δει εντυπωσιακά παραδείγματα των δυνατοτήτων του Sora, όμως η πρόσβαση παρέμενε περιορισμένη. Πλέον, η OpenAI κάνει το επόμενο βήμα και ανοίγει την πλατφόρμα στο ευρύ κοινό, δίνοντας μας την ευκαιρία να δοκιμάσουμε και μόνοι μας τις δυνατότητες του.
Δυστυχώς το Sora δεν είναι ακόμα διαθέσιμο στην Ελλάδα, όμως είχα την ευκαιρία να το χρησιμοποίησω και θα σας δείξω εδώ κάποια από τα αποτελέσματα και τις σκέψεις μου σχετικά με αυτά.
Η υπηρεσία είναι διαθέσιμη μέσω του Sora.com για συνδρομητές του ChatGPT Plus, προσφέροντας έως και 50 βίντεο ανάλυσης έως και 720p μηνιαίως, ενώ οι συνδρομητές του ChatGPT Pro διαθέτουν απεριόριστες δημιουργίες σε ανάλυση έως και 1080p.
Για όσες και όσους μπορεί να μην γνωρίζουν, το Sora είναι ένα Α.Ι. εργαλείο δημιουργίας βίντεο από μία απλή περιγραφή κειμένου. Από τα demo που έχουμε δει μέχρι σήμερα, πρόκειται ίσως για το καλύτερο εργαλείο της κατηγορίας αυτή τη στιγμή. Θα βρείτε περισσότερες πληροφορίες για το Sora στο σχετικό άρθρο της σελίδας.
Δυνατότητες
To Sora έχει την δυνατότητα να δημιουργεί βίντεο έως και 20 δευτερολέπτων από μία απλή περιγραφή κειμένου. Όμως οι δυνατότητες του δεν σταματούν εκεί.
- Μέσα από την πλατφόρμα του Sora μπορούμε να επιλέξουμε την διάρκεια του βίντεο, την ανάλυση και την αναλογία οθόνης 16:9 / 9:16 / 1:1
- Μπορούμε επίσης να ανεβάσουμε μία στατική εικόνα και σε συνδυασμό με μία περιγραφή κειμένου, να δημιουργήσουμε ένα βίντεο.
- Μπορούμε να επεξεργαστούμε ένα βίντεο αλλάζοντας ένα η περισσότερα στοιχεία, με μία περιγραφή κειμένου.
- Με την λειτουργία του “Storyboard”, μπορούμε να δημιουργήσουμε ένα timeline με εικόνες ή περιγραφές κειμένου και να αφήσουμε το Sora να δημιουργήσει ένα βίντεο που θα ακολουθεί την ροή που του ορίσαμε.
Περιορισμοί
Παρότι η γενική διαθεσιμότητα του Sora είναι ένα πολύ μεγάλο βήμα μπροστά, δεν λείπουν και τα προβλήματα.
Αρχικά φαίνεται πως τα αποτελέσματα που έχουν δημοσιευτεί από την OpenAI είναι σε μεγάλο βαθμό cherry-picked. Δηλαδή, ενώ το Sora συχνά παράγει βίντεο με αρκετές αστοχίες, στα demo που έχουμε δει μέχρι σήμερα έχουν επιλεγεί μόνο τα εντυπωσιακά πετυχημένα βίντεο.
Το μοντέλο ακόμα δυσκολεύεται με συγκεκριμένες λεπτομέρειες της φυσικής ή με σκηνές που απαιτούν πολύπλοκες αλληλεπιδράσεις. Για παράδειγμα, στο παρακάτω βίντεο, ζήτησα από το Sora να δημιουργήσει μία γάτα που σπρώχνει ένα ποτήρι με νερό από ένα τραπέζι και το ποτήρι σπάει σε πολλά μικρά κομμάτια καθώς πέφτει στο πάτωμα.
Όπως μπορούμε να δούμε από το βίντεο, το ποτήρι εξαφανίζεται κάπως περίεργα κάτω από την γάτα και δεν το βλέπουμε ποτέ να πέφτει στο πάτωμα. Παράλληλα, μπορούμε να παρατηρήσουμε κάτι περίεργο στην κίνηση της γάτας καθώς “φυτρώνει” ένα δεύτερο αριστερό πόδι καθώς περνάει πάνω από το ποτήρι.
Ασφάλεια
Με την άμεση διάθεση του Sora στο κοινό, η OpenAI γνωρίζει ότι αναδεικνύονται ανησυχίες σχετικά με την παραπληροφόρηση και τις κακόβουλες χρήσεις. Έτσι, έχει ήδη ανακοινώσει ότι συνεργάζεται με ειδικούς σε θέματα ασφαλείας, ρητορικής μίσους και προκαταλήψεων. Επιπλέον, εργάζεται πάνω σε εργαλεία που μπορούν να αναγνωρίσουν τα βίντεο που παράγονται από το Sora, χρησιμοποιώντας τεχνικές όπως τα μεταδεδομένα C2PA, με σκοπό να περιορίσουν τη διάδοση ψεύτικων βίντεο.
Φυσικά, όπως έχουμε ξαναπεί, η προσθήκη μεταδεδομένων και η χρήση ψηφιακών υπογραφών δεν είναι από μόνη της αρκετή. Υπάρχουν τρόποι παράκαμψης και αφαίρεσης αυτών των πληροφοριών. Αυτό σημαίνει ότι η καλύτερη μας άμυνα παραμένει η εκπαίδευση, η εγρήγορση και η εξοικείωση με τις νέες δυνατότητες της Α.Ι., ώστε να μπορούμε να εντοπίζουμε πότε κάτι είναι ψεύτικο και πότε όχι.
Παρακάτω μπορείτε να βρείτε μερικά χιουμοριστικά αλλά “παραπλανητικά” βίντεο που δοκίμασα να δημιουργήσω με το Sora.
Επίλογος
Δεν έχουν περάσει παρά λίγοι μήνες από τότε που μιλούσαμε για τις “φωτο-ρεαλιστικές” δυνατότητες του Sora κεκλεισμένων των θυρών, και σήμερα μπορούμε επιτέλους να το δούμε σε δράση, και να το δοκιμάσουμε και εμείς οι ίδιοι. Προσωπικά εντυπωσιάζομαι από την μεγάλη τεχνολογική πρόοδο που παρατηρούμε σε πολύ μικρό χρονικό διάστημα. Η δυνατότητα που δίνουμε στους υπολογιστές μας να κατανοούν αλλά και να παράγουν εικόνες, κείμενο, βίντεο και ήχο είναι η αρχή για μία σειρά νέων εφαρμογών που μπορεί να μην έχουμε καν φανταστεί μέχρι σήμερα. Θεωρώ εφαρμογές όπως το Sora εξαιρετικά εργαλεία που μπορούν να ενισχύσουν την δημιουργηκότητα μας και να μας βοηθήσουν να παράγουμε εντυπωσιακά αποτελέσματα.
Η ταχύτητα με την οποία εξελίσσεται η τεχνολογία στον χώρο του βίντεο είναι εντυπωσιακή, αλλά είναι απόλυτα κατανοητό να εγείρει κάποιες ανησυχίες. Είναι σχεδόν σίγουρο ότι θα δούμε απόπειρες παραπληροφόρησης και εκμετάλλευσης αυτών των δυνατοτήτων σε πολύ σύντομο χρονικό διάστημα.
Η καλύτερη μας άμυνα, όπως έχω ξανατονίσει, θεωρώ πως είναι η γνώση, η κριτική σκέψη και η συνεχής εκπαίδευση. Μαζί με τα θετικά κάθε νέας τεχνολογίας έρχονται πάντα και κάποια προβλήματα, τα οποία οφείλουμε να είμαστε έτοιμοι να τα αντιμετωπίσουμε. Θεωρώ την διάθεση των Α.Ι. εργαλείων σε περισσότερο κόσμο ένα θετικό βήμα, καθώς έχουμε την ευκαιρία να εξοικειωθούμε περισσότερο μαζί τους, να γνωρίσουμε τις δυνατότητες τους και να εντοπίσουμε πολύ πιο γρήγορα τα πιθανά προβλήματα μπορεί να φέρνουν.
Περισσότερα παραδείγματα
Και το προσωπικό μου αγαπημένο prompt σε κάθε εφαρμογή δημιουργίας εικόνων και βίντεο: