Φώτης Ζανταλής

GPT-4o: Ένα Μοντέλο που Συνδυάζει Εικόνα, Ήχο και Κείμενο

GPT-4o: Ένα Μοντέλο που Συνδυάζει Εικόνα, Ήχο και Κείμενο Μέχρι τώρα σίγουρα θα έχετε πέσει πάνω σε κάποιο βίντεο της OpenAI όπου παρουσιάζουν τις δυνατότητες του νέου μοντέλου GPT-4o. Στα βίντεο βλέπουμε το ChatGPT να μιλάει σε φυσική γλώσσα με πρωτογνωρους χρωματισμούς στην φωνή, εκφράζοντας συναισθήματα όπως χαρά και ενθουσιασμό. Επιπλέον, η συζήτηση μεταξύ των…

AlphaFold 3: Πρόβλεψη των Δομών και των Αλληλεπιδράσεων Όλων των Μορίων της Ζωής!

AlphaFold 3: Πρόβλεψη των Δομών και των Αλληλεπιδράσεων Όλων των Μορίων της Ζωής! H Deepmind έχει καταφέρει εκτοξεύει τον ενθουσιασμό της επιστημονικής κοινότητας με κάθε νέα δημοσίευση της. Αυτό έκανε ακόμα μία φορά με την δημοσίευση του AlphaFold 3 στο περιοδικό Nature. Πρόκειται για ένα μοντέλο μηχανικής μάθησης ικανό να προβλέψει την δομή και τις…

Ρεπορτάζ στο ΣΚΑΪ για τα Deepfakes

Στις 20/03/2024 συμμετείχα σε ρεπορτάζ του Αντώνη Κρητικού για τα Deepfakes και τους κινδύνους της Τεχνητής Νοημοσύνης. Στα πλαίσια του ρεπορτάζ δημιουργήσαμε 2 χιουμοριστικά deepfakes με τα πρόσωπα και τις φωνές Ελλήνων πολιτικών. Μπορείτε να παρακολουθήσετε το ρεπορτάζ στο παρακάτω βίντεο. Με αφορμή το ρεπορτάζ θέλω να παραθέσω και τις δικές μου σκέψεις πάνω στο…

OpenAI SORA: Κείμενο-σε-Βίντεο με Εντυπωσιακές Δυνατότητες!

OpenAI SORA: Κείμενο-σε-Βίντεο με Εντυπωσιακές Δυνατότητες! Στις 15 Φεβρουαρίου του 2024, η OpenAI δημοσίευσε μερικά demo του νέου Α.Ι. μοντέλου της, με το όνομα “Sora“. Το Sora είναι ένα μοντέλο δημιουργίας βίντεο από μία περιγραφή κειμένου. Η OpenAI δεν έχει δώσει ακόμα πρόσβαση στο ευρύ κοινό για την χρήση του Sora, όμως από τα πρώτα…

Πως να Δημιουργήσεις Αυτόματα Υπότιτλους για Ένα YouTube Video με το Whisper

Πως να Δημιουργήσεις Αυτόματα Υπότιτλους για Ένα YouTube Video με το Whisper Περιεχόμενα: Τι είναι το Whisper Χρήση Whisper στο Google Colab Αποτελέσματα Τι είναι το Whisper Το Whisper είναι μία εφαρμογή αυτόματης αναγνώρισης ομιλίας που δημιουργήθηκε από την OpenAI. To μοντέλο του Whisper έχει εκπαιδευτεί σε 680000 ώρες ομιλίας από διαφορετικές γλώσσες. Ως αποτέλεσμα…

Η Απόλυτη Εργαλειοθήκη Α.Ι. Επεξεργασίας Εικόνας

Η Stability AI, μας δίνει απλόχερα για άλλη μία φορά μία ολόκληρη εργαλειοθήκη με Α.Ι. εργαλεία για κάθε χρήση στο κομμάτι της επεξεργασίας εικόνας. Η Stability AI είναι η εταιρεία που δημιούργησε το μοντέλου ανοικτού κώδικα Stable Diffusion για την δημιουργία εικόνων από μία περιγραφή κειμένου.  Με την κυκλοφορία του νέου Stable Diffusion XL (SDXL),…