Μεγέθυνση Εικόνων με Τεχνητή Νοημοσύνη
Με την χρήση του κατάλληλου εργαλείου τεχνητής νοημοσύνης, μπορούμε να μεγεθύνουμε μία εικόνα χωρίς να αλλοιωθεί η ανάλυση της.
Για παράδειγμα μπορούμε να μετατρέψουμε μία εικόνα 360p σε 1080p.
Εδώ θα δούμε πως μπορούμε να το κάνουμε αυτό με την A.Ι. εφαρμογή ESRGAN.
Το ESRGAN είναι το ακρωνύμιο της φράσης “Enhanced Super-Resolution Generative Adversarial Networks” και πρόκειται για μία υλοποίηση της σχετικής δημοσίευσης του 2018.
Μπορείτε να μεγεθύνετε τις δικές σας εικόνες στο παρακάτω διαδραστικό demo!
Η εφαρμογή μας δίνει 3 επιλογές μεγέθυνσης. 2x, 4x και 8x.
Η μεγέθυνση με Α.Ι. διαφέρει από ένα απλό stretch της εικόνας.
Παραδείγματα
Εδώ για παράδειγμα βλέπετε μία εικόνα 360p που έχει γίνει 8x μεγέθυνση με το ESRGAN στα αριστερά, ενώ στα δεξιά έχει γίνει απλά stretch στην ίδια ανάλυση.
Στην δεξιά εικόνα βλέπουμε πως η ευκρίνεια χάνεται αισθητά δημιουργώντας πιξέλιασμα και θάμπωμα ως αποτέλεσμα του “τραβήγματος” της εικόνας.
Αντιθέτως, στην αριστερή εικόνα βλέπουμε πως το ESRGAN έχει προσπαθήσει να ανασυνθέσει την εικόνα διατηρώντας την σωστή “υφή” των αντικειμένων που αναπαριστώνται.
Αν σας αρέσει να δημιουργείτε εικόνες με εφαρμογές τεχνητής νοημοσύνης, θα έχετε παρατηρήσει ότι πολλές εφαρμογές δημιουργούν εικόνες χαμηλότερης ανάλυσης πχ. 512×512, καθώς όσο αυξάνεται η ανάλυση της εικόνας τόσο αυξάνεται και ο χρόνος που απαιτείται για την δημιουργία της.
To ESRGAN μπορεί να φανεί πολύ χρήσιμο σε αυτή την περίπτωση! Αντί να φτιάξουμε εικόνες πολύ μεγάλης ανάλυσης, μπορούμε να δημιουργήσουμε εικόνες σε μία ικανοποιητική ανάλυση (512×512) και να χρησιμοποιήσουμε το ESRGAN για να τις μεγεθύνουμε στο κατάλληλο μέγεθος ώστε να τις χρησιμοποιήσουμε είτε σαν ταπετσαρία στον υπολογιστή ή το κινητό μας, είτε ακόμα και τις εκτυπώσουμε.
Για παράδειγμα, η παρακάτω εικόνα δημιουργήθηκε με την εφαρμογή MidJourney σε ανάλυση 1024χ1024 και μεγεθύνθηκε στο διπλάσιο 2048χ2048.
Μπορείτε να φτιάξετε τις δικές σας εικόνες από μία περιγραφή κειμένου με την εφαρμογή Stable Diffusion