ΗΠΑ: Ερευνητές εκπαίδευσαν ένα ρομπότ να βγάζει φωτογραφίες υψηλής αισθητικής

Μια ομάδα ερευνητών στο Πανεπιστήμιο Κορνέλ σχεδίασε ένα ρομπότ που μπορεί όχι μόνο να επιλέγει την πιο ωραία εικόνα σε ένα σύνολο δεδομένων, αλλά, όπως αναφέρει το Engadget. Το πρότζεκτ ονομάζεται AutoPhoto και παρουσιάστηκε το περασμένο φθινόπωρο στο Διεθνές Συνέδριο για Ευφυή Ρομπότ και Συστήματα.

Αυτό το ρομποτ-φωτογράφος αποτελείται από τρία μέρη: τον αλγόριθμο αξιολόγησης εικόνας ο οποίος βαθμολογεί τις φωτογραφίες, ένα ρομπότ με ρόδες Clearpath Jackal στο οποίο είναι στερεωμένη η κάμερα και τον αλγόριθμο AutoPhoto που μεταφράζει τα αποτελέσματα από τη διαδικασία βαθμολόγησης της εικόνας, σε εντολές κίνησης για το ρομπότ και αυτοματοποιώντας ουσιαστικά τη βελτιστοποιημένη διαδικασία λήψης εικόνων.

Για τον αλγόριθμο αξιολόγησης εικόνων, η ομάδα του Κορνέλ με επικεφαλής τον  μεταπτυχιακό φοιτητή Hadi AlZayer, αξιοποίησε ένα υπάρχον μοντέλο αισθητικής εκτίμησης, το οποίο είχε εκπαιδευτεί σε ένα σύνολο δεδομένων με περισσότερες από ένα εκατομμύριο φωτογραφίες που είχαν βαθμολογηθεί από ανθρώπους. Το ίδιο το AutoPhoto εκπαιδεύτηκε εικονικά σε δεκάδες τρισδιάστατες εικόνες εσωτερικών σκηνών δωματίων για να εντοπίσει τη βέλτιστα συντεταγμένη γωνία πριν η ομάδα το συνδέσει με το ρομπότ. Όταν αφέθηκε ελεύθερο σε ένα κτίριο στην πανεπιστημιούπολη, το ρομπότ έκανε αρχικά μερικές κακές λήψεις, αλλά καθώς ο αλγόριθμος AutoPhoto αποκτούσε τον προσανατολισμό του, η επιλογή των λήψεων βελτιωνόταν σταθερά μέχρι οι εικόνες να συναγωνίζονται εκείνες των καταχωρίσεων στο διαδικτυακό μεσιτικό ιστότοπο Zillow. Κατά μέσο όρο χρειάστηκαν περίπου δώδεκα επαναλήψεις για τη βελτιστοποίηση κάθε λήψης και η όλη διαδικασία διήρκησε μόλις λίγα λεπτά.

«Μπορείτε ουσιαστικά να κάνετε σταδιακές βελτιώσεις στις τρέχουσες εντολές», δήλωσε ο AlZayer στο Engadget. «Μπορείτε να το κάνετε ένα βήμα τη φορά, δηλαδή μπορείτε να το διατυπώσετε ως πρόβλημα ενισχυτικής μάθησης», πρόσθεσε.

Με αυτόν τον τρόπο, ο αλγόριθμος δεν χρειάζεται να συμμορφώνεται με παραδοσιακές ευρετικές μεθόδους, όπως ο κανόνας των τρίτων, επειδή γνωρίζει ήδη τι θα αρέσει στους ανθρώπους, καθώς διδάχθηκε να ταιριάζει την εμφάνιση και την αίσθηση των λήψεων που τραβάει, με τις εικόνες με την υψηλότερη κατάταξη από τα δεδομένα εκπαίδευσης, εξήγησε ο AlZayer.

«Η μεγαλύτερη πρόκληση ήταν το γεγονός ότι δεν υπήρχε κανένας υπάρχων βασικός αριθμός που προσπαθούσαμε να βελτιώσουμε», σημείωσε ο AlZayer. «Έπρεπε να ορίσουμε ολόκληρη τη διαδικασία και το πρόβλημα».

Ο AlZayer ελπίζει να προσαρμόσει το σύστημα AutoPhoto για χρήση σε εξωτερικούς χώρους, αντικαθιστώντας ενδεχομένως το Jackal με ένα drone. «Η προσομοίωση υψηλής ποιότητας ρεαλιστικών σκηνών σε εξωτερικούς χώρους είναι πολύ δύσκολη», είπε χαρακτηριστικά, «ακριβώς επειδή είναι πιο δύσκολο να πραγματοποιηθεί ανακατασκευή μιας ελεγχόμενης σκηνής». Για να παρακάμψουν αυτό το πρόβλημα, ο ίδιος και η ομάδα του διερευνούν επί του παρόντος αν το μοντέλο AutoPhoto μπορεί να εκπαιδευτεί σε βίντεο ή φωτογραφίες αντί για τρισδιάστατες σκηνές.

ΠΗΓΗ: Engadget

www.ertnews.gr

Εύη Τσιριγωτάκη