Home NEWS Facebook: Ετοιμάζει ηχητική περιγραφή φωτογραφιών για ανθρώπους με προβλήματα στην όραση…

Facebook: Ετοιμάζει ηχητική περιγραφή φωτογραφιών για ανθρώπους με προβλήματα στην όραση…

0
318

Το Facebook μας αφήνει άφωνους για ακόμη μία φορά! Μέχρι τώρα η τεχνολογία οπτικής αναγνώρισης αντικειμένων της Facebook Inc. μπορεί να πληροφορήσει το χρήστη ότι στην πρώτη φωτογραφία εμφανίζεται ένα σουβλάκι, στη δεύτερη δέντρα και θάλασσα και στην τρίτη, “δύο χαμογελαστούς ανθρώπους” με φόντο “ουρανό και νερό”. 

Υπάρχουν 39 εκατομμύρια τυφλοί και περισσότεροι από 246 εκατομμύρια άνθρωποι με κάποια σοβαρή βλάβη στην όραση, η τεχνητή όμως νοημοσύνη μπορεί να τους επιτρέψει να “βλέπουν” τις φωτογραφίες στο Facebook όπως όλοι οι υπόλοιποι, υποστηρίζει η εταιρεία πίσω από το δημοφιλέστερο social media, εγκαινιάζοντας το “αυτόματο εναλλακτικό κείμενο”.

Η Microsoft “δημιουργεί” για τα άτομα με προβλήματα στην όραση …

Στην HTML (και XHTML), το (attribute) alt text αναφέρεται στο κείμενο που εμφανίζεται όταν για οποιοδήποτε λόγο δεν μπορεί να εμφανιστεί μια εικόνα. Στην προκειμένη περίπτωση, το alt text παράγεται αυτόματα για τις φωτογραφίες από το νευρωνικό δίκτυο του Facebook που αναλαμβάνει να διακρίνει αφενός, να αναγνωρίσει αφετέρου το θέμα της, μαθαίνοντας ταυτόχρονα από την λειτουργία του. 

Το automatic alternative text του Facebook αναφέρεται στη δυνατότητα της τεχνολογίας να παράγει μια περιγραφή φωτογραφιών, αξιοποιώντας τις εξελίξεις στην οπτική αναγνώριση αντικειμένων. Έτσι, άνθρωποι που χρησιμοποιούν αναγνώστες οθόνης σε συσκευές iOS της Apple για να ακούσουν το κείμενο στην οθόνη  θα μπορούν επίσης να ακούν τις περιγραφές που παράγονται αυτόματα και για τις φωτογραφίες στο Facebook. Ως τώρα, το μόνο που μπορούσαν να μάθουν οι τυφλοί είναι το όνομα του προσώπου που δημοσίευσε τη φωτογραφία και ότι πρόκειται για φωτογραφία.

Το “automatic alt text” θα ενεργοποιείται σε iOS screen reader, μόνο στην αγγλική γλώσσα προς το παρών, η ομάδα Accessibility στην Facebook όμως, δεσμεύεται ότι θα πάρουν σειρά και άλλες γλώσσες. Επίσης, η τεχνολογία θα αξιοποιηθεί σύντομα και και σε άλλα λογισμικά (π.χ. AndroidWindowsMac) και θα επεκταθεί για να καλύψει τις ανάγκες ανθρώπων με σοβαρά προβλήματα όρασης εκτός των ΗΠΑ, του Ηνωμένου Βασιλείου του Καναδά, της Αυστραλία και της Νέα Ζηλανδίας, όπου λανσάρεται από τις αρχές Απριλίου 2016.

Πως θα είναι η τεχνολογία σε τρεις δεκαετίες

H εταιρεία επέλεξε να ενεργοποιήσει την οπτική αναγνώριση και ηχητική μετάδοση της περιγραφής φωτογραφιών για τις 100 πλέον επιτυχημένες ταυτοποιήσεις που έχει αποδειχτεί ότι μπορεί να κάνει επί αντικειμένων σε φωτογραφίες. Μπορεί να αναγνωρίσει τα χαρακτηριστικά της ανθρώπινης όψης (να διακρίνει ότι εμφανίζεται μωρό, ότι ο άνθρωπος που εμφανίζεται φοράει γυαλιά, ή έχει γένια, και χαμογελά, ή, φορά κοσμήματα), τη φύση (πρόκειται για εξωτερική λήψη, λήψη σε βουνό, στο χιόνι, ή με ουρανό), τα μεταφορικά μέσα (αυτοκίνητο, καράβι, αεροπλάνο, ποδήλατο), αθλήματα (τένις, κολύμβηση, στάδιο, μπέιζμπολ) και φαγητό (παγωτό, πίτσα, ορεκτικό, καφές). Επίσης, μπορεί να παρέχει πληροφορία για τη δραστηριότητα στη φωτογραφία, όπως ανθρώπους που μετρούν, που χαμογελούν, παιδί ή βρέφος, αλλά και να διακρίνει εάν πρόκειται για φωτογράφιση σε εσωτερικό ή εξωτερικό χώρο ή στη φύση καθώς και άλλα χαρακτηριστικά όπως φωτογράφιση κειμένου, selfie ή κοντινό πλάνο. 

 

 

 

Η ελάχιστη ακρίβεια ορίστηκε στο 0.8, αν και οι απαιτήσεις σε κάποιες κατηγορίες «αντικειμένων» η περιγραφή δεν αποδίδεται εάν η ακρίβεια της ταυτοποίησης δεν φτάνει στο 0.99. Υπό αυτούς, τους αυστηρούς όρους, η τεχνολογία object recognition της Facebook, είναι σε θέση να αποδώσει τουλάχιστον μια περιγραφή σε περισσότερες από τις μισές φωτογραφίες στην υπηρεσία, ισχυρίζονται οι μηχανικοί της. Απώτερος στόχος τους, να εμπλουτίσουν το λεξιλόγιο της αυτόματης  ηχητικής απόδοσης σε κάθε περιγραφή φωτογραφιών.

Πηγή

Διαβάστε επίσης:

Γιατί όταν ακούμε τη φωνή μας ηχογραφημένη μοιάζει … ξένη; – Η επιστημονική εξήγηση!

Oι καλύτερες φωτογραφίες του 2016 μέχρι σήμερα!