Σύνθεση ομιλίας και cloud computing


H τεχνολογία σύνθεσης φυσικής ομιλίας βρίσκει από τα πρώτα βήματά της εφαρμογή και στην – υποβοηθητική συνήθως – μετατροπή ενός κομματιού κειμένου που εμφανίζεται στην οθόνη του υπολογιστή μας (είτε αυτό επιλέγεται (explicitly) από το χρήση είτε αυτόματα από εφαρμογές που προσπαθούν να ανιχνεύσουν τι είναι σημαντικό να ανακοινωθεί και τι όχι (screenreaders) σε ομιλία (Text To Speech – TTS). Πέρα από την απλή υποβοήθηση, τη διασκέδαση κλπ υπάρχουν βέβαια περιπτώσεις (όπως π.χ. τα ΑμεΑ με προβλήματα όρασης ή οι ηλικιωμένοι), όπου η τεχνολογία αυτή παίζει έναν πολύ ουσιαστικό ρόλο στη χρήση του υπολογιστή και κατ’επέκταση στη συμμετοχή στη Διαδικτυακή εμπειρία.

Η κίνηση της Ναυτεμπορικής να διαθέσει τη δυνατότητα «εκφώνησης» των άρθρων (βλ. Υπηρεσία AudioNews) που αναρτώνται στην ηλεκτρονική έκδοσή της μπορεί να έχει δυσκολίες να καλύψει πλήρως όλες τις παραπάνω ανάγκες (ειδικά όταν στον χώρο των υποστηρικτικών τεχνολογιών υπάρχουν πολύ εξειδικευμένα προϊόντα) αλλά πρόκειται για μια ενδιαφέρουσα πρόταση, η οποία μπορεί να χαρακτηριστεί συνέχεια των προσπαθειών του ΙΕΛ για Ομιλούντες Ιστοτόπους.

Η εφαρμογή κάνει χρήση των αντίστοιχων προϊόντων της innoetics. Με αξιοποίηση του flash streaming player Flowplayer, η κάθε σελίδα εμφανίζει το νέο ενώ παράλληλα εκκινεί το playback.

Ένα ενδιαφέρον χαρακτηριστικό της συγκεκριμένης υλοποίησης φαίνεται να είναι η αξιοποίηση των δυνατοτήτων ευέλικτης αποθήκευσης S3 που προσφέρει η πλατφόρμα Amazon AWS. Το κομμάτι κειμένου που αντιστοιχεί σε κάθε είδηση πιθανότατα μετατρέπεται offline (πιθανότατα κατά τη δημιουργία της, λιγότερο πιθανό με την πρώτη «ζήτηση» ώστε να αποφεύγονται τυχόν καθυστερήσεις) σε ήχο (mp3 φορμά), αποθηκεύεται στο «σύννεφο» της Amazon, από όπου το «ζητά» στη συνέχεια ο streaming player …

Οι τεχνολογίες αναγνώρισης και σύνθεση ομιλίας ανήκουν, πιστεύω, στην κατηγορία των εφαρμογών που είναι απαιτητικές (τόσο σε υπολογιστική ισχύ/μνήμη όσο και σε αποθηκευτικό χώρο)- τουλάχιστον) αλλά από την άλλη στις περισσότερες εφαρμογές τους εμφανίζονται φαινόμενα ακραίας ζήτησης και άλλοτε χαμηλής αξιοποίησης των πόρων (peak effects). Αυτό δείχνει να ταιριάζει με το μοντέλο της ευέλικτης δέσμευσης/αποδέσμευσης πόρων του Cloud Computing και ίσως στο μέλλον δούμε περισσότερες σχετικές υλοποιήσεις.

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s