Κάποιος χρειάζεται τη φωνή σου

Το VoxForge είναι μια πρωτοποριακή προσπάθεια για συλλογή μεταγραφών (transcriptions) ομιλίας, δηλαδή συνδυασμών ηχητικών καταγραφών αλλά και του περιεχομένου τους (σε κείμενο και άλλες σημάνσεις) σε διάφορες γλώσσες – ανάμεσά τους και για ελληνικά– , ώστε να αξιοποιηθούν από εργαλεία εκπαίδευσης ακουστικών μοντέλων Αναγνώρισης Ομιλίας του Ελεύθερου και Ανοικτού Κώδικα λογισμικού (ΕΛΛΑΚ), ανεξάρτητα από λειτουργικό σύστημα.

Οι τελικές συλλογές δεδομένων διατίθενται υπό την άδεια GPL ενώ και τα μοντέλα που δημιουργούνται με τη χρήση τους επίσης συγκεντρώνονται για τις διάφορες μηχανές αναγνώρισης ομιλίας (όπως το CMU Sphinx , το Julius, το HTK κ.α.) και επαναδιατίθενται.

Ο λόγος για αυτό είναι διότι δεν υπάρχουν ελεύθερα διαθέσιμες τέτοιες συλλογές δεδομένων παρόλο που αρκετές έχουν δημιουργηθεί στα πλαίσια και από χρηματοδότηση ερευνητικών προσπαθειών (π.χ. κάποιες που διαχειρίζεται η elda) ή μέσω άλλων πηγών (π.χ. audio-books). Για τα ελληνικά δεδομένα, ενθαρρυντικό είναι το γεγονός ότι πρόσφατα χρηματοδοτήθηκε έργο για τη συγκέντρωση, καταγραφή και επαναδιάχυση γλωσσικών πόρων (CLARIN-EL).

Στις περιπτώσεις αυτές, οι εφαρμογές Ανοιχτου Λογισμικού καταφεύγουν στην εξαγορά των συλλογών δεδομένων, χωρίς όμως τη δυνατότητα αναδιανομής λόγω των περιοριστικών αδειών χρήσης, με αποτέλεσμα να μπορούν να διανείμουν μόνο τα τελικά «τελικά» Ακουστικά Μοντέλα, περιορίζοντας κατά πολύ την ευελιξία αλλά και τις δυνατότητες βελτίωσης που θα μπορούσε να επιφέρει η συμμετοχή πολλών δημιουργών/εθελοντών στη δημιουργία τους.

Πώς Μπορεί να Βοηθήσει κάποιος;

Το VoxForge έχει αναπτύξει ειδική εφαρμογή (java applet) που ζητά από το χρήστη/εθελοντή να διαβάσει μια σειρά από προτάσεις που έχει επιλέξει, έχοντας ενεργοποιημένο το μικρόφωνό του. Με τον τρόπο αυτό καταγράφεται η ομιλία του χρήστη, συσχετίζεται με την αντίστοιχη πρόταση και αποστέλλεται στο VoxForge. Την ίδια στιγμή ο χρήστης μπορεί να διαλέξει κάποια στοιχεία όπως π.χ. προφορά, τύπο μικροφώνου κ.α.

Το κείμενο από όπου αντλούνται οι προτάσεις προς εκφώνηση είναι το Καλαμιές στον άνεμο, όπως είχε προτείνει ο SteliosK με βασικό μειονέκτημα, όμως, τον ατελή τρόπο χωρισμού του σε προτάσεις. Ακόμη, παρόλο που προτάθηκε (από τον ..γράφοντα) ο εμπλουτισμός των προτάσεων αυτών και με προτάσεις που συχνά χρησιμοποιούνται σε εφαρμογές του είδους (π.χ. ψηφία, αριθμοί. ημερομηνίες κλπ), δεν φαίνεται να έχει υιοθετηθεί ακόμη από την εφαρμογή συλλογής.

Παρόλα αυτά υπάρχουν ήδη υποβολές δεδομένων όπως μπορεί κανείς να δει εδώ ενώ μπορείς κι εσύ να βοηθήσεις στη συλλογή κάνοντας κλικ εδώ!

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s