Κάποιος χρειάζεται τη φωνή σου

Το VoxForge είναι μια πρωτοποριακή προσπάθεια για συλλογή μεταγραφών (transcriptions) ομιλίας, δηλαδή συνδυασμών ηχητικών καταγραφών αλλά και του περιεχομένου τους (σε κείμενο και άλλες σημάνσεις) σε διάφορες γλώσσες – ανάμεσά τους και για ελληνικά– , ώστε να αξιοποιηθούν από εργαλεία εκπαίδευσης ακουστικών μοντέλων Αναγνώρισης Ομιλίας του Ελεύθερου και Ανοικτού Κώδικα λογισμικού (ΕΛΛΑΚ), ανεξάρτητα από λειτουργικό σύστημα.

Οι τελικές συλλογές δεδομένων διατίθενται υπό την άδεια GPL ενώ και τα μοντέλα που δημιουργούνται με τη χρήση τους επίσης συγκεντρώνονται για τις διάφορες μηχανές αναγνώρισης ομιλίας (όπως το CMU Sphinx , το Julius, το HTK κ.α.) και επαναδιατίθενται.

Ο λόγος για αυτό είναι διότι δεν υπάρχουν ελεύθερα διαθέσιμες τέτοιες συλλογές δεδομένων παρόλο που αρκετές έχουν δημιουργηθεί στα πλαίσια και από χρηματοδότηση ερευνητικών προσπαθειών (π.χ. κάποιες που διαχειρίζεται η elda) ή μέσω άλλων πηγών (π.χ. audio-books). Για τα ελληνικά δεδομένα, ενθαρρυντικό είναι το γεγονός ότι πρόσφατα χρηματοδοτήθηκε έργο για τη συγκέντρωση, καταγραφή και επαναδιάχυση γλωσσικών πόρων (CLARIN-EL).

Στις περιπτώσεις αυτές, οι εφαρμογές Ανοιχτου Λογισμικού καταφεύγουν στην εξαγορά των συλλογών δεδομένων, χωρίς όμως τη δυνατότητα αναδιανομής λόγω των περιοριστικών αδειών χρήσης, με αποτέλεσμα να μπορούν να διανείμουν μόνο τα τελικά «τελικά» Ακουστικά Μοντέλα, περιορίζοντας κατά πολύ την ευελιξία αλλά και τις δυνατότητες βελτίωσης που θα μπορούσε να επιφέρει η συμμετοχή πολλών δημιουργών/εθελοντών στη δημιουργία τους.

Πώς Μπορεί να Βοηθήσει κάποιος;

Το VoxForge έχει αναπτύξει ειδική εφαρμογή (java applet) που ζητά από το χρήστη/εθελοντή να διαβάσει μια σειρά από προτάσεις που έχει επιλέξει, έχοντας ενεργοποιημένο το μικρόφωνό του. Με τον τρόπο αυτό καταγράφεται η ομιλία του χρήστη, συσχετίζεται με την αντίστοιχη πρόταση και αποστέλλεται στο VoxForge. Την ίδια στιγμή ο χρήστης μπορεί να διαλέξει κάποια στοιχεία όπως π.χ. προφορά, τύπο μικροφώνου κ.α.

Το κείμενο από όπου αντλούνται οι προτάσεις προς εκφώνηση είναι το Καλαμιές στον άνεμο, όπως είχε προτείνει ο SteliosK με βασικό μειονέκτημα, όμως, τον ατελή τρόπο χωρισμού του σε προτάσεις. Ακόμη, παρόλο που προτάθηκε (από τον ..γράφοντα) ο εμπλουτισμός των προτάσεων αυτών και με προτάσεις που συχνά χρησιμοποιούνται σε εφαρμογές του είδους (π.χ. ψηφία, αριθμοί. ημερομηνίες κλπ), δεν φαίνεται να έχει υιοθετηθεί ακόμη από την εφαρμογή συλλογής.

Παρόλα αυτά υπάρχουν ήδη υποβολές δεδομένων όπως μπορεί κανείς να δει εδώ ενώ μπορείς κι εσύ να βοηθήσεις στη συλλογή κάνοντας κλικ εδώ!

Advertisements

Συνέδριο Δημιουργών ΕΛ/ΛΑΚ 2009

dev-ellak-2009 Η Παρασκευή (ε, εντάξει όσο επέτρεψε η δίωρη άδεια που πήρα από το γραφείο) και το Σάββατο ήταν «αφιερωμένες» στο Συνέδριο των Δημιουργών ΕΛΛΑΚ.

Λεπτομέρειες για τις παρουσιάσεις μπορείτε να βρείτε εδώ για την 1η μέρα και εδώ για τη 2η (και σε πολυάριθμα άλλα blogs) ενώ οι παρουσιάσεις είναι ήδη διαθέσιμες.

Για μένα είχε ιδιαίτερη αξία που συνάντησα από κοντά αρκετά από τα μέλη της κοινότητας με τα οποία είτε είχαμε ηλεκτρονική επικοινωνία (π.χ. με το Δημήτρη τον Ανδρεάδη είχαμε «συναντηθεί» online στο JBoss Experience) είτε απλά διάβαζα τα άρθρα τους στα διάφορα blogs. Η …φυσική επικοινωνία λειτουργεί τουλάχιστον συμπληρωματικά σε τέτοιες περιπτώσεις αυτές και πολλές φορές κρίνεται απαραίτητη…

Από τις παρουσιάσεις ξεχώρισα τις σχετικές με το project LGAF (βλ. BetaCMS και LGAF BPM) μιας και ήταν κοντά στις τρέχουσες αναζητήσεις μου και πραγματικά (μαζί με μια σχετική κουβέντα για προδιαγραφές με έμφαση στον ανοιχτό χαρακτήρα της λύσης με τον Αλέξη το Ζάβρα που ήταν «πίσω» από τις προδιαγραφές του συγκεκριμένου έργου) ξεδιάλυναν τη -μέχρι σήμερα κάπως θολή -εικόνα που είχα σχηματίσει για το έργο παρακολουθώντας το από μακριά.

Μου άρεσε ακόμη ότι έχουν «συνεπάρει» αρκετούς developers τα RESTful APIs ενώ και το στρογγυλό τραπέζι με θέμα τα Open Source Business Models ήταν αρκετά αντιπροσωπευτικό για τα τεκταινόμενα στην ελληνική πραγματικότητα και τον τρόπο «αγκαλιάσματος» του ΕΛΛΑΚ.

Από την άλλη, έντονη ήταν η παρουσία των χρήσεων των τεχνολογιών ΕΛΛΑΚ σε όλες της βαθμίδες της Εκπαίδευσης ενώ αισιόδοξο ήταν το γεγονός ότι αρκετές πρωτοβουλίες (αν και ασφαλώς προσωπικές και κόντρα στην κυρίαρχη νοοτροπία) παρατήρησα να προέρχονται από το χώρο του Δημόσιου Τομέα. Έχω την αίσθηση ότι πλέον έχει συγκεντρωθεί αρκετό αναξιοποίητο δυναμικό στο χώρο αυτό, το οποίο, αν εκμεταλλευτεί το μοντέλο απομακρυσμένης συνεργασίας, διάδοσης και συνεισφοράς που προσφέρει το ΕΛΛΑΚ, ευελπιστώ ότι θα βρει διέξοδο και θα διεκδικήσει νέο ρόλο για τους δημόσιους φορείς (χωρίς αυτό να σημαίνει ότι δε θα συναντήσει αντιδράσεις από την αγορά που για την ώρα καθορίζει μόνη της τους κανόνες και διατηρεί το έλλειμμα των κοινών προδιαγραφών).

Στα θετικά, τέλος, ότι συνάντησα αρκετούς παλιούς γνώριμους από τα φοιτητικά χρόνια στο Πολυτεχνείο στα Χανιά, που μάλιστα έχουν αρκετά ενεργή δράση στο χώρο…Καλή συνέχεια σε όλους!

Υ.Γ. Για να μην πάθουμε floss ..overflow (και να μην κατηγορηθούμε για ..μονομέρεια), το ..3ήμερο πλαισιώθηκε από μια χορευτική εκδήλωση του Δήμου Γλυκών Νερών (όπου φεσώθηκα κυριολεκτικά για πρώτη φορά στη ζωή μου 🙂 ), από μπυροκατάνυξη στο Beer Academy στην Αγ.Παρασκευή, από την παρακολούθηση της «Όπερας της Πεντάρας» στο Badminton και από επίσκεψη στο Verde στου Παπάγου (μιας που ήμασταν και στην ..περιοχή ;-)) …Οπότε, δε μπορούμε να πούμε ότι μας έπεσε και πολύ βαρύ το πρόγραμμα, έτσι;