08 Δεκεμβρίου 2025, 05:00

7

Η κυπριακή ελληνική αποκτά τη δική της φωνή στο νέο σύστημα AI

Η κυπριακή ελληνική αποκτά τη δική της φωνή στο νέο σύστημα AI

Οι Κύπριοι Έλληνες ομιλητές μπορεί σύντομα να γίνουν κατανοητοί από τα ίδια συστήματα που ενεργοποιούνται με φωνή που συνήθως παλεύουν με τη διάλεκτο του νησιού, χάρη σε ένα πρωτοποριακό μοντέλο AI ομιλίας σε κείμενο που αναπτύχθηκε από μια ομάδα τριών ατόμων.

Ο Igor Akimov, διευθυντής προϊόντων τεχνητής νοημοσύνης σε εταιρεία ξένου ενδιαφέροντος, ένωσε τις δυνάμεις του με δύο ασκούμενους – τους Hussein Khadra και Nikita Markov, φοιτητές στο Πανεπιστήμιο Λευκωσίας και στο UCLan – για να αντιμετωπίσει το πρόβλημα της μη σωστής αναγνώρισης των τοπικών διαλέκτων από την τεχνολογία από την οποία εξαρτώνται πολλοί άνθρωποι.

Η ομάδα έχει δημιουργήσει ένα μοντέλο τεχνητής νοημοσύνης ομιλίας σε κείμενο, ένα σύστημα αυτόματης αναγνώρισης ομιλίας, προσαρμοσμένο ώστε να κατανοεί και να μεταγράφει με ακρίβεια τα κυπριακά ελληνικά. Οι χρήστες μιλούν σε μικρόφωνο και το σύστημα μετατρέπει την ομιλία σε γραπτό κείμενο, μια τεχνολογία που μπορεί στη συνέχεια να εφαρμοστεί σε φωνητικούς πράκτορες AI, υπηρεσίες μετάφρασης ή αυτοματοποιημένη τηλεφωνική υποστήριξη.

Η τεχνολογία έχει επίσης ευρύτερες εφαρμογές σε πολλούς τομείς. Στον τομέα της υγειονομικής περίθαλψης, μπορεί αυτόματα να μεταγράψει την ομιλία των ασθενών, ιδιαίτερα αυτή των ηλικιωμένων, και να την εισάγει απευθείας στα ιατρικά συστήματα χωρίς μη αυτόματη πληκτρολόγηση. Στην επιχείρηση, επιτρέπει αυτοματοποιημένους φωνητικούς πράκτορες που μπορούν να αλληλεπιδρούν φυσικά με Κύπριους πελάτες, ενώ στην εκπαίδευση μπορεί να βοηθήσει στη διατήρηση της κυπριακής διαλέκτου και κουλτούρας ψηφιοποιώντας τα αρχεία ήχου του νησιού.

Η ίδια προσέγγιση θα μπορούσε να εφαρμοστεί και σε άλλες παραγνωρισμένες γλώσσες και διαλέκτους. Ένας από τους κύριους στόχους της ομάδας ήταν να κατανοήσει πώς να εργάζεται με γλώσσες που δεν διαθέτουν επαρκή δεδομένα, μια μεθοδολογία που πιστεύουν ότι θα μπορούσε να αναπαραχθεί παγκοσμίως.

"Δεν ήταν εύκολο. Νομίζω ότι όλοι υποτιμήσαμε πόσο περίπλοκο θα ήταν. Υπήρχαν σίγουρα σκαμπανεβάσματα στην πορεία", παραδέχεται ο Akimov.

Όταν αναζητούσε πόρους δεδομένων, η ομάδα απευθυνόταν σε ερευνητές, αλλά βρήκε μικρή βοήθεια. Οι απαντήσεις κυμαίνονταν από απώλεια δεδομένων, αιτήματα για υψηλές χρεώσεις ή απόλυτη άρνηση.

Έψαξαν λεξικά, κείμενα και δείγματα ήχου, αλλά δεν μπόρεσαν να βρουν υψηλής ποιότητας, προσβάσιμα σύνολα δεδομένων που συνδύαζαν την ομιλία με το μεταγραμμένο και επικυρωμένο κείμενο.

Ακόμη και η Meta, η οποία έχει συλλέξει δεδομένα για 1.600 γλώσσες, είχε μηδέν ώρες διαθέσιμη κυπριακή ομιλία.

«Έτσι, δεν είχαμε τίποτα να ξεκινήσουμε, επομένως, αποφασίσαμε να συγκεντρώσουμε όλο τον διαθέσιμο κυπριακό ήχο από τηλεοπτικές εκπομπές έως ραδιοφωνικούς σταθμούς, podcast και βιβλία», είπε ο Akimov. «Βήμα προς βήμα δημιουργήσαμε τη μεγαλύτερη συλλογή κυπριακών ελληνικών λόγου που έχει συγκεντρωθεί ποτέ».

Η εκπαίδευση του AI ήταν μια σταδιακή διαδικασία. Σε πρώτη φάση, το σύστημα απορρόφησε την καθημερινή κυπριακή ελληνική ομιλία, τους ήχους, τους ρυθμούς και τα μοναδικά χαρακτηριστικά της, για να αποκτήσει μια αίσθηση του πώς ακούγεται φυσικά η διάλεκτος.

Στη συνέχεια, η ομάδα του έδωσε πιο ξεκάθαρη, επαγγελματική ομιλία από εκπομπές ειδήσεων και ραδιοφωνικές εκπομπές, βοηθώντας το AI να βελτιώσει την κατανόησή του και να μειώσει τα λάθη. Ένας ειδικός βοηθός ανάγνωσης, ο KenLM, προστέθηκε επίσης για να λειτουργεί σχεδόν σαν δάσκαλος, προτείνοντας τις πιο πιθανές λέξεις και ενισχύοντας την ακρίβεια αναγνώρισης.

Για να διατηρήσει τη βελτίωση του μοντέλου, η ομάδα δημιούργησε μια πλατφόρμα όπου οι φυσικοί ομιλητές μπορούν να διορθώσουν τις μεταγραφές του AI. Αυτές οι διορθώσεις ανατροφοδοτούνται στην εκπαίδευση, καθιστώντας το σύστημα όλο και πιο ακριβές και πιστό στην κυπριακή διάλεκτο με την πάροδο του χρόνου.

Είναι αξιοσημείωτο ότι όλα αυτά επιτεύχθηκαν με προϋπολογισμό μόλις 150 $, χάρη στις δημιουργικές προσεγγίσεις και την προσβάσιμη τεχνολογία cloud.

Ωστόσο, το έργο απέχει πολύ από το να έχει ολοκληρωθεί. «Με λίγες μόνο ώρες υψηλής ποιότητας απομαγνητοφωνημένου ήχου, δεν μπορέσαμε να δημιουργήσουμε ακόμα το καλύτερο μοντέλο στον κόσμο – αλλά είναι απολύτως εφικτό», εξήγησε ο Akimov. "Αυτή τη στιγμή, είναι περισσότερο μια τεχνολογική απόδειξη της ιδέας που περιμένει περισσότερα δεδομένα."

Μέχρι στιγμής, η ομάδα έχει συγκεντρώσει περίπου 300 ώρες κυπριακής ομιλίας και ζητά βοήθεια από εθελοντές. Αφιερώνοντας μόλις 15 λεπτά για την επικύρωση των μεταγραφών στον ιστότοπο του έργου θα μπορούσε να προσφέρει αρκετά δεδομένα για τη δημιουργία ενός μοντέλου αιχμής για την κυπριακή αναγνώριση ομιλίας και ενδεχομένως ακόμη και ένα σύστημα μετατροπής κειμένου σε ομιλία που να μιλάει στα αυθεντικά κυπριακά ελληνικά.

Οι ενδιαφερόμενοι μπορούν να επισκεφθούν το voiceofcyprus.org για επικύρωση ηχογραφήσεων.

"Αυτό θα βοηθήσει εμάς - και την Κύπρο - τρομερά. Ακόμη και μόλις 10-15 λεπτά κάνουν τη διαφορά", είπε ο Akimov. «Θέλουμε κάθε Κύπριος να μπορεί να μιλά στη δική του διάλεκτο και να γίνεται ακόμα κατανοητός από την τεχνολογία».

Παρόμοιες ειδήσεις

Ορκίζονται, σήμερα, τα νέα μέλη του Υπουργικού Συμβουλίου. Τρεις νέοι υπουργοί και μια νέα υφυπουργός, εισέρχονται στο κυβερνητικό σχήμα.Στις 09:00, θα πραγματοποιηθεί η τελετή διαβεβαίωσης στο Προεδρικό Μέγαρο και θα ακ...

Icon

πριν 24 λεπτά

Σε κινητοποίηση τέθηκαν οι αστυνομικές αρχές μετά από πληροφορία για εντοπισμό νεκρού άνδρα, αργά το απόγευμα, στις κεντρικές φυλακές. Το θύμα είναι αλλοδαπός βαρυποινίτης, και φαίνεται να δέχθηκε επίθεση από άλλους κρατ...

Icon

πριν 24 λεπτά

Μια νέα μόδα έκανε την εμφάνισή της στην Κύπρο - τα πάρτι Botox κόμματα ) στο σπίτι, όπου εργάζονται «γιατροί από το εξωτερικό». Με δεδομένα Πολίτης , οι συμμετέχοντες είναι κάτοικοι Κύπρου ηλικίας 18 έως 60 ετών. Οι τιμ...

Icon

πριν 25 λεπτά

Το Τμήμα Μετεωρολογίας της Κυπριακής Δημοκρατίας εισήγαγε για τέταρτο συνεχόμενο «κίτρινο» επίπεδο καιρικού κινδύνου λόγω του κυκλώνα Βύρωνα. Αυτή τη φορά - ακριβώς για μια μέρα. Προειδοποίηση Μετεωρολογικής Υπηρεσίας έγ...

Icon

πριν 26 λεπτά

Οι Βρετανοί επενδυτές ήταν καθαροί πωλητές μετοχών για έναν έκτο συνεχόμενο μήνα με ρεκόρ τον Νοέμβριο, σύμφωνα με στοιχεία από το δίκτυο κεφαλαίων Calastone την Πέμπτη, καθώς φοβούνται ότι η κυβέρνηση θα μειώσει τα φορο...

Icon

πριν 26 λεπτά

Τη Δευτέρα, ο καιρός θα είναι άστατος με κατά περιόδους βροχές και τοπικές καταιγίδες. Οι άνεμοι θα πνέουν αρχικά μεταβλητοί εντάσεως 1-3 μποφόρ, για να στραφούν προοδευτικά σε νότιους έως νοτιοδυτικούς εντάσεως 3-4 μπο...

Icon

πριν 1 ώρα

Από τη Λεμεσό, έως τη Λάρνακα, την Πάφο και τη Λευκωσία, το εορταστικό πρόγραμμα της ColumbiaRestaurants υπόσχεται να μεταφέρει μικρούς και μεγάλους στη μαγεία των Χριστουγέννων, με εμπειρίες γεμάτες γεύση, κομψότητα κα...

Icon

πριν 3 ώρες

ΦΕΤΟΣ ΤΑ ΧΡΙΣΤΟΥΓΕΝΝΑ ΤΟ ΕΜΠΟΡΙΚΟ ΒΙΟΜΗΧΑΝΙΚΟ ΕΠΙΜΕΛΗΤΗΡΙΟ ΛΕΜΕΣΟΥ ΣΕ ΧΡΕΙΑΖΕΤΑΙ Το ΕΒΕ Λεμεσού, στο πλαίσιο της κοινωνικής του προσφοράς, διοργανώνει για 4η συνεχόμενη χρονιά, συλλογή βασικών αγαθών στηρίζοντας το Κοιν...

Icon

πριν 5 ώρες

🗓️ Τρίτη, 9 Δεκεμβρίου 2025, 20:00📍 Δημοτικό Θέατρο Ύψωνα Ο Δήμος Κουρίου φιλοξενεί το σύνολο πνευστών Quintus με την εμβληματική σουίτα του Τσαϊκόφσκι, «Ο Καρυοθραύστης». Μια μοναδική συναυλία όπου η μουσική δωματίου...

Icon

πριν 7 ώρες

Έκτακτο υλικό προς υποστήριξη των ενεργειακών υποδομών και του λαού της Ουκρανίας θα αποστείλει η Ιταλία.Την απόφαση ανακοίνωσε στον Βολοντίμιρ Ζελένσκι η Ιταλίδα πρωθυπουργός, Τζόρτζια Μελόνι, σε τηλεφωνική επικοινωνία...

Icon

πριν 8 ώρες