08 декабря 2025, 05:00

6

Кипрский грек обретает собственный голос в новой системе искусственного интеллекта

Кипрский грек обретает собственный голос в новой системе искусственного интеллекта

Говорящие на кипрском греческом языке вскоре могут быть поняты теми же голосовыми системами, которые обычно борются с диалектом острова, благодаря революционной модели искусственного интеллекта для преобразования речи в текст, разработанной командой из трех человек.

Игорь Акимов, менеджер по продуктам искусственного интеллекта в иностранной компании, объединил усилия с двумя стажерами — Хусейном Хадрой и Никитой Марковым, студентами Университета Никосии и UCLan — для решения проблемы, связанной с тем, что местные диалекты не распознаются должным образом технологиями, от которых зависят многие люди.

Команда создала модель искусственного интеллекта для преобразования речи в текст — систему автоматического распознавания речи, настроенную для точного понимания и расшифровки кипрского греческого языка. Пользователи говорят в микрофон, а система преобразует речь в письменный текст — технологию, которую затем можно применить к голосовым агентам с искусственным интеллектом, службам перевода или автоматизированной телефонной поддержке.

Эта технология также имеет более широкое применение в различных секторах. В здравоохранении он может автоматически расшифровывать речь пациентов, особенно пожилых людей, и вводить ее непосредственно в медицинские системы без ручного набора текста. В бизнесе это позволяет использовать автоматизированные голосовые агенты, которые могут естественным образом взаимодействовать с кипрскими клиентами, а в сфере образования это может помочь сохранить кипрский диалект и культуру за счет оцифровки аудиоархивов острова.

Тот же подход можно применить и к другим игнорируемым языкам и диалектам. Одной из главных целей команды было понять, как работать с языками, по которым недостаточно данных. По их мнению, эту методологию можно было бы воспроизвести во всем мире.

"Это было непросто. Я думаю, мы все недооценили, насколько сложным это будет. На этом пути определенно были взлеты и падения", - признает Акимов.

При поиске ресурсов данных команда обратилась к исследователям, но не получила никакой помощи. Ответы варьировались от потери данных до требований о высокой плате или полного отказа.

Они просмотрели словари, тексты и аудиообразцы, но не смогли найти высококачественные и доступные наборы данных, в которых речь сочеталась бы с расшифрованным и проверенным текстом.

Даже у Meta, которая собрала данные по 1600 языкам, не было ни одного часа кипрской речи.

«Итак, начинать нам было не с чего, поэтому мы решили собрать всю доступную кипрскую аудиозапись от телешоу до радиостанций, подкастов и книг», — рассказал Акимов. «Шаг за шагом мы создали самую большую коллекцию кипрско-греческих речей, когда-либо собранную».

Обучение ИИ было постепенным процессом. На первом этапе система впитала повседневную кипрско-греческую речь, ее звуки, ритмы и уникальные черты, чтобы получить представление о том, как естественно звучит диалект.

Затем команда снабдила его более четкой, профессиональной речью из новостных передач и радиошоу, помогая ИИ улучшить свое понимание и уменьшить количество ошибок. Также был добавлен специальный помощник по чтению KenLM, который действует почти как наставник, подсказывая наиболее вероятные слова и повышая точность распознавания.

Чтобы продолжать совершенствовать модель, команда создала платформу, на которой носители языка могут исправлять расшифровки ИИ. Эти исправления учитываются при обучении, что со временем делает систему все более точной и точной по отношению к кипрскому диалекту.

Примечательно, что все это было достигнуто при бюджете всего в 150 долларов США благодаря творческому подходу и доступным облачным технологиям.

Однако проект далек от завершения. «Имея всего несколько часов высококачественной расшифровки аудио, мы пока не смогли создать лучшую в мире модель, но это абсолютно достижимо», — объяснил Акимов. «Сейчас это скорее технологическая проверка концепции в ожидании дополнительных данных».

На данный момент команда собрала около 300 часов кипрской речи и ищет помощи у волонтеров. Потратив всего 15 минут на проверку транскрипций на веб-сайте проекта, можно получить достаточно данных для создания современной модели распознавания кипрской речи и, возможно, даже системы преобразования текста в речь, говорящей на аутентичном кипрском греческом языке.

Заинтересованные лица могут посетить сайт voiceofcyprus.org, чтобы проверить аудиозаписи.

"Это очень поможет нам и Кипру. Даже всего 10-15 минут имеют значение", - сказал Акимов. «Мы хотим, чтобы каждый киприот мог говорить на своем диалекте и при этом быть понятым с помощью технологий».

Похожие новости

Новые члены Совета министров сегодня приведены к присяге. В правительство вошли три новых министра и новый заместитель министра. В 09:00 церемония заверения состоится в Президентском дворце, после чего последуют церемони...

Icon

13 минут назад

Полицейские власти были мобилизованы после получения информации об обнаружении трупа мужчины ближе к вечеру в центральных тюрьмах. Жертва является иностранцем из Барипоина и, судя по всему, подверглась нападению со сторо...

Icon

13 минут назад

На Кипре появилась новая мода — ботокс-вечеринки (botox parties) на дому, на которых работают «врачей из-за границы». По данным Politis, их участницами становятся жительницы Кипра в возрасте от 18 до 60 лет. Цены на инъ...

Icon

14 минут назад

Метеорологический департамент Республики Кипр ввел четвертый подряд «желтый» уровень погодной опасности из-за циклона «Байрон». На сей раз — ровно на сутки. Предупреждение метеослужбы действует с часа ночи понедельника,...

Icon

15 минут назад

Британские инвесторы были нетто-продавцами акций рекордный шестой месяц подряд в ноябре, как показали данные сети фондов Calastone в четверг, поскольку опасения, что правительство сократит налоговые льготы для инвестиций...

Icon

15 минут назад

В понедельник погода будет нестабильной, местами пройдут ливни и локальные грозы. Первоначально ветер будет дуть с переменной интенсивностью 1–3 балла по шкале Бофорта, а затем постепенно сменится на южный или юго-западн...

Icon

1 час назад

Праздничная программа ColumbiaRestaurants от Лимассола до Ларнаки, Пафоса и Никосии обещает перенести молодых и старых в волшебство Рождества, даря впечатления, полные вкуса, элегантности и радости. Каждое пространство и...

Icon

3 часа назад

В ЭТОМ ГОДУ НА РОЖДЕСТВО ТОРГОВО-ПРОМЫШЛЕННАЯ ПАЛАТА ЛИМЕСОСА НУЖДАЕТСЯ ВАС. EBE Limassol в рамках своего социального предложения уже 4-й год подряд организует сбор основных товаров в поддержку Социального продуктового м...

Icon

5 часов назад

🗓️ Вторник, 9 декабря 2025 г., 20:00📍 Муниципальный театр Ипсоны В муниципалитете Кури находится духовой ансамбль «Квинтус» с культовой сюитой Чайковского «Щелкунчик». Уникальный концерт, в котором камерная музыка сочет...

Icon

7 часов назад

Италия отправит экстренные материалы для поддержки энергетической инфраструктуры и народа Украины. Об этом решении Владимиру Зеленскому сообщила премьер-министр Италии Джорджия Мелони в телефонном разговоре двух лидеров....

Icon

8 часов назад