X
 27.12.2024 Живот

Лансирана 2.0 верзијата на „Буки“ - дигиталната платформа за транскрипција на говор: Новиот модел е побрз, поточен и овозможува транскрипција од аудиофајл

Креаторите на новата дигитална платформа базирана на вештачка интелигенција за транскрипција на говор на македонски јазик – „Буки“, која овозможува унапредено користење на официјалниот јазик при креирање текстови во дигитална форма, ја пуштија во употреба новата верзија 2.0, која е побрза, поточна и овозможува транскрипција од аудиофајл.



Еден од експертите што работеа на создавање на алатката, кој истражува на Универзитетот „Аалто“ во Финска, зборувајќи за употребата на „Буки“ наведе дека придобивките од имањето транскрипт, меѓу другото, е во тоа што е многу полесно да се пребарува содржината.

- Телевизиите имаат огромен број архивиран аудиоматеријал кој не е транскрибиран. Со помош на „Буки“ моделите, тој материјал може да се транскрибира. Во врска со образованието, доколку предавањата што се одвиваат онлајн се транскрибирани, тоа би им помогнало на студентите полесно да ја најдат содржината што им треба. Пример, доколку некој студент сака да најде што е зборувано во врска со некое прашање, наместо да го слуша целото аудио, кое може да трае еден час, ќе може многу полесно да го најде одговорот во транскриптот - образложи Порјазовски.

- Имплементирањето и употребата на македонскиот јазик во дигиталниот свет е од исклучителна важност за негово негување и афирмација. Лансирањето на „Буки“ е од огромно значење за нашето општество и ќе овозможи олеснување на работењето во многу сфери - истакна Ангелова.

Професорот Никола Стиков од Техничкиот универзитет во Монтреал, Канада, кој е иницијатор за создавање на „Буки“, посочи дека неговата цел била да се зачува македонскиот јазик и наследството, нагласувајќи дека илјадници часови снимени материјали се распаѓаат во влажните ќошиња на македонските институции чекајќи да бидат пребарани и индексирани.

- УКИМ почна кампања „Донирај глас“ и секој што сака да придонесе ќе може да го донира својот глас – да прочита текст на македонски и да го прикачи на платформата Мозила - потсети Стиков.



Презентирајќи ја практичната примена на оваа алатка, д-р Димитар Вељановски, специјалист радиолог и супспецијалист интервентен неврорадиолог, порача дека „„Буки“ може да спаси живот“.

- Со ова алатка се отвора светла иднина во нашето радиолошко друштво, веќе сме на праг да станеме побрзи, повешти и поточни правејќи го нашето секојдневие посреќно, но и нашите пациенти. Точната и брза дијагноза е од суштинско значење во третманот на пациентот кој е наш приоритет. На тој начин можеме да испишеме нова радиолошка историја која ќе биде темел на еден модерен здравствен систем кој луѓето ќе го препознаваат, ќе се чувствуваат сигурни, со тоа ќе се засилува довербата на народот во здравствените работници кои неуморно се борат да постават точна дијагноза која значи долг живот, а пак ние, радиолозите, ќе се гордееме затоа што и „радиобуки“ може да спаси живот - потенцираше Вељановски.

Процентот на погрешни зборови (word-error rate) се намали од 13,8 на 10,2 за моделот Buki-wav2vec2, кој сега има споредливи перформанси со Buki-Whisper (word-error-rate 10.5) но е далеку побрз.

- Стигнавме до 120 часа за тренинг на Буки 2.0, двојно повеќе од 60 часа со кои го создадовме Буки 1.0. Имаме многу повеќе говорници и акценти, како и неколку часа снимени детски гласови. Ова е сѐ уште далеку од посакуваните 600 часа транскрибиран говор, но убедени сме дека во 2025 ќе ја оствариме и таа цел - наведоа креаторите.
Новата алатка е достапна на следниот линк: https://huggingface.co/spaces/Macedonian-ASR/Bookie-w2v2-Macedonian-ASR.

Издвојуваме

Слични вести од Fakulteti.mk

Живот