Поддержать нас
Беларусы на войне
  1. Возле Дроздов в Минске есть секретная многоэтажка — информации о ней минимум. Но всплыли данные об одной из квартир
  2. В СК придумали новые подходы для преследования инакомыслящих беларусов — акцент делается на двух соцсетях
  3. Пропагандист заявил, что 196 политзаключенных, об освобождении которых ранее не было известно, уже на свободе
  4. Лукашенко сменил одного министра, директоров заводов и главу крупнейшего госмедиахолдинга
  5. Беларуска назвала свою пенсию после 37 лет работы и попросила других поделиться цифрами. Суммы заметно отличаются
  6. Долгожитель среди классиков, одной фразой описал менталитет беларусов, не принимал советскую систему. Чем крут Янка Брыль — пять пунктов
  7. «Меньше кофе надо было пить, не напьетесь вы этого кофе вечно». Беларуску оставил на заправке рейсовый автобус — кто прав
  8. На авторынке «умирает» один из дилеров
  9. Без Трампа, но с крупной победой. Сборная США ярко стартовала на домашнем чемпионате мира
  10. «Мы отрежем Крым от России». Командующий Силами беспилотных систем Украины Бровди о стратегии ударов
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.