вторник, 1 сентября 2015 г.

Поликсена Фазатрон. Синтезатор якутской речи. Койданава. "Кальвіна". 2015.


                                          Белорусы с радостью бы изучили великий якутский язык,
                                          но, к сожалению, их мозг «зачарнилился» так,
                                          что они уже не могут даже разговаривать
                                          на своем «колхозном» белорусском языке...
                                                                                                     Диоген из Сиракуз



                                                                        Якутск
                                                                  21 мая 2015, 00:00
                                            Ученые Беларуси научили компьютер
                                                            говорить по-якутски

    В лаборатории распознавания и синтеза речи Объединенного института проблем информатики НАН Беларуси компьютер научили читать книги и прочую литературу.
    Заведующий лабораторией Юрий Гецевич нажимает кнопки на клавиатуре компьютера, и из динамиков возникают с детства знакомые стихи классика белоруской поэзии, без перевода понятные и россиянам: "Мой родны кут, як ты мне мiлы...". Затем звучат, уже по-русски, другие классические строки: "Мой дядя самых честных правил...". Потом по-якутски компьютер проговорил цифры: один, два, три...
    Скажу честно: смысла каждого слова в отдельности я не понял. Все-таки тюркская группа языков - якутский, оказывается, сродни турецкому. Но характерные для оригинала интонации сохранились. Правда, с каким-то металлическим отзвуком, будто читает робот из фантастического фильма.
   - Так и есть, - поясняет Юрий Станиславович. - Во всех трех случаях стихи читает не диктор, а синтезатор, созданный на основе сложных компьютерных программ.
    Впервые автору этих строк с попыткой создать "говорящую машину" пришлось соприкоснуться лет 30 назад в Минском государственном педагогическом институте иностранных языков. Тогда профессор Борис Лобанов пытался использовать для этого пленочный магнитофон. С появлением компьютерной техники возможностей стало гораздо больше. Помимо лингвистов задействовать их сегодня помогают математики, компьютерщики Объединенного института проблем информатики. Так сформировалась оригинальная белорусская школа компьютерного синтеза и клонирования речи, в основе которой лежат несколько монографий, десяток патентов и авторских свидетельств на изобретения, созданных Борисом Лобановым и его учениками.
   - Люди общаются с помощью голоса и слуха, - говорит Юрий Гецевич. - Этот способ взаимодействия желателен и для отношений человека и машины. Синтезатор речи разрабатывается, чтобы мобильный или стационарный компьютер, а также интернет-сайт имели возможность прочитать отдельные слова, предложения и другие текстовые фрагменты на двух государственных языках Беларуси - белорусском и русском. А также других языках.
    Сегодня компьютер, читающий вслух, востребован в самых разных сферах. Например, при обучении людей с ослабленным зрением, а то и полностью незрячих. Раньше в их распоряжении были лишь книги, написанные азбукой Брайля. Но ведь сейчас большинство книг и других печатных материалов доступны в цифровой форме. Вывести их на экран монитора - не проблема. Белорусские ученые также научили компьютер читать цифровую запись вслух. Достаточно, нажав клавишу, прослушать перечень книг, имеющихся в электронной библиотеке, и нажатием другой клавиши выбрать для прослушивания нужную. Подобная система уже действует в школе для слабовидящих и незрячих детей в белорусском городе Молодечно.
    Недавно такой синтезатор речи был разработан для Якутии. В этом участвовали ректор Северо-Восточного федерального университета имени М.К. Аммосова Евгения Михайлова и ее коллеги. Они предоставили электронные файлы звуков якутского языка, которые белорусские специалисты заложили в свою систему компьютерного синтеза и клонирования речи. И ЭВМ заговорила по-якутски.
    Кстати, именно уроженец Беларуси Эдуард Пекарский в XIX веке первым переложил якутский язык на латиницу, а затем и кириллицу??????!!!!!
    - Конечно, все было не так просто. Но поскольку работали всей лабораторией, то выполнить работу смогли менее чем за год. Она уже принята якутскими заказчиками. Предполагаемая сфера применения - школы для слабовидящих и незрячих.
    В целом же область применения речевого синтезатора, созданного белорусскими учеными, значительно шире. Это и персональный телефонный робот, способный голосом по заданному списку передать абонентам нужную информацию. Запись и воспроизведение поступивших GSM-сообщений. Оповещение о прибытии-отправлении поездов и самолетов, городского общественного транспорта. Оказывается, компьютер может говорить более доходчиво, чем самый красноречивый диктор.
                                                               Досье "СОЮЗа"
    Символично, что эту работу для Якутии сделали именно белорусские ученые. Уроженец Минщины Эдуард Пекарский первым переложил якутский язык на латиницу, а затем и кириллицу. В далекий северный край он был сослан в 1881 году за революционную деятельность. Да так и прожил около 20 лет в 1-м Игидейском поселке Ботурусского улуса. Уже к 1887 году Пекарский при поддержке местных энтузиастов собрал 7 тысяч якутских слов, через 11 лет их было уже 20 тысяч. Эта работа легла в основу фундаментального "Словаря якутского языка". И даже получив право вернуться, Пекарский не оставил Якутский край, вел там изыскания и занимался составлением якутско-русского словаря. Впоследствии выдающийся фольклорист и этнограф был избран членом-корреспондентом, а затем и почетным членом Академии наук СССР.
    Источник: Российская газета При частичном или полном использовании материалов гиперссылка на сайт ysia.ru обязательна. Категория: Общество Просмотров: 292 Источник: ЯСИА Автор: Владимир Бибиков

                                                                Беларускія навукоўцы

                                                   стварылі сынтэзатар якуцкай мовы

                                                                   4.03.2015, 21:34

    Беларускія навукоўцы распрацавалі сінтэзатар якуцкай мовы для Паўночна-ўсходняга фэдэральнага ўнівэрсытэта, паведаміў БелТА генэральны дырэктар Аб’яднанага інстытута праблем інфарматыкі НАН Беларусі Аляксандр Тузікаў.
    У нас у інстытуце ёсьць лябараторыя сынтэзу маўленьня, супрацоўнікі якой надоечы распрацавалі сынтэзатар якуцкай прамовы для Паўночна-ўсходняга фэдэральнага ўнівэрсытэта імя М. К. Амосава (горад Якуцк, Рэспубліка Саха)”, - растлумачыў ён.
    Сынтэзатар складаецца з двух галасоў, мужчынскага “Талбон” і жаночага “Сата”, і павінен дапамагчы школьнікам і студэнтам атрымаць больш якасную адукацыю пры дапамозе адаптыўных кампутэрных тэхналёгій. Ён выкарыстоўваецца, каб перакладаць пісьмовы тэкст у гаворку.
    Аляксандр Тузікаў падкрэсьліў, што беларускіх спэцыялістаў сынтэзу мовы добра ведаюць у Расеі. “Прадстаўнікі якуцкай стараны самі выйшлі на наш інстытут”, - падкрэсьліў ён.
    Са слоў Аляксандра Тузікава, прылада была распрацаваная супольна з якуцкімі моўнымі спэцыялістамі. “Падобныя сынтэзатары расейскай, ангельскай мовы ўжо існуюць у сьвеце, дарэчы, у нас у інстытуце таксама ёсьць такое абсталяваньне - сынтэзатары беларускай і расейскай мовы. А вось сынтэз якуцкай мовы мы яшчэ не рабілі. На распрацоўку сынтэзатара сышло блізу аднаго года. Спачатку мы падалі першапачатковы варыянт, які потым давялося дапрацаваць з улікам пажаданьняў замоўцы”, - адзначыў генэральны дырэктар Аб’яднанага інстытута праблем інфарматыкі.
    Сынтэзатар павінен дапамагчы школьнікам і студэнтам РФ атрымаць больш якасную адукацыю.
                                                                   Комментарии
Бефар., 21:31, 4.03
Язык чукчей ? Учат для чего ?
Ответить
небурят, 21:34, 4.03
Синтезатор БУРЯТСКОЙ речи более актуален
Ответить
кабздох, 1:19, 5.03
как я рад
Ответить
Stelmah, 21:47, 4.03
лепш бы гэтыя "вучоныя" роднай мовай займаліся
Ответить
Sергей, 21:48, 4.03
Белорусские ученые разработали синтезатор якутской речи
--------------------------------------------------------------
Я один чуть со стула не упал?
Ответить
Яна, 22:53, 4.03
Вы что,это же сейчас как воздух необходимо-теперь заживем...)))))
Ответить
Son of Grodno, 22:09, 4.03
А что не синтезатор "трасянской" речи? Может тогда прЫзядзент поймёт Народ :-)
Ответить
Vladimir, 22:14, 4.03
Белорусские ученые создали синтезатор якутской речи... Представляю как они намучились! Этот бесконечный дифицит синей изоленты... Тут даже Эдиссон бы неосилил! Зато теперь, якуты с бурятами, смогут гутарить на Украинской мове!
Ответить
Чел, 22:21, 4.03
Типа с английским не получилось, зато по якутски всё нормально, откаты пошли и не проверит никто. Якутов-то нету. Давайте хлопцы, на очереди зимбабвийский, олбанский..
Ответить
Акелла, 22:25, 4.03
Следующим достижением белорусских ученых будет создание голосового переводчика с якутского на суахили и обратно. Очень актуальная штукенция, я вам доложу...
Ответить
сын партызана, 22:25, 4.03
А сваю родную-беларускую мабыць забылі?
Тады калі ласка у РАСЕЮ, у ЯКУЦІЮ!
А я застануся у сваей сінявокай, дзе лятаюць нашыя буслы, пяюць птушкі, зьвіняць ручайкі, калосяцца у жыцце васількі...
БЕЛАРУСЬ-ГЭТА ЦУДОУНЫ КРАЙ,ЯГО КАХАЦЬ ПАТРЭБНА,ЯК БЕЛАРУСКУЮ ПРЫГАЖУННЮ.
Крыудна спадары,што так робіцца у нашай краіне з беларускай мовай і літаратурай.
СЭРЦА ПЛАЧА!
Ответить
Ужос, чем занимаются ученые!, 22:36, 4.03
Дебилы вы, а не ученые! Вы свой родной язык скоро забудете.
И всем нам нем скоро вообще запретят разговаривать.
А если будем пытаться говорить, то приедут бурятские танкисты бороться с "беларуским фашизмом". Им так расскажут по паРаша ТВ.
Ответить
у них, 12:19, 5.03
родной язык советский ...
Ответить
sidda, 22:54, 4.03
ну все,теперь я счастлив
Ответить
Geo, 23:10, 4.03
По логике, следующим девайсом должен стать синтезатор речи мраморных тараканов...
Ответить
рус, 23:12, 4.03
Вот же ж. Всех этих ученых(вместе с властью) в Якутию. Пусть там жрут ягель и оленям мозги пудрят.
Ответить
Дмитрий (инвалид 1-ой группы по зрению), 23:30, 4.03
насколько мне известно, синтезаторы этой компании очень низкого качества, а лучше бы разработали синттезатор родной речи, а то белорусский текст при помощи программ экранного доступа читать невозможно.
Ответить
беларусское правительство, 1:22, 5.03
нашим гражданам такое не нада...
Ответить
123, 23:43, 4.03
Вот действительно большую проблему решили! Ай да молодцы! Тянет на Нобеля! Не иначе! А в Беларуси и в Мире то больше и нет научных задач то.
Ответить
Старый, 0:35, 5.03
Слава Богу уже создали синтезатор беларуского языка. Благодаря успешной деятельности наших учёных, в скором времени белорусскую мову в Беларуси можно будет услышать только в музее через синтезатор. На улицах наших городов её не слышно уже давно, лет 70- т...
Ответить
Гой, 1:51, 5.03
Один вопрос: нахера?
Ответить
про, 7:36, 5.03
почему не китайской!?
Ответить
valery, 8:40, 5.03
Лучше бы китайской!
Ответить
Да уж, 8:41, 5.03
А совсем недавно они открыли закон всемирного тяготения , что то не слышно оваций мирового сообщества.
Ответить
Елена, 9:00, 5.03
Какую актуальную, насущную проблему решили. Ай да, молодцы! Беларусским ученым большое человеческое спасибо!
Ответить
</>, 11:05, 5.03
Угнетает обилие неуважения в комментариях к якутскому языку.
На этом языке разговаривали люди, научившиеся выживать на полюсе холода (Оймякон - средняя температура в Июле 14.9 градусов, средняя температура в Январе - -46.4 градусов, с Октября по Апрель средняя температура ниже нуля).
Любой язык - это культура. Нет повода его учить, но стебаться зачем?
Подумайте лучше о том, что люди заплатили беларуским "ученым" ДЕНЬГИ за то, чтобы создать синтезатор речи для своего языка. А ведь якутов в Якутии меньше, чем четверть населения Минска.
Похоже, что они уважают свой язык больше, чем беларусы - свой.
Вот только вряд ли синтезатор речи создавали ученые.
Ученые делают открытия в науке, а не создают синтезаторы речи.
Синтезатор речи был создан программистами, инженерами, лингвистами и т.д, а вот как раз ученых там скорее всего не было.
Ответить
Vladimir, 12:21, 5.03
</>, 11:05, 5.03 Во первых, стебается народ не над якутами и их языком, а над беларусскими учеными! Во вторых, полРоссии живет в худших условиях чем якуты, живущие в стерильном климате, при полном отсутствии бактерий! Миллионы россиян, в деревнях и отдаленных перефериях, страдают от алкоголизма, наркозависимости, туберкулеза, Спида, грязи, отсутствия жилья и тд и тп...Но это им не мешает любить Путина и восхищатся Русским Миром! И если мы не перестаем стебаться над этим,то есть надежда, что у ватников откроютя глаза и очистятся наконец, зас..ные властью мозги!
Ответить
</>, 13:38, 5.03
Vladimir, 12:21, 5.03
За что деньги заплатили, то и сделали - чего тут смешного?
99% любителей путина якутского языка не знают, путают якутов с чукчами, смеются над языками малочисленных народов и в данном случае они вообще ни при чем.
    Падала:
    Поликсена  Фазатрон,
    Койданава


                                                        СОВЕТСКАЯ  БЕЛОРУССИЯ


                                                             Союз. Беларусь-Россия
                                                  НЕ  ДЕРЖИ  ЯЗЫК  ЗА  ЗУБАМИ
    В лаборатории распознавания и синтеза речи Объединенного института проблем информатики НАН Беларуси компьютер научили читать книги и прочую литературу.

                                  Юрий Гецевич говорит с синтезатором на одном языке.
    Заведующий лабораторией Юрий Гецевич нажимает кнопки на клавиатуре компьютера, и из динамиков возникают с детства знакомые стихи классика белоруской поэзии, без перевода понятные и россиянам: «Мой родны кут, як ты мне мiлы...» Затем звучат, уже по–русски, другие классические строки: «Мой дядя самых честных правил...» Потом по–якутски компьютер проговорил цифры: один, два, три...
    Скажу честно: смысла каждого слова в отдельности я не понял. Все–таки тюркская группа языков — якутский, оказывается, сродни турецкому. Но характерные для оригинала интонации сохранились. Правда, с каким–то металлическим отзвуком, будто читает робот из фантастического фильма.
    — Так и есть, — поясняет Юрий Станиславович. — Во всех трех случаях стихи читает не диктор, а синтезатор, созданный на основе сложных компьютерных программ.
    Впервые автору этих строк с попыткой создать «говорящую машину» пришлось соприкоснуться лет 30 назад в Минском государственном педагогическом институте иностранных языков. Тогда профессор Борис Лобанов пытался использовать для этого пленочный магнитофон. С появлением компьютерной техники возможностей стало гораздо больше. Помимо лингвистов задействовать их сегодня помогают математики, компьютерщики Объединенного института проблем информатики. Так сформировалась оригинальная белорусская школа компьютерного синтеза и клонирования речи, в основе которой лежат несколько монографий, десяток патентов и авторских свидетельств на изобретения, созданных Борисом Лобановым и его учениками.
    — Люди общаются с помощью голоса и слуха, — говорит Юрий Гецевич. — Этот способ взаимодействия желателен и для отношений человека и машины. Синтезатор речи разрабатывается, чтобы мобильный или стационарный компьютер, а также интернет–сайт имели возможность прочитать отдельные слова, предложения и другие текстовые фрагменты на двух государственных языках Беларуси — белорусском и русском. А также других языках.
    Сегодня компьютер, читающий вслух, востребован в самых разных сферах. Например, при обучении людей с ослабленным зрением, а то и полностью незрячих. Раньше в их распоряжении были лишь книги, написанные азбукой Брайля. Но ведь сейчас большинство книг и других печатных материалов доступны в цифровой форме. Вывести их на экран монитора — не проблема. Белорусские ученые также научили компьютер читать цифровую запись вслух. Достаточно, нажав клавишу, прослушать перечень книг, имеющихся в электронной библиотеке, и нажатием другой клавиши выбрать для прослушивания нужную. Подобная система уже действует в школе для слабовидящих и незрячих детей в белорусском городе Молодечно.
    Недавно такой синтезатор речи был разработан для Якутии. В этом участвовали ректор Северо–Восточного федерального университета имени М.К. Аммосова Евгения Михайлова и ее коллеги. Они предоставили электронные файлы звуков якутского языка, которые белорусские специалисты заложили в свою систему компьютерного синтеза и клонирования речи. И ЭВМ заговорила по–якутски.
     — Конечно, все было не так просто. Но поскольку работали всей лабораторией, то выполнить работу смогли менее чем за год. Она уже принята якутскими заказчиками. Предполагаемая сфера применения — школы для слабовидящих и незрячих.
    В целом же область применения речевого синтезатора, созданного белорусскими учеными, значительно шире. Это и персональный телефонный робот, способный голосом по заданному списку передать абонентам нужную информацию. Запись и воспроизведение поступивших GSM–сообщений. Оповещение о прибытии–отправлении поездов и самолетов, городского общественного транспорта. Оказывается, компьютер может говорить более доходчиво, чем самый красноречивый диктор.


                                                                   Досье «СОЮЗа»
    Символично, что эту работу для Якутии сделали именно белорусские ученые. Уроженец Минщины Эдуард Пекарский первым переложил якутский язык на латиницу, а затем и кириллицу. В далекий северный край он был сослан в 1881 году за революционную деятельность. Да так и прожил около 20 лет в 1–м Игидейском поселке Ботурусского улуса. Уже к 1887 году Пекарский при поддержке местных энтузиастов собрал 7 тысяч якутских слов, через 11 лет их было уже 20 тысяч. Эта работа легла в основу фундаментального «Словаря якутского языка». И даже получив право вернуться, Пекарский не оставил Якутский край, вел там изыскания и занимался составлением якутско–русского словаря. Впоследствии выдающийся фольклорист и этнограф был избран членом–корреспондентом, а затем и почетным членом Академии наук СССР.

    Владимир Бибиков
    Фото Александра Ружечко
    /Советская Белоруссия (Союз Белоруссия Россия. № 19). Минск. 21 мая 2015. С. VIII./

                                                                27 верасьня 2011
                                                       БЕЛАРУСКАЯ  ГАВАРЫЛКА
                                    Як кампутар навучыўся размаўляць па-беларуску:
                                                праграма гаворыць любым голасам,
                                        а найбольшую складанасьць выклікаюць націскі.

    Тэхналёгіі распазнаваньня тэкставай інфармацыі і пераводу яе ў маўленьне распрацаваныя шмат для якіх моваў сьвету. Цяпер і беларуская не выключэньне. У нашай краіне распрацоўкай такой праграмы займаюцца ў Аб’яднаным інстытуце праблем інфарматыкі Нацыянальнай Акадэміі Навук, а таксама ў прыватнай кампаніі «Сакрамэнт». Пра сваю распрацоўку расказала кандыдат тэхнічных навук Лілія Цырульнік і малодшы навуковы супрацоўнік Юрась Гецэвіч, які непасрэдна займаецца беларускамоўным сэгмэнтам.
    «Наша Ніва»: У чым адметнасьць вашай лябараторыі?
    Лілія Цырульнік: Наша асаблівасьць — гэта распрацоўка сыстэмы сынтэзу маўленьня для беларускай мовы. Акрамя гэтага, мы распрацавалі такія сыстэмы для расейскай і польскай моваў, а таксама займаемся стварэньнем сынтэзатара якуцкай мовы.
    «НН»: Дзе можа выкарыстоўвацца ваша праграма?
    ЛЦ: Сфэра прымяненьня даволі шырокая: стварэньне аўдыёкніг, чытаньне электроннай пошты, дапамога сьляпым людзям. Што яшчэ важна, сыстэма сынтэзу беларускага маўленьня будзе спрыяць захаваньню мовы.
    «НН»: Колькі каштуе такая праграма?
    ЛЦ: Пакуль няма камэрцыйнай вэрсіі праграмы для беларускай мовы, яна будзе створана цягам некалькіх месяцаў. Для канчатковага карыстальніка гэта будзе адзін кошт, для карпаратыўнага ўжытку ці для выкарыстоўваньня ў сыстэмах апавяшчэньня абанэнтаў па тэлефоне — іншы. Напрыклад, створаная намі праграма для агучваньня аўдыёкніг на расейскай мове «aBookForge» каштуе каля $7. На гэту лічбу можна арыентавацца.
    «НН»: Як даўно вы займаецеся распрацоўкамі сынтэзатараў маўленьня?
    ЛЦ: Лябараторыя існуе ўжо больш за 40 гадоў. Былы загадчык лябараторыі — Барыс Мяфодзевіч Лабанаў — вядомы вучоны, на рахунку якога шмат навуковых распрацовак. Дарэчы, яго голасам «размаўляе» праграма. А беларускамоўным сынтэзатарам пачалі займацца гадоў 10 таму.
    «НН»: Ці зьвяртаецеся вы да паслуг філёлягаў?
    ЛЦ: Вядома ж. Трэба ўлічваць асаблівасьці і гукаў, і інтанацыі. Напрыклад, у польскай мове націск трапляе пераважна на перадапошні склад. Мовы пастаянна разьвіваюцца, зьяўляюцца новыя словы. А вось колькасьць гукаў — абмежаваная. У беларускай мове ёсьць 42 гукі. Такім чынам, з існуючай базы гукаў праграма ўтварае словы, сказы, тэксты… Акрамя таго, адзін і той жа гук можа быць вымаўлены з рознай інтанацыяй і тэмпам.
    «НН»: Ці можа праграма «размаўляць» голасам іншага чалавека па жаданьні заказчыка?
    ЛЦ: Што тычыцца пэрсанальнага голасу, у нас распрацавана тэхналёгія, дзякуючы якой любы дыктар можа прачытаць пэўны тэкст, зрабіць яго аўдыёзапіс. Потым гэты запіс апрацоўваецца спэцыяльным чынам і ствараецца маўленчая база дадзеных. Таму тэарэтычна праграма можа размаўляць любым голасам.
    «НН»: З якімі цяжкасьцямі вы сутыкаліся пры распрацоўцы беларускай вэрсіі?
    Юрась Гецэвіч: Найбольшую складанасьць выклікаюць розныя скарачэньні, абрэвіятуры, даты, а таксама пастаноўка націскаў у словах. Да таго ж, людзі часта робяць памылкі пры напісаньні тэкстаў. Таму мая задача — рабіць лінгвістычны блёк, які б мог распазнаваць «закадаваныя» выразы ў тэксьце, затым пераводзіць іх у артаграфічныя словы, знаходзіць гэтыя словы ў слоўніку і расстаўляць націскі. Напачатку слоўніка не было. Нам яго перадалі з Лябараторыі кампутэрнай лінгвістыкі БДУ. Зразумела, што прыйшлося яго адаптаваць, дадаваць новыя словы, імёны.
    Каб лепш зразумець, як працуе праграма, Юрась Гецэвіч надрукаваў некалькі словаў на клавіятуры — і кампутар прамовіў прыемным мужчынскім голасам з лёгкім мэталёвым акцэнтам: «Прывітаньне, газэта «Наша Ніва»! Вы першая беларуская газэта з малюнкамі. А мы першая лябараторыя, якая сынтэзуе беларускую мову».
    Аксана Рудовіч

                                              Лаборатория распознавания и синтеза реч

                                                    yuras.hetsevich@newman.bas-net.by
                                                      Гецевич Юрий Станиславович
                                                          Заведующий лабораторией,
                                                           кандидат технических наук,
                                                 магистр физико-математических наук.
                                                               Тел. +375(17) 284 25 22
    Поликсена  Фазатрон,
    Койданава