dr_trans: (Default)
[personal profile] dr_trans
Распознавание речи компьютером — это круто. Русский начинали делать на базе американского Dragon Dictate. Создали движок Змей Горыныч, но потом проект закинули. (Я пробовал тогда в нем работать, но большое количество ошибок при распознавании сводило на нет преимущества. Скорость набора текста не увеличивалась. А без предварительного обучения хотя бы на "стандартном" тексте, который система предлагает новому пользователю, вообще бред на выходе.)



Лучшие движки распознавания — английский и испанский. Это основные языки в США, потому в них и вкладывают деньги. И там сейчас реально отличное качество работы. Многие переводчики в Штатах и других англо- и испаноговорящих странах практически не используют клавиатуру для набора массивов текста при письменном переводе, а диктуют, глядя на экран (движок голосового набора встраивается в стандартные программы набора текста как еще одно средство ввода — см. проф. сайты, например, proz.com, там на форуме есть темы, посвященные распознаванию речи).

В 2000 году работал на проекте, и наш руководитель проекта, англичанин, начитывал текущие отчеты в микрофон. А мы в щелочку двери смотрели на это, как на чудо. Он садился у себя в кабинете с ноутом на пол (с ковролином), надевал наушники с микрофоном, вокруг раскладывал все необходимые документы, и диктовал текст... в компьютер. Рыба отчета объемом 150-200 страниц делалась за 2 рабочих дня. При этом железяка вполне корректно распознавала такие слова, как "Стенцовско-Жебриянские плавни" в исполнении истинного лондонца. Дальше уже шла вычитка, правка, верстка, вставка картинок... А потом уже делался перевод готового отчета на русский.

Чтобы этого добиться, он методично обучал систему своему голосу в течение примерно трех месяцев. Выделял на это по часу-полтора в день, и просто читал разные тексты, исправляя ошибки распознавания. Компьютер учился. За одно и сам тренировался говорить ровным тоном, без резких интонаций, с постоянным темпом и четко. Без этого никак. Чудес не бывает. Зато потом (а он был еще автомобилист и любил ездить по Европе на машине, ну и домой, в Англию на праздники), он спокойно "писал" (диктовал заготовки, мысли) научные статьи и прочие документы, находясь за рулем, чтобы не терять время. Ноутбук лежал на соседнем сиденье.

В 2000 году это выглядело как фантастический фильм. Однако больше половины успеха зависело от самого человека, его точности и дисциплины.

Сейчас системы уже немного умнее, и человеку уже не надо так сильно напрягаться и приспосабливаться к возможностям системы, но все равно есть ряд требований к речи, которые приходится соблюдать, ломая привычку. И все равно, незнакомые машине слова надо вводить вручную.

Так обстоят дела с английским и испанским. Остальные языки остаются на совести соответствующих стран.
И мы видим результат. Годного русского движка пока нет. Правда, есть проблемы, обусловленные самим языком: много окончаний и словоформ, нечеткое произнесение окончаний и безударных гласных, съедание частей слов. Этого нет в английском и испанском, они проще с точки зрения фонетики.

Date: 2013-12-09 07:47 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Я тоже. А она любит в ушах, и вязать или рыбу чистить. :)

Profile

dr_trans: (Default)
dr_trans

December 2021

S M T W T F S
   1234
567891011
12131415161718
1920212223 2425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 30th, 2026 04:42 pm
Powered by Dreamwidth Studios