dr_trans: (Default)
[personal profile] dr_trans
Распознавание речи компьютером — это круто. Русский начинали делать на базе американского Dragon Dictate. Создали движок Змей Горыныч, но потом проект закинули. (Я пробовал тогда в нем работать, но большое количество ошибок при распознавании сводило на нет преимущества. Скорость набора текста не увеличивалась. А без предварительного обучения хотя бы на "стандартном" тексте, который система предлагает новому пользователю, вообще бред на выходе.)



Лучшие движки распознавания — английский и испанский. Это основные языки в США, потому в них и вкладывают деньги. И там сейчас реально отличное качество работы. Многие переводчики в Штатах и других англо- и испаноговорящих странах практически не используют клавиатуру для набора массивов текста при письменном переводе, а диктуют, глядя на экран (движок голосового набора встраивается в стандартные программы набора текста как еще одно средство ввода — см. проф. сайты, например, proz.com, там на форуме есть темы, посвященные распознаванию речи).

В 2000 году работал на проекте, и наш руководитель проекта, англичанин, начитывал текущие отчеты в микрофон. А мы в щелочку двери смотрели на это, как на чудо. Он садился у себя в кабинете с ноутом на пол (с ковролином), надевал наушники с микрофоном, вокруг раскладывал все необходимые документы, и диктовал текст... в компьютер. Рыба отчета объемом 150-200 страниц делалась за 2 рабочих дня. При этом железяка вполне корректно распознавала такие слова, как "Стенцовско-Жебриянские плавни" в исполнении истинного лондонца. Дальше уже шла вычитка, правка, верстка, вставка картинок... А потом уже делался перевод готового отчета на русский.

Чтобы этого добиться, он методично обучал систему своему голосу в течение примерно трех месяцев. Выделял на это по часу-полтора в день, и просто читал разные тексты, исправляя ошибки распознавания. Компьютер учился. За одно и сам тренировался говорить ровным тоном, без резких интонаций, с постоянным темпом и четко. Без этого никак. Чудес не бывает. Зато потом (а он был еще автомобилист и любил ездить по Европе на машине, ну и домой, в Англию на праздники), он спокойно "писал" (диктовал заготовки, мысли) научные статьи и прочие документы, находясь за рулем, чтобы не терять время. Ноутбук лежал на соседнем сиденье.

В 2000 году это выглядело как фантастический фильм. Однако больше половины успеха зависело от самого человека, его точности и дисциплины.

Сейчас системы уже немного умнее, и человеку уже не надо так сильно напрягаться и приспосабливаться к возможностям системы, но все равно есть ряд требований к речи, которые приходится соблюдать, ломая привычку. И все равно, незнакомые машине слова надо вводить вручную.

Так обстоят дела с английским и испанским. Остальные языки остаются на совести соответствующих стран.
И мы видим результат. Годного русского движка пока нет. Правда, есть проблемы, обусловленные самим языком: много окончаний и словоформ, нечеткое произнесение окончаний и безударных гласных, съедание частей слов. Этого нет в английском и испанском, они проще с точки зрения фонетики.
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

dr_trans: (Default)
dr_trans

December 2021

S M T W T F S
   1234
567891011
12131415161718
1920212223 2425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 30th, 2026 03:23 pm
Powered by Dreamwidth Studios