Распознавание речи компьютером — это круто. Русский начинали делать на базе американского Dragon Dictate. Создали движок Змей Горыныч, но потом проект закинули. (Я пробовал тогда в нем работать, но большое количество ошибок при распознавании сводило на нет преимущества. Скорость набора текста не увеличивалась. А без предварительного обучения хотя бы на "стандартном" тексте, который система предлагает новому пользователю, вообще бред на выходе.)

Лучшие движки распознавания — английский и испанский. Это основные языки в США, потому в них и вкладывают деньги. И там сейчас реально отличное качество работы. Многие переводчики в Штатах и других англо- и испаноговорящих странах практически не используют клавиатуру для набора массивов текста при письменном переводе, а диктуют, глядя на экран (движок голосового набора встраивается в стандартные программы набора текста как еще одно средство ввода — см. проф. сайты, например, proz.com, там на форуме есть темы, посвященные распознаванию речи).
В 2000 году работал на проекте, и наш руководитель проекта, англичанин, начитывал текущие отчеты в микрофон. А мы в щелочку двери смотрели на это, как на чудо. Он садился у себя в кабинете с ноутом на пол (с ковролином), надевал наушники с микрофоном, вокруг раскладывал все необходимые документы, и диктовал текст... в компьютер. Рыба отчета объемом 150-200 страниц делалась за 2 рабочих дня. При этом железяка вполне корректно распознавала такие слова, как "Стенцовско-Жебриянские плавни" в исполнении истинного лондонца. Дальше уже шла вычитка, правка, верстка, вставка картинок... А потом уже делался перевод готового отчета на русский.
Чтобы этого добиться, он методично обучал систему своему голосу в течение примерно трех месяцев. Выделял на это по часу-полтора в день, и просто читал разные тексты, исправляя ошибки распознавания. Компьютер учился. За одно и сам тренировался говорить ровным тоном, без резких интонаций, с постоянным темпом и четко. Без этого никак. Чудес не бывает. Зато потом (а он был еще автомобилист и любил ездить по Европе на машине, ну и домой, в Англию на праздники), он спокойно "писал" (диктовал заготовки, мысли) научные статьи и прочие документы, находясь за рулем, чтобы не терять время. Ноутбук лежал на соседнем сиденье.
В 2000 году это выглядело как фантастический фильм. Однако больше половины успеха зависело от самого человека, его точности и дисциплины.
Сейчас системы уже немного умнее, и человеку уже не надо так сильно напрягаться и приспосабливаться к возможностям системы, но все равно есть ряд требований к речи, которые приходится соблюдать, ломая привычку. И все равно, незнакомые машине слова надо вводить вручную.
Так обстоят дела с английским и испанским. Остальные языки остаются на совести соответствующих стран.
И мы видим результат. Годного русского движка пока нет. Правда, есть проблемы, обусловленные самим языком: много окончаний и словоформ, нечеткое произнесение окончаний и безударных гласных, съедание частей слов. Этого нет в английском и испанском, они проще с точки зрения фонетики.

Лучшие движки распознавания — английский и испанский. Это основные языки в США, потому в них и вкладывают деньги. И там сейчас реально отличное качество работы. Многие переводчики в Штатах и других англо- и испаноговорящих странах практически не используют клавиатуру для набора массивов текста при письменном переводе, а диктуют, глядя на экран (движок голосового набора встраивается в стандартные программы набора текста как еще одно средство ввода — см. проф. сайты, например, proz.com, там на форуме есть темы, посвященные распознаванию речи).
В 2000 году работал на проекте, и наш руководитель проекта, англичанин, начитывал текущие отчеты в микрофон. А мы в щелочку двери смотрели на это, как на чудо. Он садился у себя в кабинете с ноутом на пол (с ковролином), надевал наушники с микрофоном, вокруг раскладывал все необходимые документы, и диктовал текст... в компьютер. Рыба отчета объемом 150-200 страниц делалась за 2 рабочих дня. При этом железяка вполне корректно распознавала такие слова, как "Стенцовско-Жебриянские плавни" в исполнении истинного лондонца. Дальше уже шла вычитка, правка, верстка, вставка картинок... А потом уже делался перевод готового отчета на русский.
Чтобы этого добиться, он методично обучал систему своему голосу в течение примерно трех месяцев. Выделял на это по часу-полтора в день, и просто читал разные тексты, исправляя ошибки распознавания. Компьютер учился. За одно и сам тренировался говорить ровным тоном, без резких интонаций, с постоянным темпом и четко. Без этого никак. Чудес не бывает. Зато потом (а он был еще автомобилист и любил ездить по Европе на машине, ну и домой, в Англию на праздники), он спокойно "писал" (диктовал заготовки, мысли) научные статьи и прочие документы, находясь за рулем, чтобы не терять время. Ноутбук лежал на соседнем сиденье.
В 2000 году это выглядело как фантастический фильм. Однако больше половины успеха зависело от самого человека, его точности и дисциплины.
Сейчас системы уже немного умнее, и человеку уже не надо так сильно напрягаться и приспосабливаться к возможностям системы, но все равно есть ряд требований к речи, которые приходится соблюдать, ломая привычку. И все равно, незнакомые машине слова надо вводить вручную.
Так обстоят дела с английским и испанским. Остальные языки остаются на совести соответствующих стран.
И мы видим результат. Годного русского движка пока нет. Правда, есть проблемы, обусловленные самим языком: много окончаний и словоформ, нечеткое произнесение окончаний и безударных гласных, съедание частей слов. Этого нет в английском и испанском, они проще с точки зрения фонетики.
no subject
Date: 2013-12-09 07:12 pm (UTC)no subject
Date: 2013-12-09 07:26 pm (UTC)Я как-то, чтобы не искать-качать-собирать, покупал у одного хлопца аудиокниги. (Если надо, дам контакты.)
Брал сразу примерно 70 ГБ в MP3 — у меня мама любит слушать книги, занимаясь домашними делами. Этого ей хватит лет на 5 слушать (уходит примерно 1 ГБ/мес, летом — 2 ГБ/мес).
Я взял у хлопца каталог, выбрали нужное, он подготовил мне архив, и я подъехал к нему с внешним жестким диском, чтобы записать.
Пришел к нему домой. А он слепой. От слова "полностью".
Он роет Инет, собирает архивы книг (причем много книг в начитке разными актерами, кому кто нравится), потом пишет людям под заказ и пополняет аудиотеку общества слепых (я в нее когда-то отдал все свои аудиокассеты). Это его приработок.
Мне было жутко интересно, как он пользуется компом. А вот пользуется. Системник стоит на балконе. В комнате только клавиатура на длинном шнуре, чтобы по всей комнате носить, колонки (большие, чтобы на всю комнату слышно) и микрофон. Всё. На компе установлена программа, которая голосом произносит все действия "на экране". (Мышь не используется, только клавиатура.) Он спокойно пользуется Интернетом, пишет диски, качает музыку, слушает сериалы (!), переписывается по Скайпу/Аське.
Есть инструменты для слепых. Надо поковырять.
no subject
Date: 2013-12-09 07:32 pm (UTC)Интересно, а чо за интерфейс для клавы у человека? Даже ЮСБ, со шнурком более 5 метров, требует дополнительного "гемора".
а ваще - таким людям только респект.
no subject
Date: 2013-12-09 07:42 pm (UTC)Если надо книги, я дам контакт, у него огромная коллекция.
Я на перекрестках не подаю, но дать работу и оплатить ее таким людям всегда готов.
no subject
Date: 2013-12-09 07:45 pm (UTC)no subject
Date: 2013-12-09 07:47 pm (UTC)no subject
Date: 2013-12-09 07:33 pm (UTC)радио Маяки ты удалил... написал короткоno subject
Date: 2013-12-09 07:43 pm (UTC)no subject
Date: 2013-12-09 08:02 pm (UTC)no subject
Date: 2013-12-09 08:14 pm (UTC)no subject
Date: 2014-01-06 07:17 pm (UTC)no subject
Date: 2014-01-06 07:26 pm (UTC)Нет рабочих систем для русского. Есть баловство типа управления компом (копировать, вставить, переименовать, свернуть окно)... Это можно и мышкой делать. А нормальная система должна внедряться во все другие программы, где требуется ввод текста (Excel, Word, AutoCAD, эл. словари, другие специальные программы для работы с текстами, т.е. работать в любом поле ввода) и полностью заменять клавиатурный ввод текста (а не команд! служебные команды при этом даются именно с клавиатуры для экономии времени). Есть старый "Горыныч" и потуги на новые версии, он слегка внедряется в некоторые программы, но ни хрена не распознает толком. Русски язык слишком сложный для этого.
no subject
Date: 2014-01-06 07:35 pm (UTC)Жаль, что в данном случае не получится использовать такую программу...
no subject
Date: 2014-01-06 07:45 pm (UTC)no subject
Date: 2014-01-06 07:47 pm (UTC)no subject
Date: 2014-01-06 07:54 pm (UTC)Цепочка созвучных слов без смысла. По бокам субтитров особые значки (дужки).
Субтитры, написанные человеком:
Нормальный текст со знаками препинания.
Отличить легко.
no subject
Date: 2014-01-06 07:57 pm (UTC)no subject
Date: 2014-01-06 08:00 pm (UTC)http://www.youtube.com/watch?v=3URrYnZS_Tw
no subject
Date: 2014-01-06 08:05 pm (UTC)no subject
Date: 2014-01-06 08:42 pm (UTC)no subject
Date: 2014-01-06 07:58 pm (UTC)no subject
Date: 2014-01-06 08:01 pm (UTC)