dr_trans: (Default)
[personal profile] dr_trans
Распознавание речи компьютером — это круто. Русский начинали делать на базе американского Dragon Dictate. Создали движок Змей Горыныч, но потом проект закинули. (Я пробовал тогда в нем работать, но большое количество ошибок при распознавании сводило на нет преимущества. Скорость набора текста не увеличивалась. А без предварительного обучения хотя бы на "стандартном" тексте, который система предлагает новому пользователю, вообще бред на выходе.)



Лучшие движки распознавания — английский и испанский. Это основные языки в США, потому в них и вкладывают деньги. И там сейчас реально отличное качество работы. Многие переводчики в Штатах и других англо- и испаноговорящих странах практически не используют клавиатуру для набора массивов текста при письменном переводе, а диктуют, глядя на экран (движок голосового набора встраивается в стандартные программы набора текста как еще одно средство ввода — см. проф. сайты, например, proz.com, там на форуме есть темы, посвященные распознаванию речи).

В 2000 году работал на проекте, и наш руководитель проекта, англичанин, начитывал текущие отчеты в микрофон. А мы в щелочку двери смотрели на это, как на чудо. Он садился у себя в кабинете с ноутом на пол (с ковролином), надевал наушники с микрофоном, вокруг раскладывал все необходимые документы, и диктовал текст... в компьютер. Рыба отчета объемом 150-200 страниц делалась за 2 рабочих дня. При этом железяка вполне корректно распознавала такие слова, как "Стенцовско-Жебриянские плавни" в исполнении истинного лондонца. Дальше уже шла вычитка, правка, верстка, вставка картинок... А потом уже делался перевод готового отчета на русский.

Чтобы этого добиться, он методично обучал систему своему голосу в течение примерно трех месяцев. Выделял на это по часу-полтора в день, и просто читал разные тексты, исправляя ошибки распознавания. Компьютер учился. За одно и сам тренировался говорить ровным тоном, без резких интонаций, с постоянным темпом и четко. Без этого никак. Чудес не бывает. Зато потом (а он был еще автомобилист и любил ездить по Европе на машине, ну и домой, в Англию на праздники), он спокойно "писал" (диктовал заготовки, мысли) научные статьи и прочие документы, находясь за рулем, чтобы не терять время. Ноутбук лежал на соседнем сиденье.

В 2000 году это выглядело как фантастический фильм. Однако больше половины успеха зависело от самого человека, его точности и дисциплины.

Сейчас системы уже немного умнее, и человеку уже не надо так сильно напрягаться и приспосабливаться к возможностям системы, но все равно есть ряд требований к речи, которые приходится соблюдать, ломая привычку. И все равно, незнакомые машине слова надо вводить вручную.

Так обстоят дела с английским и испанским. Остальные языки остаются на совести соответствующих стран.
И мы видим результат. Годного русского движка пока нет. Правда, есть проблемы, обусловленные самим языком: много окончаний и словоформ, нечеткое произнесение окончаний и безударных гласных, съедание частей слов. Этого нет в английском и испанском, они проще с точки зрения фонетики.

Date: 2013-12-09 07:12 pm (UTC)
From: [identity profile] shackih.livejournal.com
говорят, будто Siri подтянется к лидерам.

Date: 2013-12-09 07:26 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Надо пробовать.
Я как-то, чтобы не искать-качать-собирать, покупал у одного хлопца аудиокниги. (Если надо, дам контакты.)
Брал сразу примерно 70 ГБ в MP3 — у меня мама любит слушать книги, занимаясь домашними делами. Этого ей хватит лет на 5 слушать (уходит примерно 1 ГБ/мес, летом — 2 ГБ/мес).
Я взял у хлопца каталог, выбрали нужное, он подготовил мне архив, и я подъехал к нему с внешним жестким диском, чтобы записать.
Пришел к нему домой. А он слепой. От слова "полностью".

Он роет Инет, собирает архивы книг (причем много книг в начитке разными актерами, кому кто нравится), потом пишет людям под заказ и пополняет аудиотеку общества слепых (я в нее когда-то отдал все свои аудиокассеты). Это его приработок.

Мне было жутко интересно, как он пользуется компом. А вот пользуется. Системник стоит на балконе. В комнате только клавиатура на длинном шнуре, чтобы по всей комнате носить, колонки (большие, чтобы на всю комнату слышно) и микрофон. Всё. На компе установлена программа, которая голосом произносит все действия "на экране". (Мышь не используется, только клавиатура.) Он спокойно пользуется Интернетом, пишет диски, качает музыку, слушает сериалы (!), переписывается по Скайпу/Аське.

Есть инструменты для слепых. Надо поковырять.
Edited Date: 2013-12-09 07:27 pm (UTC)

Date: 2013-12-09 07:32 pm (UTC)
From: [identity profile] shackih.livejournal.com
Серж, я о Сири в iOS. Кста, куча прог там подобных: надиктовал и тебе текст для псто готов, в ЖЖ например

Интересно, а чо за интерфейс для клавы у человека? Даже ЮСБ, со шнурком более 5 метров, требует дополнительного "гемора".

а ваще - таким людям только респект.

Edited Date: 2013-12-09 07:36 pm (UTC)

Date: 2013-12-09 07:33 pm (UTC)
From: [identity profile] shackih.livejournal.com
З.Ы. катал большой камметн, а потом хуяк - радио Маяк и ты удалил... написал коротко

Date: 2013-12-09 07:42 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Ну, там и было примерно метра 4. И есть еще одна клава на ИК, если он хочет лежа слушать сериал. :)
Если надо книги, я дам контакт, у него огромная коллекция.
Я на перекрестках не подаю, но дать работу и оплатить ее таким людям всегда готов.

Date: 2013-12-09 07:43 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Глюк ЖЖ, Там как начинаются новости Майдана (вечером до блогиры до дома добираются), то весь, инет ложится, блин.

Date: 2013-12-09 07:45 pm (UTC)
From: [identity profile] shackih.livejournal.com
да нет, спасибо. Мне читать приятней.

Date: 2013-12-09 07:47 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Я тоже. А она любит в ушах, и вязать или рыбу чистить. :)

Date: 2013-12-09 08:02 pm (UTC)
From: [identity profile] shackih.livejournal.com
та вроде как нет. разные камменты были у тебя.... Хотя, пофиг в принципе. Суть я передал.

Date: 2013-12-09 08:14 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Я пост набирал, случайно зацепил Ctrl+Enter, оно ушло. Потом залипло. Я начал новый ответ, восстановил Лазаруксом набранное и дописал. Потом первую копию удалил. :) Тормозит ЖЖ именно на отправке постов и каментов туда.

Date: 2014-01-06 07:17 pm (UTC)
From: [identity profile] tanda-mif-chgk.livejournal.com
То есть, фильм так распознать пока не получится? Поскольку и интонации, и четкость может хромать... и громкость может меняться от шепота до выкрикивания команды в бою...

Date: 2014-01-06 07:26 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Угу. Там дикция должна быть как в программе "Время" эпохи СССР, тогда еще что-то схватит.
Нет рабочих систем для русского. Есть баловство типа управления компом (копировать, вставить, переименовать, свернуть окно)... Это можно и мышкой делать. А нормальная система должна внедряться во все другие программы, где требуется ввод текста (Excel, Word, AutoCAD, эл. словари, другие специальные программы для работы с текстами, т.е. работать в любом поле ввода) и полностью заменять клавиатурный ввод текста (а не команд! служебные команды при этом даются именно с клавиатуры для экономии времени). Есть старый "Горыныч" и потуги на новые версии, он слегка внедряется в некоторые программы, но ни хрена не распознает толком. Русски язык слишком сложный для этого.
Edited Date: 2014-01-06 07:30 pm (UTC)

Date: 2014-01-06 07:35 pm (UTC)
From: [identity profile] tanda-mif-chgk.livejournal.com
Ну, мне как раз для английского и надо, потому как я его не знаю, а любимого сериала с дубляжом в сети нет, только на языке оригинала, так что приходится моменты разговоров либо по фанфикам вылавливать, либо просить знающих английский знакомых записать наиболее интересные моменты, чтобы потом загнать их в переводчик (ну, или знакомых американцев, которые тоже фанаты, просить о том же. Но не могу же я их просить все 58 серий мне записать... а сценариев в сети только два есть, и те не полностью)
Жаль, что в данном случае не получится использовать такую программу...

Date: 2014-01-06 07:45 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Включите на YouTube любой художественный фильм и справа внизу включите субтитры. Если специально написанных субтитров для данного фильма нет, то включается движок распознавания. Посмотрите результат. Он обычно ужасен: что недослышал, то переврал, короче, праздничный набор слов. На каждый голос надо учить. А сейчас в кино тенденция говорить "естественно" — с кашей во рту. Уже давно актеры не говорят так четко, как в советских фильмах, нет уже той театральной школы дикции.
Edited Date: 2014-01-06 07:45 pm (UTC)

Date: 2014-01-06 07:47 pm (UTC)
From: [identity profile] tanda-mif-chgk.livejournal.com
Хм. Спасибо, попробую. Сериал старый, еще конца 60-х, так что неразборчиво там если и говорят,то или потому, что тихо, или в спешке. Главное, найти нужную кнопку :)

Date: 2014-01-06 07:54 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Субтитры на основе распознавания речи:


Цепочка созвучных слов без смысла. По бокам субтитров особые значки (дужки).

Субтитры, написанные человеком:


Нормальный текст со знаками препинания.

Отличить легко.
Edited Date: 2014-01-06 07:55 pm (UTC)

Date: 2014-01-06 07:57 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Старые фильмы почти все уже идут с нормальными "человеческими" субтитрами.

Date: 2014-01-06 07:58 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Можно поискать сценарии, субтитры и скрипты (это три разные вещи) в Итернете.
Edited Date: 2014-01-06 07:59 pm (UTC)

Date: 2014-01-06 08:00 pm (UTC)
From: [identity profile] tanda-mif-chgk.livejournal.com
Нету значка :( открыла себе, а там только в настройках скорость и еще можно размер проигрыывателя увеличить, и все :( Или я чего-то не вижу?
http://www.youtube.com/watch?v=3URrYnZS_Tw

Date: 2014-01-06 08:01 pm (UTC)
From: [identity profile] tanda-mif-chgk.livejournal.com
Да уж искала.

Date: 2014-01-06 08:05 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
В этой серии нет. А в другой (http://www.youtube.com/watch?v=MErnCa6Hoq0) есть распознавание.

Date: 2014-01-06 08:42 pm (UTC)
From: [identity profile] tanda-mif-chgk.livejournal.com
И как раз в той, где перевод практически не нужен, и так все понятно по ходу действия. А что неясно из действия - так "радий" звучит вполне четко и других знакомых слов достаточно :) Такое уж мое счастье. Хотя, может и в других сериях есть? Я их себе давно все скачала... надо будет проверить на ютубе, где еще есть хотя бы распознавание.

Profile

dr_trans: (Default)
dr_trans

December 2021

S M T W T F S
   1234
567891011
12131415161718
1920212223 2425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 30th, 2026 08:37 am
Powered by Dreamwidth Studios