dr_trans: (Default)
[personal profile] dr_trans
Пришел текст на перевод. Софтовые строки (сообщения, меню, и пр. интерфейс) объемом 30 тыс. слов.
Одним файлом в формате RTF. Уже с разметкой какой-то кошкой. Вот такое барахло:

  <Row>
    <Cell><Data ss:Type="String">Memory error while accessing scan file %s: %s - %s</Data></Cell>
   </Row>
   <Row>
    <Cell><Data ss:Type="String">Error accessing scan file %s: %s - %s</Data></Cell>
   </Row>

и т.д.

Нам не привыкать. Обычный отфильтрованный XML. Но задача была в другом. Работай, как хочешь, но сдать надо все равно RTF, еще и в билингве с разметкой Традоса, само собой одним файлом. Работать решил с товарищем, и этот файл надо как-то делить на двоих. Причем я хочу работать в SDLX, а он привык работать в OmegaТ.

Посидел, подумал, и пришел к такой цепочке:

Исходный .RTF
—> TWB: Pre-translate (copy source) —>
—> SDLX —> .ITD —>
—> SDLX Split —> 30 мелких .ITD по 1000 слов в каждом (формат для меня) —>
—> SDlL Exchange —> 30 мелких .TTX (формат для товарища).

Обратный путь видится таким:
.TTX —> SDlL Exchange —> .ITD —>
—> SDLX Split: Merge —> 30 мелких .ITD объединяются в один большой .ITD —>
—> SDLX: Create Translation —> .RTF (требуемая билингва).

Исходная разметка Традоса сохранена (исходник — скрытый, теги Традоса на местах).
Файл отлично чистится в TWB без единой ошибки. :)

Date: 2013-09-17 05:18 pm (UTC)
From: [identity profile] german-ukraine.livejournal.com
На самом деле, тут все очень просто. Надо.... надо... да забей на это, лучше пивка попей.

Date: 2013-09-17 05:20 pm (UTC)
From: [identity profile] shackih.livejournal.com
Янихуянепонел. Но можно былоб открыть в notepad++ и убрать нафиг из видимого код.

Date: 2013-09-17 05:54 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Да там легко. Пиво уже пью. Что-то простыл...

Date: 2013-09-17 05:55 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Не, есть специально обученные программы, которые извлекают переводимое и ставят на его место перевод. И ты вообще не видишь никакой код. И любые файлы открываются без необходимости иметь оригинальный софт, в котором файл был создан (так никакого софта не напасешься). Этот случай реально довольно простой.

Date: 2013-09-17 06:48 pm (UTC)
From: [identity profile] vatslav yehurnov (from livejournal.com)
Мущина, %s — строка, %d — вещественное число с двойной точностью, %c — адын символ ASCII. И куча других фиговин с процентом спереди еще есть, это из языка программирования С или ему подобного.

Нет чтоб разбить РТФ руцями на куски без наперстков и переливания из пустого в порожнее

Date: 2013-09-17 07:55 pm (UTC)
From: [identity profile] enru-translator.livejournal.com
Так, а подсчет слов как идет — по всему исходному RTF? То есть теги , и прочие считаются платными словами? Тогда да, неплохая схема работы.

Date: 2013-09-17 08:11 pm (UTC)
From: [identity profile] enru-translator.livejournal.com
ЖЖ съел часть текста... я имел в виду «теги < Row >, < Cell > и прочие».

Да, еще такой момент: инкапсуляция всего этого добра в RTF выглядит ненужной оболочкой и потенциально может создать проблемы. Я бы сохранил исходник как юникодный plain text, а на самом последнем этапе вернул RTF обратно.

Date: 2013-09-17 10:27 pm (UTC)
From: [identity profile] eugnat.livejournal.com
какая-то порнография. Товарища с ОмегаТ срочно подружить с Традосом...

Date: 2013-09-18 08:00 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Коллега, растеговка в РТФ бледно-серая, а заглушки красные. Там пучком. А в SDLX оно вообще превращается в теги, чтобы не париться. Ну и мы не ищем легких путей.

Date: 2013-09-18 08:01 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Не, теги не считаются. Там и без тегов 30 тыс. будет.
А сам текст просто и делается по тыще в час легко.

Date: 2013-09-18 08:02 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Этот номер не пройдет. У него Линукс головного мозга.

Date: 2013-09-18 08:03 am (UTC)
From: [identity profile] eugnat.livejournal.com
У меня заказчики обычно более вменяемые и присылают более-менее готовые к употреблению файлы.

А почему SDLX? Прога, конечно, удобная, но есть и недостатки.

Date: 2013-09-18 08:22 am (UTC)
From: [identity profile] dr-trans.livejournal.com
В Традосе неудобно, а в других кошках (МемоКу, например) сильно муторно создавать проект и втягивать файлы. Тут SDLX как раз оптимально идет по задачам.

Date: 2013-09-18 09:17 am (UTC)
From: [identity profile] troels.livejournal.com
Хе, точно такую мухотеть работаю счас, по банкоматам с функцией закрытого оборота наличности.
Фигачу в Деже х2, че я зря целый час потратил на семинар с рекламой, чтобы потом лицуху получить?:-)

Date: 2013-09-18 10:33 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Это, кстать, годный метод осваивать новый софт. Я тоже беру мелкие проекты, когда они неспешные, и делаю в чем-то новом. Не ум ею учиться впрок. Только в бою. :)

Date: 2013-09-18 10:34 am (UTC)
From: [identity profile] dr-trans.livejournal.com
В SDLX есть функция нарезки большого файла на куски. А мне это очень надо.

Date: 2013-09-18 10:35 am (UTC)
From: [identity profile] dr-trans.livejournal.com
У меня что-то про ДНК... сканирование хроматографии какой-то... еще не разобрался... Пока идет софтовая тема...

Date: 2013-09-18 10:57 pm (UTC)
From: [identity profile] vatslav yehurnov (from livejournal.com)
А, ну дык все равно не лишним будет знать, где подставляется цифирь, где строка, а где еще какая штука. Ох уж эта красно-серая растеговка, как вспомню, так вздрогну. Особенно если файлы под 50 мегабайт в лохопорте под Вордом лет 7 назад

Date: 2013-09-19 07:52 am (UTC)
From: [identity profile] almin.livejournal.com
индусский код ?

Date: 2013-09-19 08:31 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Так вот SDLX ее нормально превращает в свою разметку.

Date: 2013-09-19 08:32 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Не, почему? Обычный XML.

Date: 2013-09-19 08:48 am (UTC)

Profile

dr_trans: (Default)
dr_trans

December 2021

S M T W T F S
   1234
567891011
12131415161718
1920212223 2425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 29th, 2026 09:16 am
Powered by Dreamwidth Studios