dr_trans: (Default)
[personal profile] dr_trans
Сейчас переводил несколько DOCX-файлов. Там всего страниц по 12–15 в файле, текста не больше 2,5 тыс. слов, на каждой странице есть картинки, но размеры каждого файла по 70–90 МБ.

Задумался. Полез искать, кто же там сидит и занимает 4 стула вместо одного.

Обнаружил внутри DOCX огромные BIN-файлы. Это исходники внедренных объектов (чаще всего в форматах более старых версий Офиса, например, перетянутые из 2003), рабочие копии которых в файлах Офиса 2007–2010, как правило, лежат в папке media. И именно файлы из папки media используются для экрана и печати. Чаще всего это картинки в не самом удобном формате BMP дичайшего размера, которым в папке media соответствуют файлы с теми же именами в форматах JPG и PNG (нумерация объектов последовательная от начала файла или в порядке добавления в файл, если файл изменялся непоследовательно).





Если DOCX имеет размер 50–80 МБ, хотя там всего 15 страниц, но есть картинки, то скорее всего такой размер обусловлен наличием этих же картинок в формате BIN (размером по 5-15 МБ каждая) в папке embeddings. Удалил. Все файлы стали примерно по 10–12 МБ. Работоспособность не изменилась.

С другими форматами в этой папке надо быть осторожнее.

Еще почитать: тыц и дрыц.

Date: 2015-03-26 04:11 pm (UTC)
From: [identity profile] pent-racoon.livejournal.com
мекросовт как всегда песдетц...

Date: 2015-03-26 04:16 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
они стараюццо. это точно я там ↑ картинок досыпал
Edited Date: 2015-03-26 04:16 pm (UTC)

Date: 2015-03-27 02:19 pm (UTC)
From: [identity profile] egor-13.livejournal.com
Имел дело с подобными, но там просто тупо вставили картинок из фотоаппарата во все 10 мегапикселов. Пришлось их оттуда извлекать и уменьшать до типа 800х600, после чего файлу резко полегчало.

Date: 2015-03-27 03:46 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Такое у мня тоже было. Причем там были файлы с зеркалки, т.е. приличного веса, но на листе уменьшенные до 5х9 см. Только вынимать их не надо. В Ворде есть своя функция сжатия картинок глобально по всему файлу с удалением обрезанного и выбор DPI "для эл. почты", "для экрана" или "для печати".

Date: 2015-03-28 12:33 am (UTC)
From: [identity profile] egor-13.livejournal.com
Вручную проще, в смысле, лучше результат: как надо по числу пикселов и качеству сжатия, так и сделал.

Date: 2015-03-28 09:18 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Согласен. Но в папку media можно складывать картинки любого размера. Отображаемый размер задается в основном файле — document.xml.

Date: 2015-03-28 09:27 am (UTC)
From: [identity profile] egor-13.livejournal.com
Речь-то же не о размере отображаемом, а о фактическом размере изображения, внедренном в вордовский файл (и соответственно определяющем величину файла). Тут как ни крути, а что JPG, что другой формат - чем больше сама картинка, тем больше в ней байт.

Date: 2015-03-28 09:34 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Ну да. Но сам Ворд умеет сжимать картинки уже под заданный тобой размер. Мышкой на листе установил размер картинки (в сантиметрах), и Ворд сам ее пересчитает с разрешением 200 или 96 dpi.

Date: 2015-03-28 09:43 am (UTC)
From: [identity profile] egor-13.livejournal.com
Мне как-т пересчитывать в dpi лишняя морока - вот в пикселы НЕ на дюйм - самое то.

Date: 2015-03-28 10:02 am (UTC)
From: [identity profile] dr-trans.livejournal.com
"вот в пикселы НЕ на дюйм" -- это неправильно.

Танцевать надо от параметров печати. Если нам нужна фотография 9х13 см, то это будет 3,5"х5". Дальше смотрим возможности принтера. Допустим, 300 dpi, и готовим ему файл 1050х1500 пкс. Меньше — потеря четкости. Больше — избыточные данные, которые все равно усекаются, и опять потеря четкости. Так что твое 600х800 будет не пришей кобыле хвост.

А когда ресайзит Ворд, то он уже знает абсолютный размер, поэтому адекватно вычисляет необходимое количество пикселей.
Edited Date: 2015-03-28 10:03 am (UTC)

Date: 2015-03-28 10:14 am (UTC)
From: [identity profile] egor-13.livejournal.com
>>то он уже знает абсолютный размер,

... для ПЕЧАТИ. Многое ли из зафайленного для нее предназначено? (а еше меньше - заслуживает)

Date: 2015-03-28 10:24 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Вот поэтому там есть еще варианты:



Этого хватает с головой.
Edited Date: 2015-03-28 10:25 am (UTC)

Date: 2015-03-28 10:44 am (UTC)
From: [identity profile] egor-13.livejournal.com
Еще бы у них их не было. Но непонятно, правда, отчего оно называется сжатием, а не изменением размера.

Date: 2015-03-28 11:26 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Потому что "изменение размера" предполагает изменение линейных размеров. А сжатие -- это именно downgrading по разрешению.

Date: 2015-03-28 11:41 am (UTC)
From: [identity profile] egor-13.livejournal.com
"Сжатие" это уменьшение величины. Без поясняющих слов тоже не пригодно, тем более что исходно сжатие - это уплотнение, а применительно к файлам - изменение размера в байтах (а цифровые картинки тоже суть файлы). ("Изменение размера", впрочем, тоже)

Date: 2015-03-28 11:46 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Применительно к изображениям есть "сжатие с потерями" и "сжатие без потерь". У цифровых изображений нет понятия "размера" в смысле сантиметров, т.к. это поток битов. Сжатие с потерями — это и есть снижение разрешения за счет удаления лишних пикселей, например, по алгоритму Ланцоша.
Edited Date: 2015-03-28 11:47 am (UTC)

Date: 2015-03-28 11:50 am (UTC)
From: [identity profile] egor-13.livejournal.com
Зато есть размер - точнее, величина - в объеме информации, сиречь числе байтов.

Date: 2015-03-28 11:52 am (UTC)
From: [identity profile] egor-13.livejournal.com
... и эти потери как раз из-за этого сыра-бора чтоб байтов поменьше.

Date: 2015-03-28 11:52 am (UTC)
From: [identity profile] egor-13.livejournal.com
(штука-то это совершенно очевидная, но она делает неочевидным употребление понятий)

Date: 2015-03-28 11:57 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Которая никак не связана с "размером" картинки на листе бумаги. ;)

Date: 2015-03-28 11:59 am (UTC)
From: [identity profile] egor-13.livejournal.com
Как же не связана - при прочих равных (!) как раз связана напрямую.

Profile

dr_trans: (Default)
dr_trans

December 2021

S M T W T F S
   1234
567891011
12131415161718
1920212223 2425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 29th, 2026 04:14 am
Powered by Dreamwidth Studios