[personal profile] borislvin
Уже много раз задавал вопросы о том, как справляться с pdf-файлами, и всегда получал ценную помощь. Попробую еще раз. Не знает ли кто, существует ли какая-нибудь возможность форматировать интервал между строчками в pdf-файле? Вопрос связан с тем, что почти все диссертации, выложенные онлайн, напечатаны через два интервала (похоже, что это общий мировой стандарт), поэтому при распечатывании получаются просто огромными. Если бы можно было переформатировать их через один интервал - использовать их стало бы намного проще.

Конечно, можно прогнать файл через какой-нибудь файнридер, перегнать в ворд и переформатировать уже там, но хотелось бы избежать этих трудоемких и искажающих операций, а сделать все как-нибудь внутри самого акробата или другой программы, работающей с pdf-файлами.

Шансы, что это возможно, кажутся мне очень маленькими, но чем черт не шутит...

Date: 2007-11-22 10:54 pm (UTC)
From: [identity profile] aptsvet.livejournal.com
Есть программа, кажется называется PdfToWord или в этом роде, которая совершает соответствующую трансформацию, а потом уже можно править. Но если в самом файле .pdf проставлены разные ограничения и коды, то может не получиться. Можно также выбрать орудие text и скопировать текст, но это трудоемко, и теряется весь формат.

Date: 2007-11-22 10:56 pm (UTC)
From: [identity profile] ex-tritopor.livejournal.com
А не проще ли экспортировать в *.txt, вставить в любой текстовый процессор и распечатать? В txt Акробат Ридер экспортирует, насколько я помню.

Date: 2007-11-22 11:27 pm (UTC)
From: [identity profile] vvagr.livejournal.com
Продвинутые последние версии акробатов и в ворд экспортируют. Даже если защита.

Date: 2007-11-23 12:11 am (UTC)
From: [identity profile] sorotokin.livejournal.com
А можно пример такого файла?

Date: 2007-11-23 06:27 am (UTC)
From: [identity profile] bbb.livejournal.com
Ну, скажем, http://etd.lsu.edu/docs/available/etd-11162005-210229/unrestricted/matthewschandlerthesis.pdf

Date: 2007-11-23 01:09 am (UTC)
From: [identity profile] riftsh.livejournal.com
Если pdf-файл содержит "renderable text": File -> Save as -> Word doc or XML
и потом форматировать (начиная с Acrobat 6)

Если pdf-файл сосканирован (почти все старые диссертации и многие новые): Document -> Paper capture и потом в Word.

Date: 2007-11-23 05:38 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
...второе и есть OCR %)

Date: 2007-11-23 06:00 am (UTC)
From: [identity profile] riftsh.livejournal.com
я этого ни разу не отрицал

Date: 2007-11-23 05:43 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
PDF-файл внутри себя ничего не знает ни про какие параграфы, а то и про строчки. Он нечто наподобие бумаги, на которой нарисованы буквы и прочие закорючки, притом без особенного различения букв, векторных картинок и растровых картинок, всё вперемешку. PDF-ы не слишком предназначены для редактирования -- максимум для вписывания чего-нибудь в предусмотренные пустые места. Они предназначены, наоборот, для максимально единообразного воспроизведения везде, без модификаций.

Поэтому переформатировать PDF обычно очень болезненно (и я их за это очень не люблю).

Мой вариант -- печатать по две уменьшенных страницы на лист A4 и тем вдвое сокращать носимые с собой пачки бумаги (при двусторонней печати -- и вчетверо).

Date: 2007-11-23 06:14 am (UTC)
From: [identity profile] bbb.livejournal.com
Я именно это и хочу сделать - распечатать по две страницы на лист на обеих сторонах. С большинством книг, выложенных в pdf, это вполне получается, если вручную убрать белые поля, что несложно. Но с диссертациями через два интервала такой способ печати приведет к драматическому уменьшению шрифта до нечитаемости. Если бы можно было переделать два интервала в один - все было бы удобнее. Но, как я понимаю, это невозможно без перевода pdf в doc, чего бы я хотел максимально избежать.

Date: 2007-11-23 07:17 am (UTC)
From: [identity profile] fima.livejournal.com
Имеется ввиду, печатать уменьшенные копии двух страниц на одном листе, например, вот так. Можно на одном листе печатать и больше, но может получится слишком мелко и тяжело читать. Если идея нравится, пришлите ваши pdf и я их сконвертирую, как это сделать самому под виндами я не знаю, а на маке это практически встроено в систему.

Date: 2007-11-23 07:58 am (UTC)
From: [identity profile] bbb.livejournal.com
Конечно, именно об этом я и говорю. Я именно так и распечатываю большинство pdf-ов, это называется "multiple pages per sheet", даже акробат ридер это делает с легкостью. Но если таким образом распечатывать тексты, набранные через два интервала, то при таком распечатывании буквы уменьшатся до нечитаемых. А вот если убрать пустые строки интервалов - все было бы намного удобнее.

Date: 2007-11-23 08:01 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
Это везде "встроено в систему" в том смысле, что в pdf можно печатать как на принтер, задав соотв. размещение нескольких страниц на листе.

Date: 2007-11-23 07:59 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
Боюсь, если с простой текстовой частью pdf-ов как-то можно расправляться, то стоит оказаться там формуле или диаграмме, и привет. А в диссертациях этого, поди, полно.

(Но мне проще, я и обычный-то текст печатаю себе размером в 7 пунктов, а то и в 6.)

Date: 2007-11-23 08:05 am (UTC)
From: [identity profile] bbb.livejournal.com
В диссертациях, которые меня интересуют, формул обычно мало :)))

Проблема в том, как именно расправиться, не переделывая файл в вордовский (то есть не корежа пагинацию, примечания, разбивку на строки и т.д, и т.п). Похоже, проблема не решается :(
From: [identity profile] freedom_of_sea.livejournal.com
и вставить куда хотите

Profile

borislvin

January 2026

S M T W T F S
    123
45 6 7 8 910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 31st, 2026 06:39 am
Powered by Dreamwidth Studios