[personal profile] borislvin
Оказывается, они ввели новую практику в отношении редких и рассыпающихся книг. Если их запрашивают по межбиблиотечному абонементу (мне-то казалось, что Библиотека Конгресса вообще не высылает книги по межбибу, но вот, получается, ошибался) - она теперь их не высылает, а сканирует, переводит в pdf и выставляет на специальной странице - http://lcweb.loc.gov/rr/loan/illscanhome.html

Оттуда эту книгу могут скачать все желающие, а по истечении полугода линк на нее с этой страницы удаляется - но не уничтожается вообще, а переносится в общую каталожную запись по данной книге. То есть узнать, какие именно книги доступны онлайн, будет не так-то просто. Правда, можно сделать общий поиск по каталогу - например, с поиском слова "pdf". Пока такой поиск выдал чуть больше трех тысяч записей, причем часть из них, понятно, представляют собой не отсканированные книги, а издания, где сочетание букв "pdf" просто входит в заголовок.

Нет сомнений, что рано или поздно они догадаются соорудить общий каталог дигитализированных изданий, но пока его нет.

Интересно, что этот подход полностью demand-driven - то есть сканируется только то, что просят по межбиблиотечному абонементу. Соответственно, пока, вроде, доминируют старинные издания по истории США. Хотя уже вот можно скачать книгу генерала Пронина "Последние дни царской ставки" (Белград, 1939) - http://hdl.loc.gov/loc.gdc/scd0001.20020312001po.1

Правда, книга, хоть размером всего в 88 страниц, получилась у них тридцатимегабайтовой...

Date: 2002-05-19 01:20 am (UTC)
From: [identity profile] ella-p.livejournal.com
Гнусный pdf. Мало того, что любая брошюрка весит неимоверные мегабайты, так там еще шрифты менять нельзя. В результате у меня не распечатывается половина файлов в этом формате. Читать же его с экрана тоже на редкость противно. Из каких соображений им пользуются - ума не приложу. Неужели только ради того, чтобы нельзя было скопировать текст через копи/паст?

Date: 2002-05-19 01:38 am (UTC)
From: [identity profile] ex-udod985.livejournal.com
pdf поддается обузданию вполне,
вполть до copy-past. Под windows для этого нужен полный Аcrobat, наверно.

Date: 2002-05-19 01:47 am (UTC)
From: [identity profile] ella-p.livejournal.com
Простите мою серость, а что такое полный Аcrobat? У меня стоит Аcrobat Reader, скачанный из интернета, с официального сайта. Но он только показывает странички. Мне очень мешает, что невозможно преобразовать это дело в нормальный текст (скажем когда он в три колонки), повыкидывать картинки, которые сажают принтер, поменять шрифты.

Date: 2002-05-19 02:25 am (UTC)
From: [identity profile] ex-udod985.livejournal.com
Acrobat-reader -- это свободный кусочек
(с нарочно ограниченными возможностями)
дорогой системы Adobe Acrobat http://www.adobe.com/products/acrobat/main.html
обработки текстов в postscript и pdf.
К ней приложены разнее конверторы и, в целом, можно делать все (и переформатировать). (Конечно, если текст снят
как битовая картинка с ним много не сделаешь,
но тогда его можно спасти в виде пригодном для программ распознающих текст на картинке).
Эта штука (полный Acrobat) встречается на дисках в переходах, конечно. Я - юниксоид и пользуюсь свободными
заменителями (они не все умеют, но текст извлекают).
Да, .pdf может быть защищен и тогда, не зная пароля, его не преобразовать с помошью
Acrobat'a.

Date: 2002-05-19 02:46 am (UTC)
From: [identity profile] ella-p.livejournal.com
Спасибо Вам большое за просвещение. Вот теперь буду знать. Интересно будет проверить, библиотечные тексты в основном под паролями? Узнаю - расскажу.

Date: 2002-05-19 12:38 pm (UTC)
From: [identity profile] levg.livejournal.com
Пользуются потому, что это наилучший из существующих (безумно при этом далекий от идеала) формат позволяющий детально описывать и корректно передавать между аппаратными платформами и устройствами форматирование документа. Плюс бесплатная программа для чтения существующая для всех мало-мальски распространенных платформ. Плюс вес и авторитет Adobe и огормные средства вложенные этой фирмой в его продвижение на рынке. Плюс открытая документация. Плюс развитые средства для создания/обработки. Вобщем причин много.

Это теория однако. Практических замечаний два:
1)правильно изготовленный - весьма компактен.
2)Reader прекрасно умеет делать сору (a потом, понятно paste куда пожелаете). Нажмите жирную "T" в toolbar.

Date: 2002-05-19 12:57 pm (UTC)
From: [identity profile] ella-p.livejournal.com
Огромное спасибо! Ага, теперь можно постранично копировать в Word.
Ламер я, конечно. Давно бы ртфм.

Date: 2002-05-19 01:46 am (UTC)
From: [identity profile] ex-udod985.livejournal.com
Замечательно делают старые
журналы на www.jstor.org -- с поиском по тексту
-- но пускают только по большому блату.

Date: 2002-05-20 06:19 am (UTC)
From: [identity profile] bbb.livejournal.com
Э, мест, где оцифровано, но нужен блат - предостаточно... Главное - где блат взять?

Правда, есть всякие обходные пути. Например, вот такое место - http://www.ciaonet.org - содержит множество книг по международной тематике, выложенных онлайн (кстати - не pdf, а простой html), и дает trial period сроком на месяц. А за месяц можно выкачать немало...

Бывают и дырки. Например, несколько месяцев назад случайно обнаружил такую дырку на сайте ун-та штата Вашингтон (http://www.lib.washington.edu/subject/RussiaEastEurope/dr/eljnl.html) - и скачал некоторое количество Canadian Slavonic Papers. Сейчас пошел посмотреть - ан дырка уже заделана.

Date: 2002-05-19 12:40 pm (UTC)
From: [identity profile] levg.livejournal.com
Такой размер видимо потому, что не могут или не хотят делать OCR, а заворачивают страницы в PDF просто картинками.

Date: 2002-05-20 06:07 am (UTC)
From: [identity profile] bbb.livejournal.com
Конечно. Просто я не проверял, связано ли это с тем, что речь в данном случае идет о РУССКОМ тексте (может, они не умеют оцифровывать кириллицу), или это общая политика.

Date: 2002-05-26 10:30 am (UTC)
From: [identity profile] miram.livejournal.com
IMHO политика, конечно. И правильная. Распознавать, а потом вычитывать -- непременно внесешь искажения. А картинка честно передает все закорючки оригинала, для которых, может, и юникода не хватит.

Date: 2002-05-26 02:57 pm (UTC)
From: [identity profile] bbb.livejournal.com
Да, скорее всего, так и есть. И для Библиотеки Конгресса это правильно - аутентичность превыше всего.

Profile

borislvin

January 2026

S M T W T F S
    123
45 6 7 8 910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 17th, 2026 08:45 pm
Powered by Dreamwidth Studios