[personal profile] borislvin
7 агуста dolboebАнтон возмущался:
Я не очень понимаю, как может Арбитражный суд в цифровую эпоху, в городе, где число пользователей Интернета превышает 5,5 миллионов, требовать бумажной копии текста, доступного в открытом доступе на официальном сайте газеты. Надеюсь, это фирменный идиотизм отечественной судебной машины, а не хитрая уловка для снятия дела с рассмотрения.
А теперь, после микро-расследования юзера [livejournal.com profile] hoz_subiekt, выходит, что суд-то был прав. Гарантии, что текст на официальном сайте газеты идентичен тексту ее бумажной версии, нет.

Некий аноним предлагает конспирологическую версию случившегося. С учетом того, что, как выяснилось, бумажная версия в целом сокращена по сравнению с электронной, версия о том, что там имеет место редактирование с точки зрения не только размера, но и содержания, не кажется совсем невероятной...

Date: 2008-08-24 07:18 pm (UTC)
From: [identity profile] bbb.livejournal.com
Кстати, никогда не задумывался, как они это делают. Неужели в лоб сканируют бумажные выпуски, игнорируя веб?

Date: 2008-08-24 10:10 pm (UTC)
From: [identity profile] riftsh.livejournal.com
Насколько я понимаю, многие из таких западных компаний пропустили этап сканирования полностью. Т.е., начинали они с ручного набора (до OCR), а потом перешли на файлы, получаемые от издателей (до интернета). Думаю, что для западных газет они (ЛексисНексис, Фактива и т.д.) используют издательские файлы, соответствующие бумажным версиям, что происходит с русскими газетами я не знаю.

Date: 2008-08-24 10:44 pm (UTC)
From: [identity profile] diesell.livejournal.com
И сканят, и получают файлы с верстки - в зависимости от наличия соответствующих договоров с редакциями. С веб-версиями не работают.

Рассказываю на примере public.ru (был у них на семинаре)

Integrum и иже с ними

Date: 2008-08-25 08:35 pm (UTC)
From: [identity profile] olexa.livejournal.com
Мне приходится плотно работать с Integrum'oм, база данных по центральным газетам. Так вот, материалы до 1995 - просто тихий ужас. Обрезанные заголовки, автоматически сгенерированные выжимки вместо полнотекстовой версии статей, примерно 30% просто отсутствуют (пришлось вручную пересматривать микрофильмы соотвествующих изданий).
Насчет бумажных версий. Не уверен, т.к. в моей выборке присутствуют и те и другие (т.е. две версии одной и той же статьи, но указано, что вторая вышла в эл. версии газеты). Для некоторых газет (в частности, Сегодня), эти версии еще и не идентичны, но пока (материал в процессе обработки), я не заметил "злого умысла", т.е. правка не носит явно выраженный идеологический характер. Оттого я был просто потрясен вашим примером.

Profile

borislvin

January 2026

S M T W T F S
    123
45 678910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 6th, 2026 01:28 pm
Powered by Dreamwidth Studios