borislvin ([personal profile] borislvin) wrote2016-06-22 06:51 pm

Архив советской дипломатии времен второй мировой войны

МИД сделал очень-очень большое дело - оцифровал и выложил в сеть огромный массив рассекреченных документов по международным отношениям СССР во время второй мировой войны. По их подсчетам, это "3900 архивных дел общим объемом более 370 тысяч листов".

Лежит это здесь - http://agk.mid.ru

Отсканированы и выложены архивные дела целиком, включая учетные листы, в которых отмечено, кому и когда они выдавались.

Одна проблема - сделано это не очень удобно. Посмотреть дело целиком не получается, можно только постранично.

Допустим, мы идем в раздел "Секретариат Молотова" (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova), видим список описей (с указанием, сколько дел в каждой описи), открываем опись 5 (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova/5) и видим список из первых десяти дел описи. Всего дел в этой описи 312, то есть чтобы ознакомиться со всем списком, необходимо пролистать 32 экрана. Допустим, нас интересует дело 34, то есть 6-й том записей бесед Молотова с иностранными представителями. Линк на него выводится на третьем экране (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova/5/?PAGEN_1=3). Кликнув на него, мы получаем всплывающую картинку первой страницы дела с возможностью навигации по другим страницам.

Мне кажется, было бы еще удобнее, если бы каждое из дел, помимо нынешнего формата, было сведено в отдельный pdf-файл с возможностью нормального просмотра.

Сделать это на самом деле не так уж и сложно, потому что имется прямые линки на картинки.

Скажем, линк на первую страницу нашего дела - http://agk.mid.ru/DATA/6_5_34/00000000.jpg

Соответственно, линк на последнюю страницу этого дела - http://agk.mid.ru/DATA/6_5_34/00000129.jpg

То есть в деле всего 129 страниц.

Имея список картинок, пронумерованных по порядку, сделать из них pdf-файлы очень просто. Но для этого надо, наверно, сперва скачать все эти картинки. Это, думаю, тоже не сложно с учетом прозрачной структуры сайта. Наверно, знающие люди могут сделать для этого соответствующий скрипт. Полученные файлы можно уже будет сортировать, разглядывать и читать в более удобном виде, несмотря на их значительное число.

Более того, полученные сборные файлы дел я бы с удовольствием передал архивистам МИДа, чтобы они их выложили на свой сайт.

Что думают знающие люди, сложно это или нет?

На всякий случай ставлю это под замок, чтобы не спровоцировать админов сайта на усложнение доступа.

[identity profile] tash-v.livejournal.com 2017-08-14 02:21 am (UTC)(link)
>По идее, они охватывают весь период за июнь-август - так сказать, встык. Но остается непонятным, что содержит некая папка 1 дела 18, да и существует ли она вообще?

Здесь несколько другая система. Сами дела разделены по принципу Фонд.Опись.Дело., но как отдельные элементы они же объединены в папки. Связано это, по-видимому, с тем, что самих дел много, но они содержат разное количество страниц, от нескольких страниц до пары сотен страниц. В результате, для более-мене компактного хранения пришлось дела поместить в общие папки. Поэтому нет папки 1 дела 18, но есть папка 1 с делами от 9 по 17, папка 2 с делами от 18 до 23, папка 3 с делами от 24 по 31, и т.д.

Почему же возникла такая система? ИМХО, дело в том, что перед нами не те единицы хранения, которые реально находятся в архиве МИД, а дела, которые были скомплектованы для последующего опубликования в печати или просто для открытого доступа. Этим, кстати, хорошо объясняется и факт наличия номера "первичного" дела, находящемся на большинстве аннотаций, помещенным на первую страницу обложки того или иного дела.

[identity profile] bbb.livejournal.com 2017-08-14 02:31 am (UTC)(link)
Спасибо, теперь понял. Я не задумывался над этим, потому что, признаюсь, вообще не обращал внимания на нумерацию папок, а только на фонд, опись и дело.

В этом смысле нумерацию по папкам в данном представлении можно вообще считать излишний.

В любом случае логика требовала бы, чтобы все это перечислялось в другом порядке - фонд, опись, папка, дело. То есть чтобы каждый последующий элемент рубрикации был частью более общего предыдущего.