Архив советской дипломатии времен второй мировой войны
МИД сделал очень-очень большое дело - оцифровал и выложил в сеть огромный массив рассекреченных документов по международным отношениям СССР во время второй мировой войны. По их подсчетам, это "3900 архивных дел общим объемом более 370 тысяч листов".
Лежит это здесь - http://agk.mid.ru
Отсканированы и выложены архивные дела целиком, включая учетные листы, в которых отмечено, кому и когда они выдавались.
Одна проблема - сделано это не очень удобно. Посмотреть дело целиком не получается, можно только постранично.
Допустим, мы идем в раздел "Секретариат Молотова" (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova), видим список описей (с указанием, сколько дел в каждой описи), открываем опись 5 (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova/5) и видим список из первых десяти дел описи. Всего дел в этой описи 312, то есть чтобы ознакомиться со всем списком, необходимо пролистать 32 экрана. Допустим, нас интересует дело 34, то есть 6-й том записей бесед Молотова с иностранными представителями. Линк на него выводится на третьем экране (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova/5/?PAGEN_1=3). Кликнув на него, мы получаем всплывающую картинку первой страницы дела с возможностью навигации по другим страницам.
Мне кажется, было бы еще удобнее, если бы каждое из дел, помимо нынешнего формата, было сведено в отдельный pdf-файл с возможностью нормального просмотра.
Сделать это на самом деле не так уж и сложно, потому что имется прямые линки на картинки.
Скажем, линк на первую страницу нашего дела - http://agk.mid.ru/DATA/6_5_34/00000000.jpg
Соответственно, линк на последнюю страницу этого дела - http://agk.mid.ru/DATA/6_5_34/00000129.jpg
То есть в деле всего 129 страниц.
Имея список картинок, пронумерованных по порядку, сделать из них pdf-файлы очень просто. Но для этого надо, наверно, сперва скачать все эти картинки. Это, думаю, тоже не сложно с учетом прозрачной структуры сайта. Наверно, знающие люди могут сделать для этого соответствующий скрипт. Полученные файлы можно уже будет сортировать, разглядывать и читать в более удобном виде, несмотря на их значительное число.
Более того, полученные сборные файлы дел я бы с удовольствием передал архивистам МИДа, чтобы они их выложили на свой сайт.
Что думают знающие люди, сложно это или нет?
На всякий случай ставлю это под замок, чтобы не спровоцировать админов сайта на усложнение доступа.
Лежит это здесь - http://agk.mid.ru
Отсканированы и выложены архивные дела целиком, включая учетные листы, в которых отмечено, кому и когда они выдавались.
Одна проблема - сделано это не очень удобно. Посмотреть дело целиком не получается, можно только постранично.
Допустим, мы идем в раздел "Секретариат Молотова" (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova), видим список описей (с указанием, сколько дел в каждой описи), открываем опись 5 (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova/5) и видим список из первых десяти дел описи. Всего дел в этой описи 312, то есть чтобы ознакомиться со всем списком, необходимо пролистать 32 экрана. Допустим, нас интересует дело 34, то есть 6-й том записей бесед Молотова с иностранными представителями. Линк на него выводится на третьем экране (http://agk.mid.ru/fonds/sekretariat-v-m-molotova/sekretariat-v-m-molotova/5/?PAGEN_1=3). Кликнув на него, мы получаем всплывающую картинку первой страницы дела с возможностью навигации по другим страницам.
Мне кажется, было бы еще удобнее, если бы каждое из дел, помимо нынешнего формата, было сведено в отдельный pdf-файл с возможностью нормального просмотра.
Сделать это на самом деле не так уж и сложно, потому что имется прямые линки на картинки.
Скажем, линк на первую страницу нашего дела - http://agk.mid.ru/DATA/6_5_34/00000000.jpg
Соответственно, линк на последнюю страницу этого дела - http://agk.mid.ru/DATA/6_5_34/00000129.jpg
То есть в деле всего 129 страниц.
Имея список картинок, пронумерованных по порядку, сделать из них pdf-файлы очень просто. Но для этого надо, наверно, сперва скачать все эти картинки. Это, думаю, тоже не сложно с учетом прозрачной структуры сайта. Наверно, знающие люди могут сделать для этого соответствующий скрипт. Полученные файлы можно уже будет сортировать, разглядывать и читать в более удобном виде, несмотря на их значительное число.
Более того, полученные сборные файлы дел я бы с удовольствием передал архивистам МИДа, чтобы они их выложили на свой сайт.
Что думают знающие люди, сложно это или нет?
На всякий случай ставлю это под замок, чтобы не спровоцировать админов сайта на усложнение доступа.
no subject
там задают первый и последний файл по именам, остальное высасывается само
Увы, названия не вспомню, хотя он у меня есть (и на руборде есть)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
если нужен один файл, то это - разумный вариант, т.к. позволяет на ходу управлять сжатием, например
или надо писать скрипт, который скачает файлы (это тоже несложно), и какой-нибудь программой соединять их в pdf пакетном режиме (и такое есть)
но тут есть тонкость - pdf получится очень большой, для первого же дела - 20-30 МБ, причем пережимать эти изображения не имеет смысла, они уже нормально сжаты
просматривать через сеть pdf такого размера, по-моему, не очень удобно
общий объем обработки по нынешним временам не критичен <100GB
если лучших специалистов не найдется - напиши мне в FB-мессенджере, попробую помочь ;-)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
т.е. для вышеприведенного примера это выглядело бы
6_5_34 129 output_file_name
имя файла необязательно, я могу использовать номер папки, например
упомянутый файл лежит здесь, гляньте, все ли так.
хттп//bit. ly/ 28RHSmx без пробелов
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
Для примера:
дело "Информация о США." (Фонд 129 Опись 25 Дело 12 Папка 35 01.06.1941 — 31.08.1941) и
дело "Приезд в СССР англо-американской делегации на Московскую конференцию 1. Маршрут, обслуживание, мероприятия по линии ВОКС и Интуриста, списки переводчиков, встреча. 2. Распоряжение СМ СССР № 10710-рс от 21.09.41г. об установке радиоприемников для членов делегаций" (Фонд 129 Опись 25 Дело 12 Папка 140 15.09.1941 — 04.10.1941)
имеют одинаковую адресацию, в связи с чем документы из первого упомянутого дела просто не отображаются.
Если да, то смогли ли вы получить эти документы каким-то "обходным путем" и при положительном ответе - каким именно?
(no subject)
(no subject)
(no subject)