Бабий Алексей Андреевич, председатель Красноярского общества «Мемориал»
Начиная с влиятельной работы Маргарет Хедстром [1], в литературе неоднократно отмечалась недолговечность цифровых материалов по сравнению с традиционными печатными материалами, необходимость выделения ресурсов и разработки программы сохранения электронных архивов [2, 3].
В выступлении на конференции на примере создания электронного архива Красноярского общества “Мемориал” будет показано, что помимо известных технологий поддержки цифровых исторических архивов необходимо создать институциональную структуру , которая могла бы агрегировать цифровые данные, способствовать их хранению и конвертации на другие платформы.
Красноярское общество «Мемориал» с момента своего создания в 1988 году активно использовало информационные технологии. Первая реляционная база данных о репрессированных была создана в 1989 году на ДВК-2. В начале девяностых была создана более совершенная база данных на IBM PC, которая модифицируется, пополняется и используется до сих пор. В 1998 году был запущен сайт Красноярского общества «Мемориал» - первый сайт о политических репрессиях, и он также до сих пор активно используется и пополняется. В это же время стал формироваться электронный архив, который теперь полностью находится в «облаке».
Задача сегодняшнего дня – тотальная оцифровка «бумажного» архива. Некоторые фонды мемориальского архива уже полностью оцифрованы. К концу 2021 года «бумажный» архив полностью уйдёт в «облако». Члены организации находятся в едином информационном пространстве (облачный архив, сайт, средства коммуникации). Консультационная и прочая работа идёт в основном по электронной почте, в социальных сетях и мессенджерах. «Физические» посетители крайне редки. В организации работают «виртуальные» волонтеры, которые также занимаются обработкой материалов из «облака».
Основная задача на будущее: создание на базе сайта Красноярского общества «Мемориал» электронной энциклопедии о политических репрессиях в Красноярском крае. Частично эта задача реализована уже сейчас.
Поскольку электронный архив – результат более чем тридцатилетней работы, вопрос сохранения его принципиально важен. Сейчас архив надёжно бэкапируется и синхронизируется. Однако хотелось бы, чтобы была государственная институция, которая могла принимать на хранение электронные архивы.
База данных о репрессированных первоначально создавалась с утилитарной целью: заменить бумажную картотеку Красноярского «Мемориала», которая к середине девяностых насчитывала десятки тысяч карточек, занимала много места и была неудобна в работе. Сейчас в базе данных сведения более чем о 200 000 репрессированных, связанных с Красноярским краем. Это примерно 20% от общего количества.
Следует отметить важное отличие нашей базы данных от других: они, как правило, создавались на основе однородных документов – учётных карточек заключенных, анкет арестованных в архивно-следственных делах и т.д. Их структура повторяла структуру этого документа, а сама база данных описывала людей, подвергшихся конкретному типу репрессии. Мы же собирали разрозненную информацию из различных источников – от интервью до архивных документов. Мы изначально предполагали, что человек может неоднократно подвергаться различным типам репрессий. Эта задача намного сложнее.
Мы имеем дело с неструктурированной и неформализованной информацией. Был соблазн всю информацию кроме «установочных данных» со-хранять обычным текстом. Однако мы попытались формализовать предметную область, чтобы создать реляционную модель. Насколько нам известно, это была первая попытка такого рода. Не все решения оказались удачными, не по всем пунктам получилось нормализовать реляционные отношения, но в целом это было эффективное и действующее решение, которое потом легло в основу проекта «Возвращенные имена» - Единый банк данных о репрессированных в СССР . (Международный проект создания единого электронного банка данных жертв политических репрессий «Возвращенные имена»: Сборник матери-алов по итогам первого этапа проекта. 2000–2003 годы / Составители: В. М. Кириллов, Л. В. Ковальчук. — Нижний Тагил, 2003. — 306 с., ил)
База данных успешно используется в повседневной работе общества, а в последнее время применяется для исследований. В частности, с помощью неё было доказано, что приговоры особой тройки по Красноярскому краю по приказу НКВД № 00606 не были приведены в исполнение. Около 2000 человек, числящихся по отчетам расстрелянными, после ноября 1938 г. были освобождены или отправлены в лагерь. Таким образом, в Красноярском крае количество расстрелянных в ходе национальных операций НКВД почти на 30% ниже, чем это было установлено по отчётам в НКВД СССР . (Бабий А.А. Польская операция НКВД в Красноярском крае — Сибирь Многонациональная. Материалы Сибирского исторического форума. Красноярск, 24-25 октября 2018 г.)
Большое внимание уделяется надёжности. База данных с компьютера оператора «налету» синхронизируется с «облаком». Кроме того, имеется 12 ежемесячных копий базы данных в «облаке».
Сайт Красноярского общества «Мемориал» был создан в 1998 году в соответствии с технологиями того времени: не использовались CMS (их ещё не было) и какие-либо скрипты. Сайт построен и до сих пор функционирует исключительно на «плоском» HTML. Это важный момент: если обычные сайты создаются для нужд сегодняшнего дня и постоянно поддерживаются, в том числе переводятся на новые платформы, мы рассчитываем на то, что наш сайт переживет нас самих, а потому должен поддерживаться с минимальными усилиями и легко конвертироваться при кардинальных сменах технологий. Это хорошо согласуется с литературой в области сохранности цифровых ресурсов, где утверждается, что “скорость изменения в компьютерных технологиях такова, что информация может стать недоступной в течение одного десятилетия” [4]. Поэтому принципиально не используются никакие платформы (по определению недолговечные) кроме стандарта HTML. Автор, работавший в сфере IT почти полвека, пережил множество смен оборудования, операционных систем и приложений, потерял на этом пути (а если спас, то не без труда) много накопленных данных. Не исключено, что и стандарт HTML перестанет существовать, как и интернет в его нынешнем понимании, но простое устройство сайта позволит автоматически конвертировать его. Казалось бы, этот подход архаичен, но он оказывается самым надёжным. Сайт – это просто папка. Достаточно скопировать эту папку на FTP и «прописать» DNS, и сайт становится доступен. Им можно пользоваться даже при отсутствии интернета, на локальном компьютере. Это решает и проблему надёжности. Кроме папки на сервере, которая бэкапируется хостером, имеется копия сайта на локальном компьютере и копия в «облаке».
В отличие от базы данных, созданной только для хранения сведений о конкретных персонах, сайт предназначен для хранения и представления полной информации по теме. Это полнотекстовые документы, фото-и видео-материалы, сканы документов и т.д. По сути, весь электронный архив постепенно представляется на сайте, кроме тех документов, которые содержат персональные данные или защищены авторским правом.
Следует отметить, что материалы с других сайтов копируются на наш сайт. Сайты исчезают, реорганизуются и, как правило, ссылка через несколько лет становится «битой». Надёжнее собрать сведения по теме на одном сайте. Контекстный поиск по сайту даёт намного меньше «мусора», чем поиск в интернете в целом.
Контекстный поиск не единственный инструмент. Материалы сайта «привязываются» как к списку репрессированных (мы можем, найдя человека в списке, получить активные ссылки на все материалы о нём), так и к раз-личным рубрикаторам (зайдя на страницу Краслага, мы получаем активные ссылки на все материалы на сайте, относящиеся к Краслагу).
И, наконец, высший уровень сайта – энциклопедия. Например, на странице Краслага появится, кроме перечня ссылок, обзорная статья о Краслаге, написанная на основе материалов сайта, с активными ссылками из текста на соответствующие материалы сайта. Пока это реализовано только для раздела «Ссылка», где дана классификация ссыльных потоков в Красноярском крае и для каждого ссыльного потока написана небольшая обзорная статья. Но предполагается сделать это для всех разделов.
Таким образом, сайт является своеобразной базой знаний о репрессиях в Красноярском крае, позволяющей при минимальной формализации получать необходимые сведения по теме. Сейчас на сайте свыше 15 000 материалов на трёх языках.
Облачный архив (около терабайта) содержит все оцифрованные и полученные в электронном виде материалы. Он состоит из двух частей: собственно архива и «свалки». В «свалку» регулярно помещаются новые оцифрованные или пришедшие в цифровом виде материалы. Постоянно идёт работа по разбору это «свалки». Часть материалов размещается на сайте, после чего удаляется из архива. Часть помещается и на сайт, и в архив. Часть – только в архив. Также в облачном архиве сохраняются актуальные копии сайта и базы данных.
Собственно архив – это просто папки в «облаке», в которые складыва-ются файлы. Например, папка «Люди» - это 7 123 фотографий репрессированных, «Документы» - это сканы 41320 листов документов, в том числе 15087 листов документов, относящихся к конкретным людям, «Объекты» - это 3790 сканов и фотографий, относящихся к лагерям, памятникам и т.д.
Облачный архив решает две стратегические задачи.
1. Сохранность. В отличие от бумажного архива, который может в одночасье погибнуть от природных, хозяйственных или политических причин, электронный архив регулярно бэкапируется, а также синхронизируется на несколько компьютеров, находящихся в разных географических точках.
2. Доступность. Все «мемориальцы» имеют доступ к облачному архиву и используют его в своей работе. Доступ к отдельным папкам даётся при необходимости коллегам, СМИ, волонтерам и т.д. Всё это резко снижа-ет затраты на коммуникации.
Материалы, собранные из различных источников и объединенные рубрикаторами, дают «объёмный взгляд». В воспоминаниях женщины, арестованной в начале пятидесятых, обнаруживается глава о монашках-староверах, с которыми она оказалась в одной камере, и сведения о них подтверждаются материалами следственного дела в другом разделе сайта. Крестьяне, по документам районного архива сбежавшие от раскулачивания, обнаруживаются в другом районе в воспоминаниях жителей и в архивно-следственном деле. Постепенно из этих мозаичных фрагментов складывается общая картина. Собственно, это и есть конечная цель нашей работы: оставить после себя ресурс, содержащий полный комплект сведений о политических репрессиях в Красноярском крае, удобный в работе, защищенный от катаклизмов, легко обслуживаемый и автоматически конвертирующийся. Мы надеемся, что этот ресурс окажется полезным для исследователей.
Сейчас электронный архив Красноярского Мемориала» поддерживается на должном уровне. Однако мы обеспокоены его судьбой в будущем. Нет государственной службы, принимающей на хранение электронные архивы. Такая служба должна решать задачи сохранения и конвертации данных. Как уже отмечалось, наш сайт сделан с учетом легкой конвертации, архив также построен максимально просто, однако с базой данных это не так. Она была первоначально реализована на СУБД Paradox, однако вскоре Paradox перестал поддерживаться новыми ОС, пришлось конвертировать базу данных в Access, с потерей оболочки. Возможно, со временем Access постигнет та же участь. Разумеется, это не только проблема нашей базы данных, это проблема всех электронных архивов, построенных с использованием приложений (СУБД, интернет-платформы и и т.д.) 3.
Необходимо создать государственный электронный архив для хранения архивов государственных и негосударственных организаций, а также личных электронных архивов. Помимо задач учёта, хранения и доступа, необходимо решить задачу конвертации на новые платформы.
Литература
1. Hedstrom, M. (1998). Digital preservation: A time bomb for digital libraries.
Computers and the Humanities, 31, 189-202.
2. Rosenzweig, R. (2003). Scarcity or abundance: Preserving the past in a
digital era. American Historical Review, 108(3), 735-762.
3. Higgins, S. (2011). Digital curation: The emergence of a new discipline. The
In-ternational Journal of Digital Curation, 6(2), 78–88.
4. Jackson, J. (2011), “Digital longevity: the lifespan of digital files”,
Digital Preser-vation Coalition. York,
www.dpconline.org/events/previous-events/306-digital-longevity
EADH2021 «Междисциплинарные перспективы данных»
2-я Международная конференция Европейской ассоциации цифровых гуманитарных наук
(EADH) - Красноярск (Россия) 21-25 сентября 2021 г