По договору № ВИ-09/ff Красноярское общество «Мемориал» должно было организовать работу по заполнению баз данных в рамках проекта «Возвращённые имена» в Красноярске.
Красноярское общество Мемориал продолжает ввод данных из Фонда прекращенных дел архива РУ ФСБ по Красноярскому краю, а также других, открытых, источников. Этой работой, как и предполагалось, занимается С. Б. Сиротинина. В рамках второй части выполнения Проекта введено 2601 записей (в рамках первой части проекта 2836, итого 5437), еще несколько тысяч записей проверено, уточнено и откорректировано. В базе данных Красноярского общества «Мемориал» (далее БД КО) содержатся сведения о репрессированных, полученные из различных источников, включая устные. Для помещения в БДВИ отобран однородный массив записей, в качестве источника послужили протоколы троек УНКВД по Красноярскому краю в 1937-1938 гг.
К сожалению, не удалось отработать ввод данных в унифицированной программе ввода, хотя опытная эксплуатация ее предполагалась именно в Красноярске. Причина в том, что БД КО изначально была рассчитана на многие типы репрессий, многие типы источников (в том числе и неофициальные) и на отслеживание всей судьбы репрессированного. Собственно говоря, в БД КО судьба репрессированного человека как бы постепенно «проявлялась» - начиная с упоминаний в прессе и результатов устных опросов и заканчивая подтверждением и уточнением сведений из официальных источников. В частности, материалы, полученные в 2002 г. из протоколов троек, в значительной мере пересекались с уже известными сведениями о конкретных репрессированных. Однако в БДКО содержались и другие данные об этих репрессированных – например, лагерная история, сведения о реабилитации, предыдущих и последующих репрессиях.
Программа же ввода в 2002 году поддерживала только информацию из архивно-следственных дел и, если импортировать данные из БДКО в программу ввода (и в дальнейшем работать именно с программой ввода), значительная часть уже введенной информации была бы утеряна. Если же осуществлять ввод данных в программе ввода, то, во-первых, часть информации невозможно было бы разместить, а во-вторых, в будущем встала бы нешуточная задача соединения этих двух баз данных в единое целое.
Поэтому мы продолжили ввод данных в БД КО, с тем, чтобы, как только программа ввода будет поддерживать все требуемые категории репрессированных, осуществить импорт базы данных в программу ввода и далее уже работать с программой ввода. Кроме того, в целях отладки функционирования БДВИ и совместимости структуры БД программы ввода, БДВИ и БД КО, в 2002 г. БД КО была импортирована в БДВИ. Импорт прошел успешно, хотя, конечно, некоторая часть данных была потеряна из-за того, что пилотная версия БДВИ несколько уже по охвату типов репрессий, чем БДКО.
Таким образом, несмотря на то, что первоначальные планы претерпели изменения, был обработан важный массив документов, получены, введены и выверены сведения о более чем 5000 репрессированных, а также отработан импорт данных из БД КО в БДВИ.
В приложении даны образцы отчета из базы данных Красноярского общества Мемориал.
Заполнение базы данных по Норильлагу активно поддержано ГУВД Красноярского края, поскольку картотека Норильлага находится в плачевном состоянии (она дважды была затоплена в результате прорыва системы отопления, а сейчас интенсивно используется для запросов и края карточек «обтрепываются»). Оцифровка архива – единственный способ спасти информацию, и делать это нужно срочно, потому что мы рискуем потерять единственный оставшийся источник информации о заключенных Норильлага (личные дела заключенных Норильлага практически полностью уничтожены в 50-х годах, да и сама картотека существует уже далеко не в полном виде). Это в основном карточки формы 2, гораздо реже карточки формы 1 и, совсем редкие (нам на 37000 карточек встретилось всего несколько штук) карточки формы 3.
Ввод данных ведется силами работников ИЦ ГУВД Красноярского края, координирует их работу сотрудник ИЦ ГУВД Т.Л.Моисеева, методическое руководство осуществляет Красноярское общество «Мемориал».
Установлено два компьютера в архиве ГУВД Красноярского края (один приобретен в рамках договора ВИ-09/ff, второй принадлежит обществу Мемориал). Таким образом, удалось увеличить интенсивность ввода вдвое. Кроме того, в октябре-декабре 2002 г. нам с ГУВД, используя собственные ресурсы, удалось подключить к работе еще 9 операторов.
По состоянию на февраль 2002 г. введено 37 882 карточек, включая 6235 карточек, введенных на первом этапе выполнения проекта. Таким образом, введено уже свыше 10% от 274000 имеющихся карточек.
При работе с БД Норильлага мы встретились с рядом трудностей, видимо, типичных для обработки картотек заключенных, поэтому на них стоит остановиться подробнее.
Проблема ветхости. Многие карточки от постоянного употребления «обмахрились», их края уже обрезали. Таким образом, часть информации, находившаяся «на краю карточки», утеряно безвозвратно. Как правило, это был номер личного дела заключенного (сверху) или особые примечания (снизу). Потеря номеров личных дел была не слишком существенной (поскольку самих дел уже нет, номер личного дела нес разве что некоторую информацию об общем количестве заключенных). Особые же примечания, судя по сохранившимся карточкам, нередко имели особую ценность как источник важной, но неформализуемой информации.
Кроме того, часть карточек пострадала при прорыве отопления, и карточки были сильно размыты, так что не всегда удавалось восстановить даже ФИО заключенного. Это сильно снижало темп ввода карточек. Мы пытались перенести в БД максимум сохранившейся информации. Так, например, если удавалось разобрать часть даты, то вводилась эта часть, а остальная часть даты заменялась звездочками. Были случаи, когда даже фамилия была частично или полностью смыта – в этом случае мы максимально восстанавливали ФИО исходя из расположения карточки. Например, если и перед размытой карточкой, и после нее были карточки с фамилией «Антоненко», мы предполагали, что и на этой карточке была указана фамилия «Антоненко». Разумеется, в этом случае соответствующие поля и сама карточка помечалась как содержащая возможные неточности.
Проблема доступа. Первоначально предполагалось, что ввод данных будет осуществляться членами КО «Мемориал». Однако они, по закону, не могут быть допущены к работе с картотекой Норильлага, поскольку в картотеке содержатся данные не только о политических заключенных, но и об уголовниках и «бытовиках» (да и политические заключенные далеко не все реабилитированы; об этой проблеме подробнее см. ниже). Таким образом, ввод данных могут осуществлять только сотрудники ГУВД, имеющие разрешение на доступ к информации. Оказалось, что это обстоятельство не помешало работе, а, наоборот, помогло: сотрудники ГУВД, не один год работавшие с этой и другими аналогичными картотеками, прекрасно владели темой, что помогло избежать типичных ошибок при набивке данных. То есть, фактически, операторы и архивисты совмещались в одном лице.
Проблема реабилитации. Следует отметить изменение первоначального плана ввода: мы рассчитывали вводить данные только о политических заключенных, однако вводятся все карточки (это примерно в два раза больше). Хотя это уменьшает скорость ввода нужной нам категории (политических заключенных), это решение важно с «политической» точки зрения: такая схема ввода обеспечила нам режим наибольшего благоприятствования в архиве ГУВД.
С другой стороны, оператор зачастую не в состоянии самостоятельно принять решение, является ли данный заключенный политическим. Во время «конвейерного» ввода данных, когда перед оператором стоит задача максимально точного и полного перенесения информации из карточки в компьютер, и ему и без того приходится принимать массу решений, было бы неправильным заставлять его еще и отделять «политиков» от «неполитиков», даже с учетом того, что в данном случае квалификация операторов (в смысле владения темой) значительно выше средней.
Но, даже если затем «политики» выделены в отдельный список, это еще не означает, что данные могут быть переданы за пределы архива ГУВД (в частности, помещены в БДВИ) и к ним могут иметь доступ граждане, не имеющие специального разрешения. Дело в том, что далеко не все заключенные, осужденные по политическим мотивам, в данный момент реабилитированы.
Эта проблема практически не возникает при вводе и передаче материалов фонда прекращенных дел, поскольку в этом фонде находится информация о реабилитированных гражданах, и она может быть опубликована без нарушения законодательства.
Эта проблема практически не возникает при вводе и передаче материалов о трудармейцах, поскольку она реабилитированы автоматически.
Заключенные же (тем более, заключенные обычного, не особого лагеря) весьма разнородны. Там есть и уголовники, и «бытовики», и собственно политические заключенные, которые, в свою очередь, тоже разбиваются на ряд категорий, не столь очевидных, как хотелось бы. Проблемы, вытекающие из этого положения, носят вполне практический характер: чтобы не нарушить закон (а по закону, напомним, может быть опубликована информация только о реабилитированных гражданах), нужно очень четко разделить категории и опубликовать только информацию о реабилитированных гражданах.
После консультаций с краевой прокуратурой, руководством ИЦ ГУВД, специалистами, мы пришли к выводу, что проблему надо решать поэтапно.
1.Выделить из массива заключенных тех, кто был осужден по статьям 58-10, 58-11 РСФСР или соответствующим статьям других союзных республик (54-10, 54-11 УССР; 72, 76 БССР; 72, 73 Аз.ССР; 67, 68 Арм.ССР; 54-10, 54-11 Туркм. ССР; 66, 67 Уз.ССР: 61, 62 Тадж.ССР), а также имеющих формулировки обвинения АСА, КРА, и религиозные типа УАСБО (Участие в антисоветской баптистской организации).
Все они должны были быть реабилитированы автоматически, в соответствии со ст.5 Закона о реабилитации:
Статья 5. Признаются не содержащими общественной опасности нижеперечисленные деяния и реабилитируются независимо от фактической обоснованности обвинения лица, осужденные за:
Информация по этим категориям заключенных помещается в БДВИ без проверки на «реабилитированность». Таковых во введенных данных оказалось 3118 из 37 882. Именно эти записи и будут перенесены в БДВИ уже в апреле 2003 г.
2. Выделить из массива заключенных тех, кто был осужден по другим политическим обвинениям, которые, однако, не предполагают «автоматической» реабилитации, т.е. остальные части статьи 58 и соответствующих статей республик (см. приложение 1), а также литеры (см. приложение 2).
Статья 3. Подлежат реабилитации лица, которые по политическим мотивам были:
По этим категориям заключенных делаются запросы в регионы, в которых они были осуждены, и выясняется, реабилитированы они или нет. В случае реабилитации информация о заключенном передается в БДВИ.
3. Оставшиеся заключенные не подлежат реабилитации в соответствии с Законом о реабилитации, запросы по ним не делаются, а информация о них в БДВИ не передается.
Этот процесс уже начат: из 37 882 введенных карточек выделены 3118 записей о заключенных, которые должны были реабилитироваться «автоматически». Эти данные выверены и подготовлены к помещению в БДВИ. Начата работа по выделению второй группы заключенных и разрабатывается программное обеспечение для автоматической генерации писем-запросов в регионы, в которых эти заключенные были осуждены. Параллельно идет процесс ввода новых карточек, которые затем будут обрабатываться таким же образом.
Проблема программного обеспечения. К сожалению, имеющаяся версия программы ввода пока ориентирована в основном на архивно-следственные дела, и ввод карточек заключенных в ней невозможен. Можно ввести установочные данные и приговор, однако ввод лагерной истории, обстоятельств прибытия-убытия и т.п. информации, содержащейся в карточках форм 1, 2, невозможен. Поэтому было принято решение начать ввод в специально разработанной форме в MS Excel, с тем, чтобы в дальнейшем экспортировать эти данные в формат БДВИ. В приложении дан образец заполнения карточек заключенных в MS Excel. Распечатывать все карточки мы сочли нецелесообразным, поскольку это – несколько тысяч листов. В приложении также дана инструкция для операторов, работающих с БД Норильлага.
В целом, следует признать, ввод данных в таблицы MS Excel позволяет несколько ускорить ввод однотипных данных по сравнению с СЛП, однако при этом существенно увеличивается возможность ошибок и опечаток, а также уменьшаются возможности ввода «нечетких» данных.. Так, например, в СЛП в принципе невозможно ввести дату за пределами разумных диапазонов (например, дату рождения более позднюю, чем дату ареста), и потому такого рода ошибки в данных отсутствуют (а в Excel их приходится «вылавливать» специальными средствами при приемке массива данных). Также, в Excel, чтобы ввести неразобранный номер месяца, приходится заменять его звездочками, в СЛП же существуют механизмы для описания не только точных дат, но и диапазонов дат. Особая проблема была также и при перечислении статей, формулировке обвинения и т.п.: при отсутствии справочников эта информация записывалась достаточно неформализованно, что потом создало трудности при группировке записей (например, при выделении политических заключенных). Одним словом, в процессе ввода и последующей приемки данных все-таки был выработан некоторый набор правил, который позволил уменьшить трудоемкость последующей обработки. Так, например, было выделено отдельное поле для вариантов написания ФИО, стандартизованы формулировки статей, и т.п.
Следует отметить, что состав полей в Excel разрабатывался таким образом, чтобы быть максимально приближенным к структуре СЛП и БДВИ. Так, например, фамилия, имя, отчество сразу были разнесены в отдельные поля, так же как и название населенного пункта, района, области и республики. В формулировке решения количество лет ИТЛ и поражения в правах также разнесены в разные поля, что существенно упростит импорт этих данных в БДВИ и СЛП. Хотя, конечно, не все удалось сделать достаточно единообразно. Особенно большие трудности возникнут при импорте статей УК, которые записывались в весьма произвольной форме, поскольку операторам было дано указание максимально точно воспроизводить записи из карточек. В качестве примера приведу несколько формулировок статей:
Очевидно, что в плоской структуре таблицы Excel трудно было реализовать механизм «множественной статейности», но необходимо хотя бы стандартизовать формулировки, т.е. отказаться от принципа максимально точного воспроизведения источника.
Несмотря на возникшие затруднения, была проведена большая и полезная работа. Были выявлены типовые проблемы, возникающие при обработке массивов карточек заключенных (а это пока тип данных, редко используемых партнерскими организациями, в основном партнеры работают с архивно-следственными делами), намечены и апробированы пути решения этих проблем.
Как отмечалось в промежуточном отчете, была достигнута договоренность с управлением архивов Красноярского края об обработке части Фонда прекращенных дел, переданного им ФСБ на хранение. Предполагалось, что работа будет вестись в рамках проекта «Краевая книга памяти жертв политических репрессий» и оплачиваться краевой администрацией.
К сожалению, в связи с нестабильностью власти в крае, внеочередными выборами губернатора и т.п., финансирование Книги памяти в 2002 году не произошло, а, следовательно, работа пока ведется на волонтерских началах в ознакомительном режиме. Архивно-следственные дела обрабатываются архивистом и, в соответствии с методическими пособиями, разработанными в рамках проекта «Возвращенные времена», заполняются анкеты репрессированных. Достигнута договоренность, что при работе над Книгой памяти будет использоваться программное обеспечение, разработанное в рамках проекта «Возвращенные имена». Но реальная работа будет производиться только после финансирования.
Если судить по количественным показателям, обязательства, указанные в заявке, перекрыты (5437+37882=43319 записей вместо 36000). Следует, однако, отметить, что из ~38000 введенных данных БД Норильлага политические заключенные составляют около 50%, т.е.~19000. То есть, реально для БДВИ введено около 25000 записей (~19000+5467). Уже полностью доступны для помещения в БДВИ 3118+5437=8555 записей (предстоит еще «рассекречивание» данных о политических заключенных Норильлага, не реабилитированных автоматически).
Впрочем, в данном проекте количество введенных данных играет второстепенную роль, оно скорее некоторый ориентир на будущее. Очевидно, что 36000 записей – слишком большой объем для двух операторов на год, даже в случае достаточно однородных данных, таких как карточки заключенных. В нашем случае удалось добиться ввода 37882 карточек БД Норильлага только за счет привлечения дополнительных ресурсов, как со стороны «Мемориала», так и со стороны ГУВД. Очевидно, при обработке таких массивов надо исходить из скорости 50-60 карточек в день, а не 100, как мы это предполагали в заявке.
Более важными мы считаем другие результаты проекта:
Следует отметить, что работа, начавшаяся по проекту «Возвращенные имена», позитивно повлияла на отношение администрации края и архивов к работе Красноярского общества «Мемориал». Во многом благодаря этому проекту сдвинулась с места работа над краевой Книгой памяти, архивные материалы стали доступнее, архивы проявили заинтересованность в сотрудничестве с «Мемориалом». Администрация края проявила большой интерес к проекту и всемерно его поддерживает.
Работа «Красноярского «Мемориала» в проекте «Возвращенные имена» освещается в прессе (ксерокопия статьи и распечатки материалов информационных агентств прилагаются).