Архивирование баз данных с перспективой на 100 000 лет

Архивирование баз данных с перспективой на 100 000 лет

Архивирование данных  - одна из важнейших вещей для сохранения информации в мировом масштабе. О новых трендах и технологиях этого дела рассказывает

Анна Петтерссон

Магистр архивоведения и документоведения, президент некоммерческой ассоциации «Корпоративные архивы» (Näringslivets Arkivråd)

Здравствуйте! Я очень рада принять участие в вашем мероприятии. Меня зовут Анастасия Петтерссон, я работаю руководителем архивов компании по утилизации радиоактивных отходов Svensk Kärnbränslehantering AB (SKB).

 

Моя тема немножечко отличается от других тем. Я и мои коллеги занимаемся сохранением вашей информации, нашей общей информации в европейском и мировом масштабе, и в общем трендами и технологиями этого дела. Перспектива в нашей компании - сохранить информацию на сто тысяч лет вперед. Я закончила магистратуру Стокгольмского университета  и работаю с электронными архивами. Я также являюсь президентом некоммерческой компании Корпоративные архивы.

Как проходит архивирование информации?

Каждый день все больше информации сохраняется с помощью цифровых ресурсов. Количество цифровой информации вырастет до 35 триллионов Гб к 2020 году. То есть уже через год, можно сказать. Параллельно с постоянно растущими объемами цифровой информации бумажные архивы и документы остаются. Оцифровка, можно сказать, удаляет границы архивов. Сегодня информация стала настолько подвижной, что уже не связана организациями, которым она принадлежит.

Так называемые комьюнити архивы (архивы сообщества) могут объединять людей в социальных сетях, например. И действия, которые возникают там, создают в лучшем случае архив, но чаще всего нет. Новые способы, которые в первую очередь связаны с оцифровкой, проникли в наш сегодняшний офис. Нам нужны стратегии для того, чтобы управлять информацией и сделать ее управляемой на сегодня и на будущее. Это папки из нашего архива, просто хотела показать вам как пример, что сегодняшняя информация хранится на бумажных и, естественно, других носителях. Здесь важно понимать, что носители информации и сама информация – это две разные вещи. Диски по правилам Национального архива Швеции переписываются через каждые пять лет, чтобы не допустить сильного ухудшения качества диска.

 

Я была на конференции в Японии несколько лет назад, где обсуждались CD-диски из золота как более устойчивые носители. Их можно хранить до двадцати пяти лет, но этот вопрос опять-таки двоякий. Даже если носители информации лучшего качества, возможно, информация будет не читаема, если она будет в техническом формате, который не поддерживается нынешними оперативными системами.

Как хранится информация?

Сегодняшняя информация хранится также в базах данных, например, генеалогических. База данных персонала с информацией о возрасте, образовании, например, зарплате работников. В Швеции также используется персональный номер, который состоит из даты рождения и четырех дополнительных цифр, и он используется в качестве идентификации. Отчество не используется, как вы знаете. Есть еще один пример – геологические данные, например, количество и размер трещин горных пород и других параметров с разных экспериментов, которые проводятся например в нашей компании. Как я уже говорила, нетрадиционные архивы создаются также в социальных сетях: Facebook, Twitter, Одноклассники, ВКонтакте, естественно. Facebook стал широко использоваться в Швеции в 2009 году, Twitter в 2010, Instagram и YouTube в 2011.

 

У нас, архивистов есть контроль над бумажными и электронными архивами, правила и порядок в которых мы сами создаем. Но есть так называемые нетрадиционные архивы – информация в социальных сетях созданная не по правилам архивов, и она тоже является нашим наследием. Она должна определяться, оцениваться и сохраняться. Я хочу рассказать, как мы работаем в этом направлении, исходя из моей кампании. Моя презентация называется «Срок хранения 100 тысяч лет». И я сейчас объясню почему.

Но основная работа организации не архивирование?

Моя основная работа, как я уже говорила, в компании по утилизации радиоактивных отходов. Наши владельцы – ядерные станции Швеции. У нас работают 500 человек постоянных работников и 500 консультантов.

Деятельность разделена на три сектора:

  • научно-исследовательскую
  • развитие техники
  • переработку радиоактивных отходов в лабораториях.

У нас очень много денег – это очень редко, но все жители Швеции финансируют нашу деятельность. Когда они оплачивают счета за электричество, определенный процент идет в наш фонд. Главный офис находится в Стокгольме, наши лаборатории находятся на юге и севере Швеции. Я не хочу, чтобы вы стали экспертами, как говорится, нашего отдела, но коротко, это все-таки интересно. Программа наша связана с переработкой радиоактивных отходов.  Она заключается в том, что мы принимаем отходы из всех отраслей Швеции. То есть не только ядерной энергетики, а также промышленности, научных исследований и медицины.

 

Отходы с низкой и средней радиоактивностью хранятся в постоянном геологическом хранилище. Ядерные отходы с высокой радиоактивностью на данный момент находятся в бассейнах с водой для охлаждения в течение тридцати лет. Хранилища для ядерных отходов с высокой радиоактивностью находятся в стадии разработки. Будет создано геологическое хранилище, в которое будут помещены медные капсулы с отходами. Депонирование капсул будет в горизонтальном положении. В ячейке вокруг них будет залита специальная глина – бентонитовая – которая разбухает при контакте с водой. Таким образом, отходы будут защищены тремя барьерами:

  1. самой медной капсулой,
  2. глиной, не пропускающей воду к капсуле,
  3. хранилищем, находящимся на глубине 400-500 метров под землей.

Эта концепция направлена на ограждение контактов человечества с опасными отходами в течение 100 000 лет, когда уровень радиации и ядовитых отходов снизится до нормального природного уровня. Знания и информация о постоянном хранилище должны передаваться будущим поколениям, чтобы избежать непреднамеренного соприкосновения с его опасным содержимым. Таким образом, данная информация должна сохраниться в течение 100 000 лет.

Насколько опасны отходы?

Отходы радиоактивны в течение 99 000 лет, и ядовиты еще тысячу лет. Поэтому срок хранения документации и архивов 100 000 лет. Непреднамеренное вторжение в наши хранилища могут произойти по незнанию, например, при добыче полезных ископаемых, при геотермальных добычах. Но может иметь место и преднамеренное вторжение, например, для ремонта хранилища. Точно так же при открытии новых методов утилизации ядерного топлива или для извлечения ресурсов из отходов. Всего лишь 5% энергии из ядерного топлива используется при нынешних методах, то есть 95%  остается не использованным.

 

Наши метеорологи и геологи работают также с расчетом дизайна хранилища, исходя из распространения льда во время последнего ледникового периода в Швеции, то есть 100 000 лет назад. Вот посмотрите, 100 тысяч лет назад в Швеции был достаточно короткий ледниковый период, который затронул, в первую очередь, север Швеции, не дошел до Стокгольма и совсем не затронул юг Швеции. Где-то 50 000 лет назад в Швеции был длительный ледниковый период, который затронул всю Швецию. Такой же цикл мы предполагаем на 100 000 лет вперед, то есть два ледниковых периода, и поэтому при дизайне хранилища учитывается, что оно должно выдерживать давление льда.

Как понимается архивирование в SKB?

Сегодня в SKB архивирование понимается как долгосрочное хранение версии документов в необновляемой форме, включая соответствующие мета-данные. Регулируется, в основном, нормативными актами и общими рекомендациями Национального архива Швеции, а также правилами управления радиационной безопасностью. Смысл такой, что мы работаем целенаправленно, исходя из жизненного цикла наших документов. Долгосрочная цель - передать наши архивы – бумажные и электронные – в Национальный архив. До 1999 года в архиве SKB существовали только аналоговые архивные документы. Они внесены в описи, заархивированы и доступны для поиска через внутреннюю архивную систему.

 

Управление документами осуществляется на основе соответствующих планов – планов управления информации. Планы управления информацией состоят из двух частей:

  • одна в целях контроля управления документами,
  • другая – управление базами данных.

В планах описывается, где и как информация создается, в какой форме хранится и как архивируется. Смысл такой, что вы можете иметь доступ к каким-то определенным базам данных, если это необходимо. Мы также указываем степень конфиденциальности информации, и данные архивирования, типы носителей и сроки хранения. План управления базами данных описывает управление данными, а также, где и как хранится информация.

Что еще выделяет архивирование со столь долгой перспективой?

Единственное отличие – это описание системы происхождения. То есть системы, из которой были получены сами данные. Несмотря на то, что у нас перспектива 100 000 лет, мы не боимся электронных архивов. С 2008 года в архивах Швеции хранились только аналоговые архивные документы. Но после 2008 года большинство документов учреждений существуют и в электронной форме. Они архивируются автоматически в электронном виде с учетом правил и рекомендаций Национального архива Швеции. За основу взят стандарт Open Archival Information System. Я знаю, что этот же стандарт используется в России для разработки электронных архивов. Он также одобрен Национальным архивом Швеции после цифрового архивирования к документу добавляются архивные мета-данные в формате .xml. Документы архивируются в формате pdf, а также соответствуют требованиям Национального архива.

И все же, как осуществляется архивирование?

Базы данных обычно не рассматриваются как электронные архивы  – архивирование осуществляется с помощью резервного копирования. Базы данных передаются на долгосрочное хранение в Национальный архив в порядке установленном им. Это означает, что информация экспортируется в технически нейтральный формат. То есть в виде текстовых файлов или .xml файлов с описанием содержания баз данных. Это позволит автоматически считывать информацию из баз данных, что упрощает повторное использование, анализ и обработку содержания архивирования баз данных.

У нас также проводится много проектов, исходя из нашего срока хранения, связанных с разными с разными способами сохранения и передачи информации. Существует два основных способа передачи информации будущим поколениям (Я имею в виду действительно на сто тысяч лет вперед).

  • Первая из них – последовательная передача информации  – демонстрируется архивами. То есть речь идет о ее записи на более современные носители. В архивах Швеции, касательно электронных документов, это практикуется с 2009 года.
  • И второй способ передачи информации непосредственно в отдаленное будущее может быть осуществлен через знаки или рисунки. Важно, чтобы эти знаки были легкодоступны и понятны будущим поколениям. Мы пытаемся найти рисунки и знаки, которые не изменятся в течение времени.

 

Мы обсуждали три рисунка места хранилища ядерных отходов, предупреждающих об опасности. Один показывает человека, второй – копающего человека, а третий - человека, которому плохо. То есть не нужно копать в этом месте, можно заболеть. Но смысл меняется на противоположный, если предположить, что прочтение картинок будет справа налево. Как, например, в арабских странах.

Я думаю, мое время уже подошло к концу.  На примере нашей компании я хотела показать сложность работы с информацией в современном мире и необходимость делать это вовремя, а также важность роли архива для будущего, чтобы сохранить информацию о вас, ваших детях и ваших родственниках. Благодарю вас за внимание! Спасибо.

Будем рады встретить вас на ГЕНТЕХе в 2020 году, чтобы рассказать еще больше о сохранении информации!