Сравнения и лучшие практики
Сравнение подходов к сохранению цифрового наследия в разных странах и лучшие практики.
Международные сравнения
Государственная поддержка
Россия
- Отсутствие государственной политики по архивации цифровых материалов
- Нет обязательных требований к архивации
- Нет координации между ведомствами
- Нет выделения ресурсов
"В России, есть много областей в которых есть просто нулевая активность государства: архивация цифровых материалов"
США
- Библиотека Конгресса ведёт архивацию веб-сайтов
- Проекты типа "End of Term Presidential Harvest"
- Координация между организациями
- Выделение ресурсов
Великобритания
- Национальная библиотека архивирует цифровые материалы
- Единая платформа Gov.UK с сохранением архивов
- Систематический подход
- Государственная поддержка
Открытый исходный код
Россия
- Ограниченное использование открытого кода в госструктурах
- Нет системной поддержки
Международный опыт
"В десятках стран сотни госструктур раскрывают свой исходный код и ведут открытую разработку."
Сравнение подходов к архивации
Проактивная vs Реактивная архивация
Проактивная (рекомендуется)
- Архивация до исчезновения
- Полнота данных
- Меньше проблем
- Лучшее качество
Примеры: End of Term Presidential Harvest, плановые архивы
Реактивная (проблематично)
- Попытки архивировать после исчезновения
- Часто безуспешны
- Неполные данные
- Больше проблем
Примеры: Попытки восстановить исчезнувшие сайты
Единые платформы
Положительные примеры
Великобритания: Gov.UK
- Единая платформа для всех официальных сайтов
- Сохранение архивов при миграции
- Доступ к историческим данным
США
- Единые стандарты представления информации
- Стандарты доступности
- Требования к структуре
Проблемы
Россия
"При миграции на новые/единые платформы теряются огромные объемы информации. За те несколько лет что я архивирую сайты госорганов я могу сказать что потеряно уже больше чем удалось сохранить."
- Потеря данных при миграции
- Отсутствие архивации
- Уничтожение старых версий
Лучшие практики
Планирование
-
Заблаговременная подготовка
- Планирование архивации заранее
- Координация между организациями
- Выделение ресурсов
-
Приоритизация
- Фокус на критически важных ресурсах
- Определен ие приоритетов
- Эффективное использование ресурсов
Координация
-
Между организациями
- Координация между библиотеками, архивами, университетами
- Обмен опытом
- Совместные проекты
-
С сообществом
- Привлечение волонтёров
- Инструменты номинации
- Открытый код
Технические подходы
-
Стандартные форматы
- WARC для веб-архивов
- CDX для индексации
- Метаданные
-
Автоматизация
- Автоматизированные инструменты
- Скрипты для массовой обработки
- Мониторинг изменений
-
Хранение
- Облачное хранение
- Резервное копирование
- Географическое распределение
Сравнение по типам ресурсов
Веб-сайты
Полная архивация (Ruarxive)
- Полный слепок всего, что есть на сайте
- Сохранение всех форматов
- Медиа-файлы
Частичная архивация (Internet Archive)
- Основные веб-страницы
- Огр аниченное сохранение медиа
- По критериям цитируемости
Социальные сети
Telegram
- Полная архивация каналов и чатов
- Сохранение медиа
- Метаданные
Instagram
- Сообщения и метаданные
- Ограниченное сохранение медиа
- API ограничения