Перейти к основному содержимому

DH.4. Интернет архив с точки зрения цифрового архивиста

Работа с интернет-архивами и практические аспекты.

Презентация

Популярное применение Archive.org

Большинство пользователей знают Internet Archive (Archive.org) по следующим функциям:

  • Найти веб-страницу на определённую дату — Wayback Machine
  • Сравнить изменения на веб-странице — просмотр истории изменений
  • Запросить архивацию веб-страницы — функция "Save Page Now"
  • Найти текст, книгу, изображение или видео — поиск по архиву

Менее популярное применение

  • Слушать музыку — архив аудиозаписей
  • Смотреть видео — архив видеоматериалов
  • Бронировать книги — доступ к оцифрованным книгам

Известное далеко не всем

Загружать архивы!

Internet Archive позволяет загружать собственные архивы и коллекции для долгосрочного хранения.

Как это работает

Пошаговая инструкция

  1. Регистрируемся на сайте

  2. Авторизуемся

    • Войдите в созданный аккаунт
  3. Переходим на страницу загрузки файлов

  4. Выбираем файлы для загрузки

    • Выберите файлы, которые хотите заархивировать
  5. Заполняем форму с метаданными

    • Укажите название, описание, теги и другую информацию
  6. Отправляем в архив

    • Загрузите файлы в архив

Почему Archive.org?

Преимущества

  • Крупнейший онлайн архив в мире
  • Позволяет хранить условно неограниченный объём данных
  • Построен на ценностях архивации вне зависимости от политики
  • Есть проигрыватель видео и аудио и просмотр книг и документов

Недостатки

  • Блокируется Роскомнадзором в некоторых регионах
  • Только общедоступные материалы (Creative Commons или Public Domain)
  • Неудобный интерфейс для специализированных материалов (исходный код и т.д.)
  • Не работает с особо крупными объёмами данных вроде датасетов для машинного обучения

Альтернативы

Для научных данных

  • Zenodo — репозиторий для научных публикаций и данных
  • Academic Torrents — распределённый репозиторий научных данных

Для кода и данных

  • GitHub — крупнейший хостинг исходного кода
  • GitLab — альтернативный хостинг с открытым исходным кодом

Для данных для ИИ

  • Hugging Face — платформа для моделей машинного обучения и датасетов

Связанные материалы