InterPlanetary Wayback (ipwb)
InterPlanetary Wayback (ipwb) — это индексация и воспроизведение веб-архивов (WARC) с использованием IPFS.
Описание
ipwb использует IPFS (InterPlanetary File System) для распределённого хранения и доступа к веб-архивам, обеспечивая децентрализованное хранение и доступ.
Особенности
- IPFS интеграция: Использует IPFS для хранения
- Распределённость: Децентрализованное хранение
- WARC поддержка: Работает с WARC файлами
- Веб-интерфейс: Веб-интерфейс для просмотра
Установка
Требования
- Python 3.6+
- IPFS (должен быть установлен и запущен)
Установка IPFS
# Скачайте IPFS с https://ipfs.io/
# Или через пакетный менеджер
brew install ipfs # macOS
apt-get install ipfs # Linux
Запуск IPFS
ipfs init
ipfs daemon
Установка ipwb
pip install ipwb
Использование
Индексация WARC файла
ipwb index /path/to/archive.warc
Это создаст индекс и загрузит данные в IPFS.
Запуск веб-сервера
ipwb replay
Откроет веб-сервер на http://localhost:5000.
Просмотр в браузере
Откройте браузер на http://localhost:5000 для доступа к веб-интерфейсу.
Работа с IPFS
Загрузка в IPFS
При индексации WARC файл автоматически загружается в IPFS:
ipwb index archive.warc
# Файл загружается в IPFS и получает IPFS hash
Доступ через IPFS hash
После индексации можно получить доступ к архиву через IPFS hash:
ipfs cat <ipfs_hash>
Распределённый доступ
После загрузки в IPFS архив доступен всем узлам IPFS сети:
- Децентрализованное хранение
- Распределённый доступ
- Устойчивость к отказу узлов