Инструменты архивации
Инструменты для веб-архивации, создания и обработки веб-архивов.
📄️ Archive.ph: полное руководство
Archive.ph (также известный как Archive.today, Archive.is) - это бесплатный сервис для моментального создания постоянных снимков веб-страниц. Один из самых простых и быстрых инструментов для архивации.
📄️ ArchiveBox
ArchiveBox — это инструмент для создания аддитивного архива из RSS-лент, закладок и ссылок, используя wget, Chrome headless и другие методы.
📄️ Browsertricks
Browsertricks — это современный инструмент для веб-архивирования, разработанный командой Webrecorder. Его главная особенность — использование реального браузера (через Browsertricks Crawler) для захвата динамических сайтов, которые сложно архивировать классическими инструментами типа Heritrix или Wget.
📄️ Brozzler
Brozzler — это распределённый веб-кроулер, использующий реальный браузер (Chrome или Chromium) для захвата страниц и встроенных URL.
📄️ grab-site
grab-site — это веб-кроулер, разработанный специально для архивистов, с WARC выводом, дашбордом для всех кроулов и динамическими паттернами игнорирования.
📄️ Heritrix
Heritrix — это открытый, расширяемый, масштабируемый веб-кроулер архивного качества, разработанный Internet Archive.
📄️ HTTrack
HTTrack — это бесплатный и открытый инструмент для копирования веб-сайтов на локальный компьютер.