tgarc (Telegram)
tgarc — это инструмент, разработанный командой Ruarxive для потоковой архивации публичных каналов и чатов Telegram.
Основные возможности
- Загрузка истории сообщений (в JSON/JSONL).
- Скачивание медиафайлов (фото, видео, документы).
- Поддержка докачки (инкрементальный режим).
- Работа через официальный Telegram API (MTProto).
Установка
pip install tgarc
Настройка
Для работы требуется api_id и api_hash, которые можно получить на my.telegram.org.
Создайте файл config.yaml:
api_id: 12345
api_hash: "0123456789abcdef..."
phone: "+79001234567"
Использование
Архивация канала
tgarc download --target durov --output ./durov_archive
Эта команда скачает все сообщения из канала @durov и сохранит их в указанную папку.
Формат данных
По умолчанию инструмент сохраняет данные в структурированном виде, совместимом с внутренними стандартами Ruarxive. Сообщения сохраняются в messages.jsonl, медиа — в подпапке media.
Ограничения
- Работает только с публичными каналами и чатами (или теми, где вы состоите).
- Скорость загрузки медиа ограничена серверами Telegram.