Перейти к основному содержимому

tgarc (Telegram)

tgarc — это инструмент, разработанный командой Ruarxive для потоковой архивации публичных каналов и чатов Telegram.

Основные возможности

  • Загрузка истории сообщений (в JSON/JSONL).
  • Скачивание медиафайлов (фото, видео, документы).
  • Поддержка докачки (инкрементальный режим).
  • Работа через официальный Telegram API (MTProto).

Установка

pip install tgarc

Настройка

Для работы требуется api_id и api_hash, которые можно получить на my.telegram.org.

Создайте файл config.yaml:

api_id: 12345
api_hash: "0123456789abcdef..."
phone: "+79001234567"

Использование

Архивация канала

tgarc download --target durov --output ./durov_archive

Эта команда скачает все сообщения из канала @durov и сохранит их в указанную папку.

Формат данных

По умолчанию инструмент сохраняет данные в структурированном виде, совместимом с внутренними стандартами Ruarxive. Сообщения сохраняются в messages.jsonl, медиа — в подпапке media.

Ограничения

  • Работает только с публичными каналами и чатами (или теми, где вы состоите).
  • Скорость загрузки медиа ограничена серверами Telegram.