twarc
twarc — это командная строка и Python библиотека для архивации Twitter JSON данных.
Описание
twarc использует Twitter API для архивации твитов, пользователей и других данных Twitter в формате JSON.
Особенности
- Twitter API: Использует официальный Twitter API
- JSON формат: Сохраняет данные в JSON
- CLI и библиотека: Можно использовать как инструмент или библиотеку
- Rate limiting: Автоматически обрабатывает ограничения API
Установка
Через pip
pip install twarc
Из исходников
git clone https://github.com/DocNow/twarc
cd twarc
pip install -e .
Настройка
Получение API ключей
- Зарегистрируйтесь на Twitter Developer Portal
- Создайте приложение
- Получите API ключи (Consumer Key, Consumer Secret, Access Token, Access Token Secret)
Настройка twarc
twarc configure
Введите ваши API ключи при запросе.
Использование
Архивация твитов пользователя
twarc timeline username > tweets.jsonl