Все записи
5 мин

400 000 Telegram-каналов из чужого платного SaaS за 2 часа через Claude Code

нейросетиАвтоматизация

Есть такой платный сервис за $130 в месяц, и он рисует красивую граф-карту Telegram-каналов: категории, подписчики, связи, всё это крутится на Canvas и выглядит дорого. А под капотом у него — открытый API без всякой авторизации, и за два часа я забрал оттуда полную базу: 400 077 каналов, 68 мегабайт, 103 макрокатегории, 646 микрокатегорий. Сейчас расскажу как это вышло.

Задача: найти крипто-каналы

У меня есть проект MAKO — это система автопубликации контента, и ей нужны Telegram-каналы по нишам, чтобы дальше с ними работать. Наткнулся я на платный SaaS с интерактивной картой каналов, и карта реально красивая: визуальный граф, кластеры по темам, можно зумить, кликать, смотреть статистику. Подписка — $130 в месяц.

Первая мысль была простая: дать задачу Claude Code, пусть соберёт что нужно, тем более вся эта разработка с ии у меня и так на нём держится. Claude Code предложил парсить tgstat, и это было бесполезное предложение, потому что мне нужна была именно эта карта с её категоризацией, а не абстрактные каналы из какого-то другого источника.

Chrome DevTools вместо подписки

Решение нашлось такое — подключить Chrome DevTools MCP. Это штука, которая даёт Claude Code управлять браузером напрямую: навигация, клики, выполнение JavaScript, перехват сетевых запросов. То есть claude code mcp превращает ассистента из «пишет код в файлике» в «сидит руками в браузере и сам разбирается».

Открыл я страницу с графом, и Claude Code попытался кликать по элементам карты через DOM. Не вышло, потому что граф отрисован на Canvas — это не HTML-элементы, это пиксели, и через DOM до них просто не добраться.

Тогда переключились на JavaScript и перехват сетевых запросов, и Claude Code начал анализировать трафик: что страница запрашивает у сервера при загрузке карты, при зуме, при клике на кластер.

И тут обнаружился эндпоинт.

Открытый API с полной базой

Один запрос, один JSON, вся база. Без токена, без авторизации, без всякого rate limit. Просто GET-запрос, который отдаёт 400 тысяч записей и не моргает.

Смотрите в чём прикол: чтобы получить доступ к этим данным через интерфейс, надо платить $130 в месяц, а API отдаёт всё то же самое бесплатно. Кто-то просто забыл закрыть эндпоинт. Или не считал нужным, что в общем-то ещё интереснее.

Claude Code написал JavaScript для выгрузки, и первый же запрос всё подтвердил: данные настоящие, с категориями и количеством подписчиков.

Фильтрация и категоризация

Из 400 077 каналов отфильтровали крипто-нишу с порогом 1000+ подписчиков, и получилось 8 967 каналов.

Но интереснее оказалась сама структура категорий: 103 макрокатегории и 646 микрокатегорий. Это ведь не просто свалка каналов, это размеченная база с иерархией тем, которую кто-то годами собирал и поддерживал.

  • Claude Code разложил каналы по моим проектам:
  • Anima: 15 500
  • Орион: 22 400
  • Картара: 7 400
  • Микселло: 2 700

И каждый проект получил свою подборку каналов, релевантных именно его нише.

Решение: забрать всё

После крипто-фильтрации стало понятно, что ограничиваться одной нишей глупо — база-то содержит каналы по всем темам, и 400 тысяч записей с категориями пригодятся далеко не только MAKO.

Выгрузка пошла порциями по 50 000, восемь запросов, и вот она — полная база: 400 077 каналов, 68 мегабайт.

Вся операция от «нашёл сервис» до «база на диске» заняла около двух часов, из них час ушёл на попытки кликать по Canvas и анализ сетевого трафика, а сама выгрузка заняла буквально минуты.

Что здесь произошло на самом деле

Можно, конечно, рассказать эту историю как «хакнул SaaS», но это не взлом. Это GET-запрос к публичному эндпоинту, никаких обходов защиты, никакого reverse engineering — я просто заглянул в DevTools и увидел, что сервер отдаёт данные без ограничений.

А штука в другом. Большинство людей, которые платят $130 в месяц за этот сервис, никогда в жизни не откроют DevTools, и они так и будут кликать по красивой карте, фильтровать руками, экспортировать по 100 каналов за раз. Потому что платят они за интерфейс, а не за данные, и сами этого не понимают.

Chrome DevTools MCP позволяет Claude Code делать ровно то, что разработчик делает руками: открыть DevTools, посмотреть Network-вкладку, найти запросы, проанализировать ответы. Вся разница — в скорости. Я не сидел и не разбирал трафик вручную, я просто дал задачу: «найди все крипто-каналы на этой карте». А дальше ai агент сам разобрался, что DOM не работает, переключился на анализ трафика, нашёл эндпоинт и написал код для выгрузки.

Моё участие тут — направить. Сказать «не tgstat, а эта карта», сказать «забери всю базу, не только крипто», принять решения. А код и ресёрч — на Claude Code.

Зачем это MAKO

MAKO нужны каналы для анализа: что публикуют, какой контент заходит, какие ниши растут, и 400 тысяч записей с категориями — это входные данные для следующего шага, где я обогащаю эти каналы через прокси и пачку аккаунтов.

Раньше я бы потратил неделю на ручной сбор: tgstat, чаты, таблицы, или заплатил бы несколько сотен долларов за подписку и вручную выгружал бы всё по кусочкам. А вместо этого — два часа и полная база.

Выводы

Первое. Платные сервисы очень часто оставляют данные открытыми, и не потому что им всё равно, а потому что бизнес-модель построена на интерфейсе: красивая карта, фильтры, дашборд. Данные для них побочный продукт, и их защита просто не приоритет.

Второе. Chrome DevTools — это не только для дебага, это полноценный инструмент ресёрча. А в связке с ии, который умеет анализировать трафик и писать скрипты на лету, DevTools превращается в способ быстро понять, что любой сервис отдаёт на самом деле — и тут уже не важно, называете вы это ии для автоматизации или просто здравым смыслом.

Третье, и главное. Направление важнее исполнения. Claude Code ведь предложил парсить tgstat, и если бы я согласился, мы бы потратили день на скрапинг и получили некатегоризированный мусор. А одно решение — «нет, работаем с этой картой» — определило весь результат. Код написала нейросеть, а выбор, откуда брать данные, сделал я. Меняется только исполнитель.

Цифры

  • 400 077 каналов в полной базе
  • 68 MB данных
  • 8 967 крипто-каналов с 1000+ подписчиков
  • 103 макрокатегории, 646 микрокатегорий
  • ~2 часа от идеи до полной выгрузки
  • $130/мес стоит подписка на сервис
  • 8 порций по 50 000 для полной выгрузки