Безлимит или токены: как я считаю, что выгоднее юзеру и продукту

Если коротко, то на вопрос «подписка или пакеты токенов» я для своего AI-продукта пока не ответил, и это, как ни странно, и есть ответ. У меня сейчас за 250 рублей человек покупает 110 токенов, то есть примерно 110 сообщений в чат, и я честно не знаю, много это или мало, а пока ты этого не знаешь, любой выбор тарифа будет гаданием на кофейной гуще. Поэтому план такой: записать идею безлимитной подписки на потом, выкатить как есть, посмотреть как люди реально жмут на кнопки, и только потом решать. Звучит лениво, но за этим стоит вполне конкретная логика, и сейчас её разложу.

Откуда вообще взялся этот вопрос

Дело было на фоне релиза, когда продукт уже почти собран и осталось докрутить деньги, и вот тут в голову лезет мысль, которую я давно ношу: а что если параллельно с пакетами токенов сделать ещё и подписку, например безлимитную? Логика простая до тупости. Вот за 250 рублей человек берёт 110 токенов, а это всего 110 сообщений в чат. Хз много это или мало, ведь один человек зайдёт пару раз в месяц спросить что-то по делу и ему этих 110 хватит на полгода, а другой будет сидеть и болтать с AI как с живым, и сожжёт пакет за один вечер.

И вот для второго типа токены — это раздражитель, он постоянно считает сколько у него осталось, экономит, не дописывает мысль, потому что жалко. Может кому-то проще купить безлимит и не париться с токенами вообще, а токены оставить для тех, кто заходит редко. Это две разные модели поведения, и натягивать на обе одну тарифную сетку — значит кого-то обязательно обидеть.

Что я прикинул по цифрам

Безлимитную подписку я для себя прикидывал в районе 1399–1599 рублей, но с одной хитростью: безлимит не на всё подряд, а на саму беседу в чате, при этом с ограничением по числу сессий. То есть ты не считаешь каждое сообщение, болтаешь сколько влезет внутри сессии, но количество самих заходов всё равно ограничено, чтобы один особо упёртый юзер не положил мне всю экономику на нейросети. Потому что безлимит без единого тормоза — это прямой путь к тому, что счёт за LLM съест всю выручку, а я этого уже наелся в других проектах.

Была и более скучная альтернатива — не вводить подписку, а просто сделать стоимость одного сообщения в полтокена вместо целого. Тогда те же 110 токенов превращаются в 220 сообщений, и пакет сразу выглядит щедрее, хотя по сути я ничего не поменял, кроме циферки в формуле. Это дёшево в реализации и снимает часть боли «мало сообщений», но не решает главного — человек всё равно считает, а не пользуется. Так что это скорее костыль на случай, если подписка окажется лишней.

Почему я не стал решать прямо сейчас

Тут многие на моём месте начали бы строить табличку юнит-экономики, выводить идеального юзера, спорить с самим собой неделю и в итоге всё равно выбрать пальцем в небо. А правда в том, что у меня пока нет данных. Я не знаю средний чек, не знаю как часто люди реально заходят, не знаю кто из них «болтун», а кто «по делу». Любая модель монетизации, которую я выкачу до релиза, будет построена на моих фантазиях о пользователе, а не на самом пользователе, а чем это заканчивается я уже разбирал на примере того, почему пользователи не платят.

Поэтому мы с моим напарником по разработке (а код в проекте пишет Claude Code под моим управлением, я оркестрирую, а не сижу руками набираю) сошлись на самом честном варианте. У меня это звучало примерно так: согласен, выкатим, посмотрим, потом решим, а идею пока надо записать на потом. Вот и весь консилиум. Сначала выкатываем то, что есть, собираем поведение живых людей, а уже на этих данных решаем — нужен безлимит, хватит полтокена за сообщение, или вообще оставить как есть. Это не прокрастинация, это отказ принимать дорогое решение вслепую, когда можно принять его зрячим через пару недель.

Одна вещь, которую я сделал заранее

Но кое-что я всё-таки докрутил до релиза, и это важнее самого выбора тарифа. Я вынес всю токеновую экономику в единый источник истины — в одну запись с пакетами, и оба фронта, и веб, и мини-приложение в телеграме, тянут эти пакеты живьём через общий запрос к серверу, а не хранят цены захардкоженными у себя. На первый взгляд мелочь, а на деле это то, что и даёт мне право сказать «потом решим».

Потому что когда я захочу поменять цену, добавить безлимит, переключить сообщение на полтокена или вообще выкатить новый пакет — мне не надо будет лезть в код двух фронтов, пересобирать билды и молиться, чтобы цены нигде не разъехались. Я поменяю цены в одном месте, и оба интерфейса подхватят новое сами. Это и есть разница между «я заложил гибкость» и «я зашил себе цемент в фундамент». Если бы я захардкодил тарифы по двум местам, любой эксперимент с монетизацией превращался бы в релиз с риском что-нибудь сломать, а так это правка одной строки.

Что из этого вынести, если вы строите свой AI-продукт

Первое — не выбирайте тарифную модель до того, как у вас появятся живые юзеры, потому что выбор без данных это не стратегия, а суеверие. Запишите гипотезы (у меня их было три: безлимит с лимитом сессий, полтокена за сообщение, оставить как есть), выкатите самый простой рабочий вариант и дайте людям его потрогать. Поведение покажет правду быстрее любой таблички. И не привязывайте тариф к тому, что легко посчитать, а не к тому, что человек реально ценит, — об этой ловушке у меня есть отдельный разбор про то, почему тариф «по размеру» не держится.

Второе и, пожалуй, главное — заложите гибкость в архитектуру цен заранее, даже если сами цены ещё не определены. Один источник истины по пакетам, фронты тянут его по запросу, никакого хардкода. Тогда смена модели монетизации стоит вам правку одной записи, а не пересборку всего продукта, и вы можете спокойно экспериментировать, а не бояться каждого изменения цены как огня.

И третье, чисто из практики — если вы строите безлимит на нейросетях, всегда оставляйте хоть какой-то тормоз, лимит сессий, потолок по токенам, что угодно. Потому что безлимит на бумаге выглядит как подарок юзеру, а на проде превращается в подарок тому одному человеку, который решит протестировать вашу щедрость на прочность и сжечь весь ваш бюджет на LLM за выходные. Я это уже проходил, и больше так не играю.

Кстати, та же история работает и за пределами продукта — у меня в проекте есть партнёрская программа, порог выплаты там 1000 рублей, а сама выплата идёт около пяти рабочих дней, и эти числа я тоже не выдумывал на старте, а поставил так, чтобы потом можно было спокойно подвинуть, не переписывая пол-системы. Везде одна и та же мысль: не фиксируй жёстко то, что наверняка придётся менять.

Так что выгоднее в итоге — безлимит или токены? Честный ответ: я пока не знаю, и узнаю не из головы, а из логов через пару недель после релиза. А пока идея записана, фундамент гибкий, тормоз заложен. Вот и делайте выводы.