Все записи
4 мин

OpenAI выкатила плагин для Claude Code. Я в тот же вечер запустил обоих

нейросетимышление

OpenAI выпустила Codex CLI как плагин для Claude Code, и да, вы правильно прочитали: конкурент сделал инструмент для продукта конкурента, звучит почти как первоапрельская шутка, но я взял оба в тот же вечер и закрыл проблему, которая неделю сидела в голове и не давала покоя.

Проблема: моноклональный совет

На прошлой неделе я через Claude Code собрал систему принятия решений, где три ai агента смотрят на задачу независимо: Архитектор думает как построить правильно, Прагматик как построить просто, а Скептик ищет что в итоге сломается, и каждый получает спеку и отвечает изолированно, а потом идёт Stress Test, потом дебаты двух сильнейших вариантов, и только потом выбираю я.

А проблему-то нашёл сам Скептик. На дебатах по архитектуре этого самого consilium он написал прямо: «Моноклональный совет. Один мозг с тремя шляпами.»

И ведь по сути он прав, потому что все три эксперта — это Claude, одна модель с разными промптами, и если Claude как модель к чему-то слеп, то все три «эксперта» это дружно пропустят, ведь diversity of thought не появляется от промпт-инжиниринга. Я получал разнообразие мнений, но не разнообразие мышления, а это совсем не одно и то же.

Частичная защита, конечно, была: дебаты шли Claude vs GPT, но сам consilium до дебатов оставался моноклональным, а ведь именно он решает, какие два варианта вообще дойдут до спора. И если три Claude-эксперта сошлись на чём-то одном, то GPT в дебатах уже спорит внутри чужой рамки, которую ему молча подсунули.

Что случилось 31 марта

Вечером листаю ленту и вижу новость: OpenAI выпустила плагин Codex CLI для Claude Code, не отдельный инструмент, а именно плагин, который запускается прямо из Claude Code, и GPT-модель теперь работает рядом с Claude-моделью в одном окне.

Первая мысль была такая: «Конкуренты буквально помогают друг другу.»

А вторая — уже по делу: «Это же решает мой моноклональный совет.»

До и после

До Codex CLI:

Consilium из трёх Claude-экспертов, одна модель, разные промпты, тот самый моноклональный совет, а дебаты Claude vs GPT я гонял вручную: копирую файл, открываю другую сессию, жду ответ, и так по кругу.

После:

Consilium из трёх Claude-экспертов плюс три GPT-эксперта параллельно, то есть шесть мнений от двух разных моделей, и сверху ещё два скилла для claude code: codex-review, где GPT ревьюит код, и codex-adversarial-review, где GPT атакует подход целиком.

Принцип простой: не заменять, а дублировать. Те же роли (Архитектор, Прагматик, Скептик), но другая модель, и каждый вопрос теперь проходит через два мозга с разными слепыми зонами, а не через один с тремя шляпами.

Два скилла за вечер

За вечер я через Claude Code собрал два новых скилла, и это, если хотите, вайбкодинг в чистом виде — я не пишу код руками, я оркестрирую модель, а она пишет; оба скилла как раз про работу с ai агентами.

codex-review. Тут GPT ревьюит код, и это не линтер, а нормальное ревью уровня «вот здесь ты обрабатываешь 404, но не 429» или «этот retry бесконечный при сетевой ошибке» — ровно то, что Claude-ревьюер запросто мог пропустить, потому что он сам этот код и писал, а кто ж себя со стороны проверит.

codex-adversarial-review. А тут GPT атакует подход целиком, не «проверь синтаксис», а «объясни, почему этот подход плохой», и если он не может объяснить — значит подход выдержал проверку, а если может — значит есть слабое место, которое Claude в упор не видел.

Разница уже видна

И знаете, Claude с GPT реально думают по-разному: Claude тянет в элегантность, красивые абстракции, всё правильное по учебнику, а GPT чаще говорит «зачем тебе вообще эта абстракция, сделай проще», и на архитектурных вопросах GPT побеждал чаще, я это заметил ещё на дебатах.

А в consilium разница ещё заметнее: Claude-Архитектор предлагает одно, GPT-Архитектор другое, и не потому что промпт разный, а потому что модель видит задачу иначе, и вот это уже настоящее разнообразие мнений, а не имитация на ровном месте.

Рынок AI перестал быть войной

Самое забавное во всей этой истории — что конкуренты помогают друг другу: OpenAI делает плагин для Anthropic, Google открывает Gemini для всех, и пользователю-то, по большому счёту, плевать чей логотип на инструменте, работает — беру, не работает — меняю, вот и весь разговор.

Лояльность к бренду AI — это как лояльность к бренду розетки, важен ток, а не надпись на пластике.

Что это меняет

Для меня лично: consilium больше не моноклональный, теперь это шесть экспертов от двух моделей, Stress Test (Now Check + Future Check) проходит через обе, а дебаты автоматизированы и я больше не копирую файлы из сессии в сессию.

А для всех, кто работает с AI, мысль такая: если вы гоняете одну модель для принятия решений, то вы получаете подтверждение, а не проверку, и это разные вещи, ведь две модели с разными слепыми зонами дают вам настоящую проверку, а не поглаживание по голове — как было, когда я выбирал модель не на ощущениях, а по данным.

Код написал Claude Code, скиллы спроектировал я, Codex CLI интегрировал OpenAI, а решения как принимал, так и принимаю я сам. Так и работаем.


Связанные посты: SCD: consilium + дебаты | AI-дебаты как метод