В линейке Claude три модели — Opus 4.7, Sonnet 4.6 и Haiku 4.5. Разница в цене между крайними — пятикратная. Разница в качестве на обычной задаче — в пределах ошибки. И всё-таки выбор модели — это первое решение, которое влияет на счёт в конце месяца и на то, выйдет ли у вас законченный продукт.
Внутри статьи: разбор каждой модели по контексту, скорости и цене, бенчмарки SWE-bench и GPQA, сравнительная таблица по восьми параметрам, цены API в долларах и рублях, матрица из 15 типовых задач с рекомендованной моделью и кейсами редакции Checkroi.
Если вы только знакомитесь с продуктами Anthropic, сначала загляните в обзор «Что такое Claude Code» — там разобрали интерфейс, тарифы и первый запуск.
А общую базу по нейросетям мы собрали в материале «Что такое нейросети простыми словами» — оттуда удобно стартовать, если термины «токен» и «контекстное окно» пока звучат как иностранный язык.
Статья пригодится не только разработчикам. Claude сегодня используют редакторы, маркетологи, аналитики, продакты, SEO-специалисты — везде, где нужно ускорить рутину и разобраться в больших объёмах текста.
Если хочется освоить ремесло системно — загляните в нашу подборку курсов по нейросетям и искусственному интеллекту: там 316 программ — от коротких интенсивов до годовых.
Главное за 60 секунд
Если читать совсем некогда — вот короткая выжимка по трём моделям и по тому, как мы их распределили в редакции Checkroi.
| Модель | Сильная сторона | Цена API (вход/выход за 1M) | На что ставим в Checkroi |
|---|---|---|---|
| Opus 4.7 | Длинные тексты, архитектура, сложный кодинг | $5 / $25 | Глубокая аналитика для статей, разработка плагинов, ревью больших PR |
| Sonnet 4.6 | Баланс цены и качества для 90 % задач | $3 / $15 | Сбор зарплат и SERP-данных, переводы, апдейты статей |
| Haiku 4.5 | Скорость и цена, чат-боты, классификация | $1 / $5 | Пока ничего регулярного — ниже расскажем, почему |
Кратко: Sonnet 4.6 закрывает 90 % рабочих сценариев. Opus берём, когда задача связана с длинным контекстом, ответственным кодом или текстом, который пойдёт под имя редакции. Haiku — для пайплайнов с тысячами запросов в минуту, где важна каждая копейка и десятая доля секунды.
Три модели — три задачи
Anthropic собрала линейку так, что каждая модель закрывает свой слой:
- Opus 4.7 — флагман. Самые сложные рассуждения, длинные агентские сессии, работа с кодовыми базами на сотни файлов. Это «модель, которая думает долго и глубоко».
- Sonnet 4.6 — рабочая лошадка. По бенчмаркам отстаёт от Opus всего на 1–2 %, а стоит в пять раз меньше. Это «модель, которая думает достаточно хорошо за разумные деньги».
- Haiku 4.5 — скоростная. Отвечает в реальном времени, обрабатывает десятки тысяч токенов в секунду. Это «модель, которая отвечает мгновенно, когда не нужно много думать».
Любопытная деталь от самой Anthropic: в Claude Code режим планирования по умолчанию использует Opus, а режим выполнения переключается на Sonnet. То есть продукт собран по той же логике, по которой мы строим этот гайд: думать — Opus, делать — Sonnet, перебирать данные — Haiku.
Opus 4.7 — флагман для статей, архитектуры и сложного кодинга
Opus — самая «умная» из трёх, но и самая дорогая. Цена входа в пять раз выше, чем у Haiku, и в 1,67 раза выше, чем у Sonnet. Анализ Anthropic показывает: дороговизна оправдана только на небольшом классе задач. Зато там разрыв с Sonnet ощутимый — на GPQA Diamond (это такой тип исследований) Opus берёт 91,3 %, Sonnet — 74,1 %.
Что внутри
- Контекстное окно: 1 000 000 токенов (~750 страниц книги).
- Максимальный вывод: 128K токенов за один ответ.
- Скорость: ~66 токенов в секунду — самая медленная из трёх.
- SWE-bench Verified: 80,8 %.
- GPQA Diamond (научные задачи): 91,3 %.
- ARC-AGI-2 (логика): 68,8 %.
- Цена API: $5 за 1M входных токенов, $25 за 1M выходных.
Дополнительная деталь: у Opus 4.7 новый токенайзер, который на тех же русских текстах может генерировать на 25–35 % больше токенов, чем Opus 4.6. Тариф за токен прежний, но реальный счёт за тот же запрос может вырасти. На это стоит закладывать запас при планировании бюджета.
Где Opus незаменим
Anthropic в документации называет четыре сценария, в которых премия Opus оправдывается:
- Длинный контекст с глубоким рассуждением. Анализ договора на 200 страниц, разбор финансовой отчётности, чтение всей кодовой базы с 500+ файлов.
- Agent Teams. Когда один агент координирует работу нескольких других — Opus устойчивее ведёт план и не путается в подзадачах.
- Архитектурные решения в коде. Рефакторинг, миграция между фреймворками, выбор паттернов — всё, где ошибка стоит дня работы.
- Тексты под имя редакции. Аналитические статьи, обзоры, тексты в стиле автора — там, где Sonnet даёт «среднее по интернету», Opus вытягивает уникальный голос.
Где Opus это прям перебор
Если задача звучит как «перепиши абзац короче», «составь оглавление» или «найди в документе все упоминания продукта» — Opus тут проигрывает Sonnet по экономике в пять раз и не даёт прироста качества. Это же касается классификации, перевода с языка на язык, генерации SQL по шаблону, ответов в чат-ботах. Везде, где задача укладывается в 1500 токенов входа и 1500 токенов выхода, Opus использовать смысла мало.
Если хочется глубже разобраться в том, как мы используем Claude Code в ежедневной работе, читайте обзор 37 slash-команд — там пайплайн SEO-статей описан подробнее.
Sonnet 4.6 — рабочая лошадка для 90 % задач
Если бы в статье можно было оставить одну рекомендацию, она была бы такой: по умолчанию используйте Sonnet 4.6. Это базовое правило самой Anthropic и всех серьёзных команд, которые публикуют свои метрики. Sonnet даёт ~98–99 % качества Opus на кодинге и большинстве текстовых задач при пятикратно меньшей цене.
Что внутри
- Контекстное окно: 1 000 000 токенов.
- Максимальный вывод: 64K токенов.
- Скорость: ~90 токенов в секунду.
- SWE-bench Verified: 79,6 % (на 1,2 % ниже Opus).
- GPQA Diamond: 74,1 %.
- Цена API: $3 за 1M входных, $15 за 1M выходных.
Sonnet и Opus делят один и тот же 1M-токеновый контекст — это значит, что для большинства задач с длинными входами Sonnet ничем не ограничен. Разница чувствуется на «нагрузках сверху»: глубокое рассуждение, длинная агентская сессия, кросс-файловый рефакторинг.
Где Sonnet оптимален
По нашему опыту и по опыту команд, которые делятся метриками публично, Sonnet — это правильный выбор для:
- ежедневного кодинга: фичи на 100–500 строк, баг-фиксы, написание тестов,
- генерации материалов и статей средней длины (до 3000 слов),
- перевода и литературной редактуры,
- анализа документов до 100 страниц,
- работы с табличными данными и парсинга SERP,
- классификации, тегирования, генерации мета-описаний,
- интерактивных диалогов с пользователем там, где важна осмысленность ответа.
Sonnet появился 17 февраля 2026, и многие команды переключились на него с GPT-моделей именно ради экономики.
Кейс редакции: как Sonnet собирает зарплаты для блога
У нас в Checkroi есть отдельная серия статей про зарплаты разных профессий — например, «Сколько зарабатывает C#-разработчик» и аналогичные тексты по другим ролям. В каждой такой статье нужны свежие цифры из 15–20 источников: HH.ru, GetMatch, отчёты НАФИ, региональные срезы, данные по зарубежным рынкам.
Sonnet тут — главный инструмент:
- читает 15–20 страниц с вакансиями и отчётами,
- извлекает медианные цифры,
- собирает их в JSON, который потом ложится в meta-поле статьи и шорткод инфографики.
Расход — около 30 000 входных и 3 000 выходных токенов на один срез. По цене это $0,09 + $0,045 = $0,135, около 13 ₽. На 200 статей это ~2600 ₽. Если бы мы собирали то же самое Opus, заплатили бы около 12 000 ₽ — без видимого прироста в точности данных.
Аналогично работает Sonnet в апдейтах старых статей и в переводах: всё, где задача — «прочитать много, отдать структурированно», Sonnet вытягивает уверенно.
Haiku 4.5 — скорость и цена для агентов и пайплайнов
Haiku — самая молодая и самая дешёвая модель линейки. Anthropic выпустила её осенью 2025 и позиционирует как ответ на GPT-5-mini и Gemini Flash. По качеству Haiku 4.5 достигает ~90 % производительности Sonnet 4.5 на агентских кодинговых задачах при цене в три раза ниже.
Что внутри
- Контекстное окно: 200 000 токенов (в 5 раз меньше Opus и Sonnet).
- Максимальный вывод: 32K токенов.
- Скорость: ~126 токенов в секунду, время до первого токена ~0,5 секунды.
- SWE-bench Verified: 73,3 %.
- Цена API: $1 за 1M входных, $5 за 1M выходных.
Цифра «126 токенов в секунду» означает, что Haiku может за секунду выдать абзац среднего размера. На потоке запросов от тысяч пользователей это критично — там, где Sonnet даст лаг в 3–4 секунды, Haiku ответит за 1.
Где Haiku работает лучше остальных (как мы думаем, но это не точно)
В документации Anthropic и в разборах команд, которые экспериментируют с Haiku, чаще всего встречаются такие сценарии:
- Чат-боты поддержки. Где важна скорость ответа и средняя длина реплики 100–300 токенов.
- Классификация и тегирование. «К какой категории относится тикет», «это ли спам», «найди тональность отзыва».
- Subagents для исследования кода. Когда основной агент на Sonnet делегирует Haiku-агенту прочитать файл, найти упоминания функции, вернуть путь.
- Bulk-обработка контента. Резюме статей, генерация мета-описаний, выделение ключевых тезисов из сотен страниц.
- Live-summarization. Резюме звонков и встреч в реальном времени, расшифровка с структурированием.
- Автодополнение в IDE. Inline-подсказки, которые должны появляться за 200–500 мс.
Anthropic даже встроила Haiku в Claude Code как движок subagent-команды Explore — той самой, которая ходит по файлам, грепает символы и возвращает выжимку, не тратя время на Sonnet или Opus.
Почему в редакции Checkroi пока не нашли применения
А теперь честно. У нас Haiku пока сидит без работы. Причин несколько.
Во-первых, основные продукты редакции — это блог-статьи, видео и Pinterest-пины. Везде задачи длинные: прочитать 30 страниц SERP, написать 6000 слов, собрать сложный JSON с 15 полями. На таких объёмах Haiku теряется — 200K контекста часто еле-еле хватает, а качество текста у него слабее, чем у Sonnet.
Во-вторых, у нас нет real-time продукта. Мы не держим чат-бот для пользователей, не показываем inline-подсказки, не стримим саммари звонков. Все наши пайплайны асинхронные — задержка в 3 секунды против 1 ничего не меняет.
В-третьих, экономика. На тех объёмах, которые мы генерируем, разница между Sonnet и Haiku — это сотни рублей в месяц, а не десятки тысяч. И ради этой разницы потерять качество — невыгодно.
Но это наш контекст. У команды с десятками тысяч пользователей в чате поддержки картина обратная — Haiku может окупить себя за день.
Идеи, где попробовать Haiku
Если у вас есть боевой кейс на Haiku — расскажите в комментариях, мы соберём лучшие идеи в апдейт статьи. Пока вот гипотезы, на которые мы смотрим:
- Короткие описания для маркетплейсов
- Классификатор курсов: тегировать новые программы по скиллам и инструментам.
- Антиспам-фильтр комментариев на сайте.
- Резюме YouTube-видео конкурентов для контент-плана.
Если кто-то из читателей уже катает Haiku в похожих задачах — особенно интересно услышать про потерю качества и реальные затраты.
Сравнение по восьми параметрам
Сводим в одну таблицу всё, что чаще всего нужно при выборе.
| Параметр | Opus 4.7 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|
| Контекстное окно | 1M токенов | 1M токенов | 200K токенов |
| Максимальный вывод | 128K | 64K | 32K |
| Скорость генерации | ~66 ток/с | ~90 ток/с | ~126 ток/с |
| SWE-bench Verified | 80,8 % | 79,6 % | 73,3 % |
| GPQA Diamond | 91,3 % | 74,1 % | — |
| ARC-AGI-2 (логика) | 68,8 % | 58,3 % | — |
| Цена входа за 1M | $5,00 | $3,00 | $1,00 |
| Цена выхода за 1M | $25,00 | $15,00 | $5,00 |
Что видно из таблицы:
- На SWE-bench разрыв Opus и Sonnet — 1,2 %, разрыв с Haiku — около 7 %. На типовом коде разница между Opus и Sonnet почти неуловима.
- На научных задачах (GPQA Diamond) разрыв Opus и Sonnet — 17,2 процентных пункта. Это сценарий, ради которого Opus покупают.
- По скорости лидер — Haiku, в два раза быстрее Opus.
- Цена входа: Opus в 5 раз дороже Haiku и в 1,67 раза дороже Sonnet.
Бенчмарки — кто умнее на цифрах
Бенчмарк — это синтетика, но по нему удобно сравнивать модели между собой. Anthropic публикует три метрики, и каждая отвечает на свой вопрос.
SWE-bench Verified. Тестовый набор из реальных багов в опенсорс-репозиториях. Модель получает описание бага и должна написать патч, который пройдёт тесты. Тут Opus берёт 80,8 %, Sonnet — 79,6 %, Haiku — 73,3 %. Вывод: для большинства практических багфиксов Sonnet работает почти как Opus.
Что важно: эти же модели в тестах AIME (математика школьного уровня) и HumanEval (генерация кода по ТЗ) показывают похожую картину — Sonnet идёт впритык за Opus, Haiku отстаёт на 5–10 %.
GPQA Diamond. Это набор из вопросов по физике, химии и биологии экспертного уровня — таких, на которые даже PhD-студенты отвечают с трудом. Тут Opus резко отрывается: 91,3 % против 74,1 % у Sonnet. Если задача похожа на «разобраться в статье из Nature, найти подвох в методологии» — это сценарий Opus.
ARC-AGI-2. Тест на абстрактное рассуждение и узнавание паттернов. Opus берёт 68,8 %, Sonnet — 58,3 %. Разрыв в 10 процентных пунктов виден на задачах, где нужна нестандартная логика: придумать алгоритм, разобраться в головоломке, выйти за шаблон.
Практический вывод: если ваша задача не похожа на «экспертный вопрос по химии» и не на «нестандартный паттерн» — берите Sonnet. На остальном бенчмарки между Sonnet и Opus отличаются в пределах процента.
Цены — сколько Claude стоит в долларах и рублях
Тарифы API Anthropic — самая прозрачная часть. Главный нюанс — оплата в долларах, а для России это не так просто. Разберём по уровням.
Тарифы API за 1M токенов
| Модель | Вход ($/1M) | Выход ($/1M) | Вход в ₽ (курс 92) | Выход в ₽ (курс 92) |
|---|---|---|---|---|
| Opus 4.7 | $5,00 | $25,00 | ~460 ₽ | ~2300 ₽ |
| Sonnet 4.6 | $3,00 | $15,00 | ~276 ₽ | ~1380 ₽ |
| Haiku 4.5 | $1,00 | $5,00 | ~92 ₽ | ~460 ₽ |
Дополнительно у Anthropic есть два способа уронить счёт:
- Prompt caching — закешированный вход стоит в 10 раз дешевле. Если вы дёргаете API с одним и тем же системным промптом, экономия колоссальная.
- Batch API — асинхронная обработка с дедлайном 24 часа даёт скидку 50 % на все токены. Подходит для оффлайн-пайплайнов.
Подписки Claude.ai
Если вы работаете руками через интерфейс claude.ai, а не через API, у Anthropic есть три тарифа:
- Pro — $20/месяц. Sonnet 4.6 с большими лимитами, Opus с ограничениями. Подходит для регулярной работы одного человека.
- Max ×5 — $100/месяц. Лимиты Pro, умноженные на пять. Уже доступ к Opus в нормальном объёме.
- Max ×20 — $200/месяц. Профессиональный уровень с большим лимитом на Opus, включая Claude Code.
Тариф Max ×20 в месяц обходится примерно как 20 штук Opus-статей по нашему расчёту выше. Но если параллельно гоняете Claude Code и делаете разработку — это окупается за неделю.
Российские прокси и агрегаторы
Из России напрямую оплатить подписку Anthropic не получится — нужен заграничный счёт и КВН. Поэтому большая часть рынка работает через прокси-сервисы, которые перепродают доступ за рубли. Цены, которые видим на рынке:
- от 500–600 ₽/месяц за Sonnet с ограниченными лимитами,
- от 1500–2000 ₽/месяц за Opus,
- кредитные системы без подписки — оплата по факту использования с наценкой 15–30 % к курсу.
Кредитная схема выгоднее, если используете нерегулярно. Подписка — если используете каждый день и знаете свой средний объём.
Как считать бюджет на проект
Простая формула для прикидки бюджета:
Цена запроса (₽) = (входные токены × цена_входа + выходные токены × цена_выхода) / 1 000 000 × курс_доллара.
Пример: статья в 5000 слов через Sonnet с 30K входных и 7K выходных токенов даёт $0,09 + $0,105 = $0,195. По курсу 92 ₽ — около 18 ₽ за статью. На 100 статей в месяц — 1800 ₽. Через прокси с наценкой 20 % — около 2200 ₽.
Реальный счёт всегда выше, потому что вы будете делать несколько итераций, ошибаться и переделывать. Закладывайте запас 1,5–2×.
Матрица «задача → модель → токены → ₽»
Это главная таблица статьи. Мы собрали 15 типовых задач, которые встречаются у разработчиков, маркетологов, аналитиков и контент-команд. Для каждой — рекомендованная модель, примерный объём токенов и цена в рублях по курсу 92.
| Задача | Модель | Вход (ток) | Выход (ток) | Цена за 1 запрос (₽) |
|---|---|---|---|---|
| SEO-статья 3000 слов на заданную тему | Sonnet | 30K | 7K | ~18 |
| Перевод 10 страниц с английского на русский | Sonnet | 15K | 15K | ~25 |
| Резюме 30 статей конкурентов | Sonnet | 200K | 5K | ~62 |
| Архитектурный план микросервиса | Opus | 10K | 5K | ~16 |
| Багфикс на 100 строк кода | Sonnet | 5K | 2K | ~4 |
| Рефакторинг 50 файлов в проекте | Opus | 200K | 50K | ~209 |
| Code-review pull request | Sonnet | 20K | 3K | ~10 |
| Генерация unit-тестов | Sonnet | 5K | 5K | ~8 |
| Анализ договора на 100 страниц | Opus | 150K | 5K | ~80 |
| Классификация 1000 тикетов поддержки | Haiku | 500K | 20K | ~55 |
| Антиспам-фильтр для 10K комментариев | Haiku | 1M | 50K | ~115 |
| Чат-бот поддержки (1000 диалогов в день) | Haiku | 2M | 500K | ~414 |
| Меты для 500 карточек товаров | Haiku | 250K | 50K | ~46 |
| Сложный аналитический отчёт | Opus | 50K | 15K | ~57 |
На что обратить внимание:
- Большинство задач разработчика и маркетолога с объёмом до 30K входа закрываются Sonnet за 5–30 ₽. Это та экономика, при которой нет смысла экономить на модели.
- Opus оправдан там, где есть длинный контекст или ответственная задача с имеемом редакции. Цена 80–200 ₽ за качественный артефакт окупает себя одной публикацией.
- Haiku берёт массовые сценарии: 500–1000 запросов в сутки, простые ответы, классификация. Тут разница в цене между Sonnet и Haiku превращается в тысячи рублей в месяц.
Дополнительно загляните в сравнение Claude Code и Cursor — там разбираем, как выбор модели сочетается с выбором инструмента разработки.
Когда переключаться между моделями
Если хочется простого алгоритма принятия решения — вот он. Прогоняйте свою задачу через четыре вопроса, и на выходе получите рекомендацию.
Вопрос 1: задача требует обработки больше 200K токенов входа за один запрос?
- Да — Opus или Sonnet (у Haiku потолок 200K).
- Нет — все три модели.
Вопрос 2: задача похожа на «экспертный анализ», «архитектура», «нестандартное рассуждение»?
- Да — Opus.
- Нет — Sonnet или Haiku.
Вопрос 3: задача должна возвращать ответ за время меньше секунды?
- Да — Haiku.
- Нет — Sonnet.
Вопрос 4: вы будете делать тысячи запросов в сутки, и разница в 3 раза по цене ощутима?
- Да — Haiku, если качество не проседает в вашем тесте.
- Нет — Sonnet, не тратьте время на A/B.
Этого хватает в 90 % случаев. Если по всем вопросам ответ «не знаю», начните с Sonnet — он покрывает большинство сценариев и даст понять, где упирается в потолок.
Pipeline Haiku → Sonnet → Opus: как комбинировать модели
Самый умный паттерн — собирать пайплайн из трёх моделей вместо ставки на одну. Это даёт экономию 60–80 % по сравнению с «всё на Opus» и не проигрывает в качестве.
Схема:
- Haiku — на грубой фильтрации. Сначала Haiku читает 1000 записей, отсеивает мусор, классифицирует по типам.
- Sonnet — на основной обработке. Дальше Sonnet берёт 200 отфильтрованных записей, делает с ними основную работу: суммирует, анализирует, генерирует.
- Opus — на финальной сборке. На конце Opus берёт результаты Sonnet и собирает их в высококачественный артефакт — отчёт, статью, рекомендацию.
Пример: у вас есть тысяча отзывов о продукте.
- Haiku читает все 1000, помечает тональность и тему — 50K выходных токенов за ~50 ₽.
- Sonnet берёт 100 самых негативных отзывов, делает по ним выжимку — 20K выходных токенов за ~30 ₽.
- Opus собирает финальный отчёт с рекомендациями для продакта — 5K выходных за ~12 ₽.
Итого ~92 ₽. Если бы вся обработка шла на Opus, заплатили бы 400–500 ₽. Если всё на Haiku — финальный отчёт получился бы средним по качеству.
Такая же логика работает в Claude Code: Explore-subagent на Haiku грепает по кодбазе, Sonnet пишет основной код, Opus подключается на планирование и ревью. Подробно про subagent в Claude Code мы разобрали в материале про MCP.
Claude vs GPT-5 vs Gemini 3 Pro
Выбор между моделями Claude почти всегда идёт в связке с вопросом «а может, взять GPT-5 или Gemini». Поэтому короткий ориентир по рынку на май 2026.
На кодинге Claude Sonnet 4.6 идёт почти вровень с GPT-5 (Sonnet 79,6 % vs GPT-5 ~80 % на SWE-bench), опережает Gemini 3 Pro и ощутимо обходит Grok 4. Большинство команд, которые делают плагины для VS Code и JetBrains, ставят Claude по умолчанию.
На длинном контексте Anthropic и Google идут плечом к плечу: у обеих 1M-токеновое окно. У OpenAI пока заметно меньше. Если задача — прочитать сборник из 500 страниц и собрать сводку, Sonnet и Gemini 3 Pro почти неотличимы по качеству, но Sonnet выходит дешевле.
На экспертных научных задачах Opus 4.7 берёт 91,3 % GPQA, GPT-5 — 84 %, Gemini 3 Pro — 82 %. Это тот класс задач, ради которого Anthropic держит флагман дорогим.
На цене у Anthropic середина рынка: Sonnet 4.6 ($3/$15) дороже Gemini 2.5 Flash и дешевле GPT-5. Haiku 4.5 ($1/$5) бьётся с GPT-5-mini и Gemini Flash по нижнему сегменту.
Что выбрать вне Claude — отдельный разговор. Если уже работаете на Anthropic и вас устраивает качество — менять смысла нет. Если экспериментируете — у Sonnet 4.6 сейчас лучший баланс цены и качества на рынке для повседневных задач.
Лимиты и rate limits — на что нарвётесь
Когда модель выбрана, остаётся неприятный сюрприз — rate limits. Anthropic ставит ограничения на каждый аккаунт по нескольким осям:
- Запросы в минуту (RPM) — у Opus и Sonnet стартовый лимит ниже, чем у Haiku. На уровне Tier 1 это 50 RPM для Opus и 1000 RPM для Haiku.
- Токены в минуту (TPM) — отдельный лимит на объём прокачанных через API токенов в минуту. Чем выше Tier, тем больше TPM.
- Tier — уровень аккаунта Anthropic растёт по мере того, как вы тратите деньги. Tier 1 — это $5 потраченных, Tier 4 — $400.
На что это влияет в продакшене:
- Если делаете чат-бот на Sonnet и ждёте 100 запросов в минуту — Tier 1 вас положит.
- Если гоняете Opus в Claude Code весь день, упрётесь не в деньги, а в TPM.
- Для пайплайнов с Haiku rate limit обычно не проблема — модель спроектирована под нагрузку.
Заранее заглядывайте в консоль Anthropic, поднимайте Tier, и если объёмы серьёзные — оформляйте корпоративный аккаунт через AWS Bedrock или Google Vertex AI. Там лимиты выше, цены те же.
5 типичных ошибок при выборе модели
Эти грабли мы собирали из своего опыта и из комментариев команд, которые публиковали отчёты про переход на Claude.
Ошибка 1 — брать Opus по инерции. «Самая дорогая, значит лучшая» работает плохо. На типовом коде, переводе, генерации сниппетов Sonnet даёт тот же результат за в пять раз меньшие деньги. Тест прост: возьмите 10 своих типовых запросов, прогоните на Sonnet и на Opus, сравните результаты глазами. В 90 % случаев увидите паритет.
Ошибка 2 — брать Haiku ради экономии без A/B-теста. Haiku дешевле в три раза, но на сложных задачах теряет 5–10 % качества. Если ваш продукт — это «классификация спама» — потеря 5 % точности приемлема. Если «генерация описаний товаров» — потеря 5 % литературного качества может стоить конверсии. Всегда сравнивайте на своих данных, не на бенчмарках.
Ошибка 3 — игнорировать prompt caching. Если у вас длинный системный промпт (документация продукта, правила, контекст), и вы дёргаете API сотни раз с одним и тем же промптом — без кеширования платите за этот промпт каждый раз. С кешированием первый запрос дороже на 25 %, последующие дешевле в 10 раз. На большом проекте это экономия 60–80 % бюджета.
Ошибка 4 — не использовать batch API. Если задача терпит до 24 часов (генерация описаний, обработка архива, оффлайн-анализ) — batch API даёт скидку 50 % на все токены. Один параметр в запросе — половина счёта.
Ошибка 5 — закладываться на текущие цены. Anthropic меняет цены и модели несколько раз в год. С Opus 4.6 на Opus 4.7 поменялся токенайзер — тот же запрос теперь выдаёт на 25–35 % больше токенов. Закладывайте в бюджет запас, мониторьте Anthropic Changelog раз в месяц.
Как переключать модели в Claude.ai, Claude Code и API
Маленький практический раздел — как именно дёрнуть конкретную модель в каждом из интерфейсов Anthropic.
В веб-интерфейсе claude.ai. Сверху чата есть переключатель моделей: Sonnet 4.6, Opus 4.7 и Haiku 4.5 (на тарифе Pro и выше). Меняется в два клика, история чата сохраняется. Удобно проверить гипотезу: задать тот же вопрос двум моделям подряд и сравнить ответы вживую.
В Claude Code. Команда /model в CLI открывает список доступных моделей. По умолчанию работает связка «Opus на планировании, Sonnet на исполнении». Принудительно переключиться на одну модель можно через /model opus или /model sonnet. Subagents (например, Explore) живут на Haiku и дёргаются автоматически. Подробнее — в разборе slash-команд Claude Code.
В API. Модель задаётся параметром model в запросе: claude-opus-4-7, claude-sonnet-4-6, claude-haiku-4-5-20251001. Менять можно из запроса в запрос — это и есть основа router-паттерна, при котором ваш сервис сам решает, на какую модель отправить конкретный запрос.
Самый простой router-паттерн в коде: считаете длину входа и сложность задачи, если короче 5000 токенов и это классификация — шлёте на Haiku, если средняя задача — Sonnet, если требуется глубокое рассуждение — Opus. Anthropic сама рекомендует именно такой подход в документации.
Чего не умеют все три модели одинаково
Чтобы не было ложных ожиданий, перечислим ограничения, которые касаются всех трёх Claude.
- Свежие данные. У всех моделей есть knowledge cutoff. На май 2026 Opus 4.7 обучен на данных до января 2026, Sonnet 4.6 и Haiku 4.5 — до октября 2025. Свежие новости и курсы валют модели не знают, для этого подключайте веб-поиск или MCP-серверы.
- Реальное время. Claude не умеет сам ходить в интернет без отдельного инструмента. Если нужны живые данные — либо встройте веб-поиск через API, либо подключите MCP-сервер. У нас есть подборка из 10 полезных MCP-серверов — там это разобрано.
- Сложная математика. Все три модели хороши на школьной математике и средней олимпиадной, но на серьёзных вычислениях ошибаются. Используйте Python-интерпретатор как инструмент.
- Гарантия фактов. Любая LLM может галлюцинировать. Особенно опасны выдуманные цитаты, ссылки на статьи и фамилии экспертов. Все факты в ответственном тексте проверяйте по первоисточникам.
- Длинный output. Даже у Opus максимальный ответ — 128K токенов (~95K слов). Для книг и очень длинных документов придётся писать главами и склеивать вручную.
На этом фоне Claude — пока самая «осторожная» из больших моделей. Меньше галлюцинирует, чаще говорит «не знаю», легче признаёт ошибку. Это плюс для серьёзных задач и минус для творческих.
Главная мысль: начните с Sonnet, переключайтесь по факту
Если унести из статьи одно правило, унесите это. По умолчанию все новые задачи запускайте на Sonnet 4.6. Sonnet справится с 90 % работы качественно и в разумную цену.
Переключайте задачу на Opus, когда видите такие особенности:
- Sonnet неправильно добавляет ToV бизнеса или голос автора в тексте.
- Sonnet перестаёт действовать по плану в агентской сессии длиннее 10 шагов.
- Sonnet делает фактические ошибки в экспертной области.
- В кодинге Sonnet выдаёт решение, которое формально работает, но ломает архитектуру.
Переключайте на Haiku, когда видите вот такое:
- Объём запросов растёт до тысяч в сутки.
- Время отклика стало узким местом продукта.
- Качество ответа в A/B-тесте между Sonnet и Haiku отличается на 1–2 %, не больше.
И помните: Anthropic постоянно обновляет модели. Цены и бенчмарки на момент публикации статьи актуальны, но через полгода-год картинка изменится. Сверяйтесь с официальной страницей цен Anthropic и с документацией перед серьёзным деплоем.
Где научиться работать с нейросетями: подборка курсов
Чтобы быстро прокачаться от «я кручу Claude в браузере» до «я собираю продакшен-пайплайны с API и Claude Code», лучше один раз сесть на нормальный курс. Мы собрали 316 программ по нейросетям и искусственному интеллекту от крупных российских школ — от коротких интенсивов на месяц до годовых программ с трудоустройством.
В подборке есть курсы по промпт-инжинирингу, по LLM-разработке, по интеграции AI в продукты, по ML-инженерии и дата-сайенсу.
| Курс | Школа | Стоимость со скидкой | В рассрочку | Длительность | Обзор курса от Checkroi |
|---|---|---|---|---|---|
| Искусственный интеллект Перейти на сайт курса | GeekBrains | 156 162 ₽ | 4688 ₽/мес. | 12 месяцев | Обзор курса |
| Нейросети на практике Перейти на сайт курса | Академия Эдюсон | 54 515 ₽ | 4542 ₽/мес. | 2 месяца | Обзор курса |
| Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса | Нетология | 162 500 ₽ | 244 ₽/мес. | 24 месяца | Обзор курса |
| Нейросети для анализа данных Перейти на сайт курса | Нетология | 31 700 ₽ | 2351 ₽/мес. | 8 недель | Обзор курса |
| Нейросети для изображений и видео Перейти на сайт курса | Академия Эдюсон | 69 100 ₽ | 5758 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети для дизайна Перейти на сайт курса | Яндекс Практикум | 64 000 ₽ | 2612 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети: практический курс Перейти на сайт курса | Skypro | 25 990 ₽ | 181 667 ₽/мес. | 3 месяца | Обзор курса |
| Нейросети для финансистов Перейти на сайт курса | Академия Эдюсон | 65 600 ₽ | 5466 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети для Бухгалтера Перейти на сайт курса | Академия Эдюсон | 49 000 ₽ | 4083 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети для рабочих задач Перейти на сайт курса | Skillbox | 29 800 ₽ | 2483 ₽/мес. | 1 месяц | Обзор курса |
Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту
Если интересует именно практика с Claude — почитайте параллельно обзор Claude Design и материал про AI-native людей. Первый — про новый продукт Anthropic для дизайнеров, второй — про то, как меняется профессиональный профиль под давлением AI.
А если у вас есть свой кейс с Haiku, Sonnet или Opus — расскажите в комментариях. Особенно интересно про реальное применение Haiku: мы всё ещё ищем, куда бы его пристроить в Checkroi.



![Статья: Subagents в Claude Code: создание, 7 готовых ролей и сравнение со Skills, Slash-commands и Agent Teams в 2026 Subagents в Claude Code: создание, 7 готовых ролей и сравнение со Skills, Slash-commands и Agent Teams в [current_year]](https://checkroi.ru/wp-content/uploads/2026/05/og-cover-58352-1779036868.jpg)
