• Опубликовано
  • 18 просмотров
  • 21 мин. чтения
  • 0 комментариев

Opus 4.7 vs Sonnet 4.6 vs Haiku 4.5: какую модель Claude выбрать в 2026

Разбираем Opus 4.7, Sonnet 4.6 и Haiku 4.5: где какая работает лучше, сколько стоит в рублях и как комбинировать их в одном пайплайне. С кейсами редакции Checkroi.
Статью написал:
Ваня Буявец, продюсер, основатель Checkroi
Ваня Буявец
Основатель Checkroi, продюсер Telegram-каналов, эксперт в выборе онлайн-курсов
Все 291 статья автора
Одобрено экспертом:
Наташа Буявец, основатель Checkroi, эксперт по онлайн-курсам
Наташа Буявец
Основательница Checkroi, продюсер Youtube-каналов, эксперт по онлайн-курсам
Все 953 экспертных мнения
Opus 4.7 vs Sonnet 4.6 vs Haiku 4.5: какую модель Claude выбрать в 2026

В линейке Claude три модели — Opus 4.7, Sonnet 4.6 и Haiku 4.5. Разница в цене между крайними — пятикратная. Разница в качестве на обычной задаче — в пределах ошибки. И всё-таки выбор модели — это первое решение, которое влияет на счёт в конце месяца и на то, выйдет ли у вас законченный продукт.

Внутри статьи: разбор каждой модели по контексту, скорости и цене, бенчмарки SWE-bench и GPQA, сравнительная таблица по восьми параметрам, цены API в долларах и рублях, матрица из 15 типовых задач с рекомендованной моделью и кейсами редакции Checkroi.

Если вы только знакомитесь с продуктами Anthropic, сначала загляните в обзор «Что такое Claude Code» — там разобрали интерфейс, тарифы и первый запуск.

А общую базу по нейросетям мы собрали в материале «Что такое нейросети простыми словами» — оттуда удобно стартовать, если термины «токен» и «контекстное окно» пока звучат как иностранный язык.

Статья пригодится не только разработчикам. Claude сегодня используют редакторы, маркетологи, аналитики, продакты, SEO-специалисты — везде, где нужно ускорить рутину и разобраться в больших объёмах текста.

Если хочется освоить ремесло системно — загляните в нашу подборку курсов по нейросетям и искусственному интеллекту: там 316 программ — от коротких интенсивов до годовых.

Главное за 60 секунд

Если читать совсем некогда — вот короткая выжимка по трём моделям и по тому, как мы их распределили в редакции Checkroi.

Модель Сильная сторона Цена API (вход/выход за 1M) На что ставим в Checkroi
Opus 4.7 Длинные тексты, архитектура, сложный кодинг $5 / $25 Глубокая аналитика для статей, разработка плагинов, ревью больших PR
Sonnet 4.6 Баланс цены и качества для 90 % задач $3 / $15 Сбор зарплат и SERP-данных, переводы, апдейты статей
Haiku 4.5 Скорость и цена, чат-боты, классификация $1 / $5 Пока ничего регулярного — ниже расскажем, почему

Кратко: Sonnet 4.6 закрывает 90 % рабочих сценариев. Opus берём, когда задача связана с длинным контекстом, ответственным кодом или текстом, который пойдёт под имя редакции. Haiku — для пайплайнов с тысячами запросов в минуту, где важна каждая копейка и десятая доля секунды.

Три модели — три задачи

Anthropic собрала линейку так, что каждая модель закрывает свой слой:

  • Opus 4.7 — флагман. Самые сложные рассуждения, длинные агентские сессии, работа с кодовыми базами на сотни файлов. Это «модель, которая думает долго и глубоко».
  • Sonnet 4.6 — рабочая лошадка. По бенчмаркам отстаёт от Opus всего на 1–2 %, а стоит в пять раз меньше. Это «модель, которая думает достаточно хорошо за разумные деньги».
  • Haiku 4.5 — скоростная. Отвечает в реальном времени, обрабатывает десятки тысяч токенов в секунду. Это «модель, которая отвечает мгновенно, когда не нужно много думать».

Любопытная деталь от самой Anthropic: в Claude Code режим планирования по умолчанию использует Opus, а режим выполнения переключается на Sonnet. То есть продукт собран по той же логике, по которой мы строим этот гайд: думать — Opus, делать — Sonnet, перебирать данные — Haiku.

Opus 4.7 — флагман для статей, архитектуры и сложного кодинга

Opus — самая «умная» из трёх, но и самая дорогая. Цена входа в пять раз выше, чем у Haiku, и в 1,67 раза выше, чем у Sonnet. Анализ Anthropic показывает: дороговизна оправдана только на небольшом классе задач. Зато там разрыв с Sonnet ощутимый — на GPQA Diamond (это такой тип исследований) Opus берёт 91,3 %, Sonnet — 74,1 %.

Что внутри

  • Контекстное окно: 1 000 000 токенов (~750 страниц книги).
  • Максимальный вывод: 128K токенов за один ответ.
  • Скорость: ~66 токенов в секунду — самая медленная из трёх.
  • SWE-bench Verified: 80,8 %.
  • GPQA Diamond (научные задачи): 91,3 %.
  • ARC-AGI-2 (логика): 68,8 %.
  • Цена API: $5 за 1M входных токенов, $25 за 1M выходных.

Дополнительная деталь: у Opus 4.7 новый токенайзер, который на тех же русских текстах может генерировать на 25–35 % больше токенов, чем Opus 4.6. Тариф за токен прежний, но реальный счёт за тот же запрос может вырасти. На это стоит закладывать запас при планировании бюджета.

Где Opus незаменим

Anthropic в документации называет четыре сценария, в которых премия Opus оправдывается:

  1. Длинный контекст с глубоким рассуждением. Анализ договора на 200 страниц, разбор финансовой отчётности, чтение всей кодовой базы с 500+ файлов.
  2. Agent Teams. Когда один агент координирует работу нескольких других — Opus устойчивее ведёт план и не путается в подзадачах.
  3. Архитектурные решения в коде. Рефакторинг, миграция между фреймворками, выбор паттернов — всё, где ошибка стоит дня работы.
  4. Тексты под имя редакции. Аналитические статьи, обзоры, тексты в стиле автора — там, где Sonnet даёт «среднее по интернету», Opus вытягивает уникальный голос.

Где Opus это прям перебор

Если задача звучит как «перепиши абзац короче», «составь оглавление» или «найди в документе все упоминания продукта» — Opus тут проигрывает Sonnet по экономике в пять раз и не даёт прироста качества. Это же касается классификации, перевода с языка на язык, генерации SQL по шаблону, ответов в чат-ботах. Везде, где задача укладывается в 1500 токенов входа и 1500 токенов выхода, Opus использовать смысла мало.

Если хочется глубже разобраться в том, как мы используем Claude Code в ежедневной работе, читайте обзор 37 slash-команд — там пайплайн SEO-статей описан подробнее.

Sonnet 4.6 — рабочая лошадка для 90 % задач

Если бы в статье можно было оставить одну рекомендацию, она была бы такой: по умолчанию используйте Sonnet 4.6. Это базовое правило самой Anthropic и всех серьёзных команд, которые публикуют свои метрики. Sonnet даёт ~98–99 % качества Opus на кодинге и большинстве текстовых задач при пятикратно меньшей цене.

Что внутри

  • Контекстное окно: 1 000 000 токенов.
  • Максимальный вывод: 64K токенов.
  • Скорость: ~90 токенов в секунду.
  • SWE-bench Verified: 79,6 % (на 1,2 % ниже Opus).
  • GPQA Diamond: 74,1 %.
  • Цена API: $3 за 1M входных, $15 за 1M выходных.

Sonnet и Opus делят один и тот же 1M-токеновый контекст — это значит, что для большинства задач с длинными входами Sonnet ничем не ограничен. Разница чувствуется на «нагрузках сверху»: глубокое рассуждение, длинная агентская сессия, кросс-файловый рефакторинг.

Где Sonnet оптимален

По нашему опыту и по опыту команд, которые делятся метриками публично, Sonnet — это правильный выбор для:

  • ежедневного кодинга: фичи на 100–500 строк, баг-фиксы, написание тестов,
  • генерации материалов и статей средней длины (до 3000 слов),
  • перевода и литературной редактуры,
  • анализа документов до 100 страниц,
  • работы с табличными данными и парсинга SERP,
  • классификации, тегирования, генерации мета-описаний,
  • интерактивных диалогов с пользователем там, где важна осмысленность ответа.

Sonnet появился 17 февраля 2026, и многие команды переключились на него с GPT-моделей именно ради экономики.

Кейс редакции: как Sonnet собирает зарплаты для блога

У нас в Checkroi есть отдельная серия статей про зарплаты разных профессий — например, «Сколько зарабатывает C#-разработчик» и аналогичные тексты по другим ролям. В каждой такой статье нужны свежие цифры из 15–20 источников: HH.ru, GetMatch, отчёты НАФИ, региональные срезы, данные по зарубежным рынкам.

Sonnet тут — главный инструмент:

  • читает 15–20 страниц с вакансиями и отчётами,
  • извлекает медианные цифры,
  • собирает их в JSON, который потом ложится в meta-поле статьи и шорткод инфографики.

Расход — около 30 000 входных и 3 000 выходных токенов на один срез. По цене это $0,09 + $0,045 = $0,135, около 13 ₽. На 200 статей это ~2600 ₽. Если бы мы собирали то же самое Opus, заплатили бы около 12 000 ₽ — без видимого прироста в точности данных.

Аналогично работает Sonnet в апдейтах старых статей и в переводах: всё, где задача — «прочитать много, отдать структурированно», Sonnet вытягивает уверенно.

Haiku 4.5 — скорость и цена для агентов и пайплайнов

Haiku — самая молодая и самая дешёвая модель линейки. Anthropic выпустила её осенью 2025 и позиционирует как ответ на GPT-5-mini и Gemini Flash. По качеству Haiku 4.5 достигает ~90 % производительности Sonnet 4.5 на агентских кодинговых задачах при цене в три раза ниже.

Что внутри

  • Контекстное окно: 200 000 токенов (в 5 раз меньше Opus и Sonnet).
  • Максимальный вывод: 32K токенов.
  • Скорость: ~126 токенов в секунду, время до первого токена ~0,5 секунды.
  • SWE-bench Verified: 73,3 %.
  • Цена API: $1 за 1M входных, $5 за 1M выходных.

Цифра «126 токенов в секунду» означает, что Haiku может за секунду выдать абзац среднего размера. На потоке запросов от тысяч пользователей это критично — там, где Sonnet даст лаг в 3–4 секунды, Haiku ответит за 1.

Где Haiku работает лучше остальных (как мы думаем, но это не точно)

В документации Anthropic и в разборах команд, которые экспериментируют с Haiku, чаще всего встречаются такие сценарии:

  • Чат-боты поддержки. Где важна скорость ответа и средняя длина реплики 100–300 токенов.
  • Классификация и тегирование. «К какой категории относится тикет», «это ли спам», «найди тональность отзыва».
  • Subagents для исследования кода. Когда основной агент на Sonnet делегирует Haiku-агенту прочитать файл, найти упоминания функции, вернуть путь.
  • Bulk-обработка контента. Резюме статей, генерация мета-описаний, выделение ключевых тезисов из сотен страниц.
  • Live-summarization. Резюме звонков и встреч в реальном времени, расшифровка с структурированием.
  • Автодополнение в IDE. Inline-подсказки, которые должны появляться за 200–500 мс.

Anthropic даже встроила Haiku в Claude Code как движок subagent-команды Explore — той самой, которая ходит по файлам, грепает символы и возвращает выжимку, не тратя время на Sonnet или Opus.

Почему в редакции Checkroi пока не нашли применения

А теперь честно. У нас Haiku пока сидит без работы. Причин несколько.

Во-первых, основные продукты редакции — это блог-статьи, видео и Pinterest-пины. Везде задачи длинные: прочитать 30 страниц SERP, написать 6000 слов, собрать сложный JSON с 15 полями. На таких объёмах Haiku теряется — 200K контекста часто еле-еле хватает, а качество текста у него слабее, чем у Sonnet.

Во-вторых, у нас нет real-time продукта. Мы не держим чат-бот для пользователей, не показываем inline-подсказки, не стримим саммари звонков. Все наши пайплайны асинхронные — задержка в 3 секунды против 1 ничего не меняет.

В-третьих, экономика. На тех объёмах, которые мы генерируем, разница между Sonnet и Haiku — это сотни рублей в месяц, а не десятки тысяч. И ради этой разницы потерять качество — невыгодно.

Но это наш контекст. У команды с десятками тысяч пользователей в чате поддержки картина обратная — Haiku может окупить себя за день.

Идеи, где попробовать Haiku

Если у вас есть боевой кейс на Haiku — расскажите в комментариях, мы соберём лучшие идеи в апдейт статьи. Пока вот гипотезы, на которые мы смотрим:

  • Короткие описания для маркетплейсов
  • Классификатор курсов: тегировать новые программы по скиллам и инструментам.
  • Антиспам-фильтр комментариев на сайте.
  • Резюме YouTube-видео конкурентов для контент-плана.

Если кто-то из читателей уже катает Haiku в похожих задачах — особенно интересно услышать про потерю качества и реальные затраты.

Сравнение по восьми параметрам

Сводим в одну таблицу всё, что чаще всего нужно при выборе.

Параметр Opus 4.7 Sonnet 4.6 Haiku 4.5
Контекстное окно 1M токенов 1M токенов 200K токенов
Максимальный вывод 128K 64K 32K
Скорость генерации ~66 ток/с ~90 ток/с ~126 ток/с
SWE-bench Verified 80,8 % 79,6 % 73,3 %
GPQA Diamond 91,3 % 74,1 %
ARC-AGI-2 (логика) 68,8 % 58,3 %
Цена входа за 1M $5,00 $3,00 $1,00
Цена выхода за 1M $25,00 $15,00 $5,00

Что видно из таблицы:

  • На SWE-bench разрыв Opus и Sonnet — 1,2 %, разрыв с Haiku — около 7 %. На типовом коде разница между Opus и Sonnet почти неуловима.
  • На научных задачах (GPQA Diamond) разрыв Opus и Sonnet — 17,2 процентных пункта. Это сценарий, ради которого Opus покупают.
  • По скорости лидер — Haiku, в два раза быстрее Opus.
  • Цена входа: Opus в 5 раз дороже Haiku и в 1,67 раза дороже Sonnet.

Бенчмарки — кто умнее на цифрах

Бенчмарк — это синтетика, но по нему удобно сравнивать модели между собой. Anthropic публикует три метрики, и каждая отвечает на свой вопрос.

SWE-bench Verified. Тестовый набор из реальных багов в опенсорс-репозиториях. Модель получает описание бага и должна написать патч, который пройдёт тесты. Тут Opus берёт 80,8 %, Sonnet — 79,6 %, Haiku — 73,3 %. Вывод: для большинства практических багфиксов Sonnet работает почти как Opus.

Что важно: эти же модели в тестах AIME (математика школьного уровня) и HumanEval (генерация кода по ТЗ) показывают похожую картину — Sonnet идёт впритык за Opus, Haiku отстаёт на 5–10 %.

GPQA Diamond. Это набор из вопросов по физике, химии и биологии экспертного уровня — таких, на которые даже PhD-студенты отвечают с трудом. Тут Opus резко отрывается: 91,3 % против 74,1 % у Sonnet. Если задача похожа на «разобраться в статье из Nature, найти подвох в методологии» — это сценарий Opus.

ARC-AGI-2. Тест на абстрактное рассуждение и узнавание паттернов. Opus берёт 68,8 %, Sonnet — 58,3 %. Разрыв в 10 процентных пунктов виден на задачах, где нужна нестандартная логика: придумать алгоритм, разобраться в головоломке, выйти за шаблон.

Практический вывод: если ваша задача не похожа на «экспертный вопрос по химии» и не на «нестандартный паттерн» — берите Sonnet. На остальном бенчмарки между Sonnet и Opus отличаются в пределах процента.

Цены — сколько Claude стоит в долларах и рублях

Тарифы API Anthropic — самая прозрачная часть. Главный нюанс — оплата в долларах, а для России это не так просто. Разберём по уровням.

Тарифы API за 1M токенов

Модель Вход ($/1M) Выход ($/1M) Вход в ₽ (курс 92) Выход в ₽ (курс 92)
Opus 4.7 $5,00 $25,00 ~460 ₽ ~2300 ₽
Sonnet 4.6 $3,00 $15,00 ~276 ₽ ~1380 ₽
Haiku 4.5 $1,00 $5,00 ~92 ₽ ~460 ₽

Дополнительно у Anthropic есть два способа уронить счёт:

  • Prompt caching — закешированный вход стоит в 10 раз дешевле. Если вы дёргаете API с одним и тем же системным промптом, экономия колоссальная.
  • Batch API — асинхронная обработка с дедлайном 24 часа даёт скидку 50 % на все токены. Подходит для оффлайн-пайплайнов.

Подписки Claude.ai

Если вы работаете руками через интерфейс claude.ai, а не через API, у Anthropic есть три тарифа:

  • Pro — $20/месяц. Sonnet 4.6 с большими лимитами, Opus с ограничениями. Подходит для регулярной работы одного человека.
  • Max ×5 — $100/месяц. Лимиты Pro, умноженные на пять. Уже доступ к Opus в нормальном объёме.
  • Max ×20 — $200/месяц. Профессиональный уровень с большим лимитом на Opus, включая Claude Code.

Тариф Max ×20 в месяц обходится примерно как 20 штук Opus-статей по нашему расчёту выше. Но если параллельно гоняете Claude Code и делаете разработку — это окупается за неделю.

Российские прокси и агрегаторы

Из России напрямую оплатить подписку Anthropic не получится — нужен заграничный счёт и КВН. Поэтому большая часть рынка работает через прокси-сервисы, которые перепродают доступ за рубли. Цены, которые видим на рынке:

  • от 500–600 ₽/месяц за Sonnet с ограниченными лимитами,
  • от 1500–2000 ₽/месяц за Opus,
  • кредитные системы без подписки — оплата по факту использования с наценкой 15–30 % к курсу.

Кредитная схема выгоднее, если используете нерегулярно. Подписка — если используете каждый день и знаете свой средний объём.

Как считать бюджет на проект

Простая формула для прикидки бюджета:

Цена запроса (₽) = (входные токены × цена_входа + выходные токены × цена_выхода) / 1 000 000 × курс_доллара.

Пример: статья в 5000 слов через Sonnet с 30K входных и 7K выходных токенов даёт $0,09 + $0,105 = $0,195. По курсу 92 ₽ — около 18 ₽ за статью. На 100 статей в месяц — 1800 ₽. Через прокси с наценкой 20 % — около 2200 ₽.

Реальный счёт всегда выше, потому что вы будете делать несколько итераций, ошибаться и переделывать. Закладывайте запас 1,5–2×.

Матрица «задача → модель → токены → ₽»

Это главная таблица статьи. Мы собрали 15 типовых задач, которые встречаются у разработчиков, маркетологов, аналитиков и контент-команд. Для каждой — рекомендованная модель, примерный объём токенов и цена в рублях по курсу 92.

Задача Модель Вход (ток) Выход (ток) Цена за 1 запрос (₽)
SEO-статья 3000 слов на заданную тему Sonnet 30K 7K ~18
Перевод 10 страниц с английского на русский Sonnet 15K 15K ~25
Резюме 30 статей конкурентов Sonnet 200K 5K ~62
Архитектурный план микросервиса Opus 10K 5K ~16
Багфикс на 100 строк кода Sonnet 5K 2K ~4
Рефакторинг 50 файлов в проекте Opus 200K 50K ~209
Code-review pull request Sonnet 20K 3K ~10
Генерация unit-тестов Sonnet 5K 5K ~8
Анализ договора на 100 страниц Opus 150K 5K ~80
Классификация 1000 тикетов поддержки Haiku 500K 20K ~55
Антиспам-фильтр для 10K комментариев Haiku 1M 50K ~115
Чат-бот поддержки (1000 диалогов в день) Haiku 2M 500K ~414
Меты для 500 карточек товаров Haiku 250K 50K ~46
Сложный аналитический отчёт Opus 50K 15K ~57

На что обратить внимание:

  • Большинство задач разработчика и маркетолога с объёмом до 30K входа закрываются Sonnet за 5–30 ₽. Это та экономика, при которой нет смысла экономить на модели.
  • Opus оправдан там, где есть длинный контекст или ответственная задача с имеемом редакции. Цена 80–200 ₽ за качественный артефакт окупает себя одной публикацией.
  • Haiku берёт массовые сценарии: 500–1000 запросов в сутки, простые ответы, классификация. Тут разница в цене между Sonnet и Haiku превращается в тысячи рублей в месяц.

Дополнительно загляните в сравнение Claude Code и Cursor — там разбираем, как выбор модели сочетается с выбором инструмента разработки.

Когда переключаться между моделями

Если хочется простого алгоритма принятия решения — вот он. Прогоняйте свою задачу через четыре вопроса, и на выходе получите рекомендацию.

Вопрос 1: задача требует обработки больше 200K токенов входа за один запрос?

  • Да — Opus или Sonnet (у Haiku потолок 200K).
  • Нет — все три модели.

Вопрос 2: задача похожа на «экспертный анализ», «архитектура», «нестандартное рассуждение»?

  • Да — Opus.
  • Нет — Sonnet или Haiku.

Вопрос 3: задача должна возвращать ответ за время меньше секунды?

  • Да — Haiku.
  • Нет — Sonnet.

Вопрос 4: вы будете делать тысячи запросов в сутки, и разница в 3 раза по цене ощутима?

  • Да — Haiku, если качество не проседает в вашем тесте.
  • Нет — Sonnet, не тратьте время на A/B.

Этого хватает в 90 % случаев. Если по всем вопросам ответ «не знаю», начните с Sonnet — он покрывает большинство сценариев и даст понять, где упирается в потолок.

Pipeline Haiku → Sonnet → Opus: как комбинировать модели

Самый умный паттерн — собирать пайплайн из трёх моделей вместо ставки на одну. Это даёт экономию 60–80 % по сравнению с «всё на Opus» и не проигрывает в качестве.

Схема:

  1. Haiku — на грубой фильтрации. Сначала Haiku читает 1000 записей, отсеивает мусор, классифицирует по типам.
  2. Sonnet — на основной обработке. Дальше Sonnet берёт 200 отфильтрованных записей, делает с ними основную работу: суммирует, анализирует, генерирует.
  3. Opus — на финальной сборке. На конце Opus берёт результаты Sonnet и собирает их в высококачественный артефакт — отчёт, статью, рекомендацию.

Пример: у вас есть тысяча отзывов о продукте.

  • Haiku читает все 1000, помечает тональность и тему — 50K выходных токенов за ~50 ₽.
  • Sonnet берёт 100 самых негативных отзывов, делает по ним выжимку — 20K выходных токенов за ~30 ₽.
  • Opus собирает финальный отчёт с рекомендациями для продакта — 5K выходных за ~12 ₽.

Итого ~92 ₽. Если бы вся обработка шла на Opus, заплатили бы 400–500 ₽. Если всё на Haiku — финальный отчёт получился бы средним по качеству.

Такая же логика работает в Claude Code: Explore-subagent на Haiku грепает по кодбазе, Sonnet пишет основной код, Opus подключается на планирование и ревью. Подробно про subagent в Claude Code мы разобрали в материале про MCP.

Claude vs GPT-5 vs Gemini 3 Pro

Выбор между моделями Claude почти всегда идёт в связке с вопросом «а может, взять GPT-5 или Gemini». Поэтому короткий ориентир по рынку на май 2026.

На кодинге Claude Sonnet 4.6 идёт почти вровень с GPT-5 (Sonnet 79,6 % vs GPT-5 ~80 % на SWE-bench), опережает Gemini 3 Pro и ощутимо обходит Grok 4. Большинство команд, которые делают плагины для VS Code и JetBrains, ставят Claude по умолчанию.

На длинном контексте Anthropic и Google идут плечом к плечу: у обеих 1M-токеновое окно. У OpenAI пока заметно меньше. Если задача — прочитать сборник из 500 страниц и собрать сводку, Sonnet и Gemini 3 Pro почти неотличимы по качеству, но Sonnet выходит дешевле.

На экспертных научных задачах Opus 4.7 берёт 91,3 % GPQA, GPT-5 — 84 %, Gemini 3 Pro — 82 %. Это тот класс задач, ради которого Anthropic держит флагман дорогим.

На цене у Anthropic середина рынка: Sonnet 4.6 ($3/$15) дороже Gemini 2.5 Flash и дешевле GPT-5. Haiku 4.5 ($1/$5) бьётся с GPT-5-mini и Gemini Flash по нижнему сегменту.

Что выбрать вне Claude — отдельный разговор. Если уже работаете на Anthropic и вас устраивает качество — менять смысла нет. Если экспериментируете — у Sonnet 4.6 сейчас лучший баланс цены и качества на рынке для повседневных задач.

Лимиты и rate limits — на что нарвётесь

Когда модель выбрана, остаётся неприятный сюрприз — rate limits. Anthropic ставит ограничения на каждый аккаунт по нескольким осям:

  • Запросы в минуту (RPM) — у Opus и Sonnet стартовый лимит ниже, чем у Haiku. На уровне Tier 1 это 50 RPM для Opus и 1000 RPM для Haiku.
  • Токены в минуту (TPM) — отдельный лимит на объём прокачанных через API токенов в минуту. Чем выше Tier, тем больше TPM.
  • Tier — уровень аккаунта Anthropic растёт по мере того, как вы тратите деньги. Tier 1 — это $5 потраченных, Tier 4 — $400.

На что это влияет в продакшене:

  • Если делаете чат-бот на Sonnet и ждёте 100 запросов в минуту — Tier 1 вас положит.
  • Если гоняете Opus в Claude Code весь день, упрётесь не в деньги, а в TPM.
  • Для пайплайнов с Haiku rate limit обычно не проблема — модель спроектирована под нагрузку.

Заранее заглядывайте в консоль Anthropic, поднимайте Tier, и если объёмы серьёзные — оформляйте корпоративный аккаунт через AWS Bedrock или Google Vertex AI. Там лимиты выше, цены те же.

5 типичных ошибок при выборе модели

Эти грабли мы собирали из своего опыта и из комментариев команд, которые публиковали отчёты про переход на Claude.

Ошибка 1 — брать Opus по инерции. «Самая дорогая, значит лучшая» работает плохо. На типовом коде, переводе, генерации сниппетов Sonnet даёт тот же результат за в пять раз меньшие деньги. Тест прост: возьмите 10 своих типовых запросов, прогоните на Sonnet и на Opus, сравните результаты глазами. В 90 % случаев увидите паритет.

Ошибка 2 — брать Haiku ради экономии без A/B-теста. Haiku дешевле в три раза, но на сложных задачах теряет 5–10 % качества. Если ваш продукт — это «классификация спама» — потеря 5 % точности приемлема. Если «генерация описаний товаров» — потеря 5 % литературного качества может стоить конверсии. Всегда сравнивайте на своих данных, не на бенчмарках.

Ошибка 3 — игнорировать prompt caching. Если у вас длинный системный промпт (документация продукта, правила, контекст), и вы дёргаете API сотни раз с одним и тем же промптом — без кеширования платите за этот промпт каждый раз. С кешированием первый запрос дороже на 25 %, последующие дешевле в 10 раз. На большом проекте это экономия 60–80 % бюджета.

Ошибка 4 — не использовать batch API. Если задача терпит до 24 часов (генерация описаний, обработка архива, оффлайн-анализ) — batch API даёт скидку 50 % на все токены. Один параметр в запросе — половина счёта.

Ошибка 5 — закладываться на текущие цены. Anthropic меняет цены и модели несколько раз в год. С Opus 4.6 на Opus 4.7 поменялся токенайзер — тот же запрос теперь выдаёт на 25–35 % больше токенов. Закладывайте в бюджет запас, мониторьте Anthropic Changelog раз в месяц.

Как переключать модели в Claude.ai, Claude Code и API

Маленький практический раздел — как именно дёрнуть конкретную модель в каждом из интерфейсов Anthropic.

В веб-интерфейсе claude.ai. Сверху чата есть переключатель моделей: Sonnet 4.6, Opus 4.7 и Haiku 4.5 (на тарифе Pro и выше). Меняется в два клика, история чата сохраняется. Удобно проверить гипотезу: задать тот же вопрос двум моделям подряд и сравнить ответы вживую.

В Claude Code. Команда /model в CLI открывает список доступных моделей. По умолчанию работает связка «Opus на планировании, Sonnet на исполнении». Принудительно переключиться на одну модель можно через /model opus или /model sonnet. Subagents (например, Explore) живут на Haiku и дёргаются автоматически. Подробнее — в разборе slash-команд Claude Code.

В API. Модель задаётся параметром model в запросе: claude-opus-4-7, claude-sonnet-4-6, claude-haiku-4-5-20251001. Менять можно из запроса в запрос — это и есть основа router-паттерна, при котором ваш сервис сам решает, на какую модель отправить конкретный запрос.

Самый простой router-паттерн в коде: считаете длину входа и сложность задачи, если короче 5000 токенов и это классификация — шлёте на Haiku, если средняя задача — Sonnet, если требуется глубокое рассуждение — Opus. Anthropic сама рекомендует именно такой подход в документации.

Чего не умеют все три модели одинаково

Чтобы не было ложных ожиданий, перечислим ограничения, которые касаются всех трёх Claude.

  • Свежие данные. У всех моделей есть knowledge cutoff. На май 2026 Opus 4.7 обучен на данных до января 2026, Sonnet 4.6 и Haiku 4.5 — до октября 2025. Свежие новости и курсы валют модели не знают, для этого подключайте веб-поиск или MCP-серверы.
  • Реальное время. Claude не умеет сам ходить в интернет без отдельного инструмента. Если нужны живые данные — либо встройте веб-поиск через API, либо подключите MCP-сервер. У нас есть подборка из 10 полезных MCP-серверов — там это разобрано.
  • Сложная математика. Все три модели хороши на школьной математике и средней олимпиадной, но на серьёзных вычислениях ошибаются. Используйте Python-интерпретатор как инструмент.
  • Гарантия фактов. Любая LLM может галлюцинировать. Особенно опасны выдуманные цитаты, ссылки на статьи и фамилии экспертов. Все факты в ответственном тексте проверяйте по первоисточникам.
  • Длинный output. Даже у Opus максимальный ответ — 128K токенов (~95K слов). Для книг и очень длинных документов придётся писать главами и склеивать вручную.

На этом фоне Claude — пока самая «осторожная» из больших моделей. Меньше галлюцинирует, чаще говорит «не знаю», легче признаёт ошибку. Это плюс для серьёзных задач и минус для творческих.

Главная мысль: начните с Sonnet, переключайтесь по факту

Если унести из статьи одно правило, унесите это. По умолчанию все новые задачи запускайте на Sonnet 4.6. Sonnet справится с 90 % работы качественно и в разумную цену.

Переключайте задачу на Opus, когда видите такие особенности:

  • Sonnet неправильно добавляет ToV бизнеса или голос автора в тексте.
  • Sonnet перестаёт действовать по плану в агентской сессии длиннее 10 шагов.
  • Sonnet делает фактические ошибки в экспертной области.
  • В кодинге Sonnet выдаёт решение, которое формально работает, но ломает архитектуру.

Переключайте на Haiku, когда видите вот такое:

  • Объём запросов растёт до тысяч в сутки.
  • Время отклика стало узким местом продукта.
  • Качество ответа в A/B-тесте между Sonnet и Haiku отличается на 1–2 %, не больше.

И помните: Anthropic постоянно обновляет модели. Цены и бенчмарки на момент публикации статьи актуальны, но через полгода-год картинка изменится. Сверяйтесь с официальной страницей цен Anthropic и с документацией перед серьёзным деплоем.

Где научиться работать с нейросетями: подборка курсов

Чтобы быстро прокачаться от «я кручу Claude в браузере» до «я собираю продакшен-пайплайны с API и Claude Code», лучше один раз сесть на нормальный курс. Мы собрали 316 программ по нейросетям и искусственному интеллекту от крупных российских школ — от коротких интенсивов на месяц до годовых программ с трудоустройством.

В подборке есть курсы по промпт-инжинирингу, по LLM-разработке, по интеграции AI в продукты, по ML-инженерии и дата-сайенсу.

КурсШколаСтоимость со скидкойВ рассрочкуДлитель­ностьОбзор курса от Checkroi
Искусственный интеллект
Перейти на сайт курса
GeekBrains156 162 ₽4688 ₽/мес.12 месяцевОбзор курса
Нейросети на практике
Перейти на сайт курса
Академия Эдюсон54 515 ₽4542 ₽/мес.2 месяцаОбзор курса
Магистратура «Прикладной искусственный интеллект» с УрФУ
Перейти на сайт курса
Нетология162 500 ₽244 ₽/мес.24 месяцаОбзор курса
Нейросети для анализа данных
Перейти на сайт курса
Нетология31 700 ₽2351 ₽/мес.8 недельОбзор курса
Нейросети для изображений и видео
Перейти на сайт курса
Академия Эдюсон69 100 ₽5758 ₽/мес.2 месяцаОбзор курса
Нейросети для дизайна
Перейти на сайт курса
Яндекс Практикум64 000 ₽2612 ₽/мес.2 месяцаОбзор курса
Нейросети: практический курс
Перейти на сайт курса
Skypro25 990 ₽181 667 ₽/мес.3 месяцаОбзор курса
Нейросети для финансистов
Перейти на сайт курса
Академия Эдюсон65 600 ₽5466 ₽/мес.2 месяцаОбзор курса
Нейросети для Бухгалтера
Перейти на сайт курса
Академия Эдюсон49 000 ₽4083 ₽/мес.2 месяцаОбзор курса
Нейросети для рабочих задач
Перейти на сайт курса
Skillbox29 800 ₽2483 ₽/мес.1 месяцОбзор курса

Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту

Если интересует именно практика с Claude — почитайте параллельно обзор Claude Design и материал про AI-native людей. Первый — про новый продукт Anthropic для дизайнеров, второй — про то, как меняется профессиональный профиль под давлением AI.

А если у вас есть свой кейс с Haiku, Sonnet или Opus — расскажите в комментариях. Особенно интересно про реальное применение Haiku: мы всё ещё ищем, куда бы его пристроить в Checkroi.

Часто задаваемые вопросы

Какая модель Claude лучше для написания кода?

По умолчанию используйте Sonnet 4.6 — она набирает 79,6% на SWE-bench Verified против 80,8% у Opus 4.7, при пятикратно меньшей цене. Opus берите только на сложный рефакторинг кодовой базы из 500+ файлов, многошаговые агентские сессии и архитектурные решения, где ошибка стоит дня работы. Для подсказок в IDE и автодополнения подходит Haiku 4.5.

В чём разница между Opus и Sonnet?

Opus 4.7 — флагман для глубокого рассуждения: длинный контекст, экспертные научные задачи (91,3% GPQA Diamond против 74,1% у Sonnet), агентские команды и тексты под имя автора. Sonnet 4.6 закрывает 90% повседневных задач: код, тексты, переводы, анализ документов до 100 страниц. По цене Opus в 1,67 раза дороже Sonnet ($5 vs $3 за 1M входных токенов).

Когда использовать Haiku?

Haiku 4.5 оптимален в трёх сценариях: чат-боты и поддержка в реальном времени (~126 токенов в секунду, отклик 0,5 сек), массовая классификация и тегирование (тысячи запросов в минуту), subagents для исследования кода в Claude Code. Для одиночных задач со сложным контекстом или текстов под имя автора — берите Sonnet, разница в цене не окупит просадку качества.

Sonnet или Opus для длинного контекста?

Контекстное окно у обеих моделей одинаковое — 1 миллион токенов (около 750 страниц книги). Если задача — «прочитать много и собрать структурированный ответ», Sonnet справится почти как Opus и обойдётся в пять раз дешевле. Opus стоит брать только когда внутри длинного контекста нужно сложное рассуждение: разобраться в методологии научной статьи, найти противоречия в договоре, спланировать рефакторинг большого проекта.

Сколько стоит Claude в месяц для подписки?

У Anthropic три тарифа: Pro за $20/месяц (Sonnet и ограниченный Opus, подходит одному человеку), Max ×5 за $100/месяц (увеличенные лимиты на Opus), Max ×20 за $200/месяц (профессиональный уровень с Claude Code). Из России оплата напрямую недоступна — большинство пользователей идут через прокси-сервисы, где Sonnet стоит от 500–600 ₽/месяц, Opus — от 1500–2000 ₽.

Можно ли пользоваться Claude из России?

Anthropic официально не работает с пользователями из России: оплата напрямую и доступ к claude.ai заблокированы. Доступные варианты: КВН с зарубежной картой для прямой подписки, российские прокси-сервисы (MashaGPT, GoGPT, Study24.ai и аналоги) с оплатой в рублях, API через AWS Bedrock или Google Vertex AI с корпоративного счёта. Кредитные системы прокси обычно выгоднее подписки при нерегулярном использовании.

Какая модель Claude самая умная?

По бенчмаркам — Opus 4.7. На научных задачах экспертного уровня (GPQA Diamond) она берёт 91,3%, Sonnet — 74,1%. На задачах абстрактного рассуждения (ARC-AGI-2) Opus набирает 68,8% против 58,3% у Sonnet. Но на обычном коде и текстах разница между Opus и Sonnet — 1–2 процентных пункта, что чувствуется только на пограничных задачах.

Какая модель Claude самая быстрая?

Haiku 4.5 — её скорость генерации около 126 токенов в секунду, время до первого токена примерно 0,5 секунды. Это в два раза быстрее Opus (~66 токенов/сек) и в 1,4 раза быстрее Sonnet (~90 токенов/сек). Поэтому Haiku ставят в чат-боты, inline-подсказки в IDE и live-summarization, где задержка критична.

Что такое Agent Teams в Claude?

Agent Teams — это паттерн, в котором один Claude-агент координирует работу нескольких других через MCP или subagent-API. Например, главный агент на Opus планирует задачу и раздаёт подзадачи: один subagent на Sonnet пишет код, другой на Haiku грепает по файлам и возвращает выжимку. Anthropic рекомендует Opus для координаторов и Haiku для исполнительных subagents — это даёт экономию 60–80% при сохранении качества.

Как комбинировать Opus, Sonnet и Haiku в одном проекте?

Классический pipeline-паттерн: Haiku на грубой фильтрации входных данных (классификация, отсев мусора), Sonnet на основной обработке (анализ, генерация, суммаризация), Opus на финальной сборке артефакта (отчёт, статья, рекомендация). Так распределяет задачи Claude Code: subagent Explore на Haiku ходит по файлам, Sonnet пишет код в режиме выполнения, Opus подключается на планирование и сложный рефакторинг.

Оставить комментарий
0 комментариев
Форма комментария

Оставьте комментарий

Напишите, что думаете. Нам важно ваше мнение!