• Обновлено
  • Опубликовано
  • 822 просмотра
  • 27 мин. чтения
  • 0 комментариев

Claude Fable 5 vs Opus 4.8 vs Sonnet 4.6 vs Haiku 4.5: какую модель выбрать в 2026

Вышла Claude Fable 5 — новый тир выше Opus. Разбираем все 4 модели Claude: Opus 4.8, Sonnet 4.6 и Haiku 4.5 — где какая работает лучше, сколько стоит в рублях и как комбинировать их в одном пайплайне.
Статью написал:
Ваня Буявец, продюсер, основатель Checkroi
Ваня Буявец
Основатель Checkroi, продюсер, эксперт в выборе онлайн-курсов
Все 915 статей автора Подписаться на Телеграм-канал
Одобрено экспертом:
Наташа Буявец, основатель Checkroi, эксперт по онлайн-курсам
Наташа Буявец
Основательница Checkroi, продюсер Youtube-каналов, эксперт по онлайн-курсам
Все 1575 экспертных мнений Подписаться на Телеграм-канал
Claude Fable 5 vs Opus 4.8 vs Sonnet 4.6 vs Haiku 4.5: какую модель выбрать в 2026

9 июня 2026 Anthropic выпустила Claude Fable 5 — первую публичную модель нового класса Mythos, который компания ставит уровнем выше Opus. Так что теперь в линейке Claude не три модели, а четыре: Claude Fable 5, Opus 4.8, Sonnet 4.6 и Haiku 4.5. Разница в цене между крайними — десятикратная. Разница в качестве на обычной задаче — часто в пределах ошибки. И всё-таки выбор модели — это первое решение, которое влияет на счёт в конце месяца и на то, выйдет ли у вас законченный продукт.

Внутри статьи: разбор всех четырёх моделей по контексту, скорости и цене, что даёт новый Claude Fable 5 и кому он нужен, бенчмарки SWE-bench и GPQA, сравнительная таблица, цены API в долларах и рублях, матрица типовых задач с рекомендованной моделью и кейсами редакции Checkroi.

Если вы только знакомитесь с продуктами Anthropic, сначала загляните в обзор «Что такое Claude Code» — там разобрали интерфейс, тарифы и первый запуск.

А общую базу по нейросетям мы собрали в материале «Что такое нейросети простыми словами» — оттуда удобно стартовать, если термины «токен» и «контекстное окно» пока звучат как иностранный язык.

Статья пригодится не только разработчикам. Claude сегодня используют редакторы, маркетологи, аналитики, продакты, SEO-специалисты — везде, где нужно ускорить рутину и разобраться в больших объёмах текста.

Если хочется освоить ремесло системно — загляните в нашу подборку курсов по нейросетям и искусственному интеллекту: там 316 программ — от коротких интенсивов до годовых.
Курсы по ClaudeКурсыСравнение 25 курсов по ClaudeЦены, школы, длительность, рассрочка

Главное за 60 секунд

Если читать совсем некогда — вот короткая выжимка по четырём моделям и по тому, как мы их распределили в редакции Checkroi.

Модель Сильная сторона Цена API (вход/выход за 1M) На что ставим в Checkroi
Claude Fable 5 (новинка) Абсолютный максимум: сложнейшие исследования, длинные агентские сессии, код целыми проектами $10 / $50 Точечно на самых тяжёлых задачах, где даже Opus упирается
Opus 4.8 Длинные тексты, архитектура, сложный кодинг $5 / $25 Глубокая аналитика для статей, разработка плагинов, ревью больших PR
Sonnet 4.6 Баланс цены и качества для 90 % задач $3 / $15 Сбор зарплат и SERP-данных, переводы, апдейты статей
Haiku 4.5 Скорость и цена, чат-боты, классификация $1 / $5 Пока ничего регулярного — ниже расскажем, почему

Кратко: Sonnet 4.6 закрывает 90 % рабочих сценариев. Opus берём, когда задача связана с длинным контекстом, ответственным кодом или текстом, который пойдёт под имя редакции. Haiku — для пайплайнов с тысячами запросов в минуту, где важна каждая копейка и десятая доля секунды. Claude Fable 5 — это новый потолок: берём его в исключительных случаях, когда нужен максимум и Opus уже не вытягивает, и готовы платить вдвое.

Четыре модели — четыре уровня

Anthropic собрала линейку так, что каждая модель закрывает свой слой:

  • Claude Fable 5 — новый верхний тир, класс Mythos. Anthropic прямо называет его уровнем выше Opus: лучшие результаты почти на всех бенчмарках, и чем длиннее и сложнее задача, тем больше отрыв. Это «модель, которую включают, когда нужен абсолютный максимум».
  • Opus 4.8 — флагман. Самые сложные рассуждения, длинные агентские сессии, работа с кодовыми базами на сотни файлов. Это «модель, которая думает долго и глубоко».
  • Sonnet 4.6 — рабочая лошадка. По бенчмаркам отстаёт от Opus всего на 1–2 %, а стоит в пять раз меньше. Это «модель, которая думает достаточно хорошо за разумные деньги».
  • Haiku 4.5 — скоростная. Отвечает в реальном времени, обрабатывает десятки тысяч токенов в секунду. Это «модель, которая отвечает мгновенно, когда не нужно много думать».

Любопытная деталь от самой Anthropic: в Claude Code режим планирования по умолчанию использует Opus, а режим выполнения переключается на Sonnet. То есть продукт собран по той же логике, по которой мы строим этот гайд: думать — Opus, делать — Sonnet, перебирать данные — Haiku.

Корги Рой у пульта с четырьмя светящимися ступенями выбирает уровень

Claude Fable 5 — новый максимум линейки (класс Mythos)

9 июня 2026 Anthropic открыла доступ к Claude Fable 5 — первой публичной модели класса Mythos. Это отдельный тир, который компания ставит уровнем выше Opus по способностям. По заявлению Anthropic, Fable 5 показывает state-of-the-art почти на всех протестированных бенчмарках — в программировании, работе со знаниями, компьютерном зрении и научных задачах. Главная формулировка компании: чем длиннее и сложнее задача, тем заметнее отрыв Fable 5 от остальных.

Что внутри

  • Класс: Mythos — тир выше Opus.
  • Сильные стороны: сложный кодинг, длинные агентские сессии, научные исследования, компьютерное зрение.
  • Бенчмарки: SOTA почти везде; точные цифры по SWE-bench и GPQA Anthropic пока не опубликовала, поэтому сравнивать Fable 5 с Opus по конкретным процентам рано.
  • Цена API: $10 за 1M входных токенов, $50 за 1M выходных — вдвое дороже Opus 4.8.
  • Доступ к API: открыт сразу, с первого дня.

Сейфгарды: спорные темы уходят на Opus

Fable 5 вышел с консервативными ограничениями. Запросы на чувствительные темы — кибербезопасность, биологию и химию — модель не обрабатывает сама, а передаёт следующей по мощности модели, Opus 4.8. По данным Anthropic, это срабатывает в среднем меньше чем в 5 % сессий, так что на обычных рабочих задачах разницы вы не заметите.

Доступ и цена: нюанс со сроками

На старте Fable 5 включён без доплаты в тарифы Pro, Max, Team и корпоративный Enterprise — но только до 22 июня 2026. После этой даты доступ внутри подписок временно переведут на usage-кредиты, пока Anthropic не нарастит мощности; компания обещает вернуть модель в обычные тарифы, «как только сможет». Для России работают те же схемы, что и с остальными моделями: КВН с зарубежной картой или прокси-сервисы с оплатой в рублях — про это подробно ниже.

Mythos 5 — закрытая версия для своих

Вместе с Fable 5 Anthropic анонсировала Claude Mythos 5 — ту же модель, но со снятыми ограничениями в чувствительных областях. Доступ к ней ограничен: сначала через программу Project Glasswing в связке с госструктурами США, дальше — для проверенных исследователей в кибербезопасности и биомедицине. Обычному пользователю Mythos 5 недоступен, и для выбора модели под рабочие задачи он роли не играет — ориентируйтесь на Fable 5 как на верхнюю публичную ступень.

Кому Fable 5 реально нужен

Честно: большинству пока нет. Если Sonnet закрывает ваши задачи, а Opus подключается на самое сложное, то Fable 5 за двойную цену оправдан в узком классе сценариев: исследовательские задачи на грани возможностей моделей, генерация крупных кусков кода за один проход, длинные агентские сессии, где важна каждая десятая процента качества. Для повседневной работы это всё ещё перебор — базовая рекомендация статьи не меняется: начинайте с Sonnet.

Ваня Буявец, продюсер, основатель CheckroiВаня Буявец, основатель CheckroiПоказываю, как применять Claude Code, ChatGPT и другие нейросети в учёбе и работе, с примерами и промптамиЧитать в Телеграме

Opus 4.8 — флагман для статей, архитектуры и сложного кодинга

Opus — самая «умная» из трёх, но и самая дорогая. Цена входа в пять раз выше, чем у Haiku, и в 1,67 раза выше, чем у Sonnet. Анализ Anthropic показывает: дороговизна оправдана только на небольшом классе задач. Зато там разрыв с Sonnet ощутимый — на GPQA Diamond (это такой тип исследований) Opus берёт 91,3 %, Sonnet — 74,1 %.

Что внутри

  • Контекстное окно: 1 000 000 токенов (~750 страниц книги).
  • Максимальный вывод: 128K токенов за один ответ.
  • Скорость: ~66 токенов в секунду — самая медленная из трёх.
  • SWE-bench Verified: 80,8 %.
  • GPQA Diamond (научные задачи): 91,3 %.
  • ARC-AGI-2 (логика): 68,8 %.
  • Цена API: $5 за 1M входных токенов, $25 за 1M выходных.

Дополнительная деталь: у Opus 4.8 новый токенайзер, который на тех же русских текстах может генерировать на 25–35 % больше токенов, чем Opus 4.6. Тариф за токен прежний, но реальный счёт за тот же запрос может вырасти. На это стоит закладывать запас при планировании бюджета.

Где Opus незаменим

Anthropic в документации называет четыре сценария, в которых премия Opus оправдывается:

  1. Длинный контекст с глубоким рассуждением. Анализ договора на 200 страниц, разбор финансовой отчётности, чтение всей кодовой базы с 500+ файлов.
  2. Agent Teams. Когда один агент координирует работу нескольких других — Opus устойчивее ведёт план и не путается в подзадачах.
  3. Архитектурные решения в коде. Рефакторинг, миграция между фреймворками, выбор паттернов — всё, где ошибка стоит дня работы.
  4. Тексты под имя редакции. Аналитические статьи, обзоры, тексты в стиле автора — там, где Sonnet даёт «среднее по интернету», Opus вытягивает уникальный голос.

Где Opus это прям перебор

Если задача звучит как «перепиши абзац короче», «составь оглавление» или «найди в документе все упоминания продукта» — Opus тут проигрывает Sonnet по экономике в пять раз и не даёт прироста качества. Это же касается классификации, перевода с языка на язык, генерации SQL по шаблону, ответов в чат-ботах. Везде, где задача укладывается в 1500 токенов входа и 1500 токенов выхода, Opus использовать смысла мало.

Если хочется глубже разобраться в том, как мы используем Claude Code в ежедневной работе, читайте обзор 37 slash-команд — там пайплайн SEO-статей описан подробнее.

Sonnet 4.6 — рабочая лошадка для 90 % задач

Курсы по SQLКурсыСравнение 421 курса по SQLЦены, школы, длительность, рассрочка

Если бы в статье можно было оставить одну рекомендацию, она была бы такой: по умолчанию используйте Sonnet 4.6. Это базовое правило самой Anthropic и всех серьёзных команд, которые публикуют свои метрики. Sonnet даёт ~98–99 % качества Opus на кодинге и большинстве текстовых задач при пятикратно меньшей цене.

Что внутри

  • Контекстное окно: 1 000 000 токенов.
  • Максимальный вывод: 64K токенов.
  • Скорость: ~90 токенов в секунду.
  • SWE-bench Verified: 79,6 % (на 1,2 % ниже Opus).
  • GPQA Diamond: 74,1 %.
  • Цена API: $3 за 1M входных, $15 за 1M выходных.

Sonnet и Opus делят один и тот же 1M-токеновый контекст — это значит, что для большинства задач с длинными входами Sonnet ничем не ограничен. Разница чувствуется на «нагрузках сверху»: глубокое рассуждение, длинная агентская сессия, кросс-файловый рефакторинг.

Где Sonnet оптимален

По нашему опыту и по опыту команд, которые делятся метриками публично, Sonnet — это правильный выбор для:

  • ежедневного кодинга: фичи на 100–500 строк, баг-фиксы, написание тестов,
  • генерации материалов и статей средней длины (до 3000 слов),
  • перевода и литературной редактуры,
  • анализа документов до 100 страниц,
  • работы с табличными данными и парсинга SERP,
  • классификации, тегирования, генерации мета-описаний,
  • интерактивных диалогов с пользователем там, где важна осмысленность ответа.

Sonnet появился 17 февраля 2026, и многие команды переключились на него с GPT-моделей именно ради экономики.

Кейс редакции: как Sonnet собирает зарплаты для блога

У нас в Checkroi есть отдельная серия статей про зарплаты разных профессий — например, «Сколько зарабатывает C#-разработчик» и аналогичные тексты по другим ролям. В каждой такой статье нужны свежие цифры из 15–20 источников: HH.ru, GetMatch, отчёты НАФИ, региональные срезы, данные по зарубежным рынкам.

Sonnet тут — главный инструмент:

  • читает 15–20 страниц с вакансиями и отчётами,
  • извлекает медианные цифры,
  • собирает их в JSON, который потом ложится в meta-поле статьи и шорткод инфографики.

Расход — около 30 000 входных и 3 000 выходных токенов на один срез. По цене это $0,09 + $0,045 = $0,135, около 13 ₽. На 200 статей это ~2600 ₽. Если бы мы собирали то же самое Opus, заплатили бы около 12 000 ₽ — без видимого прироста в точности данных.

Аналогично работает Sonnet в апдейтах старых статей и в переводах: всё, где задача — «прочитать много, отдать структурированно», Sonnet вытягивает уверенно.

Haiku 4.5 — скорость и цена для агентов и пайплайнов

Haiku — самая молодая и самая дешёвая модель линейки. Anthropic выпустила её осенью 2025 и позиционирует как ответ на GPT-5-mini и Gemini Flash. По качеству Haiku 4.5 достигает ~90 % производительности Sonnet 4.5 на агентских кодинговых задачах при цене в три раза ниже.

Что внутри

Курсы по GeminiКурсыСравнение 7 курсов по GeminiЦены, школы, длительность, рассрочка
  • Контекстное окно: 200 000 токенов (в 5 раз меньше Opus и Sonnet).
  • Максимальный вывод: 32K токенов.
  • Скорость: ~126 токенов в секунду, время до первого токена ~0,5 секунды.
  • SWE-bench Verified: 73,3 %.
  • Цена API: $1 за 1M входных, $5 за 1M выходных.

Цифра «126 токенов в секунду» означает, что Haiku может за секунду выдать абзац среднего размера. На потоке запросов от тысяч пользователей это критично — там, где Sonnet даст лаг в 3–4 секунды, Haiku ответит за 1.

Где Haiku работает лучше остальных (как мы думаем, но это не точно)

В документации Anthropic и в разборах команд, которые экспериментируют с Haiku, чаще всего встречаются такие сценарии:

  • Чат-боты поддержки. Где важна скорость ответа и средняя длина реплики 100–300 токенов.
  • Классификация и тегирование. «К какой категории относится тикет», «это ли спам», «найди тональность отзыва».
  • Subagents для исследования кода. Когда основной агент на Sonnet делегирует Haiku-агенту прочитать файл, найти упоминания функции, вернуть путь.
  • Bulk-обработка контента. Резюме статей, генерация мета-описаний, выделение ключевых тезисов из сотен страниц.
  • Live-summarization. Резюме звонков и встреч в реальном времени, расшифровка с структурированием.
  • Автодополнение в IDE. Inline-подсказки, которые должны появляться за 200–500 мс.

Anthropic даже встроила Haiku в Claude Code как движок subagent-команды Explore — той самой, которая ходит по файлам, грепает символы и возвращает выжимку, не тратя время на Sonnet или Opus.

Почему в редакции Checkroi пока не нашли применения

А теперь честно. У нас Haiku пока сидит без работы. Причин несколько.

Во-первых, основные продукты редакции — это блог-статьи, видео и Pinterest-пины. Везде задачи длинные: прочитать 30 страниц SERP, написать 6000 слов, собрать сложный JSON с 15 полями. На таких объёмах Haiku теряется — 200K контекста часто еле-еле хватает, а качество текста у него слабее, чем у Sonnet.

Во-вторых, у нас нет real-time продукта. Мы не держим чат-бот для пользователей, не показываем inline-подсказки, не стримим саммари звонков. Все наши пайплайны асинхронные — задержка в 3 секунды против 1 ничего не меняет.

В-третьих, экономика. На тех объёмах, которые мы генерируем, разница между Sonnet и Haiku — это сотни рублей в месяц, а не десятки тысяч. И ради этой разницы потерять качество — невыгодно.

Но это наш контекст. У команды с десятками тысяч пользователей в чате поддержки картина обратная — Haiku может окупить себя за день.

Идеи, где попробовать Haiku

Если у вас есть боевой кейс на Haiku — расскажите в комментариях, мы соберём лучшие идеи в апдейт статьи. Пока вот гипотезы, на которые мы смотрим:

  • Короткие описания для маркетплейсов
  • Классификатор курсов: тегировать новые программы по скиллам и инструментам.
  • Антиспам-фильтр комментариев на сайте.
  • Резюме YouTube-видео конкурентов для контент-плана.

Если кто-то из читателей уже катает Haiku в похожих задачах — особенно интересно услышать про потерю качества и реальные затраты.

Сравнение по восьми параметрам

Сводим в одну таблицу всё, что чаще всего нужно при выборе.

Параметр Claude Fable 5 Opus 4.8 Sonnet 4.6 Haiku 4.5
Контекстное окно не раскрыто 1M токенов 1M токенов 200K токенов
Максимальный вывод не раскрыто 128K 64K 32K
Скорость генерации не раскрыто ~66 ток/с ~90 ток/с ~126 ток/с
SWE-bench Verified SOTA 80,8 % 79,6 % 73,3 %
GPQA Diamond SOTA 91,3 % 74,1 %
ARC-AGI-2 (логика) SOTA 68,8 % 58,3 %
Цена входа за 1M $10,00 $5,00 $3,00 $1,00
Цена выхода за 1M $50,00 $25,00 $15,00 $5,00

Что видно из таблицы:

  • На SWE-bench разрыв Opus и Sonnet — 1,2 %, разрыв с Haiku — около 7 %. На типовом коде разница между Opus и Sonnet почти неуловима.
  • На научных задачах (GPQA Diamond) разрыв Opus и Sonnet — 17,2 процентных пункта. Это сценарий, ради которого Opus покупают.
  • По скорости лидер — Haiku, в два раза быстрее Opus.
  • Цена входа: Opus в 5 раз дороже Haiku и в 1,67 раза дороже Sonnet.
  • Fable 5 в таблице полупустой не случайно: Anthropic пока не раскрыла его технические параметры и точные бенчмарки. Известны только класс (выше Opus) и цена — $10 / $50 за 1M токенов.

Бенчмарки — кто умнее на цифрах

Бенчмарк — это синтетика, но по нему удобно сравнивать модели между собой. Anthropic публикует три метрики, и каждая отвечает на свой вопрос.

SWE-bench Verified. Тестовый набор из реальных багов в опенсорс-репозиториях. Модель получает описание бага и должна написать патч, который пройдёт тесты. Тут Opus берёт 80,8 %, Sonnet — 79,6 %, Haiku — 73,3 %. Вывод: для большинства практических багфиксов Sonnet работает почти как Opus.

Что важно: эти же модели в тестах AIME (математика школьного уровня) и HumanEval (генерация кода по ТЗ) показывают похожую картину — Sonnet идёт впритык за Opus, Haiku отстаёт на 5–10 %.

GPQA Diamond. Это набор из вопросов по физике, химии и биологии экспертного уровня — таких, на которые даже PhD-студенты отвечают с трудом. Тут Opus резко отрывается: 91,3 % против 74,1 % у Sonnet. Если задача похожа на «разобраться в статье из Nature, найти подвох в методологии» — это сценарий Opus.

ARC-AGI-2. Тест на абстрактное рассуждение и узнавание паттернов. Opus берёт 68,8 %, Sonnet — 58,3 %. Разрыв в 10 процентных пунктов виден на задачах, где нужна нестандартная логика: придумать алгоритм, разобраться в головоломке, выйти за шаблон.

А где в бенчмарках Fable 5? Новый флагман Anthropic заявлен как лидер почти на всех этих тестах, но на момент выхода статьи компания не опубликовала конкретные проценты по SWE-bench, GPQA и ARC-AGI-2 для Fable 5. Известно главное: чем сложнее и длиннее задача, тем больше его отрыв. Как только Anthropic выложит цифры, обновим таблицу — пока сравнивать Fable 5 с Opus по конкретным процентам некорректно.

Практический вывод: если ваша задача не похожа на «экспертный вопрос по химии» и не на «нестандартный паттерн» — берите Sonnet. На остальном бенчмарки между Sonnet и Opus отличаются в пределах процента.

Цены — сколько Claude стоит в долларах и рублях

Тарифы API Anthropic — самая прозрачная часть. Главный нюанс — оплата в долларах, а для России это не так просто. Разберём по уровням.

Тарифы API за 1M токенов

Модель Вход ($/1M) Выход ($/1M) Вход в ₽ (курс 92) Выход в ₽ (курс 92)
Claude Fable 5 $10,00 $50,00 ~920 ₽ ~4600 ₽
Opus 4.8 $5,00 $25,00 ~460 ₽ ~2300 ₽
Sonnet 4.6 $3,00 $15,00 ~276 ₽ ~1380 ₽
Haiku 4.5 $1,00 $5,00 ~92 ₽ ~460 ₽

Дополнительно у Anthropic есть два способа уронить счёт:

  • Prompt caching — закешированный вход стоит в 10 раз дешевле. Если вы дёргаете API с одним и тем же системным промптом, экономия колоссальная.
  • Batch API — асинхронная обработка с дедлайном 24 часа даёт скидку 50 % на все токены. Подходит для оффлайн-пайплайнов.

Подписки Claude.ai

Если вы работаете руками через интерфейс claude.ai, а не через API, у Anthropic есть три тарифа:

  • Pro — $20/месяц. Sonnet 4.6 с большими лимитами, Opus с ограничениями. Подходит для регулярной работы одного человека.
  • Max ×5 — $100/месяц. Лимиты Pro, умноженные на пять. Уже доступ к Opus в нормальном объёме.
  • Max ×20 — $200/месяц. Профессиональный уровень с большим лимитом на Opus, включая Claude Code.

На старте (до 22 июня 2026) Claude Fable 5 включён без доплаты во все платные тарифы — Pro, Max, Team и корпоративный Enterprise. После 22 июня доступ к нему внутри подписок временно переведут на usage-кредиты, пока Anthropic не расширит мощности.

Тариф Max ×20 в месяц обходится примерно как 20 штук Opus-статей по нашему расчёту выше. Но если параллельно гоняете Claude Code и делаете разработку — это окупается за неделю.

Российские прокси и агрегаторы

Из России напрямую оплатить подписку Anthropic не получится — нужен заграничный счёт и КВН. Поэтому большая часть рынка работает через прокси-сервисы, которые перепродают доступ за рубли. Цены, которые видим на рынке:

  • от 500–600 ₽/месяц за Sonnet с ограниченными лимитами,
  • от 1500–2000 ₽/месяц за Opus,
  • кредитные системы без подписки — оплата по факту использования с наценкой 15–30 % к курсу.

Кредитная схема выгоднее, если используете нерегулярно. Подписка — если используете каждый день и знаете свой средний объём.

Как считать бюджет на проект

Простая формула для прикидки бюджета:

Цена запроса (₽) = (входные токены × цена_входа + выходные токены × цена_выхода) / 1 000 000 × курс_доллара.

Пример: статья в 5000 слов через Sonnet с 30K входных и 7K выходных токенов даёт $0,09 + $0,105 = $0,195. По курсу 92 ₽ — около 18 ₽ за статью. На 100 статей в месяц — 1800 ₽. Через прокси с наценкой 20 % — около 2200 ₽.

Реальный счёт всегда выше, потому что вы будете делать несколько итераций, ошибаться и переделывать. Закладывайте запас 1,5–2×.

Канал основателя Checkroi Вани БуявцаПоказываю тебе, как публично строю Checkroi с нейросетями и делюсь цифрами, провалами и тем, что сработалоПодписаться

Матрица «задача → модель → токены → ₽»

Это главная таблица статьи. Мы собрали 15 типовых задач, которые встречаются у разработчиков, маркетологов, аналитиков и контент-команд. Для каждой — рекомендованная модель, примерный объём токенов и цена в рублях по курсу 92.

Задача Модель Вход (ток) Выход (ток) Цена за 1 запрос (₽)
SEO-статья 3000 слов на заданную тему Sonnet 30K 7K ~18
Перевод 10 страниц с английского на русский Sonnet 15K 15K ~25
Резюме 30 статей конкурентов Sonnet 200K 5K ~62
Архитектурный план микросервиса Opus 10K 5K ~16
Багфикс на 100 строк кода Sonnet 5K 2K ~4
Рефакторинг 50 файлов в проекте Opus 200K 50K ~209
Code-review pull request Sonnet 20K 3K ~10
Генерация unit-тестов Sonnet 5K 5K ~8
Анализ договора на 100 страниц Opus 150K 5K ~80
Классификация 1000 тикетов поддержки Haiku 500K 20K ~55
Антиспам-фильтр для 10K комментариев Haiku 1M 50K ~115
Чат-бот поддержки (1000 диалогов в день) Haiku 2M 500K ~414
Меты для 500 карточек товаров Haiku 250K 50K ~46
Сложный аналитический отчёт Opus 50K 15K ~57
Сложнейшая исследовательская задача на грани возможностей модели Fable 5 50K 20K ~138
Генерация крупного модуля кода за один проход Fable 5 80K 40K ~257

На что обратить внимание:

  • Большинство задач разработчика и маркетолога с объёмом до 30K входа закрываются Sonnet за 5–30 ₽. Это та экономика, при которой нет смысла экономить на модели.
  • Opus оправдан там, где есть длинный контекст или ответственная задача с имеемом редакции. Цена 80–200 ₽ за качественный артефакт окупает себя одной публикацией.
  • Haiku берёт массовые сценарии: 500–1000 запросов в сутки, простые ответы, классификация. Тут разница в цене между Sonnet и Haiku превращается в тысячи рублей в месяц.
  • Fable 5 в матрице появляется только на самых тяжёлых задачах. На всём остальном он переплата: те же 18 ₽ за SEO-статью на Sonnet превратятся в ~60 ₽ без заметного прироста качества.

Дополнительно загляните в сравнение Claude Code и Cursor — там разбираем, как выбор модели сочетается с выбором инструмента разработки.

Когда переключаться между моделями

Если хочется простого алгоритма принятия решения — вот он. Прогоняйте свою задачу через пять вопросов, и на выходе получите рекомендацию.

Вопрос 1: задача требует обработки больше 200K токенов входа за один запрос?

  • Да — Opus или Sonnet (у Haiku потолок 200K).
  • Нет — все три модели.

Вопрос 2: задача похожа на «экспертный анализ», «архитектура», «нестандартное рассуждение»?

  • Да — Opus.
  • Нет — Sonnet или Haiku.

Вопрос 3: задача должна возвращать ответ за время меньше секунды?

  • Да — Haiku.
  • Нет — Sonnet.

Вопрос 4: вы будете делать тысячи запросов в сутки, и разница в 3 раза по цене ощутима?

  • Да — Haiku, если качество не проседает в вашем тесте.
  • Нет — Sonnet, не тратьте время на A/B.

Вопрос 5: даже Opus не вытягивает — задача на грани возможностей модели, и бюджет позволяет?

  • Да — пробуйте Claude Fable 5, новый верхний тир (вдвое дороже Opus).
  • Нет — оставайтесь на Opus, для 99 % задач его потолка хватает.

Этого хватает в 90 % случаев. Если по всем вопросам ответ «не знаю», начните с Sonnet — он покрывает большинство сценариев и даст понять, где упирается в потолок.

Маленький корги Рой ведёт ленту данных через три нарастающие станции-арки конвейера

Pipeline Haiku → Sonnet → Opus: как комбинировать модели

Самый умный паттерн — собирать пайплайн из трёх моделей вместо ставки на одну. Это даёт экономию 60–80 % по сравнению с «всё на Opus» и не проигрывает в качестве.

Схема:

  1. Haiku — на грубой фильтрации. Сначала Haiku читает 1000 записей, отсеивает мусор, классифицирует по типам.
  2. Sonnet — на основной обработке. Дальше Sonnet берёт 200 отфильтрованных записей, делает с ними основную работу: суммирует, анализирует, генерирует.
  3. Opus — на финальной сборке. На конце Opus берёт результаты Sonnet и собирает их в высококачественный артефакт — отчёт, статью, рекомендацию.

Пример: у вас есть тысяча отзывов о продукте.

  • Haiku читает все 1000, помечает тональность и тему — 50K выходных токенов за ~50 ₽.
  • Sonnet берёт 100 самых негативных отзывов, делает по ним выжимку — 20K выходных токенов за ~30 ₽.
  • Opus собирает финальный отчёт с рекомендациями для продакта — 5K выходных за ~12 ₽.

Итого ~92 ₽. Если бы вся обработка шла на Opus, заплатили бы 400–500 ₽. Если всё на Haiku — финальный отчёт получился бы средним по качеству.

Если финальный артефакт критичен и бюджет позволяет, верхнюю ступень можно поднять с Opus на Claude Fable 5 — логика пайплайна та же, просто потолок качества выше.

Такая же логика работает в Claude Code: Explore-subagent на Haiku грепает по кодбазе, Sonnet пишет основной код, Opus подключается на планирование и ревью. Подробно про subagent в Claude Code мы разобрали в материале про MCP.

Claude vs GPT-5 vs Gemini 3.1 Pro Preview

Выбор между моделями Claude почти всегда идёт в связке с вопросом «а может, взять GPT-5 или Gemini». Поэтому короткий ориентир по рынку на июнь 2026. С выходом Claude Fable 5 Anthropic снова подняла верхнюю планку: новый флагман заявлен как сильнейший почти на всех бенчмарках — выше и GPT-5, и Gemini 3.1 Pro Preview. Но для повседневного сравнения цены и качества по-прежнему интереснее средние тиры, про них ниже.

На кодинге Claude Sonnet 4.6 идёт почти вровень с GPT-5 (Sonnet 79,6 % vs GPT-5 ~80 % на SWE-bench), опережает Gemini 3.1 Pro Preview и ощутимо обходит Grok 4.3. Большинство команд, которые делают плагины для VS Code и JetBrains, ставят Claude по умолчанию.

На длинном контексте Anthropic и Google идут плечом к плечу: у обеих 1M-токеновое окно. У OpenAI пока заметно меньше. Если задача — прочитать сборник из 500 страниц и собрать сводку, Sonnet и Gemini 3.1 Pro Preview почти неотличимы по качеству, но Sonnet выходит дешевле.

На экспертных научных задачах Opus 4.8 берёт 91,3 % GPQA, GPT-5 — 84 %, Gemini 3.1 Pro Preview — 82 %. Это тот класс задач, ради которого Anthropic держит флагман дорогим.

На цене у Anthropic середина рынка: Sonnet 4.6 ($3/$15) дороже Gemini 2.5 Flash и дешевле GPT-5. Haiku 4.5 ($1/$5) бьётся с GPT-5-mini и Gemini Flash по нижнему сегменту.

Что выбрать вне Claude — отдельный разговор. Если уже работаете на Anthropic и вас устраивает качество — менять смысла нет. Если экспериментируете — у Sonnet 4.6 сейчас лучший баланс цены и качества на рынке для повседневных задач.

Лимиты и rate limits — на что нарвётесь

Когда модель выбрана, остаётся неприятный сюрприз — rate limits. Anthropic ставит ограничения на каждый аккаунт по нескольким осям:

  • Запросы в минуту (RPM) — у Opus и Sonnet стартовый лимит ниже, чем у Haiku. На уровне Tier 1 это 50 RPM для Opus и 1000 RPM для Haiku.
  • Токены в минуту (TPM) — отдельный лимит на объём прокачанных через API токенов в минуту. Чем выше Tier, тем больше TPM.
  • Tier — уровень аккаунта Anthropic растёт по мере того, как вы тратите деньги. Tier 1 — это $5 потраченных, Tier 4 — $400.

На что это влияет в продакшене:

  • Если делаете чат-бот на Sonnet и ждёте 100 запросов в минуту — Tier 1 вас положит.
  • Если гоняете Opus в Claude Code весь день, упрётесь не в деньги, а в TPM.
  • Для пайплайнов с Haiku rate limit обычно не проблема — модель спроектирована под нагрузку.

Заранее заглядывайте в консоль Anthropic, поднимайте Tier, и если объёмы серьёзные — оформляйте корпоративный аккаунт через AWS Bedrock или Google Vertex AI. Там лимиты выше, цены те же.

5 типичных ошибок при выборе модели

Эти грабли мы собирали из своего опыта и из комментариев команд, которые публиковали отчёты про переход на Claude.

Корги Рой досадливо прикрывает морду лапкой над слишком большой шестерёнкой

Ошибка 1 — брать Opus по инерции. «Самая дорогая, значит лучшая» работает плохо. На типовом коде, переводе, генерации сниппетов Sonnet даёт тот же результат за в пять раз меньшие деньги. Тест прост: возьмите 10 своих типовых запросов, прогоните на Sonnet и на Opus, сравните результаты глазами. В 90 % случаев увидите паритет.

Ошибка 2 — брать Haiku ради экономии без A/B-теста. Haiku дешевле в три раза, но на сложных задачах теряет 5–10 % качества. Если ваш продукт — это «классификация спама» — потеря 5 % точности приемлема. Если «генерация описаний товаров» — потеря 5 % литературного качества может стоить конверсии. Всегда сравнивайте на своих данных, не на бенчмарках.

Ошибка 3 — игнорировать prompt caching. Если у вас длинный системный промпт (документация продукта, правила, контекст), и вы дёргаете API сотни раз с одним и тем же промптом — без кеширования платите за этот промпт каждый раз. С кешированием первый запрос дороже на 25 %, последующие дешевле в 10 раз. На большом проекте это экономия 60–80 % бюджета.

Ошибка 4 — не использовать batch API. Если задача терпит до 24 часов (генерация описаний, обработка архива, оффлайн-анализ) — batch API даёт скидку 50 % на все токены. Один параметр в запросе — половина счёта.

Ошибка 5 — закладываться на текущие цены и модели. Anthropic меняет линейку несколько раз в год. У нового Opus, например, сменился токенайзер — тот же запрос стал выдавать на 25–35 % больше токенов. А 9 июня 2026 вышел Claude Fable 5, новый тир выше Opus, — это повод пересматривать свой выбор модели хотя бы раз в пару месяцев. Закладывайте в бюджет запас и мониторьте Anthropic Changelog.

Как переключать модели в Claude.ai, Claude Code и API

Маленький практический раздел — как именно дёрнуть конкретную модель в каждом из интерфейсов Anthropic.

В веб-интерфейсе claude.ai. Сверху чата есть переключатель моделей: Sonnet 4.6, Opus 4.8, Haiku 4.5 и — на старте до 22 июня 2026 — новый Claude Fable 5 (на тарифе Pro и выше). Меняется в два клика, история чата сохраняется. Удобно проверить гипотезу: задать тот же вопрос двум моделям подряд и сравнить ответы вживую.

В Claude Code. Команда /model в CLI открывает список доступных моделей. По умолчанию работает связка «Opus на планировании, Sonnet на исполнении». Принудительно переключиться на одну модель можно через /model opus или /model sonnet. Subagents (например, Explore) живут на Haiku и дёргаются автоматически. Подробнее — в разборе slash-команд Claude Code.

В API. Модель задаётся параметром model в запросе: claude-fable-5, claude-opus-4-8, claude-sonnet-4-6, claude-haiku-4-5-20251001. Менять можно из запроса в запрос — это и есть основа router-паттерна, при котором ваш сервис сам решает, на какую модель отправить конкретный запрос.

Самый простой router-паттерн в коде: считаете длину входа и сложность задачи, если короче 5000 токенов и это классификация — шлёте на Haiku, если средняя задача — Sonnet, если требуется глубокое рассуждение — Opus, а на самое тяжёлое — Fable 5. Anthropic сама рекомендует именно такой подход в документации.

Чего не умеют модели Claude — общие ограничения

Чтобы не было ложных ожиданий, перечислим ограничения, которые касаются всех моделей Claude, включая новый Fable 5.

  • Свежие данные. У всех моделей есть knowledge cutoff. На июнь 2026 Opus 4.8 обучен на данных примерно до начала 2026, Sonnet 4.6 и Haiku 4.5 — до октября 2025, а для свежего Fable 5 Anthropic дату отсечения пока не объявила. Свежие новости и курсы валют модели не знают — для этого подключайте веб-поиск или MCP-серверы.
  • Реальное время. Claude не умеет сам ходить в интернет без отдельного инструмента. Если нужны живые данные — либо встройте веб-поиск через API, либо подключите MCP-сервер. У нас есть подборка из 10 полезных MCP-серверов — там это разобрано.
  • Сложная математика. Все модели Claude хороши на школьной математике и средней олимпиадной, но на серьёзных вычислениях ошибаются. Используйте Python-интерпретатор как инструмент.
  • Гарантия фактов. Любая LLM может галлюцинировать. Особенно опасны выдуманные цитаты, ссылки на статьи и фамилии экспертов. Все факты в ответственном тексте проверяйте по первоисточникам.
  • Длинный output. Даже у Opus максимальный ответ — 128K токенов (~95K слов). Для книг и очень длинных документов придётся писать главами и склеивать вручную.

На этом фоне Claude — пока самая «осторожная» из больших моделей. Меньше галлюцинирует, чаще говорит «не знаю», легче признаёт ошибку. Это плюс для серьёзных задач и минус для творческих.

Главная мысль: начните с Sonnet, переключайтесь по факту

Если унести из статьи одно правило, унесите это. По умолчанию все новые задачи запускайте на Sonnet 4.6. Sonnet справится с 90 % работы качественно и в разумную цену.

Переключайте задачу на Opus, когда видите такие особенности:

  • Sonnet неправильно добавляет ToV бизнеса или голос автора в тексте.
  • Sonnet перестаёт действовать по плану в агентской сессии длиннее 10 шагов.
  • Sonnet делает фактические ошибки в экспертной области.
  • В кодинге Sonnet выдаёт решение, которое формально работает, но ломает архитектуру.

Переключайте на Haiku, когда видите вот такое:

  • Объём запросов растёт до тысяч в сутки.
  • Время отклика стало узким местом продукта.
  • Качество ответа в A/B-тесте между Sonnet и Haiku отличается на 1–2 %, не больше.

Поднимайтесь на Claude Fable 5 в редком случае — когда даже Opus упёрся в потолок на исследовательской или сверхсложной задаче, а результат стоит двойной цены. Для 99 % работы это лишнее.

И помните: Anthropic постоянно обновляет модели. Цены и бенчмарки на момент публикации статьи актуальны, но через полгода-год картинка изменится. Сверяйтесь с официальной страницей цен Anthropic и с документацией перед серьёзным деплоем.

Где научиться работать с нейросетями: подборка курсов

Чтобы быстро прокачаться от «я кручу Claude в браузере» до «я собираю продакшен-пайплайны с API и Claude Code», лучше один раз сесть на нормальный курс. Мы собрали 316 программ по нейросетям и искусственному интеллекту от крупных российских школ — от коротких интенсивов на месяц до годовых программ с трудоустройством.

В подборке есть курсы по промпт-инжинирингу, по LLM-разработке, по интеграции AI в продукты, по ML-инженерии и дата-сайенсу.

КурсШколаСтоимость со скидкойВ рассрочкуДлитель­ностьОбзор курса от Checkroi
Нейросети для изображений и видео
Перейти на сайт курса
Академия ЭдюсонЭдюсон69 100 ₽5758 ₽/мес.2 месяцаОбзор курса
Нейросети: практический курс
Перейти на сайт курса
SkyproSkypro25 990 ₽181 667 ₽/мес.3 месяцаОбзор курса
Нейросети для рабочих задач
Перейти на сайт курса
SkillboxSkillbox29 800 ₽2483 ₽/мес.1 месяцОбзор курса
Нейросети. Практический курс
Перейти на сайт курса
SkillboxSkillbox74 900 ₽6242 ₽/мес.3 месяцаОбзор курса
Нейросети для каждого: как решать рабочие задачи быстрее
Перейти на сайт курса
НетологияНетология37 300 ₽2763 ₽/мес.6 недельОбзор курса
Нейросети на практике
Перейти на сайт курса
Академия ЭдюсонЭдюсон54 515 ₽4542 ₽/мес.2 месяцаОбзор курса
Нейросети для дизайнера
Перейти на сайт курса
SkillboxSkillbox84 272 ₽3831 ₽/мес.4 месяцаОбзор курса
Нейросети для каждого
Перейти на сайт курса
Академия СинергияСинергия39 900 ₽3325 ₽/мес.3 месяцаОбзор курса
Нейросети для анализа данных
Перейти на сайт курса
НетологияНетология31 700 ₽2351 ₽/мес.8 недельОбзор курса
Магистратура «Прикладной искусственный интеллект» с УрФУ
Перейти на сайт курса
НетологияНетология162 500 ₽244 ₽/мес.24 месяцаОбзор курса

Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту

Если интересует именно практика с Claude — почитайте параллельно обзор Claude Design и материал про AI-native людей. Первый — про новый продукт Anthropic для дизайнеров, второй — про то, как меняется профессиональный профиль под давлением AI.

А если у вас есть свой кейс с Haiku, Sonnet или Opus — расскажите в комментариях. Особенно интересно про реальное применение Haiku: мы всё ещё ищем, куда бы его пристроить в Checkroi.

Прокомментировать

Часто задаваемые вопросы

Какая модель Claude лучше для написания кода?

По умолчанию используйте Sonnet 4.6 — она набирает 79,6% на SWE-bench Verified против 80,8% у Opus 4.8, при пятикратно меньшей цене. Opus берите только на сложный рефакторинг кодовой базы из 500+ файлов, многошаговые агентские сессии и архитектурные решения, где ошибка стоит дня работы. Для подсказок в IDE и автодополнения подходит Haiku 4.5.

В чём разница между Opus и Sonnet?

Opus 4.8 — флагман для глубокого рассуждения: длинный контекст, экспертные научные задачи (91,3% GPQA Diamond против 74,1% у Sonnet), агентские команды и тексты под имя автора. Sonnet 4.6 закрывает 90% повседневных задач: код, тексты, переводы, анализ документов до 100 страниц. По цене Opus в 1,67 раза дороже Sonnet ($5 vs $3 за 1M входных токенов).

Когда использовать Haiku?

Haiku 4.5 оптимален в трёх сценариях: чат-боты и поддержка в реальном времени (~126 токенов в секунду, отклик 0,5 сек), массовая классификация и тегирование (тысячи запросов в минуту), subagents для исследования кода в Claude Code. Для одиночных задач со сложным контекстом или текстов под имя автора — берите Sonnet, разница в цене не окупит просадку качества.

Sonnet или Opus для длинного контекста?

Контекстное окно у обеих моделей одинаковое — 1 миллион токенов (около 750 страниц книги). Если задача — «прочитать много и собрать структурированный ответ», Sonnet справится почти как Opus и обойдётся в пять раз дешевле. Opus стоит брать только когда внутри длинного контекста нужно сложное рассуждение: разобраться в методологии научной статьи, найти противоречия в договоре, спланировать рефакторинг большого проекта.

Сколько стоит Claude в месяц для подписки?

У Anthropic три тарифа: Pro за $20/месяц (Sonnet и ограниченный Opus, подходит одному человеку), Max ×5 за $100/месяц (увеличенные лимиты на Opus), Max ×20 за $200/месяц (профессиональный уровень с Claude Code). Из России оплата напрямую недоступна — большинство пользователей идут через прокси-сервисы, где Sonnet стоит от 500–600 ₽/месяц, Opus — от 1500–2000 ₽.

Можно ли пользоваться Claude из России?

Anthropic официально не работает с пользователями из России: оплата напрямую и доступ к claude.ai заблокированы. Доступные варианты: КВН с зарубежной картой для прямой подписки, российские прокси-сервисы (MashaGPT, GoGPT, Study24.ai и аналоги) с оплатой в рублях, API через AWS Bedrock или Google Vertex AI с корпоративного счёта. Кредитные системы прокси обычно выгоднее подписки при нерегулярном использовании.

Какая модель Claude самая умная?

Из публично доступных — Claude Fable 5, новая модель класса Mythos, которую Anthropic ставит уровнем выше Opus. Точные цифры по бенчмаркам компания пока не раскрыла, но заявляет лучшие результаты почти на всех тестах. Среди трёх рабочих моделей умнее всех Opus 4.8: на научных задачах экспертного уровня (GPQA Diamond) она берёт 91,3%, Sonnet — 74,1%. Но на обычном коде и текстах разница между Opus и Sonnet — 1–2 процентных пункта, заметна она только на пограничных задачах.

Какая модель Claude самая быстрая?

Haiku 4.5 — её скорость генерации около 126 токенов в секунду, время до первого токена примерно 0,5 секунды. Это в два раза быстрее Opus (~66 токенов/сек) и в 1,4 раза быстрее Sonnet (~90 токенов/сек). Поэтому Haiku ставят в чат-боты, inline-подсказки в IDE и live-summarization, где задержка критична.

Что такое Agent Teams в Claude?

Agent Teams — это паттерн, в котором один Claude-агент координирует работу нескольких других через MCP или subagent-API. Например, главный агент на Opus планирует задачу и раздаёт подзадачи: один subagent на Sonnet пишет код, другой на Haiku грепает по файлам и возвращает выжимку. Anthropic рекомендует Opus для координаторов и Haiku для исполнительных subagents — это даёт экономию 60–80% при сохранении качества.

Как комбинировать Opus, Sonnet и Haiku в одном проекте?

Классический pipeline-паттерн: Haiku на грубой фильтрации входных данных (классификация, отсев мусора), Sonnet на основной обработке (анализ, генерация, суммаризация), Opus на финальной сборке артефакта (отчёт, статья, рекомендация). Так распределяет задачи Claude Code: subagent Explore на Haiku ходит по файлам, Sonnet пишет код в режиме выполнения, Opus подключается на планирование и сложный рефакторинг.

Что такое Claude Fable 5 и стоит ли её брать?

Claude Fable 5 вышел 9 июня 2026 — это первая публичная модель класса Mythos, который Anthropic ставит уровнем выше Opus. Цена API — за 1M входных токенов и за выходных, вдвое дороже Opus 4.8. На старте Fable 5 включён без доплаты в тарифы Pro, Max, Team и Enterprise до 22 июня 2026, дальше — за usage-кредиты. Запросы на чувствительные темы (кибербезопасность, биология, химия) модель передаёт Opus 4.8. Большинству Fable 5 пока не нужен: для повседневных задач хватает Sonnet, для сложных — Opus. Берите его точечно, когда даже Opus упирается в потолок, а результат стоит двойной цены.

Оставить комментарий
0 комментариев
Форма комментария

Оставьте комментарий

Напишите, что думаете. Нам важно ваше мнение!