Лимиты Claude Code 2026: контекст, rate limits, /compact

Q: Чем отличаются /compact и /clear в Claude Code?

/compact просит модель сжать историю диалога в короткое summary и освобождает около 95% контекста, сохраняя ключевые решения. /clear полностью стирает историю и начинает с чистого листа. /compact используют в середине большой задачи, /clear — при переходе на новую.

Q: Что делать, если контекст переполнился?

Запустите /compact с инструкцией, что сохранить (например, /compact preserve auth flow and database schema). Это сожмёт 70 000 токенов диалога примерно до 4000 без потери ключевых решений. Если задача завершена и переходите на новую — используйте /clear.

Q: Как посмотреть остаток лимита в Claude Code?

Команда /status показывает процент использования 5-часового и недельного бюджета, остаток контекстного окна и время следующего сброса. Команда /cost сообщает, сколько денег потрачено на текущей сессии при работе через API. Полезно сверяться с ними каждые 20-30 запросов.

Q: Что делать с ошибкой 429 от Claude API?

Подождите столько секунд, сколько указано в заголовке retry-after — Claude Code обычно ждёт сам. Если 429 лезет регулярно, включите prompt caching (закешированные токены не считаются в ITPM-лимит), проверьте свой Tier на странице Limits в Claude Console и при необходимости пополните баланс для апгрейда тира.

Опубликовано 17.05.2026
22 просмотра
11 мин. чтения
0 комментариев

Разбираем лимиты Claude Code в 2026 году: 5-часовое окно на Pro/Max, weekly limit, контекстное окно 200K vs 1M, команды /compact и /clear, 7 способов снизить расход токенов и когда переключаться на API.

Статью написал:

Ваня Буявец

Основатель Checkroi, продюсер Telegram-каналов, эксперт в выборе онлайн-курсов

Все 291 статья автора

Одобрено экспертом:

Наташа Буявец

Основательница Checkroi, продюсер Youtube-каналов, эксперт по онлайн-курсам

Все 953 экспертных мнения

Лимиты Claude Code в 2026 году: контекст, rate limits и что делать

Claude Code умеет писать код часами без перерыва, но рано или поздно упирается в стену. Либо пишет «context low, run /compact», либо отвечает «usage limit reached, your limit will reset at 19:00». И в этот момент важно понимать, что происходит и какой именно лимит вы съели.

Лимитов на самом деле два разных типа, и они работают параллельно. Один отвечает за подписку Pro и Max, второй за API. У них разные счётчики, разные сбросы и разные способы обойти. Если перепутать, какой именно мешает, можно купить ненужный тариф или зря переключиться на API.

Если вы только знакомитесь с Claude Code, начните с обзорной статьи «Что такое Claude Code: обзор, цены и как начать пользоваться в 2026 году». Там разобрали интерфейс, тарифы и установку. А если выбираете между Claude Code и Cursor, есть подробное сравнение по двенадцати параметрам.

Эта статья про то, что делать, когда вы уже работаете в Claude Code и упёрлись в лимит. Расскажем про обе системы, разберём команды /compact и /clear, покажем семь способов снизить расход токенов и объясним, когда стоит переключиться на API.

Статья пригодится не только разработчикам. Claude Code сегодня используют маркетологи для автоматизации, аналитики для скриптов, продакты для прототипов, контент-менеджеры для парсинга. Везде, где AI-агент работает с файлами на машине пользователя.

Если хочется освоить нейросети системно, посмотрите нашу подборку курсов по нейросетям и искусственному интеллекту: 316 программ от коротких интенсивов до годовых.

Две системы лимитов: подписка и API

Когда люди пишут «упёрся в лимит Claude Code», они обычно имеют в виду одну из двух разных вещей. Хорошая привычка — каждый раз уточнять, какая именно.

Лимиты подписки работают на тарифах Pro и Max. Anthropic считает, сколько сообщений вы отправили за 5 часов и за неделю. Когда вы превысили лимит, Claude Code пишет «usage limit reached, your limit will reset at HH:MM» и блокирует отправку до сброса. Этот счётчик общий для claude.ai, Claude Code и Desktop. Если сидели полдня в браузере, на Code останется меньше.

Лимиты API работают на ключе, который выписали в Claude Console. У API нет понятия «сообщение»: там считают запросы в минуту (RPM), входные и выходные токены в минуту (ITPM, OTPM) и общий месячный спенд. При превышении API возвращает 429-ю ошибку с заголовком retry-after, и Claude Code сам ждёт нужное время.

Понять, в какую систему вы упёрлись, проще всего по тексту ошибки. «Usage limit reached» относится к подписке. «Rate limit exceeded» или 429 в логах — к API. Если работаете на подписке, API-лимит вас просто не касается, и наоборот.

5-часовое окно: сколько сообщений на каждом тарифе

Главная единица учёта в подписке — скользящее окно в 5 часов. Оно начинается с первого сообщения, а не в полночь. Открыли Claude Code в 14:00, в 19:00 счётчик сбросится автоматически. Эти 5 часов не тратятся, если вы не пишете: пауза не считается.

В мае 2026 года Anthropic удвоил лимиты на 5-часовое окно для всех платных тарифов. Цифры стали такими:

Тариф	Цена	Сообщений за 5 часов	Сообщений в неделю
Pro	20 $ / мес	~45	~240–480
Max 5x	100 $ / мес	~225	~1200–2400
Max 20x	200 $ / мес	~900	~4800–9600

«Сообщение» здесь не один ваш промпт. Claude Code за один диалоговый шаг может прочитать пять файлов, запустить тесты, отредактировать три файла и показать вам результат. Каждое чтение, запуск и правка считаются отдельным turn внутри сессии, и каждый расходует часть счётчика.

Точные цифры плавают в ±20 %, потому что Anthropic пересчитывает их раз в несколько недель и часто двигает в большую сторону. С 13 мая по 13 июля 2026 у всех платных тарифов недельный лимит ещё +50 % сверху. Anthropic делает это, чтобы перетянуть пользователей у OpenAI Codex.

Что съедает счётчик быстрее всего:

модель Opus: расход примерно в 5 раз выше, чем у Sonnet (подробнее в статье «Какую модель Claude выбрать в 2026»);
длинные сессии: каждый следующий ход тянет с собой всю предыдущую историю;
работа с большими файлами: JSON на 5000 строк в контексте съест больше, чем 30 промптов подряд;
агентные циклы, когда Claude сам решает «прочитаю-ка ещё файлов» и роется по проекту.

Недельный лимит: что это и зачем он нужен

Помимо 5-часового окна Anthropic ввёл недельный лимит. Он запускается раз в 7 дней и сбрасывается тоже скользяще. Этот лимит общий для всего вашего использования Claude: claude.ai, Claude Code, Desktop считаются вместе.

Недельный лимит Anthropic ввёл против аккаунтов, которые перепродают доступ или гоняют автоматизацию 24/7. На разработчика-одиночку он почти не давит. Если вы работаете в Claude Code 8 часов в день, в недельный лимит вы упрётесь скорее на Pro, чем на Max 5x. На Max 20x недельный потолок для нормальной работы уже почти недостижим.

В Claude Code посмотреть остаток можно командой /status: она покажет, сколько процентов 5-часового и недельного бюджета вы уже потратили и когда сброс. Полезно держать вкладку с ней открытой, если работаете на Pro.

Контекстное окно: 200K vs 1M токенов

Второй частый источник проблем — переполнение контекста. У каждой модели Claude есть потолок, сколько текста она может одновременно держать в памяти. Когда вы пишете «контекст переполнился», речь именно про это.

В 2026 году цифры выглядят так:

Стандартные планы (Pro и Max 5x): 200 000 токенов на Sonnet и Opus;
Max 20x, Team, Enterprise: расширенное окно до 1 000 000 токенов на Sonnet 4.6 и Opus 4.6;
Enterprise со special: до 500 000 на отдельных моделях.

200 000 токенов — это примерно 150 000 русских слов или книга на 500 страниц. Звучит много. Но в реальной агентной сессии контекст забивается за 2-3 часа: Claude читает файлы, кладёт их в историю, потом читает ещё, и каждый следующий запрос идёт уже с полной свитой из предыдущих.

Когда контекст подходит к 75 %, качество ответов начинает падать. Это эффект «lost in the middle»: модель хуже находит детали в середине длинного диалога, чем в начале и конце. Поэтому контекст лучше разгружать заранее, не дожидаясь потолка. Под это есть две главные команды.

/compact и /clear: как разгрузить контекст

В Claude Code есть две встроенные команды для работы с переполненным контекстом, и путать их не стоит. Подробно про них и остальные 35 команд мы разобрали в статье «37 команд Claude Code в 2026», здесь короткая выжимка по двум главным.

Параметр	`/compact`	`/clear`
Что делает	Просит модель сжать историю в короткое summary	Полностью стирает историю диалога
Сколько освобождает	~95 % контекста (70 000 токенов сжимается до 4000)	~100 % контекста
Сохраняется ли преемственность	Да, ключевые решения остаются	Нет, начинаете с чистого листа
Скорость	10-30 секунд, тратит токены на генерацию summary	Мгновенно
Когда использовать	В середине большой задачи, когда упёрлись в потолок	При переходе на новую задачу или после череды неудачных попыток

Правило простое: /compact по умолчанию запускается в Claude Code на 75 % контекста автоматически, но лучше запускать руками раньше, на 60-65 %, пока качество ответов ещё не деградировало.

/compact можно вызывать с инструкцией, что именно сохранить:

/compact preserve auth flow decisions and database schema

Тогда модель сожмёт всё, но оставит подробности про авторизацию и БД в summary почти без потерь.

/clear используют, когда диалог зашёл в тупик: Claude дважды ошибся в одном и том же месте, и каждый новый ход тянет за собой кучу неверных гипотез. Чистый старт с точной формулировкой задачи работает лучше, чем третья попытка в замусоренном контексте.

7 способов снизить расход токенов

Чтобы реже упираться в лимит, есть несколько приёмов. Они не требуют переходить на API и работают на любом тарифе.

1 — выбирайте Sonnet по умолчанию

Opus 4.7 — самая умная модель Claude, но в 5 раз дороже Sonnet 4.6 по счётчику подписки. Sonnet справляется с 80 % задач разработки на уровне Opus: рефакторинг, тесты, документация, простые фичи. Opus берите для архитектурных решений и сложной отладки.

Переключение модели на лету: команда /model.

2 — указывайте конкретные файлы вместо «посмотри проект»

Когда вы пишете «исправь баг в форме регистрации», Claude может прочитать 15 файлов в поисках нужного. Если сразу указать @src/auth/registration.tsx и @src/api/auth.ts, контекст не раздуется.

3 — храните контекст проекта в CLAUDE-md

Файл CLAUDE.md в корне проекта Claude Code читает один раз в начале сессии и держит как системный промпт. Туда стоит положить стек, конвенции кода, неочевидные правила. Это избавит от повторных объяснений в каждом диалоге.

4 — используйте /compact заранее

Не ждите автоматического сжатия на 75 %. Если работаете в длинной сессии и видите по /status, что контекст уже на 55-60 %, прогоните /compact вручную и продолжайте.

5 — разбивайте задачи на короткие сессии

Вместо одной сессии «сделай весь модуль авторизации» лучше три: «сделай форму», /clear, «сделай API-эндпоинт», /clear, «напиши тесты». Каждая короткая сессия съест меньше токенов, чем одна большая.

6 — выключайте лишние инструменты

Каждый подключённый MCP-сервер добавляет свои описания в системный промпт, и это десятки тысяч токенов на старте сессии. Если в конкретной задаче нужен только GitHub, отключите остальное командой /mcp. Подробнее про настройку — в статье «MCP в Claude Code: как подключить и 10 полезных серверов».

7 — следите за `/status` и `/cost`

Команда /status показывает остаток сессионного бюджета и контекста, /cost сообщает, сколько денег вы потратили на текущей сессии (если работаете через API). Привычка глянуть на них каждые 20-30 запросов экономит часы простоя.

Когда переключаться на API

Если упираетесь в лимит подписки несколько раз в неделю и даже Max 20x не хватает, это сигнал, что вам нужен API. На API нет 5-часовых окон и недельных лимитов, есть только rate limits по tier-ам и месячный спенд.

Tier-ы у API такие:

Tier	Депозит для апгрейда	Месячный лимит	RPM (Sonnet)	ITPM (Sonnet)
Tier 1	5 $	500 $	50	30 000
Tier 2	40 $	500 $	1000	450 000
Tier 3	200 $	1000 $	2000	800 000
Tier 4	400 $	200 000 $	4000	2 000 000

Чтобы Claude Code заработал через API, нужно прописать переменные окружения:

export ANTHROPIC_API_KEY=sk-ant-...
export ANTHROPIC_AUTH_TOKEN=$ANTHROPIC_API_KEY

После этого Claude Code будет ходить в API напрямую, минуя ваш Pro/Max аккаунт.

Главное преимущество API — prompt caching. Закешированные токены не считаются в ITPM-лимит и стоят 10 % от базовой цены. При cache hit rate в 70-80 % эффективная пропускная способность вырастает в 5 раз. На подписке этого механизма нет: расход считается по сообщениям, без скидки за кэш.

Когда переход на API окупается:

пишете 8+ часов в день и Max 20x уже не покрывает: на API при умеренном кэшировании это выйдет 250-400 $ в месяц, без блокировок;
работаете с большими репозиториями (50+ файлов в контексте);
гоняете Claude Code в автоматизации: скриптах, CI, batch-обработке;
нужна предсказуемая пропускная способность без сюрпризов.

Когда подписка выгоднее:

работаете 2-4 часа в день: на Pro или Max 5x хватит почти всегда;
не любите следить за счётом, фиксированная цена в месяц предсказуемее;
используете не только Code, но и claude.ai через браузер.

Где научиться работать с AI-инструментами

Claude Code — это не только команды и настройки. Чтобы выжать из AI-агента максимум, нужно понимать, как работают модели, как строить промпты, как комбинировать инструменты. Эти навыки сегодня нужны не только разработчикам: маркетологи автоматизируют рутину, аналитики пишут скрипты, продакты собирают прототипы.

В нашем агрегаторе собрано 316 курсов по нейросетям и ИИ — от коротких интенсивов по промптам до годовых программ под ML-инженера. Все цены, программы и отзывы собраны в одном месте.

Курс	Школа	Стоимость со скидкой	В рассрочку	Длительность	Обзор курса от Checkroi
Искусственный интеллект Перейти на сайт курса	GeekBrains	156 162 ₽	4688 ₽/мес.	12 месяцев	Обзор курса
Нейросети на практике Перейти на сайт курса	Академия Эдюсон	54 515 ₽	4542 ₽/мес.	2 месяца	Обзор курса
Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса	Нетология	162 500 ₽	244 ₽/мес.	24 месяца	Обзор курса
Нейросети для анализа данных Перейти на сайт курса	Нетология	31 700 ₽	2351 ₽/мес.	8 недель	Обзор курса
Нейросети для изображений и видео Перейти на сайт курса	Академия Эдюсон	69 100 ₽	5758 ₽/мес.	2 месяца	Обзор курса
Нейросети для дизайна Перейти на сайт курса	Яндекс Практикум	64 000 ₽	2612 ₽/мес.	2 месяца	Обзор курса
Нейросети: практический курс Перейти на сайт курса	Skypro	25 990 ₽	181 667 ₽/мес.	3 месяца	Обзор курса
Нейросети для финансистов Перейти на сайт курса	Академия Эдюсон	65 600 ₽	5466 ₽/мес.	2 месяца	Обзор курса
Нейросети для Бухгалтера Перейти на сайт курса	Академия Эдюсон	49 000 ₽	4083 ₽/мес.	2 месяца	Обзор курса
Нейросети для рабочих задач Перейти на сайт курса	Skillbox	29 800 ₽	2483 ₽/мес.	1 месяц	Обзор курса

Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту

Если хочется глубже разобраться в линейке моделей Claude, посмотрите наш разбор «Opus 4.7 vs Sonnet 4.6 vs Haiku 4.5: какую модель Claude выбрать» с детальной разницей в расходе токенов и качестве ответов. А для понимания, как Claude Code сравнивается с другими AI-инструментами разработки, есть статья «Claude Code vs Cursor: что выбрать в 2026 году».

Что делать прямо сейчас, если упёрлись в лимит

Короткий алгоритм для трёх типичных ситуаций.

Контекст переполнен (видно в /status): запустите /compact с инструкцией, что сохранить. Если задача завершена, лучше /clear и новая сессия.

«Usage limit reached» на Pro: проверьте через /status, до какого времени сброс. Если работать нужно срочно, апгрейд до Max 5x даёт сразу ×5 к потолку. Если ситуация регулярная, пора смотреть в сторону Max 20x или API.

429 от API: подождите столько секунд, сколько указано в retry-after. Если 429-я ошибка лезет регулярно, включите prompt caching, проверьте Tier на Limits в Claude Console, рассмотрите апгрейд через пополнение баланса.

Лимиты Claude Code — это управление нагрузкой со стороны Anthropic, не баг. Они меняются раз в пару месяцев, обычно в большую сторону. На май 2026 года Anthropic сначала удвоил 5-часовые лимиты, потом добавил +50 % к недельному, и это, скорее всего, ещё не финал. Так что навык работать в пределах потолка через /compact, /clear, /status и разумный выбор модели окупается дольше, чем апгрейд тарифа.

Часто задаваемые вопросы

Какой лимит в Claude Code на тарифе Pro?

На Pro за 20$ в месяц Claude Code даёт примерно 45 сообщений в скользящее 5-часовое окно и около 240–480 сообщений в неделю. Точные цифры зависят от модели (Opus тратит в 5 раз быстрее Sonnet) и длины контекста.

Чем отличаются /compact и /clear в Claude Code?

/compact просит модель сжать историю диалога в короткое summary и освобождает около 95% контекста, сохраняя ключевые решения. /clear полностью стирает историю и начинает с чистого листа. /compact используют в середине большой задачи, /clear — при переходе на новую.

Что делать, если контекст переполнился?

Запустите /compact с инструкцией, что сохранить (например, /compact preserve auth flow and database schema). Это сожмёт 70 000 токенов диалога примерно до 4000 без потери ключевых решений. Если задача завершена и переходите на новую — используйте /clear.

Как работает 5-часовое окно в Claude Code?

Это скользящий счётчик, который запускается с первого сообщения, а не в полночь. Открыли Code в 14:00 — счётчик сбросится в 19:00. Окно общее для claude.ai, Claude Code и Desktop. Сколько сообщений влезает, зависит от тарифа: ~45 на Pro, ~225 на Max 5x, ~900 на Max 20x.

Что такое weekly limit и почему он есть?

Это недельный лимит сверху 5-часового, общий для всего использования Claude. Anthropic ввёл его, чтобы блокировать аккаунты, которые перепродают доступ или гоняют автоматизацию 24/7. На Max 20x недельный потолок для нормальной работы почти недостижим. С 13 мая по 13 июля 2026 он временно поднят на 50% для всех платных тарифов.

Когда стоит переключиться с подписки на API?

Когда упираетесь в лимит подписки несколько раз в неделю даже на Max 20x, работаете с большими репозиториями (50+ файлов в контексте) или гоняете Claude Code в автоматизации. На API нет 5-часовых окон и недельных лимитов, только rate limits по tier-ам и prompt caching, который снижает реальный расход в 5 раз при высоком cache hit rate.

Сколько токенов в контекстном окне Claude Code?

200 000 токенов на стандартных планах Pro и Max 5x, до 1 000 000 на Max 20x, Team и Enterprise при использовании Sonnet 4.6 или Opus 4.6. 200 000 токенов — это примерно 150 000 русских слов или книга на 500 страниц. В агентной сессии этот объём забивается за 2-3 часа из-за того, что каждый следующий запрос тянет с собой всю историю.

Как посмотреть остаток лимита в Claude Code?

Команда /status показывает процент использования 5-часового и недельного бюджета, остаток контекстного окна и время следующего сброса. Команда /cost сообщает, сколько денег потрачено на текущей сессии при работе через API. Полезно сверяться с ними каждые 20-30 запросов.

Какая модель Claude Code расходует токены меньше всего?

Sonnet 4.6 расходует примерно в 5 раз меньше токенов подписки, чем Opus 4.7, при сопоставимом качестве на 80% задач разработки. Haiku 4.5 ещё дешевле, но подходит больше для простой автоматизации. Opus стоит брать только для архитектурных решений и сложной отладки. Переключение модели на лету — командой /model.

Что делать с ошибкой 429 от Claude API?

Подождите столько секунд, сколько указано в заголовке retry-after — Claude Code обычно ждёт сам. Если 429 лезет регулярно, включите prompt caching (закешированные токены не считаются в ITPM-лимит), проверьте свой Tier на странице Limits в Claude Console и при необходимости пополните баланс для апгрейда тира.

Ваня Буявец

Основатель Checkroi, продюсер Telegram-каналов, эксперт в выборе онлайн-курсов

Все статьи автора

Оставить комментарий

0 комментариев

Оставьте комментарий

Напишите, что думаете. Нам важно ваше мнение!

Лимиты Claude Code в 2026 году: контекст, rate limits и что делать

Две системы лимитов: подписка и APIСкопировано

5-часовое окно: сколько сообщений на каждом тарифеСкопировано

Недельный лимит: что это и зачем он нуженСкопировано

Контекстное окно: 200K vs 1M токеновСкопировано

/compact и /clear: как разгрузить контекстСкопировано

7 способов снизить расход токеновСкопировано