Claude Code умеет писать код часами без перерыва, но рано или поздно упирается в стену. Либо пишет «context low, run /compact», либо отвечает «usage limit reached, your limit will reset at 19:00». И в этот момент важно понимать, что происходит и какой именно лимит вы съели.
Лимитов на самом деле два разных типа, и они работают параллельно. Один отвечает за подписку Pro и Max, второй за API. У них разные счётчики, разные сбросы и разные способы обойти. Если перепутать, какой именно мешает, можно купить ненужный тариф или зря переключиться на API.
Если вы только знакомитесь с Claude Code, начните с обзорной статьи «Что такое Claude Code: обзор, цены и как начать пользоваться в 2026 году». Там разобрали интерфейс, тарифы и установку. А если выбираете между Claude Code и Cursor, есть подробное сравнение по двенадцати параметрам.
Эта статья про то, что делать, когда вы уже работаете в Claude Code и упёрлись в лимит. Расскажем про обе системы, разберём команды /compact и /clear, покажем семь способов снизить расход токенов и объясним, когда стоит переключиться на API.
Статья пригодится не только разработчикам. Claude Code сегодня используют маркетологи для автоматизации, аналитики для скриптов, продакты для прототипов, контент-менеджеры для парсинга. Везде, где AI-агент работает с файлами на машине пользователя.
Если хочется освоить нейросети системно, посмотрите нашу подборку курсов по нейросетям и искусственному интеллекту: 316 программ от коротких интенсивов до годовых.
Две системы лимитов: подписка и API
Когда люди пишут «упёрся в лимит Claude Code», они обычно имеют в виду одну из двух разных вещей. Хорошая привычка — каждый раз уточнять, какая именно.
Лимиты подписки работают на тарифах Pro и Max. Anthropic считает, сколько сообщений вы отправили за 5 часов и за неделю. Когда вы превысили лимит, Claude Code пишет «usage limit reached, your limit will reset at HH:MM» и блокирует отправку до сброса. Этот счётчик общий для claude.ai, Claude Code и Desktop. Если сидели полдня в браузере, на Code останется меньше.
Лимиты API работают на ключе, который выписали в Claude Console. У API нет понятия «сообщение»: там считают запросы в минуту (RPM), входные и выходные токены в минуту (ITPM, OTPM) и общий месячный спенд. При превышении API возвращает 429-ю ошибку с заголовком retry-after, и Claude Code сам ждёт нужное время.
Понять, в какую систему вы упёрлись, проще всего по тексту ошибки. «Usage limit reached» относится к подписке. «Rate limit exceeded» или 429 в логах — к API. Если работаете на подписке, API-лимит вас просто не касается, и наоборот.
5-часовое окно: сколько сообщений на каждом тарифе
Главная единица учёта в подписке — скользящее окно в 5 часов. Оно начинается с первого сообщения, а не в полночь. Открыли Claude Code в 14:00, в 19:00 счётчик сбросится автоматически. Эти 5 часов не тратятся, если вы не пишете: пауза не считается.
В мае 2026 года Anthropic удвоил лимиты на 5-часовое окно для всех платных тарифов. Цифры стали такими:
| Тариф | Цена | Сообщений за 5 часов | Сообщений в неделю |
|---|---|---|---|
| Pro | 20 $ / мес | ~45 | ~240–480 |
| Max 5x | 100 $ / мес | ~225 | ~1200–2400 |
| Max 20x | 200 $ / мес | ~900 | ~4800–9600 |
«Сообщение» здесь не один ваш промпт. Claude Code за один диалоговый шаг может прочитать пять файлов, запустить тесты, отредактировать три файла и показать вам результат. Каждое чтение, запуск и правка считаются отдельным turn внутри сессии, и каждый расходует часть счётчика.
Точные цифры плавают в ±20 %, потому что Anthropic пересчитывает их раз в несколько недель и часто двигает в большую сторону. С 13 мая по 13 июля 2026 у всех платных тарифов недельный лимит ещё +50 % сверху. Anthropic делает это, чтобы перетянуть пользователей у OpenAI Codex.
Что съедает счётчик быстрее всего:
- модель Opus: расход примерно в 5 раз выше, чем у Sonnet (подробнее в статье «Какую модель Claude выбрать в 2026»);
- длинные сессии: каждый следующий ход тянет с собой всю предыдущую историю;
- работа с большими файлами: JSON на 5000 строк в контексте съест больше, чем 30 промптов подряд;
- агентные циклы, когда Claude сам решает «прочитаю-ка ещё файлов» и роется по проекту.
Недельный лимит: что это и зачем он нужен
Помимо 5-часового окна Anthropic ввёл недельный лимит. Он запускается раз в 7 дней и сбрасывается тоже скользяще. Этот лимит общий для всего вашего использования Claude: claude.ai, Claude Code, Desktop считаются вместе.
Недельный лимит Anthropic ввёл против аккаунтов, которые перепродают доступ или гоняют автоматизацию 24/7. На разработчика-одиночку он почти не давит. Если вы работаете в Claude Code 8 часов в день, в недельный лимит вы упрётесь скорее на Pro, чем на Max 5x. На Max 20x недельный потолок для нормальной работы уже почти недостижим.
В Claude Code посмотреть остаток можно командой /status: она покажет, сколько процентов 5-часового и недельного бюджета вы уже потратили и когда сброс. Полезно держать вкладку с ней открытой, если работаете на Pro.
Контекстное окно: 200K vs 1M токенов
Второй частый источник проблем — переполнение контекста. У каждой модели Claude есть потолок, сколько текста она может одновременно держать в памяти. Когда вы пишете «контекст переполнился», речь именно про это.
В 2026 году цифры выглядят так:
- Стандартные планы (Pro и Max 5x): 200 000 токенов на Sonnet и Opus;
- Max 20x, Team, Enterprise: расширенное окно до 1 000 000 токенов на Sonnet 4.6 и Opus 4.6;
- Enterprise со special: до 500 000 на отдельных моделях.
200 000 токенов — это примерно 150 000 русских слов или книга на 500 страниц. Звучит много. Но в реальной агентной сессии контекст забивается за 2-3 часа: Claude читает файлы, кладёт их в историю, потом читает ещё, и каждый следующий запрос идёт уже с полной свитой из предыдущих.
Когда контекст подходит к 75 %, качество ответов начинает падать. Это эффект «lost in the middle»: модель хуже находит детали в середине длинного диалога, чем в начале и конце. Поэтому контекст лучше разгружать заранее, не дожидаясь потолка. Под это есть две главные команды.
/compact и /clear: как разгрузить контекст
В Claude Code есть две встроенные команды для работы с переполненным контекстом, и путать их не стоит. Подробно про них и остальные 35 команд мы разобрали в статье «37 команд Claude Code в 2026», здесь короткая выжимка по двум главным.
| Параметр | /compact |
/clear |
|---|---|---|
| Что делает | Просит модель сжать историю в короткое summary | Полностью стирает историю диалога |
| Сколько освобождает | ~95 % контекста (70 000 токенов сжимается до 4000) | ~100 % контекста |
| Сохраняется ли преемственность | Да, ключевые решения остаются | Нет, начинаете с чистого листа |
| Скорость | 10-30 секунд, тратит токены на генерацию summary | Мгновенно |
| Когда использовать | В середине большой задачи, когда упёрлись в потолок | При переходе на новую задачу или после череды неудачных попыток |
Правило простое: /compact по умолчанию запускается в Claude Code на 75 % контекста автоматически, но лучше запускать руками раньше, на 60-65 %, пока качество ответов ещё не деградировало.
/compact можно вызывать с инструкцией, что именно сохранить:
/compact preserve auth flow decisions and database schema
Тогда модель сожмёт всё, но оставит подробности про авторизацию и БД в summary почти без потерь.
/clear используют, когда диалог зашёл в тупик: Claude дважды ошибся в одном и том же месте, и каждый новый ход тянет за собой кучу неверных гипотез. Чистый старт с точной формулировкой задачи работает лучше, чем третья попытка в замусоренном контексте.
7 способов снизить расход токенов
Чтобы реже упираться в лимит, есть несколько приёмов. Они не требуют переходить на API и работают на любом тарифе.
1 — выбирайте Sonnet по умолчанию
Opus 4.7 — самая умная модель Claude, но в 5 раз дороже Sonnet 4.6 по счётчику подписки. Sonnet справляется с 80 % задач разработки на уровне Opus: рефакторинг, тесты, документация, простые фичи. Opus берите для архитектурных решений и сложной отладки.
Переключение модели на лету: команда /model.
2 — указывайте конкретные файлы вместо «посмотри проект»
Когда вы пишете «исправь баг в форме регистрации», Claude может прочитать 15 файлов в поисках нужного. Если сразу указать @src/auth/registration.tsx и @src/api/auth.ts, контекст не раздуется.
3 — храните контекст проекта в CLAUDE-md
Файл CLAUDE.md в корне проекта Claude Code читает один раз в начале сессии и держит как системный промпт. Туда стоит положить стек, конвенции кода, неочевидные правила. Это избавит от повторных объяснений в каждом диалоге.
4 — используйте /compact заранее
Не ждите автоматического сжатия на 75 %. Если работаете в длинной сессии и видите по /status, что контекст уже на 55-60 %, прогоните /compact вручную и продолжайте.
5 — разбивайте задачи на короткие сессии
Вместо одной сессии «сделай весь модуль авторизации» лучше три: «сделай форму», /clear, «сделай API-эндпоинт», /clear, «напиши тесты». Каждая короткая сессия съест меньше токенов, чем одна большая.
6 — выключайте лишние инструменты
Каждый подключённый MCP-сервер добавляет свои описания в системный промпт, и это десятки тысяч токенов на старте сессии. Если в конкретной задаче нужен только GitHub, отключите остальное командой /mcp. Подробнее про настройку — в статье «MCP в Claude Code: как подключить и 10 полезных серверов».
7 — следите за /status и /cost
Команда /status показывает остаток сессионного бюджета и контекста, /cost сообщает, сколько денег вы потратили на текущей сессии (если работаете через API). Привычка глянуть на них каждые 20-30 запросов экономит часы простоя.
Когда переключаться на API
Если упираетесь в лимит подписки несколько раз в неделю и даже Max 20x не хватает, это сигнал, что вам нужен API. На API нет 5-часовых окон и недельных лимитов, есть только rate limits по tier-ам и месячный спенд.
Tier-ы у API такие:
| Tier | Депозит для апгрейда | Месячный лимит | RPM (Sonnet) | ITPM (Sonnet) |
|---|---|---|---|---|
| Tier 1 | 5 $ | 500 $ | 50 | 30 000 |
| Tier 2 | 40 $ | 500 $ | 1000 | 450 000 |
| Tier 3 | 200 $ | 1000 $ | 2000 | 800 000 |
| Tier 4 | 400 $ | 200 000 $ | 4000 | 2 000 000 |
Чтобы Claude Code заработал через API, нужно прописать переменные окружения:
export ANTHROPIC_API_KEY=sk-ant-...
export ANTHROPIC_AUTH_TOKEN=$ANTHROPIC_API_KEY
После этого Claude Code будет ходить в API напрямую, минуя ваш Pro/Max аккаунт.
Главное преимущество API — prompt caching. Закешированные токены не считаются в ITPM-лимит и стоят 10 % от базовой цены. При cache hit rate в 70-80 % эффективная пропускная способность вырастает в 5 раз. На подписке этого механизма нет: расход считается по сообщениям, без скидки за кэш.
Когда переход на API окупается:
- пишете 8+ часов в день и Max 20x уже не покрывает: на API при умеренном кэшировании это выйдет 250-400 $ в месяц, без блокировок;
- работаете с большими репозиториями (50+ файлов в контексте);
- гоняете Claude Code в автоматизации: скриптах, CI, batch-обработке;
- нужна предсказуемая пропускная способность без сюрпризов.
Когда подписка выгоднее:
- работаете 2-4 часа в день: на Pro или Max 5x хватит почти всегда;
- не любите следить за счётом, фиксированная цена в месяц предсказуемее;
- используете не только Code, но и claude.ai через браузер.
Где научиться работать с AI-инструментами
Claude Code — это не только команды и настройки. Чтобы выжать из AI-агента максимум, нужно понимать, как работают модели, как строить промпты, как комбинировать инструменты. Эти навыки сегодня нужны не только разработчикам: маркетологи автоматизируют рутину, аналитики пишут скрипты, продакты собирают прототипы.
В нашем агрегаторе собрано 316 курсов по нейросетям и ИИ — от коротких интенсивов по промптам до годовых программ под ML-инженера. Все цены, программы и отзывы собраны в одном месте.
| Курс | Школа | Стоимость со скидкой | В рассрочку | Длительность | Обзор курса от Checkroi |
|---|---|---|---|---|---|
| Искусственный интеллект Перейти на сайт курса | GeekBrains | 156 162 ₽ | 4688 ₽/мес. | 12 месяцев | Обзор курса |
| Нейросети на практике Перейти на сайт курса | Академия Эдюсон | 54 515 ₽ | 4542 ₽/мес. | 2 месяца | Обзор курса |
| Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса | Нетология | 162 500 ₽ | 244 ₽/мес. | 24 месяца | Обзор курса |
| Нейросети для анализа данных Перейти на сайт курса | Нетология | 31 700 ₽ | 2351 ₽/мес. | 8 недель | Обзор курса |
| Нейросети для изображений и видео Перейти на сайт курса | Академия Эдюсон | 69 100 ₽ | 5758 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети для дизайна Перейти на сайт курса | Яндекс Практикум | 64 000 ₽ | 2612 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети: практический курс Перейти на сайт курса | Skypro | 25 990 ₽ | 181 667 ₽/мес. | 3 месяца | Обзор курса |
| Нейросети для финансистов Перейти на сайт курса | Академия Эдюсон | 65 600 ₽ | 5466 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети для Бухгалтера Перейти на сайт курса | Академия Эдюсон | 49 000 ₽ | 4083 ₽/мес. | 2 месяца | Обзор курса |
| Нейросети для рабочих задач Перейти на сайт курса | Skillbox | 29 800 ₽ | 2483 ₽/мес. | 1 месяц | Обзор курса |
Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту
Если хочется глубже разобраться в линейке моделей Claude, посмотрите наш разбор «Opus 4.7 vs Sonnet 4.6 vs Haiku 4.5: какую модель Claude выбрать» с детальной разницей в расходе токенов и качестве ответов. А для понимания, как Claude Code сравнивается с другими AI-инструментами разработки, есть статья «Claude Code vs Cursor: что выбрать в 2026 году».
Что делать прямо сейчас, если упёрлись в лимит
Короткий алгоритм для трёх типичных ситуаций.
Контекст переполнен (видно в /status): запустите /compact с инструкцией, что сохранить. Если задача завершена, лучше /clear и новая сессия.
«Usage limit reached» на Pro: проверьте через /status, до какого времени сброс. Если работать нужно срочно, апгрейд до Max 5x даёт сразу ×5 к потолку. Если ситуация регулярная, пора смотреть в сторону Max 20x или API.
429 от API: подождите столько секунд, сколько указано в retry-after. Если 429-я ошибка лезет регулярно, включите prompt caching, проверьте Tier на Limits в Claude Console, рассмотрите апгрейд через пополнение баланса.
Лимиты Claude Code — это управление нагрузкой со стороны Anthropic, не баг. Они меняются раз в пару месяцев, обычно в большую сторону. На май 2026 года Anthropic сначала удвоил 5-часовые лимиты, потом добавил +50 % к недельному, и это, скорее всего, ещё не финал. Так что навык работать в пределах потолка через /compact, /clear, /status и разумный выбор модели окупается дольше, чем апгрейд тарифа.



![Статья: Subagents в Claude Code: создание, 7 готовых ролей и сравнение со Skills, Slash-commands и Agent Teams в 2026 Subagents в Claude Code: создание, 7 готовых ролей и сравнение со Skills, Slash-commands и Agent Teams в [current_year]](https://checkroi.ru/wp-content/uploads/2026/05/og-cover-58352-1779036868.jpg)
