Когда вы пишете нейросети «Привет, как дела», она не видит ваш текст так, как видите его вы. Сначала она режет фразу на маленькие кусочки и считает их. Эти кусочки и называются токенами. «Привет, как дела» по-английски — это три кусочка, а по-русски — уже около шести. Сами слова те же, а токенов в два раза больше. И именно за них вы платите, когда покупаете подписку или подключаетесь к нейросети через API.
А вот пример помасштабнее: вся «Война и мир» в токенах — это примерно 600 000 кусочков. Загрузить такую книгу одним сообщением и попросить нейросеть пересказать её — задача 2026 года уже бытовая, но справится с ней не каждая модель. Об этом ниже подробно.
В статье разберём, что такое токены простыми словами, почему ваша подписка иногда подозрительно быстро упирается в лимит и как пересчитывать «деньги в токены» в уме без калькулятора. Покажем актуальную таблицу цен 2026 года у ChatGPT, Claude, GigaChat и YandexGPT, чек-лист на 10 способов сэкономить и разберёмся, считаются ли картинки и PDF.
Если вы ещё не до конца понимаете, как устроены нейросети сами по себе, начните с обзорной статьи «Что такое нейросети простыми словами». С ней поверх токенов всё станет в десять раз яснее.
Если только начинаете именно с ChatGPT, есть отдельный разбор «Что такое ChatGPT простыми словами» с тарифами, интерфейсом и первым запуском. По Claude и GigaChat у нас тоже есть такие гайды.
Статья пригодится не только программистам. Токены это про деньги, про лимиты подписки и про «куда делся мой ответ». Дизайнеры, маркетологи, преподаватели, аналитики, все упираются в токены, как только начинают серьёзно работать с нейросетью. Если хотите освоить нейросети системно, загляните в нашу подборку курсов «Нейросети и искусственный интеллект»: 316 программ от коротких интенсивов на неделю до годовых.
Токен — это кусочек текста, не слово и не буква
Когда вы отправляете нейросети промпт (это любой текст-запрос, который вы пишете в окошко ChatGPT, Claude или Алисы), модель сначала режет его на маленькие кусочки. Эти кусочки и есть токены. Размер кусочка — где-то между буквой и словом.
На английском часто один токен = одно слово. The cat sat — это три токена. На русском так уже редко: слово «нейросеть» режется на два куска (нейро + сеть), слово «непредсказуемый» на три. Пробелы и знаки препинания тоже считаются: запятая в конце предложения это отдельный токен.
Почему модель не работает напрямую со словами или буквами? По буквам слишком медленно: слово из десяти букв превратилось бы в десять отдельных шагов обработки. По словам слишком много вариантов: «бежать», «бежал», «забегаешь», «перебежите» это всё разные словарные единицы, и модель бы хранила гигантский словарь и отвечала бы по 10 минут. Куски-токены это компромисс: их около 100–200 тысяч в словаре одной модели, и любой текст можно из них собрать.
Запомните одну вещь: токен — это техническая единица, в которой нейросеть меряет всё. Ваш промпт, её ответ, длину контекста, цену запроса, всё в токенах. Когда видите фразу «1 миллион токенов» в тарифе или «200K контекста» в описании модели, теперь понимаете, о чём речь. Слово LLM (large language model, большая языковая модель) и «нейросеть для текста» это одно и то же. Токены в LLM устроены одинаково у всех: что у ChatGPT, что у Claude, что у GigaChat.
Как нейросеть нарезает текст на токены
Процесс называется токенизацией. Звучит технически, но на практике это просто алгоритм-резак, который работает по готовому словарю. Словарь модель собрала один раз во время обучения и дальше пользуется им всегда: для русского, английского, кода, эмодзи.
BPE — главный алгоритм, его используют почти все
BPE расшифровывается как Byte Pair Encoding — это способ строить словарь токенов. Идея простая: модель смотрит на все тексты, на которых учится, и находит самые частые пары символов. Если буквы «н» и «е» постоянно стоят рядом, она склеивает их в один токен «не». Потом ищет следующие частые пары: «не» + «й» становится «ней», «ней» + «ро» становится «нейро». И так пока словарь не вырастет до нужного размера.
Результат: частые слова и слоги становятся одним токеном, редкие собираются из нескольких. Слово «привет» в ChatGPT-словаре это один токен, потому что встречалось в обучении миллион раз. Слово «токенизация» обычно два-три токена, потому что встречалось реже.
BPE используют ChatGPT, Claude, GigaChat, YandexGPT, DeepSeek, Qwen, фактически вся индустрия. Есть пара альтернатив (WordPiece у BERT, SentencePiece у LLaMA), но для пользователя разница незаметна.
Почему модель не делит просто по словам
Если в вашем запросе встретится слово, которого не было в словаре (например, новое имя, выдуманный термин или опечатка), модель не сломается. Она просто соберёт это слово из более мелких кусочков. «Чекрой» в ChatGPT превратится в что-то вроде чек + рой, и запрос пройдёт. Это и есть главное преимущество BPE перед словарём целых слов: гибкость к любому тексту.
Почему русский текст «съедает» в два-три раза больше токенов
Болезненная тема. Все популярные нейросети американские (ChatGPT, Claude, Gemini) или китайские (DeepSeek, Qwen). В обучающих данных у них процентов 80–90 английского текста. Когда модель строила свой словарь по BPE, частые английские слова стали одним токеном, а для русских осталось мало места. В итоге одна и та же фраза по смыслу в токенах получается так:
| Фраза | Английский | Русский |
|---|---|---|
| «Hello, how are you?» / «Привет, как дела?» | ~5 токенов | ~10 токенов |
| Текст в 1000 слов | ~1300 токенов | ~2500–3000 токенов |
| Книга на 300 страниц | ~120K токенов | ~280K токенов |
Что это значит на практике. Если вы покупаете ChatGPT Plus за 20 $ в месяц и пишете по-русски, ваш лимит сгорит быстрее, чем у американца на том же тарифе. Если оплачиваете API напрямую и считаете по цене за 1M токенов, русский запрос обходится в 2–3 раза дороже английского с тем же смыслом.
Российские модели (GigaChat, YandexGPT) учились в основном на русском, у них словарь честнее: одно слово в большинстве случаев = один-два токена. Это одна из причин, по которой GigaChat дешевле ChatGPT для русскоязычных задач при сопоставимом качестве.
Формула для прикидки в уме
Чтобы не лезть в калькулятор, держите в голове две формулы:
- Русский: количество символов в тексте делите на 2. Получите примерное число токенов. 1000 символов = ~500 токенов. 1000 слов = ~2500–3000 токенов.
- Английский: количество слов умножайте на 1,3. 1000 слов = ~1300 токенов.
Это прикидка ±20%, точнее можно посчитать через сайт OpenAI Tokenizer (про него ниже в разделе «Чем считать токены»). Для бытовых задач формулы хватает с запасом: если ваш промпт уложился в 500 символов, в токенах это около 250, крошечная нагрузка для любой модели.
Контекстное окно — рабочая память нейросети
Контекстное окно — это сколько токенов модель может удерживать «в голове» за один разговор. Туда входит всё: ваш промпт, ваши предыдущие сообщения в этом чате, ответы модели и даже системный промпт (инструкция, которую сервис незаметно отправляет модели перед каждым запросом, типа «ты помощник, отвечай вежливо»).
Когда контекстное окно заполняется, модель начинает забывать начало разговора. Поэтому ChatGPT в часовом диалоге может «не помнить», о чём вы договаривались в первом сообщении. Так устроена физика модели: ваш диалог просто не помещается весь в её память.
Сколько токенов у популярных моделей в 2026 году
| Модель | Контекстное окно | В книгах примерно |
|---|---|---|
| Gemini 3 Pro | 2 000 000 | «Война и мир» ×3 |
| GPT-5.5 | 1 000 000 | «Гарри Поттер» вся серия |
| GPT-4.1 | 1 000 000 | «Гарри Поттер» вся серия |
| DeepSeek V4 Pro | 1 000 000 | То же |
| Qwen3.7-Max | 1 000 000 | То же |
| GPT-5.4 | 400 000 | ~2/3 «Войны и мира» |
| Grok 4 | 256 000 | ~500 страниц книги |
| Claude Opus 4.7 (1M beta) | 1 000 000 | «Гарри Поттер» вся серия |
| Claude Opus 4.7 | 200 000 | ~400 страниц |
| Claude Sonnet 4.6 | 200 000 | ~400 страниц |
| GigaChat 2 Max | 128 000 | ~250 страниц |
| DeepSeek V3.2 | 128 000 | ~250 страниц |
| YandexGPT 5.1 Pro | 32 000 | ~60 страниц |
Главная цифра здесь — 2 миллиона у Gemini 3 Pro: туда влезает целая «Война и мир» ещё пару раз. С такой памятью можно скормить модели весь свой архив переписки за год и попросить найти, когда вы договаривались с Васей про дачу.
Если вам непонятно, какую модель выбирать под свои задачи, начните с дефолта. Для большинства бытовых сценариев хватит Claude Sonnet 4.6 или GPT-5.4 mini: 200K–400K окна, разумная цена. Подробнее по конкретным моделям у нас есть отдельные гайды: по ChatGPT, по Claude, по GigaChat и по YandexGPT.
«Война и мир» в один промпт: влезет или нет
Да, в 2026 году это уже бытовая задача. Полный текст «Войны и мира» весит около 600 000 токенов на русском. В Gemini 3 Pro помещается с тройным запасом, в GPT-5.5 с двукратным. В Claude Opus 4.7 (200K) уместится только треть, надо будет делить на куски.
Полный сериал из 100 серий с субтитрами на английском занимает примерно 1,5 миллиона токенов. Уже только Gemini 3 Pro потянет.
Сколько стоят токены ChatGPT, Claude, GigaChat и YandexGPT в 2026 году
Когда вы платите за подписку (ChatGPT Plus, Claude Pro, Алиса Pro), вы покупаете большой пакет токенов с дневным или недельным лимитом. Когда платите напрямую за API (для разработчиков, ботов, своих сервисов), вы платите за каждый миллион токенов отдельно. Цены за 1 миллион токенов у ChatGPT и Claude различаются в 5–10 раз в зависимости от модели, поэтому полезно держать общую картину под рукой.
| Модель | Input (за 1M токенов) | Output (за 1M токенов) |
|---|---|---|
| Claude Opus 4.7 | 5 $ | 25 $ |
| Claude Sonnet 4.6 | 3 $ | 15 $ |
| Claude Haiku 4.5 | 1 $ | 5 $ |
| GPT-5.5 | 5 $ | 30 $ |
| GPT-5.5 Pro | 30 $ | 180 $ |
| GPT-5.4 | 2,50 $ | 15 $ |
| GPT-5.4 mini | 0,75 $ | 4,50 $ |
| GPT-5.4 nano | 0,20 $ | 1,25 $ |
| Gemini 3 Pro | ~3 $ | ~15 $ |
| Qwen3.7-Max | 2,50 $ | 7,50 $ |
| GigaChat 2 Max | ~6,50 ₽ за 1K (sync) | ~6,50 ₽ за 1K |
| GigaChat 2 Pro | 0,50 ₽ за 1K | 0,50 ₽ за 1K |
| GigaChat 2 Lite | 0,065 ₽ за 1K | 0,065 ₽ за 1K |
| YandexGPT 5.1 Pro | 0,40 ₽ за 1K | 0,40 ₽ за 1K |
| YandexGPT 5 Lite | 0,20 ₽ за 1K | 0,20 ₽ за 1K |
Прикинем на живом примере. Допустим, вы делаете телеграм-бота, который суммирует длинные документы клиентов. Один документ занимает ~10 000 токенов на вход, ответ модели ~1500 токенов. В день обрабатываете 100 документов.
- На Claude Sonnet 4.6: 100 × (10K × 3 $ + 1,5K × 15 $) / 1M ≈ 5,25 $ в день
- На GPT-5.4 mini: 100 × (10K × 0,75 + 1,5K × 4,5) / 1M ≈ 1,42 $ в день
- На GigaChat 2 Lite: 100 × (10K + 1,5K) × 0,065 / 1000 ≈ 75 ₽ в день
Разница в десятки раз. Поэтому в продакшене никто не гоняет на Opus всё подряд: тяжёлые модели берут только для задач, где нужно глубокое рассуждение.
Почему output дороже input в 3–5 раз
Input — это ваш промпт, модель просто его читает. Output — это то, что модель сама пишет, и каждый новый токен она считает заново, прогоняя через всю свою «голову». Это сложнее по вычислениям, поэтому и дороже. У Opus 4.7 разница в 5 раз, у Sonnet тоже в 5, у GigaChat и YandexGPT почти нулевая.
Практический вывод: если хотите экономить, просите модель отвечать коротко. «Дай список из 5 пунктов» обычно дешевле, чем «расскажи подробно».
Как платить в 10 раз меньше за повтор одного и того же текста
У Anthropic, OpenAI и большинства провайдеров в 2026 году есть фишка под названием prompt caching (кеширование промпта). Если вы каждый раз отправляете один и тот же кусок текста в начале запроса (например, инструкцию для бота или базу знаний), провайдер запоминает этот кусок и следующие 5 минут берёт за него 10% от обычной цены. Скидка 90%.
Если строите бота или сервис на нейросети, кеширование экономит ощутимые деньги. Если просто пользуетесь чатом, провайдер это включает автоматически, делать ничего не нужно.
Зачем считать токены, если пользуешься обычным чатом
Короткий ответ: если у вас бесплатная Алиса или подписка ChatGPT Plus и вы не делаете запросы на 100 страниц текста, считать токены не нужно вообще. Сервис сам разберётся.
Длинный ответ: понимать токены полезно в трёх ситуациях.
Когда у вас обрывается ответ модели
Если модель резко обрывает свой ответ на середине предложения, скорее всего она упёрлась в лимит output-токенов на одно сообщение. У разных моделей разный максимум: у Claude обычно 8K на ответ, у GPT около 16K, у Gemini больше. Попросите модель «продолжай», она допишет следующий кусок.
Когда сгорает лимит подписки
Все подписки в 2026 устроены через токены, просто пользователю их не показывают. ChatGPT Plus за 20 $ в месяц это около 40–80 сообщений GPT-5.5 в 3 часа (точные цифры OpenAI скрывает и периодически меняет). Claude Pro за 20 $ даёт примерно столько же. Если упираетесь в лимит до конца дня, варианта два: ждать сброса или брать тариф выше (ChatGPT Pro за 200 $, Claude Max от 100 $).
Когда платите за API напрямую
Это для разработчиков и тех, кто строит свои сервисы поверх нейросети. Тут токены превращаются в конкретные деньги в конце месяца, и счёт может выйти болезненным, если не считать. Но тогда вы уже знаете, что считать.
10 способов экономить токены без потери качества
Список годится и для подписки (чтобы не сжигать лимит за час), и для API (чтобы не разориться).
1 — используйте подходящую модель под задачу
Сортировать список, классифицировать комментарии, переписать письмо в вежливом тоне: для этого хватит Claude Haiku или GPT-5.4 mini. Они в 3–5 раз дешевле флагманов и ответят так же. Флагман берите только когда нужно глубокое рассуждение: код, аналитика, креатив.
2 — открывайте новый чат, когда меняется тема
Каждое новое сообщение в старом чате тащит за собой весь предыдущий контекст, и вы платите за него заново. Закончили обсуждать рецепт борща и спрашиваете про ремонт ноутбука? Открывайте чистый чат, и ваши 50K токенов про борщ не поедут в каждый следующий запрос.
3 — просите короткие ответы, когда они уместны
«Ответь в трёх предложениях» или «дай список из пяти пунктов» экономят 60–80% output-токенов. Output дороже input в 3–5 раз, так что эффект ощутимый.
4 — загружайте только нужные куски документа
Если у вас договор на 50 страниц, а вопрос только про раздел 7, не надо отправлять всё. Скопируйте раздел 7, и контекст в разы меньше, ответ точнее, а цена смешная.
5 — резюмируйте длинные диалоги
Если чат уже на часовое обсуждение и вы продолжаете дальше, попросите модель: «Сделай краткое резюме нашего разговора за последний час». Скопируйте резюме, начните новый чат с него. Контекст ужмётся в 10–20 раз без потери смысла.
6 — системный промпт пишите на английском
Если вы собираете своего бота или ассистента, инструкцию модели («ты дружелюбный помощник, отвечай по-русски, не используй смайлики») лучше написать на английском. На ответы это не повлияет, а токены инструкции, которая отправляется с каждым запросом, ужмутся вдвое.
7 — используйте prompt caching
Если строите сервис, который часто отправляет одну и ту же базу знаний или системный промпт, включайте кеширование. Скидка 90% на повторяющуюся часть. У Anthropic и OpenAI это делается одной строчкой кода в запросе.
8 — не заливайте картинки, если можно описать словами
Картинка для нейросети — это сотни и тысячи токенов (об этом ниже). Если ваша задача «прочитай текст с этого скриншота», часто проще скопировать сам текст руками, чем платить за распознавание.
9 — выбирайте русскоязычную модель для русских задач
GigaChat 2 Pro и YandexGPT 5.1 Pro экономят 30–50% токенов на русском по сравнению с ChatGPT, у них словарь заточен под кириллицу. Качество на большинстве бытовых задач сопоставимое.
10 — просите черновик, потом точечно правьте
«Напиши черновик статьи на тему X» дешевле, чем «напиши идеальную статью на тему X». Получив черновик, дайте 2–3 точечных правки. Итог по токенам выходит в 1,5–2 раза дешевле, чем сразу просить идеал в один заход.
Чем считать токены: рабочие инструменты и формула в уме
Для большинства задач формула «русские символы ÷ 2» в уме покрывает всё. Если нужно точнее, есть пять рабочих инструментов.
- OpenAI Tokenizer (
platform.openai.com/tokenizer) — официальный сайт, вставляете текст, видите точное число токенов и как они подсвечены кусочками. Работает для всех моделей GPT. - tiktoken — Python-библиотека от OpenAI для подсчёта токенов из кода. Если делаете бота — это ваша рабочая лошадка.
- Anthropic Tokenizer — у Anthropic в документации есть свой счётчик для Claude.
- Калькуляторы LLM (например,
hostbor.com/llm-token-cost-calculator) — сразу считают и токены, и цену в долларах с учётом текущих тарифов. - Дашборды самих сервисов — в ChatGPT Pro, Claude Pro и GigaChat есть страница с историей запросов, где видно расход.
Картинки, PDF, аудио — это тоже токены
Да, любой контент в нейросети меряется в токенах. Просто пересчёт у каждого типа свой.
Картинки. У ChatGPT одна картинка обычно стоит 765 токенов (low detail) или 1100–2500 (high detail). У Claude около 1500 за стандартный скриншот. Если у вас бот, который принимает фото счетов от клиентов, каждое фото это полцены небольшой статьи в токенах.
PDF и документы. Считаются по тексту, который внутри. PDF на 10 страниц с текстом весит примерно 5–8K токенов. А вот PDF из сканов без распознанного текста обходится дороже: модель смотрит на него как на картинку, и цена резко растёт.
Аудио. Транскрибация (превращение голоса в текст) меряется в минутах, а дальше уже полученный текст считается в обычных токенах. Whisper от OpenAI стоит ~0,006 $ за минуту.
Видео. Gemini умеет понимать видео напрямую. Одна минута видео это примерно 1000 токенов. Час видео занимает 60K токенов, влезает в любую современную модель.
Где научиться работать с нейросетями системно
Понимать токены это первый шаг, но вокруг есть ещё промптинг, выбор модели под задачу, работа с API, агенты, обвязка через LangChain или n8n. Чтобы не собирать всё это по кусочкам из статей и YouTube, проще пройти курс. За месяц-два получится цельная картина.
Мы собрали в одной подборке актуальные программы: от коротких курсов «как пользоваться ChatGPT» до глубоких треков по LLM-инженерии и промптингу. Всё с рейтингами, отзывами и ценами на сегодня.
| Курс | Школа | Стоимость со скидкой | В рассрочку | Длительность | Обзор курса от Checkroi |
|---|---|---|---|---|---|
| Нейросети для изображений и видео Перейти на сайт курса | 69 100 ₽ | 5758 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети: практический курс Перейти на сайт курса | 25 990 ₽ | 181 667 ₽/мес. | 3 месяца | Обзор курса | |
| Нейросети для рабочих задач Перейти на сайт курса | 29 800 ₽ | 2483 ₽/мес. | 1 месяц | Обзор курса | |
| Нейросети. Практический курс Перейти на сайт курса | 74 900 ₽ | 6242 ₽/мес. | 3 месяца | Обзор курса | |
| Нейросети для каждого: как решать рабочие задачи быстрее Перейти на сайт курса | 37 300 ₽ | 2763 ₽/мес. | 6 недель | Обзор курса | |
| Нейросети на практике Перейти на сайт курса | 54 515 ₽ | 4542 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети для дизайна Перейти на сайт курса | 64 000 ₽ | 2612 ₽/мес. | 2 месяца | Обзор курса | |
| Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса | 162 500 ₽ | 244 ₽/мес. | 24 месяца | Обзор курса | |
| Нейросети для анализа данных Перейти на сайт курса | 31 700 ₽ | 2351 ₽/мес. | 8 недель | Обзор курса | |
| Нейросети для финансистов Перейти на сайт курса | 65 600 ₽ | 5466 ₽/мес. | 2 месяца | Обзор курса |
Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту
И ещё пара материалов, которые пригодятся следом за этой статьёй: какую модель ChatGPT выбрать в 2026, что такое GigaChat и чем он отличается от ChatGPT, обзор Claude от Anthropic.
Подытожим по токенам. Запомните формулу «русские символы ÷ 2». Помните, что output в 3–5 раз дороже input. И знайте контекстное окно своей модели в цифрах: 200K у Claude, 1M у GPT-5.5, 2M у Gemini 3 Pro. С этими тремя вещами вы уже не утонете ни в счётах за API, ни в лимитах подписки.




