Какую модель GigaChat выбрать в 2026: Lite, Pro или Max

Обновлено 12.06.2026
Опубликовано 24.05.2026
820 просмотров
24 мин. чтения
0 комментариев

У Сбера теперь три модели GigaChat: Lite, Pro и Max с ценами от 0,065 до 0,65 ₽ за тысячу токенов. В статье разобрали, какая модель для какой задачи, сколько стоит каждая в рублях, как работает бесплатный лимит в 1 миллион токенов в год и как комбинировать модели в пайплайн, чтобы не переплачивать. После прочтения выберете модель под свою работу и сэкономите бюджет в пять-десять раз.

Статью написал:

Ваня Буявец

Основатель Checkroi, продюсер, эксперт в выборе онлайн-курсов

Все 1119 статей автора Подписаться на Телеграм-канал

Одобрено экспертом:

Наташа Буявец

Основательница Checkroi, продюсер Youtube-каналов, эксперт по онлайн-курсам

Все 1780 экспертных мнений Подписаться на Телеграм-канал

Обложка: Какую модель GigaChat выбрать в 2026: гайд по Lite, Pro и Max от Сбера

У Сбера теперь не одна нейросеть GigaChat, а три модели одного поколения: Lite, Pro и Max. И стоят они очень по-разному — от 0,065 ₽ за 1000 токенов у Lite до 0,65 ₽ у Max. Разница в цене — десять раз, разница в качестве — не всегда.

В этой статье собрали подробный разбор всех трёх моделей: что у них внутри, какая для каких задач, сколько стоит каждая в рублях, какой бесплатный лимит и как комбинировать модели, чтобы не переплачивать.

Корги Рой в роли консультанта показывает на одну из трёх дверей разного размера

Если вы ещё не разобрались, что такое нейросети и как они вообще работают — начните с нашего обзорного материала «Что такое нейросети простыми словами». Там разобрали базу: токены, контекст, генеративные модели, обучение.

Статья пригодится не только разработчикам. GigaChat сегодня используют маркетологи для постов и рекламных текстов, редакторы для рерайта, аналитики для разбора длинных документов, методисты для расшифровок звонков, юристы для черновиков договоров. Везде, где нужно работать с русским языком и при этом платить в рублях напрямую, без КВН и иностранных карт.

Если ищете курс по работе с нейросетями для своей профессии — загляните в нашу подборку курсов по нейросетям и искусственному интеллекту: 316 программ от коротких интенсивов про промпт-инжиниринг до годовых программ для ML-инженеров.

А ещё в соседнем материале «50 промптов для маркетолога в ChatGPT, Claude и YandexGPT» мы разобрали готовые рабочие промпты — часть из них работает в GigaChat один в один.

КурсыСравнение 39 курсов по GigaChatЦены, школы, длительность, рассрочка

Главное за 60 секунд

Если читать дальше некогда — вот сжатая выжимка по всем трём моделям, ценам и применению.

Модель	Для чего	Цена за 1000 токенов	Бесплатно в год
GigaChat 2 Lite	Простые ответы, короткие тексты, чат-боты, рутина	0,065 ₽	900 000 токенов
GigaChat 2 Pro	Рерайт, суммаризация, разбор документов, ответы по экспертизе	0,5 ₽	50 000 токенов
GigaChat 2 Max	Длинные обзоры, сложный анализ, биология, физика, математика	0,65 ₽	50 000 токенов

Главный совет: начинайте с Lite. На большинстве задач у маркетолога, редактора и аналитика её качества хватает с запасом, а 900 тысяч бесплатных токенов в год — это примерно 1500–2000 средних запросов с нормальным ответом. Если для конкретной задачи Lite ответит мимо — переключитесь на Pro той же кнопкой в чате или поменяйте один параметр в API. Max включайте только когда речь о длинных аналитических текстах или сложной экспертизе.

Все три модели работают на контексте 128 000 токенов — это около 200 страниц обычного русского текста. Все умеют отвечать голосом, разбирать картинки и документы, генерировать изображения через встроенный Kandinsky, вызывать внешние функции (function calling). Для кода у Сбера отдельная модель — GigaCode 2.

Платить можно напрямую с любой российской карты, авторизация через Сбер ID, лимиты обновляются раз в год. Никакого КВН, никаких иностранных платёжек — это и есть главный аргумент GigaChat перед ChatGPT и Claude.

Линейка GigaChat 2: одна архитектура, три размера

КурсыСравнение 31 курса по KandinskyЦены, школы, длительность, рассрочка

До осени 2025 года GigaChat был один. С выходом поколения GigaChat 2.0 Сбер разделил линейку на три модели: Lite, Pro и Max. Это похоже на то, как у Anthropic есть Claude Haiku, Sonnet и Opus, а у OpenAI — GPT-5.4 nano, mini и базовая версия. Идея одна: маленькая и дешёвая модель для рутины, средняя — для рабочей нагрузки, флагман — для сложного.

Архитектурно все три модели построены на подходе MoE (Mixture of Experts — смесь экспертов). Это значит, что внутри нейросети живёт несколько «экспертов» — подсетей с разной специализацией, и под каждый запрос включаются только нужные. Так модель работает быстрее и дешевле, чем монолитный аналог такого же размера. Детали архитектуры разработчики GigaChat описали в открытой научной статье на arXiv — если интересен инжиниринг под капотом, она там лежит.

Чем модели отличаются друг от друга:

Lite — самая компактная и быстрая. Меньше параметров, меньше «экспертов» активно при каждом запросе, отсюда низкая цена и скорость в два-три раза выше Pro.
Pro — средняя по размеру. По качеству на уровне предыдущего флагмана (GigaChat 1.x Max), но дешевле и умнее в сложных инструкциях.
Max — самая большая. На момент выхода обогнала на русском бенчмарке MERA модели GPT-4o, DeepSeek V3 и Llama 70B, то есть в своей категории это серьёзная вещь.

КурсыСравнение 50 курсов по DeepSeekЦены, школы, длительность, рассрочка

Token (токен) внутри статьи мы будем считать стандартно: один русский токен — примерно 0,7 слова, или 3–4 буквы. То есть 1000 токенов — это страница обычного русского текста, плюс-минус.

GigaChat 2 Lite: быстро, дёшево, для рутины

Lite — это младшая модель линейки, и её роль в экосистеме чёткая: массовая обработка простых задач, где важна скорость и низкая цена за запрос.

Что внутри Lite

Сбер не раскрывает точные параметры моделей, но по поведению и цене ясно: Lite — это компактная MoE-модель, заточенная под высокий throughput (пропускную способность). В Freemium-режиме, то есть в бесплатной квоте — на Lite приходится 900 000 из 1 000 000 токенов в год. То есть Сбер сам подсказывает: «вот эта модель массовая, на ней работайте основную часть рутины».

Контекст у Lite такой же, как у старших — 128 000 токенов. Function calling, мультимодальность (понимание картинок и аудио на вход), генерация изображений через Kandinsky — всё это работает и на Lite. Разница только в качестве рассуждений: на простых задачах вы её не почувствуете, на сложных — модель начнёт упрощать.

Где Lite хороша

Хороший пример — автоматизация рутины в интернет-магазине. Допустим, у вас в день приходит 300 однотипных вопросов в чат: «когда придёт заказ», «как вернуть товар», «есть ли скидка на второй». Если посадить на них Pro или Max, вы будете платить за флагманский ответ там, где хватает компактного. Lite разруливает это в десять раз дешевле и быстрее, ошибается на 1–2 % больше, и при правильно собранном промпте даже эта разница исчезает.

Конкретные задачи, на которых Lite — оптимальный выбор:

Короткие тексты для соцсетей: 5 вариантов заголовка поста, подпись к фотографии, текст рассылки на 200 слов
Простые ответы в чат-ботах: график работы, условия доставки, ответы по каталогу
Рерайт коротких текстов: переписать абзац в другом стиле
Классификация: «этот отзыв позитивный, негативный или нейтральный»
Извлечение данных: «вытащи из письма дату, сумму и имя контрагента»
Перевод коротких текстов между русским и английским

Где Lite уже не тянет

Lite честно проседает там, где нужна экспертиза и многошаговое мышление. Если попросить её разобрать восьмистраничный договор и найти 10 опасных пунктов — она найдёт 5–6 и не всегда самые критичные. Если попросить написать сценарий вебинара на 40 минут с разбивкой по тайм-кодам и логическими переходами — получите шаблонный текст, который придётся переписывать вручную. Это нормально: у каждой модели свой потолок.

Для таких задач переключайтесь на Pro. Дальше про неё.

Корги Рой быстро штампует поток одинаковых карточек, символизируя массовую рутину

Ваня Буявец, основатель CheckroiПоказываю, как применять Claude Code, ChatGPT и другие нейросети в учёбе и работе, с примерами и промптамиЧитать в Телеграме

GigaChat 2 Pro: рабочая лошадка для 90 % задач

Если бы нужно было выбрать одну модель GigaChat и пользоваться только ей — мы бы брали Pro. Это та самая «средняя» модель, которая закрывает почти всё, на что вам захочется потратить GigaChat в работе.

Что внутри Pro

По качеству GigaChat 2 Pro находится примерно на уровне предыдущего флагмана Сбера — GigaChat 1.x Max. То есть всё, для чего раньше пришлось бы покупать самую дорогую модель, сегодня делает средняя — дешевле и быстрее. Заметно подросла работа со сложными инструкциями, суммаризация (выжимка из длинного текста), рерайтинг, аналитические ответы по конкретной области (экономика, юриспруденция, медицина).

Контекст — 128 000 токенов, как и у всех в линейке. Function calling, vision, audio, генерация картинок через Kandinsky — всё на месте.

Где Pro оптимальна

Разбор документов: договор на 15 страниц, отчёт на 50, сценарий звонка
Суммаризация: «выжми главное из этой статьи в 7 тезисов»
Рерайт средней сложности: статья в блог на 2000 слов
Ответы по прикладным доменам: налоги, законы РФ, общие медицинские вопросы
Многошаговые рассуждения: «разбери задачу, объясни решение, проверь себя»
Подготовка текста рекламной кампании, сетка постов на неделю, посты с аналитикой рынка
Помощь редактору: проверить структуру черновика, предложить заголовки, отловить логические дыры

Кейс редакции

В Checkroi мы тестировали Pro на разборе обзоров онлайн-школ. Задача: дать модели 8–10 типовых жалоб из отзывов и попросить выделить общие паттерны проблем у конкретной школы. Pro справился: построил три кластера («не вернули деньги», «куратор не отвечает», «материал устарел»), указал процент жалоб в каждом, дал короткий вывод. На Lite эта же задача дала плоский список без обобщений — модель не вытянула шаг абстракции. Max справился чуть лучше Pro, но разница не оправдала +30 % к цене.

GigaChat 2 Max: флагман для сложного

Max — старшая модель линейки. Сбер позиционирует её как «модель для самых сложных и масштабных задач», и в этом нет маркетингового преувеличения. На независимом русскоязычном бенчмарке MERA Max занял первое место среди всех протестированных моделей и обогнал GPT-4o, DeepSeek V3, Llama 70B и Qwen 2.5 на русском.

Что внутри Max

Самая мощная модель линейки, с самым большим количеством активных «экспертов» на запрос. По цифрам Сбера, Max заметно лучше предшественников в точных науках: математика, физика, химия, биология. Качество решения математических задач выросло на 25 %. Модель лучше держит контекст в многошаговых диалогах: помнит, о чём шла речь восемь сообщений назад, и связывает новый вопрос с предыдущей информацией.

На HumanEval (международный бенчмарк программирования) Max опережает свои зарубежные аналоги. На MMLU (главный бенчмарк по знаниям, на русском и английском) Max идёт вровень с мировыми лидерами или обгоняет их.

Где Max незаменим

Длинные аналитические тексты: обзор на 6000 слов с логической структурой
Сложный анализ документов: разбор контракта с поиском конкретных рисков, ответ юриста-стажёра
Многоступенчатые рассуждения по точным наукам: разбор задачи по химии или физике
Глубокое сравнение нескольких источников: «вот пять статей, найди расхождения и объясни почему»
Тексты под имя: статья, под которой не стыдно подписаться эксперту
Сценарии длинных коммуникаций: 40-минутный вебинар с логическими переходами и тайм-кодами

Где Max — перебор

Не имеет смысла пускать Max на генерацию подписи под постом во ВКонтакте или на ответ «какие у вас часы работы». Платить 0,65 ₽ за 1000 токенов там, где Lite разрулит за 0,065 ₽ — это просто слив бюджета. Max имеет смысл там, где разница в ответе на Pro и Max будет видна невооружённым глазом, а не только в тонкой настройке формулировок.

Что у всех трёх моделей одинаково

Это важная часть, потому что многие в Интернете пишут «Max умеет картинки, а Lite нет». Это неправда. Возможности и инструменты у всех трёх моделей одинаковые — разница только в качестве и скорости работы. Что доступно везде:

Контекст 128К токенов — около 200 страниц текста за один разговор
Function calling — модель умеет «вызывать» внешние функции и инструменты. Это значит, что её можно подключить к собственному коду, базе данных, поиску, и она сама решит, когда туда обратиться. Базовая штука для построения AI-агентов.
Vision — понимание картинок на вход. Можно скинуть скриншот таблицы, фотографию рукописного текста, схему процесса — модель разберёт.
Audio — приём аудио на вход (расшифровка) и генерация голосового ответа. Полезно для расшифровки записей встреч и звонков.
Документы на вход — PDF, DOCX, Excel-таблицы. Можно подсунуть файл и попросить разобрать.
Генерация изображений через Kandinsky 4.0 — отдельная модель Сбера для картинок, встроенная в GigaChat. Пишете «нарисуй обложку для презентации про логистику» прямо в чат — получаете картинку.
Embedding-модели — EmbeddingsGigaR, Embeddings-2, Embeddings-3B-2025-09. Это нужно тем, кто строит свой умный поиск или RAG-систему (когда модель отвечает по вашей собственной базе документов). Embedding (эмбеддинг) — это способ превратить текст в числа, чтобы по ним искать похожее.

Для разработки кода у Сбера есть отдельная модель — GigaCode 2. Это не часть линейки GigaChat, это самостоятельная модель с агентным режимом, бесплатным доступом через GitVerse и интеграциями с IDE (редакторами кода). Если вам нужен помощник именно по коду — брать стоит её, не GigaChat Pro. Pro код знает, но GigaCode заточен именно под программистов.

Бенчмарки: кто умнее на цифрах

Бенчмарк — это стандартный тест, по которому модели сравнивают между собой. Главные бенчмарки, по которым обычно меряют LLM:

MERA (Multimodal Evaluation for Russian-language Architectures) — главный русский лидерборд. Тестирует знание русского языка, логику, понимание контекста, ответы на вопросы по экономике, праву, медицине и другим прикладным областям. Содержится в открытом доступе на mera.a-ai.ru.
MMLU (Massive Multitask Language Understanding) — главный международный бенчмарк по общим знаниям. 57 дисциплин от школьной математики до юриспруденции и медицины.
HumanEval — стандарт для оценки моделей в программировании. Набор задач, которые модель должна решить кодом.

Как GigaChat 2 Max выглядит по цифрам:

Бенчмарк	Что измеряет	Результат Max
MERA (русский)	Общая русскоязычная компетенция	1 место в момент релиза, обогнал GPT-4o, DeepSeek V3, Llama 70B, Qwen 2.5
MMLU	Общие знания, 57 дисциплин	На уровне мировых лидеров
HumanEval	Программирование	Опережает зарубежные аналоги в своей категории

Важно понимать вот что: на момент релиза в октябре 2025-го Max был сильнее GPT-4o на русском. Но OpenAI с тех пор выпустил GPT-5.4 и GPT-5.5 — модели нового поколения, которые на большинстве задач объективно сильнее. Поэтому корректная формулировка: GigaChat 2 Max — лучшая модель для русского языка среди тех, что можно купить из России в рублях напрямую. В своей категории это правда лидер.

Если вас интересуют подробности про MoE-архитектуру GigaChat и как именно Сбер дотащил линейку до таких цифр — разработчики опубликовали полноценную научную статью «GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture» на arXiv. В ней есть точные цифры по количеству параметров, активным экспертам и инженерным решениям.

Цены: сколько GigaChat стоит в рублях

Это, наверное, самая практичная часть статьи. У GigaChat понятная схема: бесплатный режим Freemium, платные пакеты для физлиц, отдельные тарифы для бизнеса. Никаких подписок «в месяц», никакой долларовой привязки, никакой иностранной карты.

Freemium: 1 миллион токенов в год бесплатно

Сразу после регистрации через Сбер ID вы получаете 1 000 000 токенов в год бесплатно. Это годовой лимит — не месяц, не неделя. Через 12 месяцев счётчик обнуляется и даётся снова. Распределение между моделями такое:

900 000 токенов — на GigaChat 2 Lite
50 000 токенов — на GigaChat 2 Pro
50 000 токенов — на GigaChat 2 Max

В пересчёте на разговоры: 900 тысяч токенов Lite — это примерно 1500–2000 полноценных запросов с ответом средней длины. На день — по 4–5 запросов. Этого хватает, чтобы попробовать модель и понять, нужна ли она вам платной.

50 тысяч на Pro и Max — это меньше, около 80–100 серьёзных запросов с длинным контекстом. То есть Freemium-квоты Pro и Max нужны скорее «попробовать», а не «работать каждый день».

Важный нюанс Freemium: генерация идёт в один поток. То есть запросы выполняются строго по одному, один за другим. Это нормально для одного человека, но не подходит для бизнеса с параллельной обработкой.

Платные тарифы для физлиц

Цены актуальные на 1 февраля 2026 года. Самые свежие можно проверить в официальной документации Сбера.

Модель	Sync, ₽ за 1000 токенов	Async, ₽ за 1000 токенов	Пакет 3М/15М/20М
GigaChat 2 Lite	0,065 ₽	0,033 ₽	20М — 1300 ₽; 100М — 6500 ₽
GigaChat 2 Pro	0,5 ₽	0,25 ₽	3М — 1500 ₽; 15М — 7500 ₽
GigaChat 2 Max	0,65 ₽	0,33 ₽	3М — 1950 ₽; 15М — 9750 ₽

Что важно понять про эти цифры:

Sync (синхронно) — модель отвечает сразу, в реальном времени. Это режим для чат-ботов и интерактива.
Async (асинхронно) — модель отвечает с задержкой, в очереди. Это в два раза дешевле sync, но подходит только там, где ответ не нужен немедленно (массовый рерайт, разбор больших архивов, аналитические отчёты по ночам).
Пакеты — скидка за объём. Купить 100 миллионов токенов Lite за 6500 ₽ дешевле, чем платить по ходу — выходит около 0,065 ₽ за 1000, та же ставка, что и sync. Реальная выгода пакетов проявляется в комбинации с async — там цена опускается до 0,033 ₽ за тысячу.

Тарифы для юрлиц

Для бизнеса у Сбера отдельная сетка. Подключение через корпоративный договор, со счётом и НДС, с возможностью развернуть GigaChat внутри инфраструктуры компании (on-premise) для тех, у кого жёсткие требования по данным. Цены платных пакетов начинаются от 90 000 ₽ в месяц, но точные суммы зависят от конфигурации и объёмов. Уточнять надо у менеджера через форму на developers.sber.ru.

В корпоративных тарифах нет «лимита раз в год» — токены покупаются столько, сколько нужно. Запросы параллельные, генерация быстрее, есть SLA по доступности, поддержка с ответом в часах.

Как считать бюджет

Простая формула, которая работает в большинстве сценариев: средний полноценный диалог — это 600–1000 токенов на один запрос-ответ. Если работа на Lite — это 0,04–0,065 ₽ за диалог. Если на Pro — 0,3–0,5 ₽. Если на Max — 0,39–0,65 ₽.

Маркетолог, который тратит на GigaChat час в день (примерно 40 диалогов), на Pro потратит 12–20 ₽ за день, или 240–400 ₽ в месяц. На Lite уложится в 1,6–2,6 ₽ в день, или 30–50 ₽ в месяц. Разница в десять раз, и именно поэтому правильный выбор модели — это не вкусовщина, а реальные деньги.

Матрица «задача → модель → токены → ₽»

Чтобы было предметно, собрали 15 типичных задач, на каждой указали оптимальную модель, ожидаемый расход токенов и стоимость в sync-режиме по ценам февраля 2026.

Задача	Модель	~ токенов	Цена, ₽
5 вариантов заголовка поста ВК	Lite	400	0,026
Ответ в чат-боте магазина	Lite	300	0,02
Подпись к фото в Instagram	Lite	250	0,016
Классификация 100 отзывов «+/—/0»	Lite	15 000	0,97
Рерайт абзаца на 200 слов	Lite	700	0,046
Сетка постов на неделю	Pro	3500	1,75
Суммаризация статьи на 3000 слов	Pro	6000	3,0
Разбор договора на 15 страниц	Pro	20 000	10,0
Резюме часовой записи звонка	Pro	15 000	7,5
Обзор продукта на 1500 слов	Pro	5500	2,75
Сравнение 5 статей по теме	Max	25 000	16,25
Аналитический обзор на 6000 слов	Max	14 000	9,1
Разбор сложного контракта (50 стр)	Max	60 000	39,0
Сценарий вебинара на 40 минут	Max	10 000	6,5
Картинка в Kandinsky	Lite/Pro/Max + Kandinsky	200 + изображение	~3 за картинку

Глянув в таблицу, видно простое правило: задача начинает оправдывать Pro и Max только тогда, когда длина запроса превышает 2–3 тысячи токенов или когда от ответа зависит качество результата (договор, аналитика, обзор под имя). Для коротких бытовых задач Lite даёт лучшее соотношение цены и качества.

Канал основателя Checkroi Вани БуявцаПоказываю тебе, как публично строю Checkroi с нейросетями и делюсь цифрами, провалами и тем, что сработалоПодписаться

Алгоритм выбора: 4 вопроса

Если не хочется каждый раз гадать — ниже короткий алгоритм. Задайте себе четыре вопроса, и модель выберется сама.

Вопрос 1: Длина задачи короче 2000 токенов?

Если да — почти наверняка Lite. Короткие тексты, классификация, простые ответы, рерайт абзаца — Lite справится. Если нет — идём дальше.

Вопрос 2: Нужна экспертиза или многошаговое рассуждение?

Если нужно «выдай решение, потом проверь сам, потом объясни почему» — это уже Pro или Max. Если задача линейная (тут текст — перепиши) — Lite или Pro в зависимости от длины.

Вопрос 3: Текст пойдёт под имя или внешний показ?

Если статья выйдет на сайт компании, в презентацию для клиента, в договор — берите Max. Разница между «нормально написано» и «хорошо написано» здесь имеет смысл. Если текст идёт во внутренний слак или в черновики — Pro хватает.

Вопрос 4: Это разовая задача или массовый поток?

Если в день 100 однотипных запросов — однозначно Lite, даже если каждый отдельный был бы лучше на Pro. Стоимость потока на Pro съест бюджет за неделю. Если это один разовый сложный анализ — берите модель посильнее, не экономьте 5 ₽.

Дополнительный пятый параметр, который мы часто упускаем: время отклика. Lite отвечает в 2–3 раза быстрее Pro. Если интерактив с пользователем (чат-бот, голосовой помощник, реалтайм-перевод) — скорость важна не меньше качества.

Pipeline Lite → Pro → Max: как комбинировать модели

Самый интересный приём, который мало кто использует на старте: комбинировать модели в один пайплайн. Одну задачу прогонять через несколько моделей последовательно, и каждая делает свою часть. Это экономит бюджет и повышает качество.

Классическая схема в три шага:

Lite — фильтр и подготовка. Принимает входной поток (письма, обращения, документы), отсеивает мусор, нарезает на куски, выдаёт черновую разметку. Дешёвая часть работы.
Pro — основная обработка. Берёт уже отфильтрованное, делает реальную работу: разбирает, суммаризирует, переписывает. 80 % всей логики — здесь.
Max — финальная полировка. Применяется только к 5–10 % задач, где нужно вытянуть качество до предела. Например, финальная редактура текста под имя или сложный экспертный вывод.

Реальный пример: разбор архива из 2000 обращений в поддержку, чтобы найти тренды по претензиям. Если запустить весь архив на Max — это около 60 000 ₽. Если в пайплайне Lite фильтрует на валидные обращения (выкидывает 30 % мусора), Pro кластеризует оставшиеся 1400, Max делает обобщающий вывод по кластерам — получится около 7000 ₽. Разница в 9 раз при том же или лучшем результате.

Pipeline-подход требует чуть-чуть программирования или хотя бы настройки сценария в n8n / Make / собственном Python-скрипте. Если вы не разработчик — не пугайтесь: AI-агенты для запуска таких пайплайнов уже умеют собирать сами по текстовому описанию задачи. Подробнее про эту тему — в нашем материале «Что такое AI-агенты: простыми словами».

GigaChat против ChatGPT, Claude и YandexGPT

На этом месте обычно начинается холивар. Постараемся без эмоций, по цифрам и по тому, что важно конкретному пользователю в России в 2026 году.

Параметр	GigaChat 2 Max	GPT-5.5	Claude Opus 4.8	YandexGPT 5 Pro	DeepSeek V3.2
Контекст	128К	1М	200К	32К	128К
Качество на русском	Топ в своей категории	Очень высокое	Очень высокое	Высокое	Среднее
Качество на английском	Хорошее	Топ	Топ	Среднее	Высокое
Оплата из России	Прямая, рубли	Через прокси / иностранную карту	Через прокси / иностранную карту	Прямая, рубли	Прямая (большинство сервисов)
КВН	Не нужен	Нужен	Нужен	Не нужен	Не нужен
Бесплатный лимит	1М токенов / год	Ограниченный free, потом подписка	Ограниченный free	Бесплатно в Алисе	Бесплатный чат на сайте
Цена API за 1000 токенов	0,65 ₽	~$0,02 (≈1,7 ₽)	~$0,015 (≈1,3 ₽)	~0,40 ₽	~$0,002 (≈0,17 ₽)

Несколько практических выводов из таблицы:

На русском GigaChat хорош. Не «не хуже ChatGPT в 3 раза», как пишут конкуренты. На типовых задачах редактуры, аналитики по РФ-домену (законы, налоги, бренды), русскоязычной суммаризации он даёт результат, который сравним или лучше зарубежных аналогов в своей ценовой категории.
На английском и на общих знаниях лидируют GPT-5.5 и Claude Opus 4.8. Если ваша задача — перевод, англоязычный контент, академическая работа на английском — разница в пользу зарубежных моделей будет ощутимой.
Контекст у GPT-5.5 — 1 миллион токенов, у GigaChat — 128 тысяч. Это значит, что для разбора огромных документов (вся история переписки за год, книга на 800 страниц) удобнее зарубежные модели. На типовых задачах 128К с головой.
YandexGPT 5 Pro — главный конкурент GigaChat по нише. Тот же русский язык, тот же рубль, бесплатно в Алисе. Качество примерно сопоставимое, но контекст у Яндекса меньше (32К), а экосистема развития уступает (нет такой же сильной линейки и инструментов вокруг).
DeepSeek V3.2 — очень дёшево для тех, кто готов работать на китайских серверах. Качество хорошее, цена в 4 раза ниже GigaChat. Но скорость хуже, поддержки русского меньше, для бизнеса в России есть вопросы по соответствию законам о персональных данных.

Простая логика выбора: если работа на русском и нужно платить в рублях — GigaChat или YandexGPT. Если задача требует максимума и вы готовы возиться с оплатой — Claude или ChatGPT. Если нужно дёшево и не принципиально, чтобы данные оставались в РФ — DeepSeek.

Подробный разбор линейки Claude мы делали в соседней статье «Opus 4.8 vs Sonnet 4.6 vs Haiku 4.5: какую модель Claude выбрать». А общую подборку бесплатных альтернатив Claude Code собрали с упором на Россию — GigaChat там тоже в списке.

Лимиты, квоты и rate limits

Кроме цены за токены, у GigaChat есть ограничения по скорости запросов, то есть сколько обращений к API вы можете сделать за единицу времени. Это называется rate limit (рейт-лимит). Что важно знать:

Freemium — строго один поток. Один запрос за раз, следующий ждёт. Параллельная обработка не работает.
Платные тарифы для физлиц — несколько параллельных потоков, точное число зависит от модели и пакета. Обычно от 3 до 10 потоков.
Корпоративные тарифы — до десятков параллельных потоков, можно расширить под нагрузку по запросу.

Если ваш сценарий — массовая обработка (классификация 10 000 отзывов за ночь, рерайт каталога из 5000 карточек товаров), смотрите на async-режим. Там цена в два раза ниже, и нагрузка распределяется по очереди — rate limits становятся менее заметны.

Отдельный момент: длина одного ответа модели ограничена примерно 8000 токенов на генерацию. Если просите модель «напиши обзор на 20 000 слов разом» — она оборвёт ответ на 6–8 тысячах. Нормальная практика — нарезать большие задачи на куски и собирать ответ из частей. Это вообще общая практика для всех LLM, не только GigaChat.

5 типичных ошибок при выборе модели

Собрали ошибки, которые видим чаще всего у тех, кто только пробует GigaChat в работе.

Корги Рой надрывается под слишком большой коробкой, рядом маленькая которой хватило бы

Ошибка 1 — всегда брать Max «на всякий случай»

Это самая дорогая ошибка. Логика «возьму флагман, потому что он умнее» — понятная, но вредная. На 90 % задач Lite или Pro дают ровно тот же результат, что и Max, за десятую долю цены. Использовать Max нужно там, где разница в ответе будет вам видна и ценна. На генерации подписи под фоткой ВКонтакте Max не ответит лучше Lite — просто потратит ваши деньги.

Ошибка 2 — всегда брать Lite «потому что дёшево»

Обратная крайность. Если посадить Lite разбирать сложный договор — получите поверхностный анализ, пропустите важные пункты, в итоге заплатите за ошибку больше, чем сэкономили на токенах. Lite — это инструмент рутины, не экспертизы.

Ошибка 3 — ставить sync везде, где не нужно реального времени

Async-режим вдвое дешевле sync. Если задача — обработать ночью архив или сделать массовый рерайт, sync не нужен. Просто переключение режима экономит половину бюджета.

Ошибка 4 — не считать токены

«Я же мало пользуюсь, чего там считать», и потом удивление, что 1 миллион бесплатных токенов кончился за 2 месяца. Если хотя бы примерно знать, что один диалог — это 600–1000 токенов, бюджет планируется на год вперёд без сюрпризов.

Ошибка 5 — путать GigaChat с GigaCode

Эти модели часто пытаются использовать друг для друга. GigaChat (любая из трёх) код знает на уровне общей нейросети, то есть напишет, но агентный режим, разбор репозитория, контекст всего проекта она не умеет. Это работа отдельной модели GigaCode 2. Если нужен помощник для разработки — заходите на GitVerse и берите GigaCode, а не Pro.

Как подключиться: чат, Телеграм, ВКонтакте, API

Есть несколько вариантов в зависимости от того, как глубоко вы собираетесь использовать модель.

Самый простой способ — чат на сайте

Откройте giga.chat, нажмите «Попробовать», авторизуйтесь через Сбер ID. Сбер ID — это единый аккаунт Сбера, привязанный к вашему номеру телефона. Если у вас есть приложение Сбербанк Онлайн, авторизация займёт 10 секунд: либо SMS с кодом, либо QR из приложения, либо биометрия (Face ID / отпечаток).

После входа сразу попадаете в чат. В интерфейсе сверху есть переключатель моделей: Lite (по умолчанию), Pro, Max. Жмёте, и разговор идёт на выбранной модели. Картинки генерируются командой «нарисуй …» или через отдельную кнопку.

Телеграм и ВКонтакте

Альтернатива браузеру — официальные боты в мессенджерах. Найти их можно поиском по слову «GigaChat» — официальные имеют синюю галочку и большое количество подписчиков. Авторизация та же — через Сбер ID.

В ботах удобно, когда нейросеть нужна на ходу с телефона: разобрать письмо, переписать сообщение, придумать заголовок. Все три модели доступны и здесь.

API: для разработчиков и автоматизаций

Если хотите подключить GigaChat к своему сайту, чат-боту, скрипту — нужен API. Регистрируете аккаунт на developers.sber.ru, заходите в продукт GigaChat API, получаете authorization key (это OAuth-ключ — уникальная строка-пароль для программного доступа). Дальше отправляете обычные HTTP-запросы на endpoint (адрес API-сервера) и получаете ответы в JSON.

Документация подробная, с примерами кода на Python, Go, JavaScript. Есть готовые SDK (библиотеки, которые упрощают работу с API из конкретного языка).

GitVerse: бесплатный доступ к Pro и GigaCode для разработчиков

Сбер запустил GitVerse — это российский аналог GitHub, и разработчикам, которые там работают, доступна расширенная Freemium-квота на GigaChat 2 Pro и GigaCode 2. Если вы программист и хотите без денег попробовать модель в работе — заведите аккаунт на GitVerse и получите токены прямо там.

Что ни одна модель GigaChat не умеет

Важно понимать ограничения — иначе вы будете давать модели задачи, на которые она физически не способна, и разочаровываться.

Не ходит в интернет в реальном времени. Модель отвечает по тому, что заучила во время тренировки. Свежие новости, актуальные курсы валют, погоду в Москве на завтра — она знать не может. Поиск надо подключать отдельно через function calling.
Не запоминает разговор между сессиями. Открыли новый чат — модель не помнит, что вы обсуждали вчера. Долгосрочная память — это отдельная инженерная задача с использованием embedding и векторных баз.
Не ставит документы под подпись юриста. GigaChat пишет черновик договора, но юридический анализ — это всегда человек. У любой LLM есть галлюцинации (выдумывание фактов с уверенным видом).
Не запускает программы у себя на сервере. Code interpreter (когда модель сама исполняет Python-код в песочнице, как в ChatGPT) у GigaChat нет. Код модель напишет — но запускать его придётся самостоятельно.
Не даёт детерминированный ответ. Один и тот же запрос два раза подряд может выдать разные тексты. Это базовое свойство всех LLM, и если нужна стабильность — надо тщательно настраивать параметр temperature (температуру — параметр случайности) в API.

Главная мысль: начинайте с Lite, переходите по факту

Если все таблицы и разделы выше сжать в одну фразу — получится так: зарегистрируйтесь в Freemium, попробуйте Lite, и только если она мимо — переключайтесь на Pro. Max брать только под конкретную задачу, когда видите, что Pro не вытягивает.

Это работает в большинстве случаев лучше, чем «возьму сразу Max, чтобы наверняка». Потому что с нейросетями важно не то, насколько модель умная сама по себе, а то, насколько хорошо вы умеете её использовать. Промпт-инжиниринг (искусство правильно ставить задачу нейросети) часто даёт больший прирост в качестве, чем переключение с Lite на Max.

Поэтому начните с того, что научитесь хорошо разговаривать с маленькой моделью. А потом, когда у вас будет своё ощущение, какие задачи Lite не тянет, переключайте конкретные пайплайны на Pro и Max. Так бюджет тратится в разы экономнее, и качество не страдает.

Где научиться работать с нейросетями: подборка курсов

GigaChat — один из инструментов в большой теме AI-навыков. Промпт-инжиниринг, работа с API, проектирование AI-агентов, RAG-системы, эмбеддинги — это всё отдельные ремёсла, которые лучше изучать системно, а не по урывочным статьям.

Мы собрали полную подборку 316 курсов по нейросетям и искусственному интеллекту: от коротких интенсивов про работу с GigaChat и ChatGPT в маркетинге до годовых программ для тех, кто хочет стать ML-инженером или промпт-инженером.

Если ищете курс именно по GigaChat — у нас есть отдельная подборка курсов с разбором GigaChat в программе. Там 17 программ, в которых учат работе с российскими нейросетями и применению их в конкретных профессиях — от контент-маркетинга до аналитики данных.

А для маркетологов, редакторов и всех, кто работает с текстами — параллельно загляните в нашу подборку 50 промптов для ChatGPT, Claude и YandexGPT. Большая часть из них один-в-один работает и в GigaChat, нужно только заменить название модели.

Курс	Школа	Стоимость со скидкой	В рассрочку	Длительность	Обзор курса от Checkroi
Нейросети: практический курс Перейти на сайт курса	Skypro	25 990 ₽	181 667 ₽/мес.	3 месяца	Обзор курса
Нейросети для изображений и видео Перейти на сайт курса	Эдюсон	47 504 ₽	3958 ₽/мес.	2 месяца	Обзор курса
Нейросети для рабочих задач Перейти на сайт курса	Skillbox	29 800 ₽	2483 ₽/мес.	1 месяц	Обзор курса
Нейросети. Практический курс Перейти на сайт курса	Skillbox	74 900 ₽	6242 ₽/мес.	3 месяца	Обзор курса
Нейросети для каждого: как решать рабочие задачи быстрее Перейти на сайт курса	Нетология	37 300 ₽	2763 ₽/мес.	6 недель	Обзор курса
Нейросети для каждого Перейти на сайт курса	Академия Синергия	39 900 ₽	3325 ₽/мес.	3 месяца	Обзор курса
Нейросети для дизайнера Перейти на сайт курса	Skillbox	84 272 ₽	3831 ₽/мес.	4 месяца	Обзор курса
Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса	Нетология	162 500 ₽	244 ₽/мес.	24 месяца	Обзор курса
Нейросети для анализа данных Перейти на сайт курса	Нетология	31 700 ₽	2351 ₽/мес.	8 недель	Обзор курса
Нейросети для финансистов Перейти на сайт курса	Эдюсон	65 600 ₽	5466 ₽/мес.	2 месяца	Обзор курса

Нейросети: практический курс
Skypro25 990 ₽181 667 ₽/мес3 месяца
Перейти на сайт курса Обзор
Нейросети для изображений и видео
Эдюсон47 504 ₽3958 ₽/мес2 месяца
Перейти на сайт курса Обзор
Нейросети для рабочих задач
Skillbox29 800 ₽2483 ₽/мес1 месяц
Перейти на сайт курса Обзор
Нейросети. Практический курс
Skillbox74 900 ₽6242 ₽/мес3 месяца
Перейти на сайт курса Обзор
Нейросети для каждого: как решать рабочие задачи быстрее
Нетология37 300 ₽2763 ₽/мес6 недель
Перейти на сайт курса Обзор
Нейросети для каждого
Академия Синергия39 900 ₽3325 ₽/мес3 месяца
Перейти на сайт курса Обзор
Нейросети для дизайнера
Skillbox84 272 ₽3831 ₽/мес4 месяца
Перейти на сайт курса Обзор
Магистратура «Прикладной искусственный интеллект» с УрФУ
Нетология162 500 ₽244 ₽/мес24 месяца
Перейти на сайт курса Обзор
Нейросети для анализа данных
Нетология31 700 ₽2351 ₽/мес8 недель
Перейти на сайт курса Обзор
Нейросети для финансистов
Эдюсон65 600 ₽5466 ₽/мес2 месяца
Перейти на сайт курса Обзор

Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту

Прокомментировать

Часто задаваемые вопросы

Какую модель GigaChat выбрать для повседневной работы?

Для большинства задач у маркетолога, редактора и аналитика хватает GigaChat 2 Lite. Цена — 0,065 ₽ за 1000 токенов, бесплатно — 900 000 токенов в год. Если на конкретной задаче Lite ответит мимо — переключитесь на Pro той же кнопкой в чате.

Можно ли пользоваться GigaChat бесплатно?

Да. После регистрации через Сбер ID вы получаете 1 000 000 токенов в год бесплатно: 900 000 на Lite, 50 000 на Pro, 50 000 на Max. Лимит обновляется раз в 12 месяцев.

Чем GigaChat 2 Pro отличается от Max?

Pro закрывает 90% задач: рерайт, суммаризацию, разбор документов, ответы по экспертизе. Max нужен для длинных аналитических текстов, сложного многоступенчатого анализа, экспертных задач в точных науках. Разница в цене — 30%, разница в качестве заметна только на сложных задачах.

Нужен ли мне API или хватит чата на сайте?

Для личных задач хватит чата на giga.chat или бота в Телеграм. API нужен только если вы подключаете GigaChat к своему сайту, чат-боту или скрипту автоматизации.

GigaChat умеет рисовать картинки и работать с голосом?

Да, и это работает на всех трёх моделях. Изображения генерирует встроенный Kandinsky 4.0 — пишете «нарисуй …» прямо в чат. Голос идёт через модальность аудио — можно загрузить запись звонка и получить расшифровку или резюме.

Как авторизоваться в GigaChat без Сбер ID?

Никак — авторизация только через Сбер ID. Но Сбер ID привязан к номеру телефона, и для регистрации не нужно быть клиентом Сбербанка: достаточно подтвердить номер по SMS.

Что лучше для русского языка — GigaChat или YandexGPT?

GigaChat 2 Max и YandexGPT 5 Pro сопоставимы по качеству на русском, но у GigaChat контекст в 4 раза больше (128К против 32К). YandexGPT удобнее для бытового использования через Алису, GigaChat сильнее как платформа для разработки и интеграций.

Сколько стоит GigaChat в месяц при активном использовании?

Маркетолог, который тратит на GigaChat час в день (около 40 диалогов), на Lite уложится в 30–50 ₽ в месяц, на Pro — 240–400 ₽. Точная сумма зависит от длины запросов и выбранной модели.

Можно ли использовать GigaChat для бизнеса?

Да, у Сбера есть корпоративные тарифы с договором, счётом и НДС. Для жёстких требований по данным доступен on-premise — развёртывание GigaChat внутри инфраструктуры компании. Условия уточняются через форму на developers.sber.ru.

Чем GigaChat отличается от GigaCode?

GigaChat — универсальная нейросеть для текстов, документов, картинок и общих задач. GigaCode 2 — отдельная модель Сбера именно для программирования, с агентным режимом и интеграцией в IDE. Если задача — помочь с кодом, берите GigaCode, не Pro.

Ваня Буявец

Основатель Checkroi, продюсер, эксперт в выборе онлайн-курсов

Все статьи автора

Оставить комментарий

0 комментариев

Оставьте комментарий

Напишите, что думаете. Нам важно ваше мнение!

Какую модель GigaChat выбрать в 2026: гайд по Lite, Pro и Max от Сбера

Главное за 60 секундСкопировано

Линейка GigaChat 2: одна архитектура, три размераСкопировано

GigaChat 2 Lite: быстро, дёшево, для рутиныСкопировано