• Опубликовано
  • 24 просмотра
  • 24 мин. чтения
  • 0 комментариев

Какую модель Gemini выбрать в 2026: Pro, Flash и Flash-Lite

Google за последние полгода выпустил столько моделей Gemini, что в них путаются даже разработчики. Pro, Flash, Flash-Lite, Deep Think, Nano Banana, четыре тарифа в приложении и три модели, которые снимаются в июне. Разобрали по полочкам: какую брать под длинные PDF, какую под массовые задачи, какую попробовать бесплатно из браузера. С таблицами цен в рублях, схемой оплаты из России и сравнением с Claude и GPT-5.
Статью написал:
Ваня Буявец, продюсер, основатель Checkroi
Ваня Буявец
Основатель Checkroi, продюсер Telegram-каналов, эксперт в выборе онлайн-курсов
Все 327 статей автора
Одобрено экспертом:
Наташа Буявец, основатель Checkroi, эксперт по онлайн-курсам
Наташа Буявец
Основательница Checkroi, продюсер Youtube-каналов, эксперт по онлайн-курсам
Все 990 экспертных мнений
Какую модель Gemini выбрать в 2026: Pro, Flash и Flash-Lite

Google за последние полгода выпустил столько моделей Gemini, что в них путаются даже разработчики. В приложении Gemini App четыре тарифа. В Google AI Studio пять активных моделей, и ещё три снимаются с продажи в июне. На Google I/O 2026 четыре дня назад анонсировали Gemini 3.5 Flash, которая обогнала флагман по программированию. Новичок открывает выпадающий список и закрывает страницу.

В статье собрали гайд по выбору модели Gemini в 2026 году. Разобрали отличия Pro, Flash и Flash-Lite на понятных сценариях, добавили таблицу тарифов с дневными лимитами (которые конкуренты замалчивают), цены API в рублях, схему оплаты из России и сравнение с Claude и GPT-5.

Если вы только знакомитесь с темой и вообще не уверены, что такое нейросеть и чем она отличается от обычной программы, загляните в нашу обзорную статью «Что такое нейросети простыми словами». Там разобрали базу, на которой стоит весь дальнейший разговор про модели.

Параллельно с этим материалом мы выпустили сестринский гайд «Opus 4.7 vs Sonnet 4.6 vs Haiku 4.5: какую модель Claude выбрать в 2026». Если выбираете между двумя AI-провайдерами, читайте оба гайда. В конце текущего материала есть короткая сводная таблица «когда лучше Gemini, когда Claude».

Статья пригодится не только программистам. Gemini сегодня используют маркетологи для текстов, аналитики для разбора длинных отчётов, дизайнеры для Nano Banana, студенты для учёбы. Модели разные, цены разные, ограничения разные. Логика выбора одна.

Если хочется освоить ремесло работы с нейросетями системно, загляните в нашу подборку курсов по нейросетям и искусственному интеллекту: там 316 программ от коротких интенсивов до годовых, ниже в статье соберём топ конкретно под Gemini.

Главное за 60 секунд

Семь фраз для тех, кто открыл статью и хочет принять решение прямо сейчас.

Бесплатный вход. Зайдите на gemini.google.com с любой Google-почты. По умолчанию запустится Gemini 3 Flash, дневной лимит небольшой, но для первого знакомства его хватит. Картинки через Nano Banana 2: 20 штук в день бесплатно.

90 % задач закроет Flash. Если непонятно, что выбрать, берите Gemini 3 Flash. Это быстрая и дешёвая модель, на которой делают текст, перевод, чат, классификацию и несложный код.

Pro для длинных PDF и сложного. Gemini 3.1 Pro нужен, когда вы скидываете 200-страничный отчёт, требуете глубокий разбор или пишете архитектуру кода с нуля. Контекст у Pro — 2 млн токенов, такой объём в индустрии один.

Flash-Lite для тысяч запросов. Если у вас бот или пайплайн, который гоняет нейросеть тысячи раз в сутки, Flash-Lite в разы дешевле и быстрее.

Свежее: 3.5 Flash. На Google I/O 20 мая 2026 представили Gemini 3.5 Flash. На agentic-задачах и коде она обгоняет 3.1 Pro. Раскатывают постепенно, скоро будет в приложении и API.

Подписка от 7,99 $. Google AI Plus стоит 7,99 $ в месяц, AI Pro — 19,99 $, AI Ultra с Deep Think и Veo — 249,99 $. Карты РФ напрямую не принимают, есть посредники и Google Play Balance.

Не берите 2.5 и 2.0. Если в старой статье или туториале видите Gemini 2.5 или 2.0, это устаревшие модели. Google снимает их 1 и 17 июня 2026 соответственно. Новый проект делайте сразу на линейке 3.

Три модели, три задачи: с чего начать выбор

В ядре линейки три модели: Pro, Flash и Flash-Lite. Названия у Google устроены просто: чем «толще» прилагательное, тем дороже, медленнее и умнее. Pro — флагман, Flash идёт средним по цене и скорости, Flash-Lite самая дешёвая и быстрая, но и самая «простая».

Под каждой моделью на самом деле скрывается ещё несколько вариантов: Gemini 3.1 Pro с тремя уровнями «думанья», обычный Gemini 3 Flash, свежий Gemini 3.5 Flash, отдельная Flash для картинок (Nano Banana 2). Не пугайтесь, в следующих трёх разделах разберём, что внутри каждой.

Сразу запомните одно правило, оно работает в 90 % случаев: по умолчанию берите Flash и переключайтесь на Pro только тогда, когда Flash честно не справился. И ровно наоборот: если задача массовая и вы платите за каждый запрос, спускайтесь до Flash-Lite.

Чуть подробнее про каждую дальше.

Gemini 3.1 Pro: флагман для длинных PDF и сложного кода

Pro — самая сильная и самая дорогая модель в линейке. Она работает медленнее Flash, ответ приходит за 2–6 секунд, иногда дольше. Зато умеет думать пошагово и удерживает контекст в 2 млн токенов. Это примерно 1 500 000 русских слов или три толстых романа подряд.

Что внутри

В Pro есть параметр thinking levels (уровни «думанья»). Он отвечает за то, сколько модель думает перед тем, как отдать ответ. Три уровня: LOW, MEDIUM и HIGH.

  • LOW: модель отвечает почти сразу, минимум рассуждений. Подходит, когда вопрос лёгкий и вы платите за каждый запрос.
  • MEDIUM: сбалансированный режим, дефолт в приложении. Хорошо подходит для статей, разбора документов, кода до 500 строк.
  • HIGH: Deep Think Mini, режим глубокого рассуждения. Модель сама пишет себе пошаговый план и только после этого отвечает. Дольше и дороже, но точнее на олимпиадной математике, доказательствах и сложной архитектуре кода.

Контекстное окно у Pro — 2 млн токенов. Токен — это кусочек слова, в среднем одно русское слово состоит из 2–3 токенов. Контекстное окно показывает, сколько текста модель удерживает в памяти одного диалога. 2 млн токенов это все ваши переписки в Slack за год или вся документация Django от корки до корки.

Модель мультимодальная: ест не только текст, но и картинки, PDF, видео, аудио. Мультимодальность — способность работать сразу с несколькими типами данных. Можно скинуть фотографию техзадания на салфетке, Pro её распознает и превратит в структуру.

Где Pro незаменим

Допустим, у вас годовой финансовый отчёт компании, 180 страниц, нужно найти все упоминания клиента ООО «Ромашка», свести их в таблицу и посчитать оборот за квартал. Flash тут или соврёт, или разобьётся на части. Pro съест PDF целиком, удержит контекст и даст ответ.

Или вы пишете научную статью и хотите, чтобы модель сверила выводы со ссылочной базой из 30 PDF одновременно. Только Pro.

Сложный код. Например, написать миграцию базы данных с учётом 12 уже существующих таблиц, чтобы ничего не сломать. Миграция базы данных — скрипт, который меняет структуру БД (добавляет таблицы, переименовывает поля). Pro с HIGH thinking хорошо справляется с такими задачами.

Архитектура с нуля: «спроектируй мне приложение для учёта клиентов, разработай схему БД, опиши эндпоинты». Эндпоинт — адрес внутри программы, по которому она принимает запросы. Pro отрабатывает такие промпты на уровне джуна-разработчика.

Где Pro перебор

Перевести абзац с английского на русский — перебор. Flash справится за 1 секунду и будет в 10 раз дешевле. Написать пост в Telegram, придумать заголовок для статьи, проверить грамматику тоже Flash.

Если задача укладывается в один абзац контекста и не требует пошагового рассуждения, Pro вам не нужен. Платить будете больше, ждать ответ дольше, качество то же.

Gemini 3 Flash и 3.5 Flash: рабочая лошадка для 90 % задач

Flash идёт серединой линейки. Быстрее Pro в 3–5 раз, дешевле в 10–15 раз, контекст 1 млн токенов (тоже огромный, просто не 2 млн). Скорость около 100–150 токенов в секунду, ответ на средний вопрос приходит за 1–2 секунды.

Что внутри

Контекст 1 млн токенов, поддержка картинок, PDF, видео и аудио. Мультимодальность та же, что у Pro. Thinking levels тоже доступны, но дефолт ниже: Flash изначально оптимизирована под скорость.

На бенчмарках Flash проигрывает Pro по сложным рассуждениям, но на 90 % обычных задач разницы вы не заметите. Текст, перевод, классификация, чат, краткое описание длинного документа, код до 500 строк: Flash справляется на уровне Pro.

Gemini 3.5 Flash: что нового на Google I/O 2026

20 мая 2026 на Google I/O представили Gemini 3.5 Flash. Главное: модель догнала и на ряде бенчмарков обогнала Gemini 3.1 Pro, особенно на agentic-задачах (когда модель сама выбирает инструменты и ходит по шагам) и программировании.

Скорость около 289 токенов в секунду, цена API: 1,50 $ за миллион входных токенов и 9 $ за миллион выходных. Это в 7 раз дешевле Pro по входу и в 3 раза по выходу.

Раскатывают постепенно: в Gemini App в США уже доступно, в других регионах раскатывается в течение мая-июня. В Google AI Studio модель появилась с первого дня анонса. Актуальные данные есть в официальном блоге Google по линейке Gemini и на Engadget.

Что это означает на практике: если ваша задача — код или агент, а 3.5 Flash уже раскатана у вас в регионе, имеет смысл попробовать сначала её. Дешевле, быстрее, по качеству как у Pro.

Кейс редакции: как Flash работает на checkroi

В редакции мы прогоняем через Flash сбор данных по зарплатам для статей серии «Сколько зарабатывает X». Сценарий такой: модель получает 8–10 источников (HH, Хабр.Карьера, корпоративные блоги, региональные агрегаторы), разбирает данные, сводит в JSON. На один материал уходит примерно 30 000 входных токенов и 3 000 выходных. По ценам мая 2026 это около 0,12 $ или 10 ₽ за статью.

Pro для этой задачи перебор. Flash-Lite, наоборот, не справится с разбором сложных табличных данных. Flash попадает в точку.

Gemini 3.1 Flash-Lite: копейки для массовых задач

Flash-Lite — самая дешёвая и самая быстрая модель в линейке. Цена: 0,25 $ за миллион входных токенов. Это в 6 раз дешевле Flash и в 45 раз дешевле Pro. Время до первого токена: 0,2–0,4 секунды, модель почти моментальная.

Что внутри

Контекст 1 млн токенов (как у Flash), мультимодальность сохранилась. Но «мозгов» меньше: на сложных рассуждениях, длинных цепочках выводов и нетривиальном коде модель уступает старшим. Это нормальный размен: вы выиграли скорость и цену, потеряли часть глубины.

Где Flash-Lite дешевле всего

Допустим, у вас интернет-магазин, и вы хотите классифицировать 30 000 отзывов в день: «положительный», «нейтральный», «отрицательный» с коротким объяснением. Flash-Lite идеальный выбор. За месяц обойдётся примерно в 15 $.

Автокомплит в поисковой строке. Голосовой ассистент, который должен мгновенно понимать намерение. Бот в Телеграме, отвечающий на типовые вопросы клиентов. Извлечение полей из договоров (имя, дата, сумма). Везде, где главное скорость и объём, а качество «хорошее» хватает с головой.

Если вы интегрируете нейросеть в продукт впервые, начните именно с Flash-Lite. Поймёте, как устроены запросы, токены, лимиты, и только потом будете решать, нужно ли переключаться на старшую модель.

Сравнение по восьми параметрам

Свели три модели в одну таблицу. Цифры на май 2026, по официальной документации Google AI Studio и карточкам моделей.

Параметр Gemini 3.1 Pro Gemini 3 Flash Gemini 3.1 Flash-Lite
Контекстное окно 2 млн токенов 1 млн токенов 1 млн токенов
Скорость (токенов/сек) ~50–80 ~150 ~250–300
Время до первого ответа 2–6 сек 1–2 сек 0,2–0,4 сек
Цена за 1М входных токенов ~11,25 $ ~1,50 $ 0,25 $
Цена за 1М выходных токенов ~45 $ ~9 $ 1 $
Thinking levels LOW / MEDIUM / HIGH LOW / MEDIUM LOW
Мультимодальность Текст, картинки, PDF, видео, аудио Текст, картинки, PDF, видео, аудио Текст, картинки, PDF
Подходит для Длинные PDF, архитектура, наука 90 % задач: текст, перевод, код Чат-боты, классификация, поиск

На что обратить внимание под таблицей.

Разница в цене огромная. Между Flash и Pro она почти восьмикратная. Между Flash-Lite и Pro — сорокапятикратная. Поэтому когда вы выбираете «по умолчанию Pro», иногда это значит платить в 40 раз больше за то же самое.

Скорость важнее, чем кажется. Если вы строите чат-бота, который отвечает за 3 секунды, пользователь уже задумается, нужен ли ему такой бот. Если за 0,3 секунды, диалог чувствуется живым.

2 млн контекста — фича только Pro. Если ваш сценарий — анализ длинных документов целиком, без нарезки на куски, выбора нет.

Бенчмарки: кто умнее на цифрах

Бенчмарк — стандартизированный тест, по которому сравнивают модели между собой. Есть несколько ключевых.

  • SWE-bench Verified: тест на программирование. Модели дают реальную задачу из GitHub-репозитория, она должна сама написать фикс. У Pro около 78 %, у 3.5 Flash близкие цифры.
  • GPQA Diamond: научные вопросы уровня PhD по физике, биологии и химии. У Pro около 82 %, у Flash около 75 %.
  • ARC-AGI-2: абстрактные логические задачи, которые человек решает по здравому смыслу, а для модели сложно. Pro набирает 77,1 %, Flash около 65 %.
  • IMO-ProofBench: олимпиадные доказательства по математике. Только Pro с HIGH thinking (Deep Think) выходит на 90 %.

Практический вывод: если вы не занимаетесь олимпиадной математикой или научной работой, разница в бенчмарках для вашей задачи не имеет значения. Текст одинаково напишут и Pro, и Flash. Перевод одинаково сделают. Сложный SQL-запрос: тут уже Pro будет точнее, но Flash тоже справится в большинстве случаев.

Тарифы Gemini App: Free, AI Plus, AI Pro, AI Ultra

Если вы пользуетесь Gemini через приложение и сайт gemini.google.com, платите подпиской. Подписки четыре, по состоянию на май 2026.

Тариф Цена Что внутри Кому подходит
Free 0 $ Gemini 3 Flash, Nano Banana 2 (20 картинок/день), дневной лимит запросов Первое знакомство, разовое использование
Google AI Plus 7,99 $ / мес Gemini 3.1 Pro, NotebookLM, 200 ГБ Google One, расширенные лимиты Регулярная работа: тексты, разбор документов
Google AI Pro 19,99 $ / мес Всё из Plus + Veo 3.1 (видео), интеграция с Docs/Gmail, 5 ТБ Google One Профессионалы, которым нужны видео и Workspace
Google AI Ultra 249,99 $ / мес Deep Think, Deep Research, самые новые модели первыми, агентные функции Сложная наука, R&D, корпоративные кейсы

Что выбрать, если непонятно: начните с Free, попробуйте 3 Flash. Если упёрлись в дневной лимит и хочется Pro, берите AI Plus за 7,99 $. Этого хватит большинству.

AI Pro имеет смысл, если вы регулярно работаете с документами в Google Docs и хотите, чтобы Gemini жил прямо в них. Veo 3.1 — это Google-генератор видео, ниже среднего по качеству на май 2026, но для простых роликов хватает.

AI Ultra за 249,99 $ нужен ради Deep Think и раннего доступа к новинкам. Если вы научный исследователь или работаете в R&D-отделе, окупится. Для обычной работы много.

Цены API: за миллион токенов в долларах и рублях

Если вы вызываете Gemini из кода (своего бота, скрипта, продукта), это уже API, а не подписка. Платите за каждый запрос: за входные токены (то, что вы прислали модели) и выходные (то, что модель ответила).

Модель Вход за 1М ($) Выход за 1М ($) Вход за 1М (₽)* Выход за 1М (₽)*
Gemini 3.1 Pro 11,25 $ 45 $ ~990 ₽ ~3 960 ₽
Gemini 3.5 Flash 1,50 $ 9 $ ~132 ₽ ~792 ₽
Gemini 3 Flash 1,50 $ 9 $ ~132 ₽ ~792 ₽
Gemini 3.1 Flash-Lite 0,25 $ 1 $ ~22 ₽ ~88 ₽

*Курс около 88 ₽ за доллар на май 2026. У Google платёж в долларах, рубли только для ориентира.

Один миллион токенов это примерно 750 000 русских слов или 15 толстых статей. Когда говорят «дёшево, всего 0,25 $», имеют в виду, что за четверть доллара модель прочитает 15 статей.

Как считать бюджет на проект. Допустим, бот для кафе, который отвечает на 500 сообщений в день. Среднее сообщение: 100 токенов вход, 80 токенов выход. На Flash-Lite в день выходит 50 000 входных и 40 000 выходных, по ценам это 0,0125 $ + 0,04 $ = 0,053 $. В месяц 1,6 $ или 140 ₽. На Pro те же 500 сообщений обойдутся в 86 ₽ в день, 2 580 ₽ в месяц.

Разница 18-кратная при том, что качество для «бот в кафе» будет одинаковым.

Матрица «задача → модель → лимит → ₽»

Самое полезное в статье. Свели 15 типовых сценариев и посчитали реальный бюджет.

Задача Модель Токены вход/выход Цена (₽)
Перевести абзац (200 слов) Flash-Lite 500 / 500 ~0,06 ₽
Написать пост в Telegram Flash 800 / 1 500 ~1,3 ₽
Резюме длинной статьи (5 000 слов) Flash 10 000 / 800 ~2 ₽
Классификация отзыва (1 шт) Flash-Lite 300 / 50 ~0,01 ₽
Извлечение полей из договора Flash 5 000 / 500 ~1,1 ₽
Анализ PDF на 100 страниц Pro 80 000 / 3 000 ~91 ₽
Разбор 30 PDF одновременно Pro 500 000 / 10 000 ~535 ₽
Написать SQL-запрос Flash 1 500 / 600 ~0,7 ₽
Архитектура веб-приложения Pro (HIGH) 3 000 / 8 000 ~35 ₽
Чат-бот ответ клиенту Flash-Lite 500 / 200 ~0,03 ₽
Генерация картинки в соцсеть Nano Banana 2 Бесплатно (до 20/день) или ~3 ₽/шт
Транскрипция аудио (30 мин) Flash 30 000 / 5 000 ~8 ₽
Корпус документации в RAG Pro 1 000 000 / 5 000 ~1 010 ₽
Олимпиадная задача по математике Pro (Deep Think) 2 000 / 15 000 ~62 ₽
Голосовой ассистент (1 ответ) Flash-Lite 200 / 100 ~0,01 ₽

Этот блок советуем сохранить в закладки. Когда возникнет очередная задача, посмотрите на похожий сценарий и возьмите модель оттуда.

Подробнее про конкретные промпты, которые работают на Gemini и других моделях, читайте в нашей статье «50 промптов для маркетолога в ChatGPT, Claude и YandexGPT». Большая часть промптов работает и на Gemini, переключение между моделями отличается только в интерфейсе.

Pipeline Flash-Lite → Flash → Pro: как комбинировать модели

Опытные команды редко используют одну модель на всё. Делают каскад. Pipeline — цепочка моделей, где каждая обрабатывает свою часть задачи.

Простой пример. Допустим, вы делаете поддержку клиентов через бота. На входе сообщение пользователя.

  1. Flash-Lite определяет намерение: «вопрос про доставку», «вопрос про возврат», «жалоба». Это занимает 0,2 секунды и стоит 0,01 ₽.
  2. Flash формулирует ответ по шаблону для типового вопроса. Это занимает 1 секунду и стоит 1 ₽.
  3. Если Flash не уверена в ответе (вернула флаг «не знаю» или вопрос редкий), подключается Pro. Это занимает 3 секунды и стоит 30 ₽, но срабатывает только в 3 % случаев.

Итого по цене за 1 000 запросов: 10 ₽ (Flash-Lite на всех) + 1 000 ₽ (Flash на 97 %) + 900 ₽ (Pro на 3 %) = 1 910 ₽. Если бы использовали только Pro, заплатили бы 30 000 ₽. Экономия в 15 раз при том же качестве.

Если вы только начинаете, pipeline пока не нужен. Возьмите одну Flash и живите. Pipeline пригодится, когда нагрузка вырастет до тысяч запросов в день и каждый рубль начнёт считаться.

Deep Think: глубокое рассуждение для сложного

Deep Think — режим, в котором Gemini 3.1 Pro «думает дольше». Модель сначала пишет себе пошаговый план, потом перебирает варианты, проверяет каждый, и только потом отвечает. Со стороны выглядит как обычный ответ, но качество на сложных задачах поднимается заметно.

Доступ устроен в двух местах.

  • В Gemini App: только в подписке Google AI Ultra (249,99 $ / мес). В интерфейсе выбираете «Deep Think» в выпадающем списке режимов.
  • В API: через параметр thinking_level=high у Gemini 3.1 Pro. Платите за выходные токены больше, но цена за 1М та же.

Когда нужно. Олимпиадные задачи по математике, физике, химии. Доказательства теорем. Сложная архитектура с учётом 10–20 ограничений одновременно. Юридические договоры, где нужно сверить десятки пунктов между собой.

Когда не нужно. Текст, перевод, обычный код, разбор документов: всё это закроет Pro в MEDIUM-режиме без Deep Think. Платить 250 $ в месяц или запускать HIGH thinking в API ради статьи в блог пустая трата.

Подробнее про режим в официальной странице Deep Think на DeepMind.

Nano Banana 2: встроенная генерация и редактирование картинок

Nano Banana — смешное название для серьёзной модели. Это семейство Gemini для генерации и редактирования изображений. Версия 2 вышла в феврале 2026, официально называется Gemini 3.1 Flash Image.

Что умеет.

  • Генерировать картинки по текстовому описанию: «нарисуй кота-программиста в очках за ноутбуком в стиле акварели». На выходе 1–4 варианта за 4–6 секунд.
  • Редактировать загруженные изображения через диалог: «убери фон», «поменяй цвет машины на красный», «добавь надпись Sale».
  • Сохранять контекст между шагами: можно последовательно дорабатывать картинку, не начиная с нуля.
  • Работать с русским языком: описание понимает на русском.

Где использовать.

  • В приложении Gemini и на gemini.google.com: просто пишете «нарисуй», и модель сама поймёт, что нужна Nano Banana.
  • В Google AI Studio: как отдельная модель в выпадающем списке.
  • Через API: через эндпоинт gemini-3-1-flash-image.

Лимиты. На бесплатном плане Gemini до 20 генераций в день. На Google AI Plus и выше значительно больше. В API обычная цена за токены.

Когда Nano Banana, когда обычная Gemini. Если нужна картинка, берите Nano Banana. Если нужно описание картинки (что на ней изображено, какие объекты, какой стиль), берите обычную Gemini с загруженным изображением.

Agent Mode: Gemini сам выполняет многошаговые задачи

Agent Mode — режим, в котором Gemini сам ходит по шагам: открывает файлы, запускает команды, ищет в Google, проверяет результат и двигается дальше. Это уже помощник, которому ставят задачу и уходят пить кофе, а не просто чат.

Где доступен.

  • В мобильном приложении Gemini для Android и iOS: в меню есть пункт Agent Mode.
  • В Android Studio (среда разработки приложений под Android) и VS Code (популярный редактор кода) через расширение Gemini Code Assist.
  • В Google Workspace: Gemini может сам делать таблицы, презентации, документы по вашему описанию.

Что внутри. Под капотом Agent Mode чаще всего работает на Gemini 3.1 Pro или Gemini 3.5 Flash, в зависимости от того, насколько сложна задача. Модель сама выбирает уровень thinking и инструменты.

Пример задачи. «Найди в этом коде функцию аутентификации, разбери, что она делает, проверь, нет ли уязвимостей, и напиши тесты». Agent Mode открывает файлы, находит функцию, читает связанные модули, формулирует анализ, пишет тесты, запускает их, исправляет, если падают.

Для новичка. Agent Mode сейчас полезнее всего тем, кто пишет код или работает с большими документами. Если вы маркетолог или аналитик, попробуйте, но большую часть задач быстрее закрыть обычным чатом. Подробнее про сами агенты как концепцию читайте в нашем материале «Что такое AI-агенты простыми словами».

Gemini vs Claude Opus 4.7 vs GPT-5: когда какую брать

Короткий блок для тех, кто выбирает между тремя провайдерами AI. Подробное сравнение Claude есть в нашей сестринской статье про Claude. Тут только итог.

Задача Лучше Gemini Лучше Claude Лучше GPT-5
Длинные документы (50+ страниц) ✓ контекст 2М контекст 200К контекст 400К
Качество текстов на русском хорошо ✓ лучше всех хорошо
Сложный код и агенты хорошо (3.5 Flash) ✓ Opus 4.7 — топ хорошо
Мультимодальность (видео, аудио) ✓ нативно текст+картинки текст+картинки
Цена входных токенов средняя дороже средняя
Бесплатный план ✓ есть есть, ограниченный есть
Интеграция с Google Docs/Gmail ✓ нативно через API через API
Оплата из РФ сложно сложно сложно

Простыми словами. Если у вас задача про длинные документы и Google-окружение, берите Gemini. Если про сложный текст и тонкий русский, берите Claude. Если у вас уже есть аккаунт OpenAI и вы не хотите ничего менять, оставайтесь на GPT-5.

Бесплатный тест есть у всех трёх. Имеет смысл попробовать каждую на своей реальной задаче за вечер. Решение само придёт.

Как платить из России: легальные и серые способы

Российские карты Google AI напрямую не принимает. Это касается и подписок Gemini App, и Google AI Studio с API. Способы обойти.

Иностранная карта. Если у вас есть карта банка из Армении, Грузии, Казахстана, Турции, Сербии или ЕС, подключаете её в Google Pay и оплачиваете напрямую. Самый чистый и дешёвый вариант. Карту можно получить, съездив в страну лично, или через сервисы дистанционного открытия счёта.

Google Play Balance. Кладёте деньги на Google Play через подарочную карту (продаются у нескольких онлайн-сервисов), и этим балансом оплачиваете подписку Gemini App. С API такая схема не работает.

Посредники и прокси-сервисы. Десятки российских сервисов берут на себя оплату Google от вашего имени. Берут комиссию 15–30 % к курсу, иногда блокируются вместе с аккаунтом. Подходит для разовых платежей, для долгой работы нестабильно.

КВН. Для доступа к сайту gemini.google.com из России формально нужен КВН, потому что Google ограничивает регион. По факту часть пользователей заходит без него, часть с ним. С КВН всё стабильно работает.

Корпоративный счёт через Google Cloud. Если у вас юрлицо в Армении, Казахстане, Турции, можно открыть Google Cloud аккаунт и использовать Vertex AI: это API Gemini для бизнеса. Цены те же, оплата от юрлица, проще проходит финмониторинг. Vertex AI — платформа Google для корпоративных запусков AI.

Подробный гайд по оплате из РФ для разных AI-сервисов есть в нашей статье «Claude Code vs GitHub Copilot: цены, оплата из России». Логика для Gemini такая же.

Бесплатный план: что внутри и где упрётесь

Бесплатный план у Gemini реальный, без подвохов в духе «триал на 7 дней». Но есть лимиты, о которых конкуренты часто не пишут.

Что входит.

  • Gemini 3 Flash в web и приложении. Pro в Free не дают, только в AI Plus и выше.
  • Nano Banana 2 для картинок: до 20 генераций в день.
  • Загрузка PDF и изображений в чат: до нескольких документов за диалог.
  • Дневной лимит запросов к модели. Точное число Google не публикует, но на практике это около 50–80 серьёзных запросов в день. На коротких чат-репликах больше.

Где упрётесь.

  • В дневной лимит, если используете Gemini как рабочий инструмент весь день. Обычно к 5–6 часам вечера.
  • В Pro для длинных PDF, для сложного кода. На Free доступен только Flash.
  • В Deep Think и Deep Research: только AI Ultra.
  • В интеграцию с Google Docs и Gmail: только начиная с AI Pro.

API-план у разработчиков отдельный: бесплатно даёт 1 500 запросов в сутки к Flash-Lite через Google AI Studio. Этого хватит, чтобы спокойно прототипировать любую идею.

Чего избегать: устаревшие Gemini 2.5 и 2.0

Если в туториале, видео на YouTube или статье на Хабре вы видите упоминания Gemini 2.5, Gemini 2.0 или Gemini 1.5, это устаревшие модели. Deprecated — официальный термин, который означает «вытесняется новой версией, скоро будет снят с продажи».

Сроки sunset (момент полного отключения) по состоянию на май 2026.

  • Gemini 2.0 Flash: снимается 1 июня 2026.
  • Gemini 2.5 Pro / Flash / Flash-Lite: снимаются 17 июня 2026.
  • Gemini 1.5 Pro / Flash: уже сняты.

Что это значит для вас. Если вы делаете новый проект, берите сразу линейку 3 (3.1 Pro, 3 Flash, 3.5 Flash, 3.1 Flash-Lite). Старые модели в нём не нужны. Если вы пишете промпт по инструкции, где упомянута Gemini 2.5, замените на 3, всё будет работать так же или лучше.

Промпт-инжиниринг немного отличается между поколениями: у 3 лучше работают thinking levels, шире контекст, надёжнее JSON-ответы. Но принципиально логика та же.

Как переключать модели в приложении, в Web Gemini, в AI Studio и API

В разных интерфейсах Gemini переключение моделей сделано по-разному.

Web (gemini.google.com). В верхнем левом углу выпадающий список «2.5 Flash» или другая текущая модель. Клик, выбираете другую. На Free доступен только Flash. На AI Plus и выше открываются Pro и Deep Think.

Мобильное приложение. Тапаете по иконке в шапке, выбираете режим: обычный чат, Agent Mode, Deep Research. Модель под капотом подбирается автоматически.

Google AI Studio (aistudio.google.com). В правой панели селектор моделей. Видны все актуальные плюс несколько deprecated с пометкой. Здесь же ползунки thinking level, температуры (насколько модель креативна), top-P (отвечает за разнообразие).

API. В запросе указываете параметр model и идентификатор: gemini-3-1-pro, gemini-3-flash, gemini-3-1-flash-lite. Если работаете через библиотеку Google generativeai на Python, там это первый аргумент в GenerativeModel.

Если пишете код: Gemini API простыми словами

Раздел для тех, кто хочет подключить Gemini к своему скрипту, боту или продукту.

Шаг 1. Зайдите на aistudio.google.com, авторизуйтесь Google-аккаунтом. В левом меню Get API Key. Создаёте ключ, копируете. API ключ — длинная строка вида AIzaSy..., которая идентифицирует вас у Google. Хранить её надо как пароль.

Шаг 2. Установите библиотеку на Python:

pip install google-generativeai

Шаг 3. Минимальный пример запроса:

import google.generativeai as genai

genai.configure(api_key="ВАШ_КЛЮЧ")
model = genai.GenerativeModel("gemini-3-flash")
response = model.generate_content("Объясни, что такое блокчейн, в трёх предложениях")
print(response.text)

Запустили, получили ответ. Если упёрлись в rate limit (ограничение количества запросов за период времени), это нормально на бесплатном плане, подождите минуту и повторите.

Бесплатный план API даёт 1 500 запросов в сутки к Flash-Lite, около 50 к Pro в минуту. Этого хватит на всё прототипирование. Когда поймёте, что нужно больше, подключите платёжную карту (через Vertex AI, если из РФ).

Если совсем не программировали раньше, рекомендуем сначала пройти базовый курс по нейросетям и AI, где разбирают API и промпт-инжиниринг с нуля.

5 типичных ошибок при выборе модели

Собрали по письмам читателей и своим набитым шишкам.

Ошибка 1, брать Pro «на всякий случай». Кажется логичным: «возьму самое мощное, чтобы наверняка». На деле платите в 10–40 раз дороже за то же качество. Если задача укладывается в абзац, Flash справится так же.

Ошибка 2, брать Flash-Lite для сложного. Зеркальная ошибка. Дешевле не значит лучше. Если задача требует глубины (разбор юридического договора, проектирование архитектуры), Flash-Lite даст слабый ответ. Сэкономите 5 ₽, потеряете час на переделку.

Ошибка 3, копировать промпты из туториалов под Gemini 2.5. Старые промпты часто содержат хаки под устаревшие модели. В Gemini 3 они или не работают, или дают худший результат. Перепишите промпт под новую модель, обычно проще и короче.

Ошибка 4, не использовать thinking levels. Многие новички ставят дефолт и удивляются, почему модель «глупая». Поднимите thinking до HIGH на сложной задаче, увидите разницу. Снизьте до LOW на массовой обработке, увидите экономию.

Ошибка 5, забыть про Nano Banana, когда нужна картинка. Многие пишут текстовый промпт «опиши, как должна выглядеть инфографика» и удивляются, что модель не нарисовала. Gemini одна, но модели внутри разные. Для картинок есть Nano Banana 2, для текста обычная Gemini.

Итог: начните с бесплатного Flash, переключайтесь по факту

Если из всей статьи запомнить одно, пусть будет это.

Шаг 1. Зайдите на gemini.google.com с любого Google-аккаунта, бесплатно. По умолчанию работает Gemini 3 Flash, и этого хватит, чтобы понять, нравится ли вам инструмент.

Шаг 2. Попробуйте на своих реальных задачах. Не на абстрактном «расскажи про космос», а на «напиши пост в Telegram про мою тему», «разбери этот PDF», «помоги придумать заголовок для статьи». Поймёте, на какие задачи Flash годится, на какие нужно больше.

Шаг 3. Если упёрлись, переключайтесь. На длинные PDF и сложный код берите Pro через AI Plus за 7,99 $. На массовую обработку через API берите Flash-Lite, 0,25 $ за миллион токенов. На Deep Think переходите только если задача правда олимпиадного уровня.

Шаг 4. Не закладывайтесь на устаревшие версии. Если видите 2.5, мысленно переводите в 3, она лучше.

Gemini в 2026 году серьёзный игрок со своими сильными сторонами. На длинных документах, в Google Workspace и в генерации картинок через Nano Banana лучшая среди конкурентов. Если ваш сценарий попадает в эту зону, выбор сделан.

Где научиться работать с нейросетями: подборка курсов

Чтобы не изобретать велосипед, достаточно один раз сесть на нормальный курс, разобрать промпт-инжиниринг, API и интеграцию с продуктами на структурированных задачах. После этого Gemini, Claude и GPT-5 будут восприниматься как разные клавиатуры одного инструмента, без паники в первый день.

КурсШколаСтоимость со скидкойВ рассрочкуДлитель­ностьОбзор курса от Checkroi
Искусственный интеллект
Перейти на сайт курса
GeekBrainsGeekBrains156 162 ₽4688 ₽/мес.12 месяцевОбзор курса
Нейросети на практике
Перейти на сайт курса
Академия ЭдюсонЭдюсон54 515 ₽4542 ₽/мес.2 месяцаОбзор курса
Магистратура «Прикладной искусственный интеллект» с УрФУ
Перейти на сайт курса
НетологияНетология162 500 ₽244 ₽/мес.24 месяцаОбзор курса
Нейросети для анализа данных
Перейти на сайт курса
НетологияНетология31 700 ₽2351 ₽/мес.8 недельОбзор курса
Нейросети для изображений и видео
Перейти на сайт курса
Академия ЭдюсонЭдюсон69 100 ₽5758 ₽/мес.2 месяцаОбзор курса
Нейросети для дизайна
Перейти на сайт курса
Яндекс ПрактикумПрактикум64 000 ₽2612 ₽/мес.2 месяцаОбзор курса
Нейросети: практический курс
Перейти на сайт курса
SkyproSkypro25 990 ₽181 667 ₽/мес.3 месяцаОбзор курса
Нейросети для финансистов
Перейти на сайт курса
Академия ЭдюсонЭдюсон65 600 ₽5466 ₽/мес.2 месяцаОбзор курса
Нейросети для Бухгалтера
Перейти на сайт курса
Академия ЭдюсонЭдюсон49 000 ₽4083 ₽/мес.2 месяцаОбзор курса
Нейросети для рабочих задач
Перейти на сайт курса
SkillboxSkillbox29 800 ₽2483 ₽/мес.1 месяцОбзор курса

Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту

Если только начинаете путь в AI и хотите понять, как нейросети устроены под капотом, статья «Что такое нейросети простыми словами» закроет базу. Если интересует не только Gemini, но и Claude, читайте сестринский гайд про модели Claude и обзор Cursor AI как пример редактора кода с Gemini под капотом.

Часто задаваемые вопросы

Какая модель Gemini лучше для новичка?

Бесплатный Gemini 3 Flash на сайте gemini.google.com. Он закрывает 90 % обычных задач — текст, перевод, краткое содержание, простой код, разбор картинок. Когда упрётесь в дневной лимит или поймёте, что нужен 2-миллионный контекст и Deep Think — переключайтесь на Pro через подписку Google AI Plus за 7,99 $ в месяц.

Чем Gemini Flash отличается от Gemini Pro простыми словами?

Flash — быстрая и дешёвая модель, отвечает за 1–2 секунды и удерживает 1 млн токенов контекста. Pro работает медленнее (2–6 сек), но умеет думать пошагово (thinking levels LOW/MEDIUM/HIGH) и держит в памяти до 2 млн токенов — это примерно 1,5 млн русских слов или три толстых романа разом. Pro нужен на длинных PDF, сложной архитектуре кода и научных задачах. Во всех остальных случаях Flash справится.

Gemini действительно бесплатный или есть подвох?

Бесплатный план реальный, без триалов на 7 дней. Дают Gemini 3 Flash в чате, до 20 картинок Nano Banana 2 в день, загрузку PDF и изображений. Главное ограничение — дневной лимит запросов: на серьёзных задачах упираетесь в него к 5–6 часам вечера. Pro, Deep Think и интеграцию с Google Docs/Gmail дают только в платных подписках от 7,99 $ в месяц.

Как платить за Gemini из России в 2026 году?

Российские карты Google AI напрямую не принимает. Рабочие варианты: иностранная карта банка из Армении, Грузии, Казахстана, Турции или ЕС (самый чистый способ); Google Play Balance через подарочные карты (только для подписки в приложении); посредники и прокси-сервисы с комиссией 15–30 %; корпоративный счёт в Google Cloud через юрлицо в дружественной стране (для API). Для доступа к сайту gemini.google.com часто нужен КВН.

Что такое Deep Think и нужно ли оно мне?

Deep Think — режим, в котором Gemini 3.1 Pro перед ответом сам пишет себе пошаговый план, перебирает варианты и проверяет каждый. Включается на уровне thinking_level=high в API или в подписке Google AI Ultra за 249,99 $ в месяц. Нужен на олимпиадной математике, доказательствах теорем, сложных юридических договорах и архитектуре с десятками ограничений. На текстах, переводах и обычном коде — лишняя трата денег.

Какая Gemini лучше всего подходит для генерации картинок?

Nano Banana 2 (официальное имя — Gemini 3.1 Flash Image, релиз февраль 2026). Встроена прямо в Gemini App и web.gemini.google: пишете «нарисуй кота-программиста в очках» — получаете 1–4 варианта за 4–6 секунд. Понимает русский язык, умеет редактировать загруженные изображения через диалог (убрать фон, поменять цвет, добавить надпись). Бесплатно — 20 генераций в день.

Что такое Gemini 3.5 Flash и стоит ли её ждать?

Gemini 3.5 Flash — новая модель, анонсирована на Google I/O 20 мая 2026. Главное: на agentic-задачах и программировании она догнала и местами обогнала флагман Gemini 3.1 Pro, при цене Flash (1,50 $ за миллион входных токенов против 11,25 $ у Pro). В Google AI Studio доступна с первого дня анонса, в Gemini App раскатывается постепенно по регионам. Если ваша задача — код или агент — имеет смысл попробовать сначала её.

Можно ли использовать Gemini 2.5 Pro, она же ещё работает?

Можно, но не стоит начинать новый проект на ней. Gemini 2.5 Pro, Flash и Flash-Lite Google официально снимает с продажи 17 июня 2026, Gemini 2.0 Flash — 1 июня 2026. Все touring и статьи, где упомянуты эти версии, через месяц станут неактуальными. Сразу берите линейку 3 (3.1 Pro, 3 Flash, 3.5 Flash, 3.1 Flash-Lite) — она работает лучше при тех же привычках.

Оставить комментарий
0 комментариев
Форма комментария

Оставьте комментарий

Напишите, что думаете. Нам важно ваше мнение!