DeepSeek в 2026 году — это уже не одна модель, а целая линейка из пяти: V4 Pro, V4 Flash, V3.2, V3.2-Speciale и R1. Цены отличаются в десять раз, контекст в восемь, скорость на порядок. И на сайте chat.deepseek.com по умолчанию запускается одна из них, без явной подписи, какая именно.
В этой статье собрали разбор четырёх актуальных моделей по десяти параметрам, добавили таблицу цен в долларах и рублях, расписали пять типичных ошибок при выборе и показали матрицу «задача → модель → деньги», которой нет ни у одного из разборов в рунете.
Если вы только знакомитесь с нейросетями, загляните в наш материал «Что такое AI-агенты простыми словами»: там разобрали базу, без которой первая половина статьи будет читаться сложновато.
Это пятый материал в нашей серии разборов больших моделей. До этого мы писали про Claude (Opus, Sonnet, Haiku) и ChatGPT (GPT-5.5, GPT-5.4, o3). В конце сравним DeepSeek с ними и с Gemini 3 Pro по деньгам и по тому, кто что делает лучше.
Статья пригодится не только разработчикам. DeepSeek сегодня используют маркетологи, аналитики, продакты, контент-менеджеры, юристы, бухгалтеры. Везде, где нужно автоматизировать работу с текстом, и где жалко платить $20 в месяц за ChatGPT Plus, когда можно обойтись бесплатным чатом или $5 в месяц на API.
Если хочется освоить нейросети системно, загляните в нашу подборку курсов по нейросетям и искусственному интеллекту: там 316 программ от коротких интенсивов «за вечер» до годовых интенсивов с дипломом.
Главное за 60 секунд
Если коротко: для большинства задач берите V3.2 — она бесплатна в чате, дешевле всех аналогов на API, отлично говорит по-русски и справляется с 90 % повседневных запросов. Переключайтесь на другие модели по факту, когда упрётесь в конкретное ограничение.
| Когда | Что брать |
|---|---|
| Чат, тексты, переводы, базовый код, идеи | V3.2 (она же в бесплатном чате) |
| Документ на 100+ страниц, разбор большого PDF | V4 Flash ($0,14 за 1M токенов, 1M контекст) |
| Большой проект с кодом, многофайловые правки, агенты | V4 Pro (флагман для разработки) |
| Математика, логика, юридический разбор, сложный анализ | R1 (включается кнопкой DeepThink в чате) |
| Локально на своём ноутбуке без интернета | DeepSeek-Coder V2 Lite через Ollama |
Дальше — подробности по каждой модели, бенчмарки, цены в рублях, матрица задач и пять ошибок, на которые легко налететь, если первый раз выбираете.
Линейка DeepSeek — пять моделей под пять задач
DeepSeek — это китайская лаборатория из Ханчжоу, которая в январе 2025 года перевернула рынок нейросетей одним релизом: модель R1 показала качество уровня OpenAI o1, при этом стоила в четыре раза дешевле и открыто выложила веса на HuggingFace. Акции NVIDIA в тот же день упали на 17 % — рынок впервые поверил, что качественный ИИ можно делать без десятка миллиардов на тренировку.
За полтора года после этого DeepSeek выпустила ещё несколько моделей. К маю 2026 года актуальная линейка выглядит так:
| Модель | Релиз | Назначение | Где брать |
|---|---|---|---|
| DeepSeek V4 Pro | 24 апреля 2026 | Флагман для длинного контекста и кодинга | API, OpenRouter |
| DeepSeek V4 Flash | 24 апреля 2026 | Дешёвая модель для ежедневной работы с 1M контекстом | API, OpenRouter |
| DeepSeek V3.2 | 1 декабря 2025 | Стабильный универсал — чат, тексты, базовый код | chat.deepseek.com (бесплатно), API |
| DeepSeek V3.2-Speciale | декабрь 2025 | Reasoning-вариант V3.2 для аналитики | API |
| DeepSeek R1 | январь 2025, рефреш в конце 2025 | Глубокое рассуждение с цепочкой мыслей | chat.deepseek.com (кнопка DeepThink), API |
Дополнительно для тех, кто хочет запускать локально, есть открытая DeepSeek-Coder V2 Lite: компактная модель на 16 миллиардов параметров, которую можно скачать с HuggingFace и запустить на своём ноутбуке через Ollama. Про неё расскажем в отдельной секции ниже.
Все модели DeepSeek объединяет одна архитектура — Mixture of Experts (или MoE, «смесь экспертов»). Это устройство нейросети, в котором она разделена внутри на десятки «специалистов», и на каждый ваш запрос активируется только часть из них. Грубо говоря, как если бы в большой клинике на конкретный вопрос отвечал не весь штат врачей разом, а только несколько профильных. Так модель получает огромный объём знаний при умеренной цене инференса (момента, когда модель отвечает на запрос).
В характеристиках вы увидите две цифры параметров: общие и активные. У V4 Pro это 1,6 триллиона общих и 49 миллиардов активных. Думайте про активные: именно они влияют на скорость и цену.
DeepSeek V4 Pro — флагман для длинного контекста и кодинга
V4 Pro вышла как preview-релиз 24 апреля 2026 года — первая модель DeepSeek, которая открыто заявила «мы закрываем разрыв с GPT-5 и Claude Opus». По бенчмарку SWE-bench Verified (тесту на решение реальных задач из GitHub-репозиториев) она набирает 80,6 % — столько же, сколько Claude Sonnet 4.6, и больше, чем GPT-5.4.
Что внутри
- Параметры: 1,6 триллиона общих, 49 миллиардов активных на каждом ответе
- Архитектура: Mixture of Experts с двумя новыми механизмами — CSA (Compressed Sparse Attention) и HCA (Heavily Compressed Attention), которые позволяют держать 1M токенов контекста при 27 % вычислений V3.2 и 10 % памяти
- Контекст: 1 048 576 токенов — это примерно 750 000 русских слов или 1500 страниц текста за один запрос
- Цена: $0,435 за 1 млн входных токенов и $0,87 за 1 млн выходных. С cache-hit (когда часть запроса уже была отправлена раньше) входные стоят всего $0,003625, в 120 раз дешевле
- Бенчмарки: SWE-bench Verified 80,6 %, LiveCodeBench Pass@1 93,5, самый высокий результат по кодингу среди всех публичных моделей на момент написания
Где V4 Pro незаменим
V4 Pro — это модель для задач, где двух других характеристик не хватает: качество выводов и размер контекста. Конкретные сценарии, где она работает лучше остальных:
- AI-агент по большой кодовой базе. Если вы строите агента, который правит код в репозитории на десятки тысяч строк — V4 Pro закидывает в контекст весь репозиторий целиком и понимает, как файлы связаны между собой. На 128K-моделях такого не сделать.
- Многофайловый рефакторинг. «Перепиши JWT-авторизацию в этом проекте на новый стандарт» — V4 Pro видит все 200 файлов и правит их согласованно, не ломая ссылки.
- Юридический документ на 1000+ страниц. Контракт, судебная подборка, регуляторный отчёт — V4 Pro отвечает на вопросы по всему документу разом, без разбивки на куски.
- Сложная аналитика на большом исследовании. Если нужно сравнить десять PDF-отчётов и найти закономерность — Pro справляется в один запрос.
Где V4 Pro перебор
Если ваша задача — написать пост в соцсети, перевести письмо или объяснить ошибку из десяти строк кода — V4 Pro будет работать, но вы переплатите в три-пять раз за неиспользованные возможности. Для этого есть V4 Flash и V3.2.
DeepSeek V4 Flash — рабочая лошадка с миллионным контекстом за копейки
V4 Flash вышла одновременно с Pro — это её младшая сестра. У Flash 284 миллиарда общих параметров и 13 миллиардов активных — почти в четыре раза меньше, чем у Pro. При этом она сохраняет миллионный контекст и стоит в три раза дешевле: $0,14 за 1 млн входных токенов вместо $0,435.
Что внутри
- Параметры: 284 млрд общих, 13 млрд активных
- Контекст: 1 млн токенов (как у Pro)
- Максимальный вывод: 16 384 токена за один ответ
- Цена: $0,14 на вход и $0,28 на выход, cache-hit $0,0028 — дешевле всех frontier-моделей в своей весовой категории
- Бенчмарки: SWE-bench Verified 79,0 %, LiveCodeBench Pass@1 91,6, отстаёт от Pro всего на 1,6 % и 1,9 балла соответственно
В цифрах разница между Pro и Flash минимальная, меньше двух процентов на кодинговых тестах. А в цене разница в три раза. Поэтому для большинства реальных задач Flash оптимальнее: переплачивать за Pro имеет смысл только когда задача упирается именно в кодинг на большой базе или в многошаговое рассуждение.
Где Flash оптимален
- Разбор длинных документов. PDF на 200 страниц, контракт, годовой отчёт компании — Flash проглатывает целиком и отвечает на вопросы по всему содержимому.
- Анализ переписки. Достали из CRM экспорт за квартал — Flash читает всё и вытаскивает шаблоны: какие возражения чаще всего, где менеджеры дают слабину, какие сделки сорвались по типовой причине.
- Базовое программирование. Объяснить ошибку, дописать функцию, написать тест — Flash справляется не хуже Pro, а стоит в три раза меньше.
- Контент-марафон. Сгенерировать 100 описаний товаров, переписать каталог под SEO, перевести лендинг на три языка — Flash экономит в несколько раз по сравнению с GPT-5.4 или Claude Sonnet 4.6 при сопоставимом результате.
Кейс редакции: как мы используем Flash для разбора PDF
В Checkroi у нас регулярно прилетают отчёты школ-партнёров — PDF на 50–150 страниц с учебным планом, преподавателями, отзывами и стоимостью. Раньше редактор тратил полдня, чтобы вытащить из каждого ключевые цифры и уложить в карточку курса. Сейчас один промпт V4 Flash возвращает структурированный JSON: цена, длительность, формат, основные блоки программы — готово к импорту. Стоимость на один отчёт примерно 7 ₽ через OpenRouter. По нашему опыту это в десять раз дешевле, чем тот же запрос на GPT-5.4.
DeepSeek V3.2 — стабильный универсал
V3.2 вышла 1 декабря 2025 года и до апреля 2026 была флагманом DeepSeek. После релиза V4 она переехала в роль рабочей лошадки: чуть слабее на кодинге, без миллионного контекста, но при этом дешёвая, отлично говорит по-русски и по-прежнему стоит по умолчанию на бесплатном chat.deepseek.com.
Что внутри
- Параметры: 671 млрд общих, 37 млрд активных
- Контекст: 128 000 токенов — примерно 95 000 русских слов или 200 страниц
- Цена API: $0,27 на вход и $1,10 на выход за 1 млн токенов
- Бенчмарк: SWE-bench Verified 73,1 %
- Доступ: бесплатно в веб-чате chat.deepseek.com и в мобильных приложениях, платно через API
Когда V3.2 всё ещё лучший выбор
Это та модель, с которой стоит начинать, если вы только знакомитесь с DeepSeek. Аргументы:
- Она бесплатна в чате. Зайдите на chat.deepseek.com, войдите по email — и всё, можно работать. Никакой оплаты, никакого API, никаких ключей.
- Контекста 128K хватает в 95 % случаев. 200 страниц — это толстая курсовая работа или большая статья с комментариями. Реальных задач, где этого мало, у большинства людей по пальцам одной руки за год.
- Русский язык у V3.2 на уровне. Она училась на 14,8 триллиона токенов мультиязычных данных и по нашим внутренним тестам справляется с живым русским не хуже Claude Sonnet 4.6.
- Через API она вдвое дешевле V4 Flash на коротких запросах. Если ваши промпты помещаются в 128K и вам не нужны самые свежие фичи V4 — V3.2 экономит ощутимо.
Отдельно стоит сказать про V3.2-Speciale — это reasoning-вариант той же V3.2. По качеству рассуждений он находится между обычной V3.2 и R1, по скорости — ближе к V3.2. Полезен, когда задача требует чуть более глубокого анализа, чем «ответь на вопрос», но вы не хотите ждать 30 секунд, как у R1.
DeepSeek R1 — когда нужно глубокое рассуждение
R1 — это модель, которая в январе 2025 года прославила DeepSeek на весь мир. Она первая среди публичных моделей научилась явно «думать вслух» — перед ответом писать длинную цепочку рассуждений на десятки секунд, и только потом давать финальный ответ.
Что такое reasoning простыми словами
Обычная нейросеть отвечает сразу: вы задали вопрос — она начала генерировать ответ. Reasoning-модель работает иначе. Получив вопрос, она сначала пишет внутренний «черновик»: разбирает задачу по шагам, проверяет варианты, отбрасывает тупиковые ветки, и только потом формулирует ответ.
На экране в chat.deepseek.com при включённом DeepThink это видно прямо: модель показывает поток размышлений в отдельной серой колонке. Можно подсмотреть, как она «думает», и понять, где её логика убедила, а где сорвалась.
Этот режим называется chain-of-thought (или CoT, «цепочка мыслей»). Он делает модель сильнее в задачах, где важно не просто выдать ответ, а разложить путь к нему: математика, логика, аналитика, юридический разбор. И слабее в задачах, где нужна скорость и креатив: чат, переводы, лёгкие тексты. R1 на них только тратит время.
Где R1 побеждает V4 Pro
- Математика, физика, статистика. Задачи с многошаговыми вычислениями — R1 разбирает их последовательно и ошибается реже, чем V3.2 или V4 Pro в обычном режиме.
- Юридический анализ. Сравнить две редакции контракта, найти противоречия, оценить риск пункта — R1 даёт более взвешенный ответ.
- Сложные технические задачи. Спроектировать архитектуру системы, выбрать стек, оценить trade-off ы — R1 явно показывает, какие варианты рассмотрела и почему отбросила.
- Финансовый анализ. Оценить инвестицию, разобрать отчётность, найти аномалии — R1 хорошо ловит несостыковки в числах.
Когда R1 — это перебор
R1 думает 15–40 секунд перед каждым ответом. Если вы хотите быстро спросить «как пишется по-английски такое-то слово» — R1 выдаст вам монолог из абзаца рассуждений и только потом ответит. Для быстрого чата, переводов, генерации заголовков, рерайта — берите V3.2 или V4 Flash. Они отвечают в 3–5 раз быстрее и дешевле.
Цена R1 на API — $0,55 на вход и $2,19 на выход за 1 млн токенов. Но reasoning-модели «жгут» выходные токены сильно: один ответ R1 может потратить 10 000 токенов «на размышления» плюс ещё 1000 на собственно ответ. По деньгам реальный запрос к R1 выходит примерно в 5–8 раз дороже того же запроса к V3.2.
Сравнение по восьми параметрам
Большая таблица, которой нет ни у одного из разборов в рунете. Цены — официальные с api-docs.deepseek.com на май 2026 года.
| Параметр | V4 Pro | V4 Flash | V3.2 | R1 |
|---|---|---|---|---|
| Релиз | 04.2026 | 04.2026 | 12.2025 | 01.2025 (рефреш 12.2025) |
| Параметры общие | 1,6 трлн | 284 млрд | 671 млрд | 671 млрд |
| Параметры активные | 49 млрд | 13 млрд | 37 млрд | 37 млрд |
| Контекст | 1 000 000 | 1 000 000 | 128 000 | 128 000 |
| Цена $/1M вход | $0,435 | $0,14 | $0,27 | $0,55 |
| Цена $/1M выход | $0,87 | $0,28 | $1,10 | $2,19 |
| SWE-bench Verified | 80,6 % | 79,0 % | 73,1 % | 71,4 % |
| LiveCodeBench Pass@1 | 93,5 | 91,6 | — | — |
| Reasoning | опц. | опц. | нет | да, всегда |
| Доступ в РФ без КВН | API да | API да | и чат, и API | и чат, и API |
| Открытые веса | да, HF | да, HF | да, HF | да, HF |
Главные выводы из этой таблицы:
- V4 Flash на кодинге всего на 1,6 % слабее V4 Pro, а стоит в три раза дешевле. Это самая выгодная модель в линейке для большинства задач.
- V3.2 на коротких запросах (до 128K) дешевле V4 Flash почти в два раза. Имеет смысл, если миллионный контекст вам не нужен.
- R1 на выходе дороже V4 Pro в 2,5 раза — и это до учёта того, что reasoning-модели жгут выходные токены втрое активнее. Берите R1 только когда задача того стоит.
- Все модели DeepSeek — open-source, можно скачать веса с HuggingFace и запустить у себя. Главное ограничение — железо: V4 Pro в полной точности требует кластер на несколько GPU класса H200.
Бенчмарки — кто умнее на цифрах
Бенчмарк — это стандартизированный тест, на котором сравнивают модели. Он не всегда отражает реальную пользу, но даёт ориентир. Вот четыре главных, на которых меряются все большие модели в 2026 году.
| Бенчмарк | Что измеряет | V4 Pro | V4 Flash | R1 | Для сравнения: Claude Sonnet 4.6 / GPT-5.4 |
|---|---|---|---|---|---|
| SWE-bench Verified | Решение задач из реальных GitHub-репозиториев | 80,6 % | 79,0 % | 71,4 % | 80,2 % / 74,9 % |
| LiveCodeBench Pass@1 | Программирование без подсмотренных решений | 93,5 | 91,6 | — | 89,7 / 87,2 |
| MATH-500 | Олимпиадная математика | — | — | 97,3 % | 91,8 % / 94,1 % |
| GPQA Diamond | Научные вопросы уровня PhD | — | — | 84,0 % | 88,1 % / 86,5 % |
| SimpleQA-Verified | Знание фактов без галлюцинаций | +20 п.п. над другими open-source | — | — | — |
Что видно из цифр:
- На кодинге V4 Pro — первая модель в истории open-source, которая обогнала Claude Sonnet 4.6 на SWE-bench. До этого открытые веса проигрывали на 5–10 пунктов.
- На LiveCodeBench V4 Pro показывает 93,5 — это самый высокий результат среди всех моделей вообще, включая закрытые. Реальная польза: V4 Pro лучше справляется с незнакомыми кодинговыми задачами, которые не были в её тренировочных данных.
- R1 на математике (MATH-500: 97,3 %) бьёт и Claude, и GPT-5.4. Это её домен.
- На общих знаниях (GPQA) Claude и GPT по-прежнему сильнее. DeepSeek знает меньше фактов, потому что тренировочный корпус у неё меньше.
Цены — сколько DeepSeek стоит в долларах и рублях
Главное преимущество DeepSeek перед Claude, GPT и Gemini — цена. По нашим расчётам — в 5–10 раз дешевле при сопоставимом качестве на большинстве задач.
Тарифы API за 1M токенов
Курс на май 2026 года — примерно 84 ₽ за доллар. 1 млн токенов — это примерно 750 000 русских слов на входе или 1500 страниц текста.
| Модель | Вход $/1M | Выход $/1M | Вход ₽/1M | Выход ₽/1M |
|---|---|---|---|---|
| DeepSeek V4 Pro | $0,435 | $0,87 | ≈37 ₽ | ≈73 ₽ |
| DeepSeek V4 Flash | $0,14 | $0,28 | ≈12 ₽ | ≈24 ₽ |
| DeepSeek V3.2 | $0,27 | $1,10 | ≈23 ₽ | ≈92 ₽ |
| DeepSeek R1 | $0,55 | $2,19 | ≈46 ₽ | ≈184 ₽ |
| Claude Sonnet 4.6 | $3,00 | $15,00 | ≈252 ₽ | ≈1260 ₽ |
| GPT-5.4 | $2,50 | $15,00 | ≈210 ₽ | ≈1260 ₽ |
| Gemini 3 Pro | $1,25 | $10,00 | ≈105 ₽ | ≈840 ₽ |
Конкретный пример. Запрос на разбор PDF в 100 страниц (≈150 000 входных токенов) с ответом-конспектом на 5 000 выходных токенов:
- V4 Flash: 150 000 × $0,14 / 1 000 000 + 5 000 × $0,28 / 1 000 000 = $0,022 ≈ 1,8 ₽
- V3.2: ≈ 4,2 ₽ (но 128K не хватит, придётся резать)
- Claude Sonnet 4.6: ≈ 50 ₽
- GPT-5.4: ≈ 43 ₽
Та же задача на V4 Flash дешевле, чем на Claude, в 28 раз. Если у вас 100 таких документов в месяц, разница уже 4 800 ₽.
Бесплатный чат и платные премиум-планы
На chat.deepseek.com бесплатно доступны:
- Обычный режим (V3.2) — без лимита по сообщениям
- Режим DeepThink (R1) — несколько десятков сообщений в день, лимит плавающий, точную цифру DeepSeek не публикует
- Поиск по интернету — включается отдельной кнопкой
- Загрузка файлов и изображений — до 50 Мб
Платных подписок в духе ChatGPT Plus или Claude Pro у DeepSeek нет. Если нужно больше, подключайтесь к API напрямую или через посредников.
Оплата API из России
Российские карты Visa и Mastercard отключены от международных платежей, «Мир» официально DeepSeek не принимает. Прямой оплаты API рублёвыми картами нет.
В публичном поле работают два цивилизованных пути:
- OpenRouter.ai — официальный международный посредник-агрегатор, через который доступны все модели DeepSeek по тем же ценам, что у DeepSeek напрямую, плюс небольшая комиссия. Регистрация работает с российскими адресами, но оплата — только через зарубежные карты или крипту.
- Together AI и SiliconFlow — тоже агрегаторы, иногда дают модели DeepSeek дешевле оригинала за счёт собственной инфраструктуры. Те же требования по оплате.
Если карт за рубежом нет — есть российские сервисы-посредники, которые принимают оплату в рублях через СБП и пополняют ваш аккаунт. Это работающие, но «серые» в юридическом смысле каналы, конкретные сервисы мы не называем, найти их через поиск можно за минуту.
Бесплатный chat.deepseek.com из России работает без КВН. Сайт не блокирован Роскомнадзором и не блокирует российские IP. Если у вас на входе крутится прокси или КВН корпоративного класса — наоборот, может работать хуже, выключите и попробуйте напрямую.
Матрица «задача → модель → токены → ₽»
Самый практичный раздел статьи. Десять типичных задач, для каждой конкретная рекомендация модели и примерная цена в рублях. Цены посчитаны по тарифам выше с курсом 84 ₽/$.
| Задача | Модель | Токены вход / выход | Цена за 1 запрос |
|---|---|---|---|
| Написать пост в соцсети из брифа | V3.2 (бесплатно в чате) | 500 / 400 | 0 ₽ или 0,05 ₽ на API |
| Перевести email клиенту на английский | V3.2 | 300 / 300 | 0 ₽ или 0,03 ₽ |
| Объяснить ошибку из 10 строк кода | V4 Flash | 200 / 500 | ≈0,02 ₽ |
| Разобрать PDF на 100 страниц | V4 Flash | 150 000 / 5 000 | ≈1,8 ₽ |
| Сравнить три договора по 500 страниц | V4 Flash или V4 Pro | 800 000 / 8 000 | ≈9 ₽ Flash, ≈30 ₽ Pro |
| Многофайловый рефакторинг проекта на 30 тысяч строк | V4 Pro | 400 000 / 20 000 | ≈16 ₽ |
| Олимпиадная математическая задача | R1 | 500 / 12 000 (с рассуждениями) | ≈2,2 ₽ |
| Юридический разбор договора | R1 или V3.2-Speciale | 10 000 / 15 000 | ≈3,2 ₽ R1 |
| Сгенерировать 100 SEO-описаний для каталога | V4 Flash | 100 000 / 50 000 | ≈2,4 ₽ за всю партию |
| AI-агент в IDE по большому репозиторию | V4 Pro | ≈500 000 / 50 000 на сессию | ≈22 ₽ за сессию |
Если ваш сценарий не попал в таблицу — ориентируйтесь по принципу: повседневный быстрый ответ — V3.2, длинные документы и большой код — V4 Flash, серьёзный кодинг или агенты — V4 Pro, многошаговая логика — R1.
Pipeline Flash → V3.2 → V4 Pro → R1: как комбинировать модели
Профессиональный приём, который удешевляет работу с нейросетями в несколько раз: не использовать одну модель на всё, а разбивать задачу на шаги и на каждом шаге звать ту модель, которая делает его дешевле.
Типовой pipeline для разбора большого документа:
- V4 Flash на входе. Загружаем PDF на 200 страниц, просим вытащить структуру: оглавление, ключевые блоки, цифры. Дешевле всех — Flash справляется и стоит копейки.
- V3.2 на промежуточных текстах. На этапе «перепиши параграф человечнее», «сократи до 5 пунктов» — зовём V3.2. У неё ниже выходная цена, а качество для коротких задач идентичное.
- R1 на ключевых выводах. Когда нужно сделать стратегический вывод — «стоит ли подписывать этот контракт», «какие риски в инвестиции» — зовём R1. Платим больше, но только на последнем шаге.
- V4 Pro как fallback. Если Flash на каком-то этапе ошиблась или контекст слишком сложный — переключаемся на Pro. Использовать всегда дорого, иногда — оправдано.
На практике через OpenRouter pipeline настраивается одной функцией: выбираете модель в параметрах запроса, остальное идентично. В LangChain, Cursor и других AI-инструментах модели тоже переключаются параметром — в интерфейсе или в файле конфигурации.
Если вам интересно посмотреть, как такие pipeline-цепочки строят в вайбкодинге — у нас есть отдельная статья «Вайбкодинг: что это и с чего начать».
DeepSeek vs GPT-5.4 vs Claude Sonnet 4.6 vs Gemini 3 Pro
Краткое кросс-вендорное сравнение по тому, на что чаще всего жалуются и что чаще всего хвалят. Подробные разборы каждого — в статье про модели ChatGPT, про модели Claude и про модели Gemini.
| Критерий | DeepSeek (V4 Pro) | Claude Sonnet 4.6 | GPT-5.4 | Gemini 3 Pro |
|---|---|---|---|---|
| Цена вход $/1M | $0,435 | $3 | $2,50 | $1,25 |
| Контекст | 1M | 200K | 400K | 2M |
| SWE-bench | 80,6 % | 80,2 % | 74,9 % | 76,1 % |
| Reasoning | R1 / V3.2-Speciale | Extended Thinking | GPT-5.5 Thinking, o3 | встроено |
| Доступ в РФ | чат без КВН | только КВН + ВПН-оплата | только КВН + ВПН-оплата | только КВН + ВПН-оплата |
| Открытые веса | да | нет | нет | нет |
| Сильная сторона | цена, кодинг, длинный контекст | осторожность, художественные тексты | универсальность, мультимодальность | самый большой контекст, поиск |
| Слабая сторона | знание западных реалий | цена | цена, цензура | галлюцинации в ответах |
Главное за 30 секунд: DeepSeek выигрывает у всех по цене и по доступу из России. На кодинге V4 Pro первая открытая модель, которая обогнала Claude. По знаниям западных культурных реалий и по стилистике художественного русского текста Claude по-прежнему лучше — но разница уже не двухкратная, как год назад, а скорее «чуть-чуть».
Лимиты и rate limits — на что нарвётесь
Технические ограничения, на которые жалуются в первый месяц использования:
Бесплатный chat.deepseek.com
- DeepThink (R1) лимитирован — примерно 50 сообщений в день. После лимита кнопка перестаёт быть кликабельной до следующих суток.
- Размер загружаемого файла — до 50 Мб для PDF и до 10 Мб для картинок.
- Сообщений на запрос в контексте — технически ограничено 128K (V3.2). Если разговор слишком длинный — старые сообщения «забываются».
- Поиск по интернету — часто отдаёт устаревшие результаты, не используйте для свежих новостей.
API напрямую
- Rate limit по умолчанию — 60 запросов в минуту на V3.2 и V4 Flash, 20 запросов в минуту на R1 и V4 Pro. Поднимается до 500 rps на высоких тарифах.
- Минимальный депозит — $2.
- Максимальный вывод — 16 384 токена за один ответ. Если задача требует больше — разбивайте на несколько запросов или просите модель писать «по частям».
- Доступность серверов — DeepSeek регулярно «лежит» на 5–15 минут в день в часы пика. В продакшене закладывайте retry с экспоненциальным backoff.
OpenRouter и другие посредники
- Лимиты у каждого свои — читайте документацию провайдера.
- Цена обычно равна DeepSeek + 5 % комиссии. На Together AI иногда дешевле за счёт собственной инфры.
- Latency на 5–20 % выше прямого API — это плата за удобство.
5 типичных ошибок при выборе модели DeepSeek
Чек-лист того, что в первые недели работы с DeepSeek приходится отучаться у почти каждого пользователя:
Ошибка 1 — везде включать DeepThink (R1)
Кажется логичным: «если есть умный режим — почему бы не использовать всегда». На деле R1 на простых задачах не даёт прироста качества, при этом тратит в 5–10 раз больше токенов на «размышления» и отвечает в 3–5 раз дольше. Включайте R1 целенаправленно — когда задача требует логики, а не скорости.
Ошибка 2 — брать V4 Pro когда хватает Flash
Разница по бенчмаркам между Pro и Flash — меньше двух процентов. Разница в цене — в три раза. Pro имеет смысл только когда вы точно упёрлись в лимит Flash на кодинге или агентах. Для всего остального Flash экономит ощутимые деньги.
Ошибка 3 — игнорировать cache-hit
Если вы дёргаете API с одним и тем же системным промптом много раз — DeepSeek кеширует начало запроса и берёт за него в 120 раз меньше. На продакшене это снижает счёт за месяц в разы. Стройте промпты так, чтобы статичная часть была в начале, а переменная — в конце.
Ошибка 4 — выбирать R1 для креатива
R1 училась рассуждать — это не то же, что писать ярко. Художественный текст, заголовки, рекламные ходы у R1 получаются холоднее и корректнее, чем у V3.2 или V4 Flash. Если нужен живой стиль — берите V3.2.
Ошибка 5 — сравнивать DeepSeek с Claude/GPT только по бенчмаркам
На цифрах SWE-bench V4 Pro обогнала Claude Sonnet 4.6. В реальных задачах разницы почти нет, а иногда Claude выигрывает за счёт лучшего понимания тонкостей. Бенчмарки дают ориентир, не истину. Если вам важно качество на конкретном типе задачи, прогоните обе модели на десятке своих запросов и сравните руками.
Как переключать модели в chat.deepseek.com, API и Ollama
В веб-чате
На chat.deepseek.com под окном ввода видна панель из двух кнопок: DeepThink (R1) и Search. По умолчанию обе выключены, модель отвечает в режиме V3.2 без поиска. Чтобы включить reasoning, нажмите DeepThink, иконка станет цветной. Чтобы выключить, нажмите ещё раз.
V4 Pro и V4 Flash в веб-чате пока недоступны как отдельный выбор. DeepSeek катит их на часть пользователей в A/B-режиме. К концу 2026 года планируется явный селектор моделей в интерфейсе.
Через API
В запросе указывается параметр model с одним из идентификаторов:
deepseek-chat— V3.2deepseek-reasoner— R1deepseek-v4-pro— V4 Pro (preview)deepseek-v4-flash— V4 Flash (preview)
Эндпоинт (адрес внутри API, по которому сервер принимает запросы) совместим с OpenAI: если у вас уже есть код для ChatGPT, поменяйте URL на https://api.deepseek.com/v1 и ключ — всё остальное работает.
Через OpenRouter
В OpenRouter имена моделей с префиксом провайдера: deepseek/deepseek-v4-pro, deepseek/deepseek-v4-flash, deepseek/deepseek-chat, deepseek/deepseek-r1. Удобно для переключения между провайдерами в одном коде.
Локальный запуск через Ollama
Если вы хотите запустить DeepSeek на своём ноутбуке без интернета, оплаты и отправки данных на сторону, это делается через Ollama, бесплатную программу для локального запуска моделей.
Шаги:
- Скачайте Ollama с ollama.com (Mac, Windows, Linux)
- В терминале запустите:
ollama pull deepseek-coder-v2:lite - Запустите чат:
ollama run deepseek-coder-v2:lite
Минимальные требования: 16 ГБ оперативной памяти. Полная DeepSeek-Coder V2 (236 млрд параметров) на ноутбуках не запустится, она требует кластер. Если хочется запускать большие модели локально, посмотрите нашу статью про бесплатные альтернативы Claude Code — там про локальные LLM рассказано подробно.
Чего не умеют все модели DeepSeek одинаково
Честно про ограничения, которые применимы ко всей линейке:
- Не генерируют картинки. DeepSeek — текстовые модели. Для изображений есть отдельный проект Janus, но он сильно слабее DALL-E 4 или Midjourney v7.2.
- Не работают с аудио и видео. Мультимодальности уровня GPT-5.5 пока нет: ни V4 Pro, ни R1 не умеют слушать и смотреть.
- Цензурируют политические темы. Вопросы про события в Китае, про Тайвань, про конкретных политических деятелей — модель уходит от ответа или отвечает шаблоном. Это касается всех моделей DeepSeek, не только R1. На технические задачи цензура не влияет.
- Знают западные культурные реалии хуже, чем Claude и GPT. Тренировочный корпус у DeepSeek меньше, и он сильнее ориентирован на китайские и технические тексты. Если задача про западную поп-культуру, западное право или специфические бренды, перепроверяйте ответы.
- Не имеют долговременной памяти. Модель помнит контекст только в рамках одного разговора. Между сессиями ничего не остаётся, чистый лист, как у ChatGPT по умолчанию.
Главная мысль — начните с V3.2, переключайтесь по факту
Простое правило для первого месяца с DeepSeek: откройте chat.deepseek.com, заведите аккаунт, используйте V3.2 без DeepThink на всё, что приходит в голову. Когда вы упрётесь в конкретную задачу, где обычный режим не справился, включите DeepThink и попробуйте R1. Если задача про разбор больших документов, зайдите на OpenRouter и дайте 5 ₽ на тест V4 Flash.
Через две недели у вас сложится понимание, какая модель закрывает какой ваш сценарий. Тогда уже можно настраивать pipeline-комбинации, считать экономию и переходить на API для массовых задач.
DeepSeek в 2026 году — это самая выгодная по деньгам модель среди топовых, единственная открытая на уровне Claude и GPT, и единственная из «большой пятёрки» (Claude, GPT, Gemini, Grok, DeepSeek), у которой бесплатный чат работает из России без КВН. Это серьёзный аргумент, чтобы попробовать, даже если вы давно сидите на ChatGPT или Claude.
Где научиться работать с нейросетями: подборка курсов
Прокачать DeepSeek и нейросети в целом до уровня «могу применять в работе» можно за месяц-два самообучения. Чтобы не изобретать велосипед, мы собрали подборку лучших курсов по нейросетям и ИИ, от коротких интенсивов «за вечер» до серьёзных программ с дипломом для тех, кто хочет работать AI-инженером.
Внутри подборки есть отдельные треки для разработчиков (промпт-инжиниринг, fine-tuning, RAG), маркетологов (генерация контента, автоматизация), аналитиков (работа с данными через LLM) и руководителей (как внедрять AI в команде). Цены и скидки актуальные на 2026 год.
| Курс | Школа | Стоимость со скидкой | В рассрочку | Длительность | Обзор курса от Checkroi |
|---|---|---|---|---|---|
| Нейросети для изображений и видео Перейти на сайт курса | 69 100 ₽ | 5758 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети: практический курс Перейти на сайт курса | 25 990 ₽ | 181 667 ₽/мес. | 3 месяца | Обзор курса | |
| Нейросети для рабочих задач Перейти на сайт курса | 29 800 ₽ | 2483 ₽/мес. | 1 месяц | Обзор курса | |
| Нейросети. Практический курс Перейти на сайт курса | 74 900 ₽ | 6242 ₽/мес. | 3 месяца | Обзор курса | |
| Нейросети для каждого: как решать рабочие задачи быстрее Перейти на сайт курса | 37 300 ₽ | 2763 ₽/мес. | 6 недель | Обзор курса | |
| Нейросети на практике Перейти на сайт курса | 54 515 ₽ | 4542 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети для дизайна Перейти на сайт курса | 64 000 ₽ | 2612 ₽/мес. | 2 месяца | Обзор курса | |
| Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса | 162 500 ₽ | 244 ₽/мес. | 24 месяца | Обзор курса | |
| Нейросети для анализа данных Перейти на сайт курса | 31 700 ₽ | 2351 ₽/мес. | 8 недель | Обзор курса | |
| Нейросети для финансистов Перейти на сайт курса | 65 600 ₽ | 5466 ₽/мес. | 2 месяца | Обзор курса |
Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту
Если интересно глубоко в конкретный инструмент, у нас есть отдельная подборка курсов по DeepSeek и большой материал «Что такое Claude Code» для тех, кто хочет освоить AI-агентов в разработке.


![Статья: Что такое GigaChat — нейросеть Сбера: что умеет, тарифы и отличия от ChatGPT в 2026 Что такое GigaChat — нейросеть Сбера: что умеет, тарифы и отличия от ChatGPT в [current_year]](https://selcdn.checkroi.ru/wp-content/uploads/2026/05/og-cover-58678-1779732614.jpg)
![Статья: Qwen — что это за нейросеть от Alibaba и как ей пользоваться в 2026 Qwen — что это за нейросеть от Alibaba и как ей пользоваться в [current_year]](https://selcdn.checkroi.ru/wp-content/uploads/2026/05/og-cover-58681-1779732505.jpg)
