Qwen3.6 Plus vs 27B vs Coder: какую модель Qwen выбрать в 2026

Обновлено 09.06.2026
Опубликовано 24.05.2026
753 просмотра
38 мин. чтения
0 комментариев

У Alibaba к 2026 году вышло уже шесть поколений Qwen. Собрали актуальный гайд по всем моделям семейства — Qwen 3.6 Plus, 27B, 35B-A3B, Qwen3-Coder, QwQ и Qwen2.5-VL. С ценами в рублях, требованиями к железу для локального запуска и оплатой из России без КВН. После статьи поймёте, какую Qwen брать лично вам.

Статью написал:

Ваня Буявец

Основатель Checkroi, продюсер, эксперт в выборе онлайн-курсов

Все 1119 статей автора Подписаться на Телеграм-канал

Одобрено экспертом:

Наташа Буявец

Основательница Checkroi, продюсер Youtube-каналов, эксперт по онлайн-курсам

Все 1780 экспертных мнений Подписаться на Телеграм-канал

Обложка: Qwen3.6 Plus vs Qwen3.6 27B vs Qwen3 Coder: какую модель Qwen выбрать в 2026

В апреле 2026 года Alibaba выкатила Qwen 3.6, уже шестое поколение своей нейросети за три года. И это значит две вещи. Первая: гонка китайского AI идёт быстрее западной. Вторая: разобраться, какую именно Qwen брать сегодня, стало по-настоящему сложно, потому что в живых одновременно крутятся Qwen 2.5, Qwen 3, Qwen 3.5, Qwen 3.6, Qwen3-Coder, QwQ-32B и Qwen2.5-VL.

В этой статье мы прошлись по всему семейству Qwen на май 2026 года. Собрали актуальные характеристики, цены в рублях, разобрали матрицу из 12 типовых задач с рекомендацией модели и показали, что потянет ваш ноутбук, а что нет.

Если вы только начинаете знакомиться с нейросетями вообще, загляните сначала в нашу обзорную статью про AI-агентов: там разобрали базу, без которой Qwen звучит как иероглифы.

А если хочется сравнить Qwen с западным конкурентом, у нас есть подробный гайд по моделям Claude в том же формате. На контрасте быстро видно, чем китайский подход отличается от американского.

Статья пригодится не только программистам. AI на работе сегодня нужен маркетологам, аналитикам, копирайтерам, продактам и всем, кто хочет автоматизировать рутину. Qwen умеет всё, что и ChatGPT, но бесплатно, на русском и без зарубежной карты. Это сильный аргумент. Особенно, после того как ребята из обзора бесплатных альтернатив Claude Code начали массово переезжать на китайские LLM.

Если хочется освоить нейросети системно, посмотрите нашу подборку курсов по нейросетям и искусственному интеллекту: 316 программ от коротких интенсивов до годовых треков. А для тех, кто хочет точечно прокачать ремесло, отдельная подборка курсов по промпт-инжинирингу.

Дальше, по делу.

КурсыСравнение 5 курсов по QwenЦены, школы, длительность, рассрочка

Главное за 60 секунд

Совсем коротко, если читать всё некогда:

Qwen 3.6 Plus. флагман на май 2026. Через сайт и через API Alibaba. Платный, но дешевле GPT-5 в три раза. Подходит для длинных текстов, сложных рассуждений, аналитики, исследований.
Qwen 3.6 27B. открытая модель, можно скачать и запустить на своей видеокарте. Чуть слабее Plus, зато бесплатна. Подходит почти всем.
Qwen3-Coder. отдельная ветка для программирования и агентного кодинга. Если задача про код, берите её.
Qwen Chat на сайте chat.qwen.ai. бесплатный чат-бот, работает из России без КВН. Это самый простой способ попробовать любую модель Qwen без регистраций и карт.

Если непонятно ничего из вышесказанного, заходите на chat.qwen.ai, регистрируйтесь через Google, переключите модель на «Qwen3.6-Plus» в выпадающем списке вверху и пробуйте. Дальше можно читать спокойно.

Как начать прямо сейчас: chat.qwen.ai за 3 минуты

Самый частый барьер у новичка с китайскими сервисами, страх «там всё на иероглифах, я заблужусь». Спойлер: с Qwen Chat этого не случится. Интерфейс на английском, переводится одной кнопкой на русский. Регистрация привычная, через Google. Карты не просят. КВН не нужен.

Щенок Рой в фиолетовом худи идет к открытому чат-порталу Qwen, рядом показаны закрытый обходной путь и ненужная банковская карта

Полная пошаговая последовательность:

Откройте chat.qwen.ai. Сайт открывается из любого региона России. Если страница не грузится, проверьте, что у вас нет блокировки cookies от сторонних сайтов и что КВН выключен (с КВН иногда наоборот не работает).
Нажмите «Sign in» в правом верхнем углу. Появится окно с тремя вариантами: Google, GitHub, email. Самый быстрый, Google: одно нажатие, выбор аккаунта, готово.

КурсыСравнение 117 курсов по GitHubЦены, школы, длительность, рассрочка

Сразу обратите внимание на верх окна. Под полем ввода, две кнопки. Слева выпадающий список моделей, справа, переключатель «Thinking». В списке по умолчанию стоит общая модель. Откройте его и выберите «Qwen3.6-Plus».
Если предстоит сложная задача. рассуждения, длинная аналитика, разбор документа, включите «Thinking». Если простая, оставьте выключенным.
Можно прикрепить файл. Кнопка с иконкой скрепки слева от поля ввода. Подходит PDF, Word, Excel, изображение, аудио. Qwen разберёт документ сам.
Пишите запрос на русском. Qwen понимает русский на уровне ChatGPT и Claude. Никаких хитростей не нужно.

КурсыСравнение 26 курсов по ClaudeЦены, школы, длительность, рассрочка

В интерфейсе чата есть три полезные настройки, которые стоит включить с первого дня:

Web Search. Иконка глобуса под полем ввода. Когда включена, Qwen ищет в интернете и добавляет в ответ свежие данные. Без неё модель отвечает только из обучающих данных, и её знания обрезаны примерно на ноябре 2025.
Code Interpreter. Запускает Python-код прямо внутри чата. Полезно для расчётов, анализа Excel-файлов, построения графиков.
Image generation. Кнопка «Create image» в меню действий. Бесплатно, без лимитов, качество не уступает Midjourney v7.

Если уже сейчас хочется попробовать что-то конкретное, заберите наши готовые промпты. Для маркетинга работают 50 промптов для маркетолога, для разработчиков — 50 промптов для программистов. Шаблоны написаны для Claude и ChatGPT, но в Qwen работают без правок: просто копируйте и вставляйте.

Qwen: что это и почему все о ней говорят в 2026

Qwen (читается «Квен», полное название Tongyi Qianwen, 通义千问), это семейство больших языковых моделей от китайской компании Alibaba. Большая языковая модель (или LLM, Large Language Model), это нейросеть, обученная на гигантском объёме текстов, которая умеет отвечать на вопросы, писать тексты, программировать и разбираться с документами. Ровно то же самое, что и ChatGPT или Claude.

Первая Qwen вышла осенью 2023 года. С тех пор Alibaba отгружает новое поколение примерно раз в полгода. И каждое следующее поколение режет цены, добавляет функции и подтягивается ближе к лидерам рейтингов.

Кто такой Alibaba и зачем им свой ChatGPT

Alibaba, крупнейший китайский технологический гигант. У них есть AliExpress (тот самый), облачное подразделение Alibaba Cloud (китайский аналог Amazon Web Services) и собственный AI-отдел, который занимается Qwen.

Стратегия у Alibaba простая: догнать OpenAI и Anthropic качеством, обогнать ценой и сделать большинство моделей бесплатными для скачивания. У нас всё ещё думают, что китайские нейросети — это плохая копия. На самом деле к маю 2026 Qwen на многих задачах догнал, а на некоторых обогнал западные модели.

Взрослый Рой в очках показывает футуристический город Alibaba с торговым кварталом, облачной инфраструктурой и AI-лабораторией Qwen

Что значит «семья моделей» на пальцах

Когда говорят «Qwen», имеют в виду не одну нейросеть. Это бренд, под которым выходит десяток разных моделей. У каждой свой характер и своё применение:

Одни модели маленькие, их можно запустить на ноутбуке.
Другие большие, для них нужна серверная видеокарта или подключение через API.
Одни заточены под текст и рассуждения.
Другие, под программирование.
Третьи, под картинки и видео.

Внутри семьи Qwen есть несколько веток. Главная, Qwen 3.6 (чат и общие задачи). Отдельно идёт Qwen3-Coder (программирование), QwQ-32B (модель, которая умеет рассуждать вслух) и Qwen2.5-VL (для картинок). О каждой расскажем подробно ниже.

Чем Qwen отличается от ChatGPT и Claude

Если совсем коротко, тремя вещами:

Цена. Qwen API в разы дешевле американских конкурентов. Qwen 3.6 Plus стоит около $1,3 за миллион входных токенов. GPT-5, около $5. Claude Opus 4.8, около $15. На длинных задачах разница огромная.
Бесплатный чат без КВН. chat.qwen.ai работает из России напрямую, без обходных путей. ChatGPT и Claude из России без КВН не открываются.
Открытые веса. Большинство моделей Qwen можно скачать с Hugging Face (репозиторий нейросетей) под свободной лицензией Apache 2.0 и запустить у себя на компьютере или сервере. ChatGPT и Claude так не умеют, там работа только через облако.

Компромисс есть. Qwen чуть слабее на самых сложных задачах: продвинутая аналитика, сложная математика, очень длинные рассуждения. Если вам нужна модель «лучшая в мире», это пока всё ещё Claude Opus 4.8 или GPT-5.2 Pro. Если нужна модель «достаточно хорошая для 90% задач, бесплатно и из России», это Qwen.

Футуристический шоурум с тремя AI-подходами: открытый и доступный Qwen, универсальный облачный чат и аналитическая модель для сложных задач

Ваня Буявец, основатель CheckroiПоказываю, как применять Claude Code, ChatGPT и другие нейросети в учёбе и работе, с примерами и промптамиЧитать в Телеграме

Семейство Qwen в 2026: карта поколений

Самая частая ошибка новичка, натолкнуться на статью про Qwen 2.5 в 2026 году и подумать, что речь о последней версии. Это давно не так. Поколения сменяют друг друга примерно каждые шесть месяцев, и то, что было свежим осенью 2024, сегодня, музей.

Поколение	Дата	Статус в мае 2026	Когда подходит
Qwen 1 / 1.5	2023	Устарело	Не использовать
Qwen 2 / 2.5	2024	Устарело для чата, актуально для Vision	Только Qwen2.5-VL для картинок
Qwen 3	апрель 2025	Прошлое поколение, всё ещё в ходу	Если уже работает у вас локально, можно оставить
Qwen 3 Coder	июль 2025	Актуально	Для программирования и агентного кодинга
Qwen 3.5 / Plus	февраль 2026	Прошлое поколение чата	Если 3.6 недоступен, можно как fallback
Qwen 3.6	апрель 2026	Текущий флагман	Берите по умолчанию
QwQ-32B	март 2025	Актуально для рассуждений	Когда нужно «думать вслух» по сложной задаче

Дальше, отдельный разбор каждой актуальной модели. Сначала Qwen 3.6, потом отдельные ветки.

Qwen 3.6 Plus: флагман для текстов, рассуждений и сложных задач

Qwen 3.6 Plus вышла 2 апреля 2026 года. Это закрытая модель, её нельзя скачать. Доступ только через сайт chat.qwen.ai или через API в Alibaba Cloud Model Studio (платформа Alibaba для подключения к их моделям программно).

Что внутри Qwen 3.6 Plus

Размер модели Alibaba не раскрывает — это коммерческая тайна. По косвенным признакам, около 400 миллиардов параметров общих и около 30 миллиардов активных. Контекстное окно, 1 миллион токенов. Это значит, что в модель за раз можно загрузить, скажем, всю «Войну и мир» вместе с комментариями. Или базу знаний компании. Или годовой отчёт в PDF целиком.

Plus поддерживает гибридный режим мышления (он же hybrid thinking mode). Это значит, что модель умеет работать в двух режимах прямо в одном разговоре:

Thinking mode. модель сначала думает пошагово, иногда несколько минут, потом выдаёт ответ. Подходит для сложных задач: математика, аналитика, длинные рассуждения.
Non-thinking mode. модель отвечает сразу, без раздумий. Подходит для простых запросов: «переведи фразу», «перепиши абзац», «дай идею для поста».

Переключатель режима живёт прямо в интерфейсе чата. Если задача простая, оставляйте non-thinking, ответ будет быстрее и дешевле. Если непонятно, какой режим взять, берите thinking, ничего страшного, кроме нескольких лишних секунд ожидания.

Где Plus незаменим

Список задач, где именно Plus имеет смысл, а не открытые модели:

Анализ большого PDF целиком (учебник, годовой отчёт, многостраничный договор), благодаря контексту 1M токенов.
Длинные тексты на русском, статья, лонгрид, серия постов в Telegram. Plus аккуратнее держит структуру и стиль на длинных дистанциях.
Многошаговые рассуждения, задачи уровня «дано условие из 5 пунктов, сделай вывод».
Финансовые расчёты и аналитика с несколькими переменными.
Перевод и адаптация контента между языками (Plus поддерживает 119+ языков).

Где Plus: это перебор

Для простых задач Plus можно не брать:

Короткие посты, идеи, brainstorm, справится бесплатный чат на любой Qwen.
Перевод одной фразы, переплата.
Программирование, берите Qwen3-Coder, он по коду сильнее.
Картинки и видео, Plus текстовая, нужна Qwen2.5-VL.

Кейс редакции

Мы в Checkroi проверяли Plus на двух задачах. Первая, переписать 8000-словный обзор Cursor под новые тарифы. Plus справился за 40 секунд в non-thinking, сохранил структуру и 90% фактов. Пришлось вручную поправить пять чисел.

Вторая задача, разобрать 300-страничный годовой отчёт публичной компании и найти противоречия между разделом «Управление рисками» и фактическими решениями совета директоров. Plus в thinking mode потратил три минуты и нашёл четыре противоречия. Это уровень junior-аналитика за 15 минут работы. Стоимость задачи, около 50 рублей.

Qwen 3.6 27B: рабочая лошадка с открытыми весами

Qwen 3.6 27B вышла 22 апреля 2026. Это плотная (dense) модель на 27 миллиардов параметров. «Плотная» значит, что на каждый запрос работают все 27 миллиардов параметров одновременно. В отличие от MoE (Mixture of Experts), о которой ниже, плотная модель проще в запуске и стабильнее в качестве.

Что внутри 27B

Контекстное окно, 128 тысяч токенов. Это меньше, чем у Plus, но всё ещё много: примерно 300 страниц текста за раз. Модель, open-weights, под лицензией Apache 2.0. Это значит, что её веса можно скачать с Hugging Face или ModelScope (китайский аналог Hugging Face) и запустить локально. Бесплатно и без оглядки на сервер Alibaba.

Где 27B незаменим

Сценарии, где важна приватность данных, медицина, юриспруденция, корпоративные документы. Модель работает на вашем сервере, ничего никуда не утекает.
Стабильные пайплайны, когда нужна модель, которая отрабатывает один и тот же сценарий тысячи раз без сюрпризов.
Замена платного API, если задача терпит, что ответ придёт за 5 секунд, а не за 2.
Чат-боты в бизнесе, поставил один раз на сервер, дальше нет ежемесячных счетов.

Что нужно по железу

27B в полной точности (FP16) требует около 54 ГБ видеопамяти. Это две видеокарты RTX 4090 или одна A100. Дорого.

В квантизованном виде (Q4_K_M, это сжатие весов модели, чтобы они помещались в меньшую видеокарту с потерей качества около 2–3%), около 17 ГБ. Это уже один RTX 4090, RTX 4070 Ti Super или Apple M2 Max c 32 ГБ объединённой памяти. Звучит дороже, чем подписка ChatGPT Plus, но это разовая трата.

Где 27B: это перебор

Если у вас нет видеокарты от 16 ГБ VRAM, берите 27B через API провайдеров (есть несколько российских с оплатой в рублях) или через Qwen Chat на сайте Alibaba. Покупать карту специально под Qwen имеет смысл, если планируете гонять её десятки часов в неделю.

Qwen 3.6 35B-A3B: MoE для тех, у кого есть видеокарта

Qwen 3.6 35B-A3B вышла 16 апреля 2026, на неделю раньше 27B. Конструкция модели заметно отличается. Это MoE (Mixture of Experts), архитектура с «экспертами». В модели 35 миллиардов параметров всего, но на каждый запрос работают только 3 миллиарда, те, которые подходят под конкретный тип задачи. Поэтому маркировка «35B-A3B»: 35 всего, 3 активных (Active).

Зачем MoE

Преимущество MoE в скорости. Внутри модели сидят узкие «специалисты»: один лучше разбирается в программировании, другой, в литературе, третий, в математике. На вход приходит запрос, маршрутизатор выбирает 2–3 нужных эксперта, и дальше отвечает только их часть. Получается, по качеству модель близка к большой плотной 27B, но работает в 3–4 раза быстрее и на той же видеокарте.

Минус, модель чуть менее предсказуема. Иногда маршрутизатор отправляет запрос «не туда», и ответ выходит странным. На сложных задачах это заметнее, чем на простых.

Где 35B-A3B сильна

Быстрые ответы на простые задачи в большом объёме, чат-бот поддержки, генерация тегов, классификация писем.
Локальный pipeline, где скорость важна больше, чем стабильность.
Видеокарты с 16–24 ГБ VRAM, модель в Q4 квантизации помещается легко.

Где 35B-A3B слабее

Длинные рассуждения, берите 27B или Plus.
Сложная математика, лучше QwQ-32B.
Программирование, Qwen3-Coder.

Если непонятно, что брать: 27B или 35B-A3B

Простое правило: если у вас одна видеокарта на 16–24 ГБ VRAM и вы не уверены, берите 27B. Она стабильнее, проще в запуске, ведёт себя предсказуемее. 35B-A3B, для тех, кто уже знает, зачем ему нужна именно MoE.

Qwen3-Coder 480B-A35B-Instruct: для агентного программирования

Qwen3-Coder, отдельная ветка для разработчиков. Главная модель серии вышла в июле 2025, в 2026 году она всё ещё актуальна и конкурирует с Claude Sonnet 4.6 на задачах кодинга.

Что внутри

Полное название, Qwen3-Coder-480B-A35B-Instruct. 480 миллиардов параметров всего, 35 миллиардов активных. Архитектура MoE. Контекстное окно, 256 тысяч токенов нативно и до 1 миллиона при экстраполяции. Это значит, что модели можно скормить целую кодовую базу средней программы и попросить отрефакторить.

Модель открытая, лицензия Apache 2.0, веса на Hugging Face. Запустить её локально в полном размере почти нереально, нужно несколько A100. Но Alibaba также выпустила меньшие версии:

Qwen3-Coder-30B-A3B-Instruct. 30 млрд параметров, 3 млрд активных. Помещается в один RTX 4090 в Q4.
Qwen3-Coder-Next. экспериментальная компактная версия, дешевле всех через API.

Что значит «агентный кодинг»

Агентный режим — это когда модель не просто пишет код по запросу, а умеет сама запускать команды, читать ошибки, править файлы и идти по задаче до победного конца. Похоже на то, как работает Cursor в режиме Composer или Claude Code в терминале.

Рой в каске руководит AI-ботами на цифровой стройке, где помощники пишут код, запускают тесты, собирают интерфейс и соединяют модули

Qwen3-Coder специально дообучен под этот сценарий. У него хорошо отрабатывает tool calling (вызов внешних инструментов) и multi-step reasoning (многошаговые рассуждения). Alibaba дополнительно выпустила инструмент Qwen Code, это CLI-агент, аналог Claude Code, заточенный под Qwen3-Coder.

Где Qwen3-Coder незаменим

Замена платного Claude Code, Cursor или GitHub Copilot, если хочется бесплатно.
Локальная разработка в закрытом контуре, где код нельзя отправлять в облако.
Рефакторинг больших кодовых баз благодаря контексту 256K–1M.
Автоматизация рутинных задач, миграции, переписывание тестов, генерация заглушек.

Для подробного сравнения с Claude Code и Cursor посмотрите наш отдельный разбор «Claude Code vs Cursor», там же есть ссылки на бесплатные альтернативы, включая Qwen.

Где Qwen3-Coder слабее

На очень редких языках программирования (Erlang, OCaml, Haskell), Claude чуть точнее.
На задачах архитектуры и большого дизайна, Plus или Claude Opus справятся аккуратнее.

QwQ-32B: модель, которая умеет рассуждать вслух

QwQ (читается «Кью-Кью»), это reasoning-модель (модель для рассуждений) от Alibaba. Релиз, март 2025. На май 2026 это всё ещё лучшая компактная reasoning-модель в семействе Qwen, и она конкурирует с DeepSeek-R1 и OpenAI o4-mini.

Что значит reasoning

Reasoning-модель — это нейросеть, которую специально обучили думать пошагово перед ответом. У обычной модели весь процесс мышления спрятан, она просто выдаёт результат. У reasoning-модели видны все шаги: «Так, сначала разберём условие. Дано… Значит, нужно… Проверим вариант 1… Не подходит, потому что…». Это похоже на то, как студент решает задачу на бумаге.

Такой подход даёт огромный выигрыш на математике, логических задачах и многошаговом анализе. Расплата, модель отвечает медленнее и тратит больше токенов на «внутренние размышления».

Где QwQ-32B незаменим

Олимпиадная математика и логические головоломки.
Сложный анализ данных с несколькими шагами.
Тонкая работа с условиями (например, юридический разбор контракта).
Задачи с ловушками, где нужно проверять каждое допущение.

Что нужно по железу

QwQ-32B, open-weights, 32 миллиарда параметров, плотная архитектура. В Q4 квантизации помещается в 24 ГБ VRAM, то есть в RTX 3090, RTX 4090 или Apple M2/M3 Max. Если железа нет, модель доступна через API и бесплатно через chat.qwen.ai.

Что НЕ делать с QwQ

Простые задачи лучше отдавать обычным моделям. QwQ на запрос «придумай заголовок для поста» будет 30 секунд рассуждать, прежде чем выдать результат, и это будет дороже и медленнее, чем просто Qwen 3.6 27B.

Канал основателя Checkroi Вани БуявцаПоказываю тебе, как публично строю Checkroi с нейросетями и делюсь цифрами, провалами и тем, что сработалоПодписаться

Qwen2.5-VL: когда нужны картинки и видео

Qwen2.5-VL, это vision-модель, то есть модель, которая понимает не только текст, но и картинки. Аббревиатура VL = Vision-Language. Релиз, конец 2024 года, в 2026 году эта линейка по-прежнему актуальна. Свежее семейство Qwen 3.6 пока не получило vision-аналог.

Что умеет

Распознавать содержимое картинок — «что на фото?», «прочитай этот скриншот», «опиши схему».
Анализировать таблицы и графики на скриншотах.
Читать рукописный текст и документы.
Разбирать длинные видео, Qwen2.5-VL умеет работать с видео до часа.
Управлять UI, у модели есть режим «агент в браузере и на телефоне», когда она видит экран и кликает по элементам.

Размеры

В линейке Qwen2.5-VL пять вариантов: 3B, 7B, 32B, 72B и Max (закрытая, через API). Для большинства задач хватает 7B, её можно запустить локально на 12 ГБ VRAM. Для серьёзной работы с документами, 72B через API.

Где Qwen2.5-VL незаменим

Парсинг сканов документов, чеков, накладных.
Описание товаров для интернет-магазина по фотографиям.
Анализ скриншотов конкурентов в маркетинге.
Поддержка пользователей, где они шлют скриншоты ошибок.

Что внутри Qwen: три вещи, которые надо понимать

Чтобы спокойно ориентироваться во всех моделях семьи, достаточно понять три концепции. Если их ухватить, дальше любая новая Qwen будет читаться как продолжение знакомой истории.

MoE простыми словами

MoE (Mixture of Experts), это архитектура, где модель внутри поделена на много мелких подсетей, каждая из которых стала «экспертом» в своей теме. Перед моделью стоит маршрутизатор (router), который читает входящий запрос и решает: «Этот вопрос про код, пусть отвечают эксперты 7, 12 и 28». Остальные эксперты остаются спать.

В обозначении «Qwen3-Coder-480B-A35B» 480B, общее число параметров (сколько весов хранится в модели), A35B, активные параметры (сколько работают на каждый запрос). По вычислительной нагрузке модель ведёт себя как 35B, а по широте знаний, как 480B. Это и есть главный фокус MoE.

Аналогия из жизни: у вас в офисе 100 сотрудников разных специальностей, но на каждое конкретное собрание приходят только 8 из них, которым тема релевантна. Зарплата всем, но на собрании нагрузка не 100 человек, а 8. Получается экономия и скорость без потери широты экспертизы.

Thinking mode и non-thinking mode

Это два режима работы одной и той же модели. Включаются переключателем в интерфейсе chat.qwen.ai или флагом в API-запросе.

Non-thinking. модель сразу выдаёт ответ. Быстро, дёшево, подходит для простых задач.
Thinking. модель сначала пишет «внутренний монолог» (его обычно скрывают от пользователя или показывают свёрнутым), а потом финальный ответ. Медленнее в 5–10 раз, токенов тратит больше, но качество на сложных задачах сильно лучше.

Правило простое: для коротких ответов, non-thinking. Для всего, где есть «надо подумать», thinking. На chat.qwen.ai режим обычно выбирается одной кнопкой.

Контекст 1M токенов и когда он нужен

Контекстное окно — это сколько текста модель может удержать в голове в рамках одного разговора. Один токен — это примерно 0,75 слова в английском или 0,5 слова в русском. То есть 1 миллион токенов — это примерно 500 тысяч русских слов или 1500 страниц текста.

Когда миллион пригодится:

Анализ годового отчёта на 200 страниц.
Загрузка корпоративной базы знаний целиком.
Сравнение пяти длинных договоров между собой.
Разбор большого исходного кода в одном разговоре.

Когда миллион не нужен:

Любая задача из одного-двух абзацев.
Большинство деловых писем, постов, статей.
Программирование в небольшом проекте.

Для 90% задач хватает контекста 32–128 тысяч токенов — это уровень 27B и 35B-A3B. Платить за 1M есть смысл, когда вы упираетесь в ограничение.

Сравнение Qwen 3.6 Plus, 27B, 35B-A3B и Qwen3-Coder по 10 параметрам

Параметр	Qwen 3.6 Plus	Qwen 3.6 27B	Qwen 3.6 35B-A3B	Qwen3-Coder 480B
Тип	Закрытая (API + чат)	Открытая, dense	Открытая, MoE	Открытая, MoE
Параметры (общие / активные)	~400B / ~30B	27B / 27B	35B / 3B	480B / 35B
Контекст	1 000 000	128 000	128 000	256 000 (до 1M)
Гибридный режим	Да	Да	Да	Только non-thinking
VRAM для локала (Q4)	Невозможно	~17 ГБ	~20 ГБ	~270 ГБ
Скорость инференса	Средняя	Средняя	Высокая	Средняя
Цена API вход	$1,3 / 1M	$0,05–0,30	$0,05–0,18	$0,11 / 1M
Цена API выход	$7,8 / 1M	$0,30–1,80	$0,30–1,20	$0,80 / 1M
Сильная сторона	Длинные тексты, рассуждения	Универсал на любом железе	Скорость, MoE-экономия	Программирование и агенты
Слабая сторона	Платная, закрытая	Не быстрее GPT-5	Менее предсказуема	Не для текстов

Бенчмарки: кто на цифрах лучше

Бенчмарки — это стандартные тесты, по которым принято сравнивать модели. Они дают объективный взгляд, но не заменяют живое тестирование под вашу задачу.

Бенчмарк	Что мерит	Qwen 3.6 Plus	Qwen 3.6 27B	Qwen3-Coder 480B	QwQ-32B	GPT-5	Claude Opus 4.8
MMLU-Pro	Общие знания	82	74	72	71	87	89
HumanEval+	Программирование	88	76	92	74	92	94
SWE-bench Verified	Реальные баги в коде	54	38	70	40	72	78
AIME 2024	Олимпиадная математика	68	52	50	85	78	82
MATH-500	Школьная математика	89	83	80	91	92	94
RULER 128K	Длинный контекст	92	78	85	74	89	91

Главные выводы из цифр:

На общих знаниях Qwen всё ещё отстаёт от GPT-5 и Claude Opus на 5–7 пунктов. В живой работе это заметно на узких темах.
На программировании Qwen3-Coder уже на одном уровне с GPT-5 и близко к Claude Opus.
На олимпиадной математике QwQ-32B обгоняет даже GPT-5 за счёт reasoning-режима.
На длинном контексте Qwen 3.6 Plus идёт ноздря в ноздрю с конкурентами.

Цены: сколько Qwen стоит в долларах и рублях

Сразу важная оговорка. Цены на API дальше, официальные тарифы Alibaba Cloud в долларах. В России картой РФ напрямую оплатить Alibaba нельзя. Поэтому большинство пользуется одним из двух способов: бесплатный чат на chat.qwen.ai или российские провайдеры-посредники.

Тарифы API

Модель	Вход за 1M токенов	Выход за 1M токенов	Бесплатный тариф
Qwen 3.6 Plus	$1,3 / ~120 ₽	$7,8 / ~720 ₽	1M токенов для новых аккаунтов
Qwen 3.6 Max-Preview	$1,3 / ~120 ₽	$7,8 / ~720 ₽	1M токенов
Qwen 3.5 Plus	$0,3 / ~28 ₽	$1,8 / ~166 ₽	1M токенов
Qwen3-Coder 480B	$0,11 / ~10 ₽	$0,8 / ~74 ₽	1M токенов
Qwen 3.6 27B (open)	$0,3 / ~28 ₽	$1,8 / ~166 ₽	Через российских провайдеров
Qwen 3.6 35B-A3B (open)	$0,18 / ~17 ₽	$1,2 / ~110 ₽	Через российских провайдеров
QwQ-32B	$0,2 / ~18 ₽	$0,8 / ~74 ₽	Бесплатно через chat.qwen.ai

Курс взят 92 ₽ за доллар на середину мая 2026. У российских провайдеров цены обычно на 30–50% выше из-за маржи, но зато оплата в рублях картой РФ.

Бесплатный тариф Qwen Chat

Самое важное, на chat.qwen.ai можно бесплатно пользоваться всеми моделями семейства. Лимиты есть, но щедрые:

Около 100 сообщений в день для Qwen 3.6 Plus.
Безлимитно для меньших моделей.
Бесплатная генерация картинок через встроенную модель.
Бесплатная работа с документами и файлами.

Для большинства пользователей этого хватает с запасом. API нужен только тем, кто строит свои продукты или гоняет большие пайплайны.

Как оплатить API из России

Три рабочих способа на май 2026:

Российские провайдеры-посредники. AITUNNEL, GPTunneL, ProxyAPI и ещё пара десятков сервисов. Принцип одинаковый: вы пополняете рублёвый баланс картой РФ, провайдер прокидывает ваши запросы в Alibaba и берёт комиссию. Минимальное пополнение, обычно 300–500 ₽.
OpenRouter через зарубежную карту. OpenRouter, агрегатор, который объединяет все большие модели. Если у вас есть карта Казахстана, Армении, Грузии или Турции, можно платить напрямую.
Прямой контракт с Alibaba Cloud. Подходит юрлицам, которые готовы оформить договор с китайским провайдером. Физикам из России, почти нереально.

Самый простой путь, через российского посредника. У большинства из них API совместим с OpenAI и Anthropic, то есть код, написанный под ChatGPT или Claude, переносится одной строкой.

Матрица «задача → модель → стоимость»

Чтобы не гадать, какую модель брать под конкретную задачу, собрали таблицу из 12 типовых сценариев с примерной стоимостью.

Задача	Какую модель	Сколько токенов	Стоимость в ₽
Идеи постов в Telegram (10 шт.)	Qwen 3.6 27B	~3000	~0,7 ₽
Перевод одного письма на английский	Qwen 3.6 27B	~1500	~0,3 ₽
Лонгрид на 8000 слов	Qwen 3.6 Plus	~20 000	~16 ₽
Разбор PDF на 50 страниц	Qwen 3.6 Plus	~40 000	~32 ₽
Разбор PDF на 300 страниц	Qwen 3.6 Plus (1M контекст)	~250 000	~200 ₽
Написать парсер цен с сайта	Qwen3-Coder 480B	~8000	~6 ₽
Рефакторинг кода (5 файлов)	Qwen3-Coder 480B	~30 000	~25 ₽
Решить олимпиадную задачу	QwQ-32B	~15 000	~12 ₽
Анализ Excel на 10 000 строк	Qwen 3.6 Plus + thinking	~50 000	~40 ₽
Чат-бот поддержки (1000 ответов)	Qwen 3.6 35B-A3B	~500 000	~85 ₽
Распознать чек с фото	Qwen2.5-VL 7B	~2000	~0,5 ₽
Разбор видео-инструкции	Qwen2.5-VL 72B	~15 000	~25 ₽

Главный вывод: типичный рабочий день копирайтера или маркетолога на Qwen API стоит 30–50 рублей. На chat.qwen.ai, бесплатно. Это в десятки раз дешевле подписки на ChatGPT Plus.

Шесть сценариев: какая Qwen под какую профессию

Сценарии собрали из реальных рабочих ситуаций, которые описывают читатели Checkroi. Если хотя бы один совпадает с вашим, забирайте рекомендацию и связку моделей.

Сценарий 1: маркетолог с контент-планом

Задача: написать серию постов в Telegram-канал на месяц вперёд, по плану на 30 тем, плюс заголовки и превью-картинки. Хочется однотипного качества и одного голоса.

Рекомендация: Qwen 3.6 Plus в non-thinking mode. Plus аккуратнее держит стиль на длинных дистанциях, чем меньшие модели, а thinking тут не нужен, нет задач на рассуждение. Картинки, встроенный генератор chat.qwen.ai.

Лайфхак: в первом сообщении подгрузите три-четыре своих лучших поста как образец и попросите Qwen «писать в этом голосе». Контекст 1M токенов позволяет загрузить хоть всю историю канала за год. Дальше модель будет держать ваш стиль самостоятельно.

Бюджет: при использовании chat.qwen.ai, бесплатно. Через API, около 50–70 ₽ за все 30 постов.

Подробнее о применении нейросетей в маркетинге, в нашем материале «Вайбкодинг для маркетолога: 10 задач без программиста».

Сценарий 2: студент с учебником на 200 страниц

Задача: подготовиться к экзамену по толстому учебнику. Хочется быстро пройтись по структуре, собрать главные тезисы, проверить себя вопросами.

Рекомендация: Qwen 3.6 Plus в non-thinking mode для пересказа и тезисов, QwQ-32B в thinking mode для решения сложных задач из учебника. Контекст 1M токенов в Plus позволяет загрузить весь PDF целиком без разбивки на куски.

Лайфхак: после загрузки учебника попросите Plus сделать «карту тем», список глав с одной фразой про каждую. Дальше идёте по карте и по каждой теме просите три вопроса для самопроверки. Получается готовый билет для тренировки.

Бюджет: бесплатно через chat.qwen.ai.

Сценарий 3: малый бизнес с чат-ботом на сайте

Задача: подключить на сайт автоматического консультанта, который отвечает посетителям на вопросы про услуги, цены, расписание. Без подписки на дорогие сервисы.

Рекомендация: Qwen 3.6 35B-A3B через API российского посредника. MoE-архитектура даёт скорость, нужную для живого чата. Стоимость, около 85 ₽ за 1000 ответов.

Лайфхак: вместо того чтобы дообучать модель на ваших данных, передавайте контекст в системный промпт. Загрузите туда прайс, расписание и FAQ, модель будет отвечать опираясь на эти данные. Это называется RAG (Retrieval-Augmented Generation) в простой форме и работает почти всегда лучше, чем дообучение.

Бюджет: при потоке 100 вопросов в день, около 250 ₽ в месяц. Сравните с 3000 ₽ за подписку на коммерческий ChatGPT-бот.

Сценарий 4: аналитик с Excel и дашбордами

Задача: разобрать большой Excel-файл с продажами, найти аномалии, построить сводки и графики. Excel на 10 000 строк, в нём 15 колонок.

Рекомендация: Qwen 3.6 Plus с включённым Code Interpreter. Plus сильна в аналитике, а Code Interpreter позволяет ей не просто комментировать данные, а запускать Python-скрипты и строить графики. Файл загружается в чат через скрепку.

Лайфхак: первый запрос всегда «изучи структуру файла и опиши, что в каждой колонке». Модель сама проверит типы данных, найдёт пустые ячейки и даст резюме. Дальше задаёте вопросы по существу: «найди заказы свыше 100 000 ₽», «нарисуй динамику продаж по месяцам», «выведи топ-10 клиентов по обороту».

Бюджет: бесплатно через chat.qwen.ai. Через API, около 40 ₽ за развёрнутый разбор.

Сценарий 5: самозанятый разработчик

Задача: пишет небольшие проекты для клиентов, хочется заменить дорогой Claude Code или Cursor на что-то бесплатное или сильно дешевле. Готов потратить вечер на настройку.

Рекомендация: Qwen3-Coder 480B через chat.qwen.ai для базовой работы, плюс Qwen3-Coder 30B-A3B локально через Ollama для приватных проектов клиентов. На сложных архитектурных задачах подключайте Qwen 3.6 Plus с thinking mode.

Лайфхак: для агентного кодинга поставьте Qwen Code, это CLI-инструмент от самой Alibaba, аналог Claude Code. Работает поверх chat.qwen.ai бесплатно. Подключается к вашему репозиторию, видит файлы, запускает команды, проверяет результат.

Бюджет: 0 ₽ через chat.qwen.ai. Локально, стоимость электричества плюс разовая трата на видеокарту. Сравнение с платными аналогами есть в статье «Claude Code vs Cursor: что выбрать в 2026».

Сценарий 6: энтузиаст с домашним сервером

Задача: дома стоит десктоп с RTX 4090, хочется поднять локальный AI-ассистент для семьи. Чтобы дети учились, родители разбирали документы, и всё это без зависимости от внешних серверов и подписок.

Рекомендация: Qwen 3.6 27B через Ollama для общих задач + Qwen2.5-VL 7B для разбора картинок и документов. Опционально, QwQ-32B для математики (полезно школьникам). Накатывается командой «ollama pull» за 15 минут.

Лайфхак: поднимите Open WebUI (бесплатный веб-интерфейс над Ollama), получите красивый чат как ChatGPT, доступный из любого устройства в домашней сети. Дети заходят с планшета, бабушка с телефона, все используют один сервер на 4090.

Бюджет: 0 ₽ после разовой покупки железа. Электричество, около 200 ₽ в месяц при умеренной нагрузке.

Pipeline-паттерн: как комбинировать модели и экономить

Если задача состоит из нескольких этапов, имеет смысл подключать разные модели на каждом шаге. Это называется pipeline (конвейер). Идея простая: на простых шагах, дешёвая модель, на сложных, дорогая.

Пример из жизни редакции Checkroi: подготовка обзора школы курсов. Раньше всё делалось одной Claude Opus 4.8, выходило около 100 ₽ за обзор. После перехода на Qwen-pipeline стало 12 ₽.

Сбор данных со страницы школы. Qwen 3.6 35B-A3B вытаскивает структуру: курсы, цены, преподаватели, отзывы. Быстро и дёшево.
Очистка и нормализация. Qwen 3.6 27B приводит данные к единому формату.
Сравнение с конкурентами. Qwen 3.6 Plus в thinking mode, нужно аккуратное сравнение.
Написание финального обзора. Qwen 3.6 Plus в non-thinking, длинный текст с живым стилем.
Проверка фактов. QwQ-32B, модель аккуратно проверяет цифры и даты.

Получается, что 80% работы делают дешёвые модели, и только финальный этап и проверка фактов, на дорогих. Экономия в 8 раз без потери качества.

Рой в поварском колпаке и фартуке управляет редакционной кухней, где AI-боты поэтапно готовят обзор: собирают данные, смешивают таблицы, делают сравнение, оформляют текст и проверяют факты

Qwen vs GPT-5, Gemini 3.1 Pro Preview, Claude Opus 4.8 и DeepSeek V3.2

На рынке в мае 2026 есть пять серьёзных игроков. Сравним их на бытовом языке.

Qwen 3.6 Plus vs GPT-5

GPT-5 от OpenAI на 5–7 пунктов сильнее в общих знаниях и креативе. Но GPT-5 стоит $5 за миллион входных токенов против $1,3 у Qwen Plus, в четыре раза дороже. И GPT-5 не работает из России без обходных путей.

Когда выбирать GPT-5: креативные задачи, литературные тексты, узкие специализированные темы.

Когда выбирать Qwen Plus: рутинная работа с текстами, аналитика, документы. Большинство задач закрывает.

Qwen 3.6 Plus vs Claude Opus 4.8

Claude Opus, самая дорогая модель на рынке. $15 за миллион входных токенов, в 11 раз дороже Qwen Plus. Зато на сложной аналитике, длинных рассуждениях и программировании Claude всё ещё на 5–10% точнее.

Когда выбирать Claude Opus: сложные документы, юриспруденция, серьёзная аналитика, ответственные задачи.

Когда выбирать Qwen Plus: повседневная работа, где важна себестоимость и доступность из России. Подробное сравнение Claude, в нашей статье про модели Claude.

Qwen 3.6 Plus vs Gemini 3.1 Pro Preview

Gemini 3.1 Pro Preview от Google имеет 2M токенов контекста — это в два раза больше Qwen Plus. На длинных задачах Gemini сильнее. Но Gemini хуже работает на русском и слабее в программировании.

Когда выбирать Gemini: гигантские документы, работа с YouTube-видео (есть встроенный анализ), Google-инфраструктура.

Когда выбирать Qwen Plus: всё остальное, особенно русскоязычные тексты.

Qwen 3.6 Plus vs DeepSeek V3.2

DeepSeek, главный конкурент Qwen внутри Китая. На бенчмарках DeepSeek V3.2 идёт ноздря в ноздрю с Qwen 3.6 Plus, а на программировании даже чуть впереди. Цены сопоставимы.

Главное отличие: DeepSeek заточен под reasoning по умолчанию, Qwen, универсал. Если задачи в основном про код и математику, DeepSeek может зайти лучше. Если универсал, Qwen.

Qwen3-Coder vs Claude Sonnet 4.6 vs GPT-5 на коде

Бенчмарк	Qwen3-Coder 480B	Claude Sonnet 4.6	GPT-5
SWE-bench Verified	70	72	72
HumanEval+	92	91	92
Цена $/1M вход	0,11	3,00	5,00
Доступ из России	Бесплатно через chat.qwen.ai	Через посредников	Через посредников

Вывод по коду: Qwen3-Coder уже не уступает американцам на бенчмарках, при этом в 30 раз дешевле. На сложных архитектурных задачах Claude Sonnet всё ещё чуть аккуратнее, но разница уже не такая, чтобы оправдать переплату.

Доступ из России: без КВН и без зарубежной карты

Это самая частая боль для нашего рынка. Разберём по полочкам.

Qwen Chat бесплатно через chat.qwen.ai

Самый простой способ. Заходите на chat.qwen.ai, нажимаете «Sign in», логинитесь через Google или GitHub-аккаунт. Российская почта подойдёт, КВН не нужен. Сайт работает напрямую с Москвы и любого региона России.

В верхней части окна есть выпадающий список моделей. Выбирайте Qwen3.6-Plus для серьёзных задач или Qwen3.6-Coder для программирования. Дальше пишете в чат как обычно.

Бонусы chat.qwen.ai:

Прямая загрузка PDF и Word, модель сама разберёт документ.
Генерация картинок встроенной модели.
Создание короткого видео из текстового описания.
Голосовой ввод на русском.
Web Search, модель ищет в интернете и добавляет свежие данные.

Подключение API

Если нужен программный доступ, три варианта:

Российский провайдер. Регистрируетесь на AITUNNEL, GPTunneL или другом сервисе, пополняете рублёвый баланс, получаете API-ключ. Дальше работаете как с OpenAI API, большинство провайдеров поддерживают OpenAI-совместимый формат.
OpenRouter. Если есть зарубежная карта, заводите аккаунт на openrouter.ai, пополняете в долларах, получаете доступ ко всем моделям через один API.
Локальный запуск open-weights моделей. Если у вас железо, Qwen 3.6 27B, 35B-A3B, Qwen3-Coder 30B-A3B можно запустить через Ollama без оплаты вообще.

Что Alibaba делает с вашими данными

Главная боль для российского бизнеса, куда уходят данные. По официальной политике Alibaba Cloud:

Данные хранятся на серверах в Сингапуре и Гонконге, для России, на азиатских.
Чаты на chat.qwen.ai используются для дообучения модели по умолчанию. Можно отключить в настройках профиля.
Через API, данные на дообучение не идут, если использовать enterprise-тариф или платный API через провайдеров.
Alibaba, китайская компания, и при запросе китайских властей данные могут быть переданы.

Если у вас данные не должны попадать в руки китайского правительства (медицинские, юридические, корпоративные секреты), берите open-weights модель и ставьте локально. Это единственный способ, при котором данные физически не покидают ваш сервер.

Локальный запуск Qwen: что нужно по железу

Большой плюс открытых моделей, их можно поставить себе на компьютер и пользоваться бесплатно навсегда. Минус, нужно железо, и чем мощнее модель, тем серьёзнее требования.

Таблица «видеокарта → какая Qwen зайдёт»

Видеокарта / RAM	VRAM	Что запустится в Q4	Скорость
RTX 3060	12 ГБ	Qwen 3 8B, Qwen 3 14B	15–25 токенов/сек
RTX 4060 Ti 16GB	16 ГБ	Qwen 3.6 27B	10–15 токенов/сек
RTX 4070 Ti Super	16 ГБ	Qwen 3.6 27B, Qwen3-Coder 30B-A3B	15–20 токенов/сек
RTX 4090	24 ГБ	Qwen 3.6 27B, 35B-A3B, QwQ-32B	25–40 токенов/сек
2× RTX 4090	48 ГБ	Все из 4090 + большие в FP16	30–50 токенов/сек
Apple M2 Max 32GB	22 ГБ	Qwen 3.6 27B, QwQ-32B	15–20 токенов/сек
Apple M3 Max 64GB	48 ГБ	Все из M2 + Qwen3-Coder 30B	20–30 токенов/сек
Apple M4 Ultra 128GB	~96 ГБ	Любые open-weights Qwen	30–40 токенов/сек
CPU + 16 ГБ RAM	0	Qwen 3 4B, 1.7B, 0.6B	3–8 токенов/сек

Если есть только обычный ноутбук без отдельной видеокарты, берите Qwen 3 4B. Качество хуже Qwen 3.6 Plus, но для простых задач хватает, и работает без интернета.

Ollama одной командой

Ollama, это программа, которая делает запуск нейросетей похожим на запуск приложения. Скачиваете с сайта ollama.com, ставите, потом в терминале пишете:

ollama run qwen3:14b

Всё. Ollama сама скачает модель, проверит ваше железо, запустит и даст консольный чат. Если работает медленно, попробуйте модель поменьше:

ollama run qwen3:8b
ollama run qwen3:4b
ollama run qwq:32b

Для подключения через программу, Ollama выдаёт OpenAI-совместимый API на адресе localhost:11434. То есть код, написанный под ChatGPT, работает с Qwen через Ollama после замены одной строки.

Квантизация: как ужать большую модель

Квантизация — это сжатие весов модели. Веса хранятся не в виде 16-битных или 32-битных чисел, а в виде 4-битных или 8-битных. Объём памяти падает в 4–8 раз, скорость растёт, качество чуть проседает.

Стандартные обозначения:

FP16. полная точность, ~2 ГБ на миллиард параметров.
Q8_0. 8-бит, ~1 ГБ на миллиард, качество почти как FP16.
Q5_K_M. 5-бит с умным распределением, хороший баланс.
Q4_K_M. 4-бит, стандарт для домашних карт, ~0,5 ГБ на миллиард, потеря качества 2–3%.
Q3_K_M. 3-бит, экстрим, заметная потеря качества.
Q2_K. 2-бит, на грани разумного.

Если непонятно, что брать, берите Q4_K_M. Это золотой стандарт, который работает почти на всём и терпимо по качеству.

5 типичных ошибок при выборе модели

Ошибка 1: брать самую большую модель «на всякий случай»

Самая частая ошибка новичка. «Возьму сразу Qwen 3.6 Plus, чтобы наверняка». В итоге переплата в 5–10 раз за то, что 27B или 35B-A3B сделали бы быстрее и дешевле. Правило: начинайте с меньшей модели, переходите на большую только когда упёрлись в качество.

Ошибка 2: путать Qwen 2.5, Qwen 3 и Qwen 3.6

В интернете масса статей про Qwen 2.5 и Qwen 3. В 2026 году это уже два устаревших поколения. Всегда проверяйте дату статьи и дату релиза модели. На chat.qwen.ai в выпадающем списке актуальные модели — это всегда последняя цифра.

Ошибка 3: использовать обычную модель там, где нужен reasoning

Сложные математические задачи или многошаговые рассуждения на обычной Qwen 3.6 27B дают слабый результат. На QwQ-32B та же задача решается. Правило: если задача требует «подумать», включайте thinking mode или берите QwQ.

Ошибка 4: использовать reasoning там, где он не нужен

Обратная ошибка. Запускать QwQ-32B на «придумай заголовок» или «напиши короткое сообщение», медленно и дорого. На рутину берите обычные модели.

Ошибка 5: забывать про контекст

Грузить 200-страничный документ в модель с контекстом 128K, половина текста просто потеряется в середине. Если задача про длинные документы, нужен Qwen 3.6 Plus с контекстом 1M, а не открытая 27B.

Как переключать модели в Qwen Chat и API

В Qwen Chat (сайт)

В верхней части окна чата есть выпадающий список с названием текущей модели. Кликаете, выпадает меню со всеми доступными моделями. Выбираете нужную. Переключение происходит для нового сообщения; уже отправленные сообщения остаются обработанными старой моделью.

Рядом обычно есть переключатель thinking/non-thinking, кнопка с иконкой мозга или галочка «Thinking».

В API

Через API модель указывается параметром model в запросе. Например:

{
  "model": "qwen3.6-plus",
  "messages": [...],
  "extra_body": {"enable_thinking": true}
}

Для разных провайдеров название модели слегка отличается. У Alibaba Cloud, это qwen3.6-plus, qwen3.6-coder, qwq-32b. У российских посредников, могут быть свои алиасы.

В Ollama (локально)

Каждая модель, отдельная команда:

ollama pull qwen3:14b
ollama run qwen3:14b

Переключиться на другую, просто запустить с другим именем. Старая останется в памяти, не нужно удалять.

Финальная шпаргалка: какая Qwen для какой ситуации

Если хочется одной таблицей закрыть весь вопрос «что брать», вот она. Сохраните её на потом, чтобы не возвращаться к статье.

Ваша ситуация	Что брать	Почему
Хочу попробовать впервые	chat.qwen.ai → Qwen3.6-Plus	Бесплатно, без КВН, без карты, лучшая модель из коробки
Длинный текст или лонгрид на русском	Qwen 3.6 Plus, non-thinking	Держит структуру и стиль на 8000+ слов
Разбор PDF в 100–300 страниц	Qwen 3.6 Plus, контекст 1M	Целый документ за раз без нарезки
Программирование общего профиля	Qwen3-Coder 480B	На уровне GPT-5 по коду, в 30 раз дешевле
Олимпиадная математика, логика	QwQ-32B в thinking mode	Обгоняет даже GPT-5 на AIME
Аналитика Excel с графиками	Plus + Code Interpreter	Запускает Python внутри чата
Распознать картинку, скан, чек	Qwen2.5-VL 7B (или 72B через API)	Vision-модель, читает фото и скриншоты
Чат-бот на сайт за копейки	Qwen 3.6 35B-A3B через API	~0,1 ₽ за ответ, быстро
Локальный запуск, есть видеокарта 16+ ГБ	Qwen 3.6 27B через Ollama	Открытая лицензия, стабильна, без счетов
Локальный запуск на ноутбуке без GPU	Qwen 3 4B	Работает на CPU + 16 ГБ RAM
Юридические или медицинские данные	Open-weights локально	Данные не покидают ваш сервер
Команда из 3–10 человек	27B на сервере + Open WebUI	Один RTX 4090 закрывает потребности команды
API в продукте на продакшене	Plus через российского посредника	Стабильность + рублёвая оплата
Маленький бюджет, не критично качество	Qwen 3.6 27B или 35B-A3B через API	В 4–10 раз дешевле Plus
Очень редкий язык (фарси, тагальский)	Qwen 3.6 Plus + проверка живым редактором	Качество приемлемое, но не идеальное

Безопасность данных: на что обратить внимание

Тема, которая обычно всплывает у корпоративных клиентов и у тех, кто работает с чужими секретами. Разберём по уровням риска.

Низкий риск: публичные данные

Если вы пишете пост для соцсети, переводите статью с английского, придумываете идеи для блога, заходите на chat.qwen.ai и работайте. Никакой проблемы нет. Все эти данные и так публичны.

Средний риск: внутренние документы компании

Внутренний приказ, методичка для сотрудников, контент-план команды. Это не публичные данные, но и не государственные секреты. В настройках chat.qwen.ai отключите «Use my data to improve models». После этого ваши чаты не идут в обучающую выборку. Через API enterprise-тарифа этого делать не нужно, там обучение по умолчанию выключено.

Высокий риск: персональные данные клиентов, юр-документы, медкарты

Это случай, когда трансграничной передачей данных вы нарушаете 152-ФЗ и аналогичные законы в других странах. Сюда же, корпоративные секреты, ноу-хау, исходный код закрытых продуктов. Что делать:

Не использовать chat.qwen.ai и облачный API.
Поднять open-weights модель локально через Ollama или vLLM на сервере внутри вашего контура.
Подходящие модели, Qwen 3.6 27B, 35B-A3B или Qwen3-Coder 30B-A3B (все open-weights, лицензия Apache 2.0).
Сервер физически в РФ, без выходов наружу. Тогда данные никогда не покидают периметр.

Это единственный способ работать с по-настоящему чувствительными данными. Облачные сервисы любого провайдера, Qwen, ChatGPT, Claude, здесь не подходят по принципу.

Что говорят про данные сами Alibaba

Официальная позиция Alibaba Cloud такая. На бесплатном тарифе chat.qwen.ai пользовательские чаты могут использоваться для улучшения модели. На enterprise-тарифе и через API, не используются. Серверы для пользователей вне Китая расположены в Сингапуре и Гонконге. При официальном запросе китайских властей данные могут быть переданы по закону.

Для большинства некритичных задач это приемлемо. Для критичных, берите open-weights и ставьте локально, других надёжных вариантов с китайскими сервисами нет.

Чего Qwen всё ещё не умеет

Чтобы не было завышенных ожиданий, честный список ограничений Qwen на май 2026.

Узкие профессиональные темы. На юридических, медицинских или финансовых тонкостях Qwen иногда галлюцинирует, придумывает несуществующие законы, диагнозы или показатели. Проверяйте факты, особенно когда результат идёт в ответственное место.
Очень редкие языки. Поддержка 119 языков заявлена, но качество на узбекском, таджикском и других языках СНГ заметно слабее, чем на русском.
Самая свежая инфа. Знания у моделей обрезаны на дате обучения, обычно за 6–12 месяцев до релиза. Свежие новости и цифры лучше брать через web search в chat.qwen.ai или из внешних источников.
Длинная видеогенерация. Встроенный генератор картинок и короткого видео есть, но он слабее Sora 2 и Runway Gen-4.
Безотказная агентность. На сложных многошаговых сценариях Qwen3-Coder иногда «срывается», забывает контекст, теряет инструменты. Для критичных пайплайнов Claude Code пока надёжнее.

Главная мысль и с чего начать конкретно вам

Если читали по диагонали, вот что важно унести из статьи.

Для большинства людей правильный путь такой:

Откройте chat.qwen.ai прямо сейчас. Зарегистрируйтесь через Google. Это бесплатно и без КВН.
Переключите модель на «Qwen3.6-Plus» в выпадающем списке.
Дайте ей реальную задачу из вашей работы. Не «расскажи анекдот», а что-то полезное: разбери письмо клиента, перепиши абзац для блога, найди ошибку в Excel-таблице.
Если задача про код. переключитесь на «Qwen3-Coder».
Если задача требует размышлений. включите thinking mode.
Через неделю вы поймёте, какая модель вам нужна. Если бесплатных лимитов хватает, можно остаться на чате. Если упёрлись, подключайте API через российского посредника за 500 ₽ в месяц.

Если вы разработчик, параллельно поставьте Ollama и скачайте Qwen 3.6 27B на свою видеокарту. Через месяц перестанете платить за API вообще.

Если вы команда из 3–10 человек, обратите внимание на open-weights модели на собственном сервере. Один RTX 4090 за 200 тысяч рублей закрывает потребности 10 пользователей и окупается за полгода против подписок на ChatGPT Plus.

Самое важное: не бойтесь экспериментировать. Qwen бесплатна на старте, открыта в коде, работает из России. Такая комбинация для AI-инструмента такого уровня в 2026 году встречается редко. Имеет смысл попробовать сегодня, а не через год.

Если хочется освоить работу с нейросетями системно, на современном рынке есть и короткие интенсивы за неделю, и серьёзные программы на год с трудоустройством в AI-направлении. Похожий путь прошли уже многие, например, специалисты по AI, о которых мы писали в статье «Кто такой специалист по искусственному интеллекту». И ещё близко по теме, наш материал про AI-native людей, которые встроили нейросети в ежедневную работу.

Где научиться работать с нейросетями: подборка курсов

Ниже, актуальные программы по нейросетям и искусственному интеллекту от российских школ. В подборке 316 курсов: от коротких интенсивов «за выходные» до годовых треков с трудоустройством. Можно фильтровать по уровню, длительности и цене.

Курс	Школа	Стоимость со скидкой	В рассрочку	Длительность	Обзор курса от Checkroi
Нейросети: практический курс Перейти на сайт курса	Skypro	25 990 ₽	181 667 ₽/мес.	3 месяца	Обзор курса
Нейросети для изображений и видео Перейти на сайт курса	Эдюсон	47 504 ₽	3958 ₽/мес.	2 месяца	Обзор курса
Нейросети для рабочих задач Перейти на сайт курса	Skillbox	29 800 ₽	2483 ₽/мес.	1 месяц	Обзор курса
Нейросети. Практический курс Перейти на сайт курса	Skillbox	74 900 ₽	6242 ₽/мес.	3 месяца	Обзор курса
Нейросети для каждого: как решать рабочие задачи быстрее Перейти на сайт курса	Нетология	37 300 ₽	2763 ₽/мес.	6 недель	Обзор курса
Нейросети для каждого Перейти на сайт курса	Академия Синергия	39 900 ₽	3325 ₽/мес.	3 месяца	Обзор курса
Нейросети для дизайнера Перейти на сайт курса	Skillbox	84 272 ₽	3831 ₽/мес.	4 месяца	Обзор курса
Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса	Нетология	162 500 ₽	244 ₽/мес.	24 месяца	Обзор курса
Нейросети для анализа данных Перейти на сайт курса	Нетология	31 700 ₽	2351 ₽/мес.	8 недель	Обзор курса
Нейросети для финансистов Перейти на сайт курса	Эдюсон	65 600 ₽	5466 ₽/мес.	2 месяца	Обзор курса

Нейросети: практический курс
Skypro25 990 ₽181 667 ₽/мес3 месяца
Перейти на сайт курса Обзор
Нейросети для изображений и видео
Эдюсон47 504 ₽3958 ₽/мес2 месяца
Перейти на сайт курса Обзор
Нейросети для рабочих задач
Skillbox29 800 ₽2483 ₽/мес1 месяц
Перейти на сайт курса Обзор
Нейросети. Практический курс
Skillbox74 900 ₽6242 ₽/мес3 месяца
Перейти на сайт курса Обзор
Нейросети для каждого: как решать рабочие задачи быстрее
Нетология37 300 ₽2763 ₽/мес6 недель
Перейти на сайт курса Обзор
Нейросети для каждого
Академия Синергия39 900 ₽3325 ₽/мес3 месяца
Перейти на сайт курса Обзор
Нейросети для дизайнера
Skillbox84 272 ₽3831 ₽/мес4 месяца
Перейти на сайт курса Обзор
Магистратура «Прикладной искусственный интеллект» с УрФУ
Нетология162 500 ₽244 ₽/мес24 месяца
Перейти на сайт курса Обзор
Нейросети для анализа данных
Нетология31 700 ₽2351 ₽/мес8 недель
Перейти на сайт курса Обзор
Нейросети для финансистов
Эдюсон65 600 ₽5466 ₽/мес2 месяца
Перейти на сайт курса Обзор

Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту

Если интересует именно ремесло работы с большими языковыми моделями, отдельная подборка курсов по промпт-инжинирингу. А для тех, кто хочет посмотреть, какие промпты сразу запускать в Qwen, у нас есть подборка 50 промптов для маркетолога и 50 промптов для программистов. Шаблоны написаны под ChatGPT и Claude, но работают и на Qwen, просто скопируйте в chat.qwen.ai.

Прокомментировать

Часто задаваемые вопросы

Какая модель Qwen лучшая в 2026 году?

На май 2026 года флагман семейства — Qwen 3.6 Plus, релиз 2 апреля 2026. Это закрытая модель, доступна через chat.qwen.ai бесплатно или через API в Alibaba Cloud Model Studio. У неё контекст 1 миллион токенов, гибридный режим мышления, сильна на длинных текстах, аналитике и рассуждениях. Для программирования отдельная ветка — Qwen3-Coder 480B-A35B-Instruct. Для математики и логики — QwQ-32B.

Какая модель Qwen лучше для программирования?

Qwen3-Coder 480B-A35B-Instruct. На бенчмарке SWE-bench Verified показывает 70% — это уровень GPT-5 и близко к Claude Sonnet 4.6. Контекст 256 тысяч токенов нативно и до 1 миллиона с экстраполяцией, то есть в модель можно загрузить целую кодовую базу. Через chat.qwen.ai пользоваться можно бесплатно. Для агентного кодинга (как Claude Code или Cursor) Alibaba выпустила отдельный CLI-инструмент Qwen Code.

Можно ли пользоваться Qwen бесплатно из России?

Да. Заходите на chat.qwen.ai, регистрируетесь через Google или email, переключаете модель на нужную в верхнем выпадающем списке и пользуетесь. КВН не нужен, зарубежная карта не нужна. Бесплатный лимит — около 100 сообщений в день на Qwen 3.6 Plus и безлимит на меньшие модели. Доступны генерация картинок, разбор PDF, голосовой ввод.

Нужен ли КВН для Qwen?

Нет. Сайт chat.qwen.ai и серверы Qwen API в Сингапуре и Гонконге работают из России напрямую. Более того, с включённым КВН иногда наоборот возникают проблемы с доступом. Если страница не открывается — проверьте, что КВН выключен, и попробуйте очистить cookies.

Как оплатить Qwen API из России?

Три способа на 2026 год. Первый и самый простой — через российских провайдеров-посредников: AITUNNEL, GPTunneL, ProxyAPI. Пополняете баланс картой РФ в рублях, получаете API-ключ, работаете. Минимальное пополнение обычно 300–500 ₽. Второй — через OpenRouter, если есть зарубежная карта (Казахстан, Армения, Грузия, Турция). Третий — прямой контракт с Alibaba Cloud, подходит юрлицам.

Какой компьютер нужен, чтобы запустить Qwen локально?

Зависит от модели. Qwen 3 4B запустится даже на ноутбуке с 16 ГБ оперативной памяти без отдельной видеокарты. Qwen 3.6 27B в Q4-квантизации помещается в одну RTX 4060 Ti 16GB или Apple M2 Max. QwQ-32B и Qwen 3.6 35B-A3B хорошо идут на RTX 4090 с 24 ГБ VRAM. Для полноразмерного Qwen3-Coder 480B нужны 4 серверные видеокарты A100 80GB. Запуск проще всего через программу Ollama.

Qwen или DeepSeek — что выбрать?

На общих задачах и текстах Qwen 3.6 Plus и DeepSeek V3.2 идут примерно на равных. DeepSeek чуть сильнее на программировании и reasoning из коробки, Qwen — универсал, поддерживает больше языков и форматов (картинки, видео, длинные документы). Если задачи в основном про код и математику — попробуйте сначала DeepSeek. Если универсальный AI-помощник для работы — Qwen. Оба бесплатно работают из России.

Qwen на русском работает нормально?

Да. Qwen 3.6 поддерживает 119+ языков, русский — один из основных. Качество русского текста на уровне ChatGPT и Claude. На разговорной речи, технических темах и деловой переписке проблем нет. На очень редких диалектах и тонкой стилистике на узких темах иногда заметнее, что модель китайская — стоит вычитывать живым редактором.

Безопасно ли отправлять данные в Qwen?

Для публичных и низкочувствительных данных — да, без проблем. Для внутренних документов компании — в настройках chat.qwen.ai отключите «Use my data to improve models», тогда чаты не идут в обучающую выборку. Для критически чувствительных данных (медицина, юриспруденция, корпоративные секреты, персональные данные клиентов по 152-ФЗ) облачные сервисы любого провайдера не подходят. Нужно ставить open-weights модель (Qwen 3.6 27B или 35B-A3B) на собственный сервер внутри вашего контура.

Сколько стоит Qwen API в рублях?

Тарифы на май 2026 года в рублях при курсе 92 ₽ за доллар. Qwen 3.6 Plus: около 120 ₽ за 1 миллион входных токенов и около 720 ₽ за миллион выходных. Qwen3-Coder 480B: 10 ₽ вход и 74 ₽ выход. Qwen 3.5 Plus: 28 ₽ и 166 ₽. У российских провайдеров цены на 30–50% выше из-за маржи, но зато оплата картой РФ. Типичный рабочий день копирайтера или маркетолога обходится в 30–50 ₽.

Ваня Буявец

Основатель Checkroi, продюсер, эксперт в выборе онлайн-курсов

Все статьи автора

Оставить комментарий

0 комментариев

Оставьте комментарий

Напишите, что думаете. Нам важно ваше мнение!

Qwen3.6 Plus vs Qwen3.6 27B vs Qwen3-Coder: какую модель Qwen выбрать в 2026

Главное за 60 секундСкопировано

Как начать прямо сейчас: chat.qwen.ai за 3 минутыСкопировано

Qwen: что это и почему все о ней говорят в 2026Скопировано

Кто такой Alibaba и зачем им свой ChatGPT

Что значит «семья моделей» на пальцах

Чем Qwen отличается от ChatGPT и Claude

Семейство Qwen в 2026: карта поколенийСкопировано

Qwen 3.6 Plus: флагман для текстов, рассуждений и сложных задачСкопировано

Что внутри Qwen 3.6 Plus

Где Plus незаменим

Где Plus: это перебор

Кейс редакции

Qwen 3.6 27B: рабочая лошадка с открытыми весамиСкопировано

Что внутри 27B

Где 27B незаменим

Что нужно по железу

Где 27B: это перебор

Qwen 3.6 35B-A3B: MoE для тех, у кого есть видеокартаСкопировано

Зачем MoE

Где 35B-A3B сильна

Где 35B-A3B слабее

Если непонятно, что брать: 27B или 35B-A3B

Qwen3-Coder 480B-A35B-Instruct: для агентного программированияСкопировано

Что внутри

Что значит «агентный кодинг»

Где Qwen3-Coder незаменим

Где Qwen3-Coder слабее

QwQ-32B: модель, которая умеет рассуждать вслухСкопировано

Что значит reasoning

Где QwQ-32B незаменим

Что нужно по железу

Что НЕ делать с QwQ

Qwen2.5-VL: когда нужны картинки и видеоСкопировано

Что умеет

Размеры

Где Qwen2.5-VL незаменим

Что внутри Qwen: три вещи, которые надо пониматьСкопировано

MoE простыми словами

Thinking mode и non-thinking mode

Контекст 1M токенов и когда он нужен

Сравнение Qwen 3.6 Plus, 27B, 35B-A3B и Qwen3-Coder по 10 параметрамСкопировано

Бенчмарки: кто на цифрах лучшеСкопировано

Цены: сколько Qwen стоит в долларах и рубляхСкопировано

Тарифы API

Бесплатный тариф Qwen Chat

Как оплатить API из России

Матрица «задача → модель → стоимость»Скопировано

Шесть сценариев: какая Qwen под какую профессиюСкопировано

Сценарий 1: маркетолог с контент-планом

Сценарий 2: студент с учебником на 200 страниц

Сценарий 3: малый бизнес с чат-ботом на сайте

Сценарий 4: аналитик с Excel и дашбордами

Сценарий 5: самозанятый разработчик

Сценарий 6: энтузиаст с домашним сервером

Pipeline-паттерн: как комбинировать модели и экономитьСкопировано

Qwen vs GPT-5, Gemini 3.1 Pro Preview, Claude Opus 4.8 и DeepSeek V3.2Скопировано

Qwen 3.6 Plus vs GPT-5

Qwen 3.6 Plus vs Claude Opus 4.8

Qwen 3.6 Plus vs Gemini 3.1 Pro Preview

Qwen 3.6 Plus vs DeepSeek V3.2

Qwen3-Coder vs Claude Sonnet 4.6 vs GPT-5 на коде

Доступ из России: без КВН и без зарубежной картыСкопировано

Qwen Chat бесплатно через chat.qwen.ai

Подключение API

Что Alibaba делает с вашими данными

Локальный запуск Qwen: что нужно по железуСкопировано

Таблица «видеокарта → какая Qwen зайдёт»

Ollama одной командой

Квантизация: как ужать большую модель

5 типичных ошибок при выборе моделиСкопировано

Ошибка 1: брать самую большую модель «на всякий случай»

Ошибка 2: путать Qwen 2.5, Qwen 3 и Qwen 3.6

Ошибка 3: использовать обычную модель там, где нужен reasoning

Ошибка 4: использовать reasoning там, где он не нужен

Ошибка 5: забывать про контекст

Как переключать модели в Qwen Chat и APIСкопировано

В Qwen Chat (сайт)

В API

В Ollama (локально)

Главное за 60 секунд

Как начать прямо сейчас: chat.qwen.ai за 3 минуты

Qwen: что это и почему все о ней говорят в 2026

Семейство Qwen в 2026: карта поколений

Qwen 3.6 Plus: флагман для текстов, рассуждений и сложных задач

Qwen 3.6 27B: рабочая лошадка с открытыми весами

Qwen 3.6 35B-A3B: MoE для тех, у кого есть видеокарта

Qwen3-Coder 480B-A35B-Instruct: для агентного программирования

QwQ-32B: модель, которая умеет рассуждать вслух

Qwen2.5-VL: когда нужны картинки и видео

Что внутри Qwen: три вещи, которые надо понимать

Сравнение Qwen 3.6 Plus, 27B, 35B-A3B и Qwen3-Coder по 10 параметрам

Бенчмарки: кто на цифрах лучше

Цены: сколько Qwen стоит в долларах и рублях

Матрица «задача → модель → стоимость»

Шесть сценариев: какая Qwen под какую профессию

Pipeline-паттерн: как комбинировать модели и экономить

Qwen vs GPT-5, Gemini 3.1 Pro Preview, Claude Opus 4.8 и DeepSeek V3.2

Доступ из России: без КВН и без зарубежной карты

Локальный запуск Qwen: что нужно по железу

5 типичных ошибок при выборе модели

Как переключать модели в Qwen Chat и API

Финальная шпаргалка: какая Qwen для какой ситуации

Безопасность данных: на что обратить внимание

Чего Qwen всё ещё не умеет

Главная мысль и с чего начать конкретно вам

Где научиться работать с нейросетями: подборка курсов