В апреле 2026 года Alibaba выкатила Qwen 3.6, уже шестое поколение своей нейросети за три года. И это значит две вещи. Первая: гонка китайского AI идёт быстрее западной. Вторая: разобраться, какую именно Qwen брать сегодня, стало по-настоящему сложно, потому что в живых одновременно крутятся Qwen 2.5, Qwen 3, Qwen 3.5, Qwen 3.6, Qwen3-Coder, QwQ-32B и Qwen2.5-VL.
В этой статье мы прошлись по всему семейству Qwen на май 2026 года. Собрали актуальные характеристики, цены в рублях, разобрали матрицу из 12 типовых задач с рекомендацией модели и показали, что потянет ваш ноутбук, а что нет.
Если вы только начинаете знакомиться с нейросетями вообще, загляните сначала в нашу обзорную статью про AI-агентов: там разобрали базу, без которой Qwen звучит как иероглифы.
А если хочется сравнить Qwen с западным конкурентом, у нас есть подробный гайд по моделям Claude в том же формате. На контрасте быстро видно, чем китайский подход отличается от американского.
Статья пригодится не только программистам. AI на работе сегодня нужен маркетологам, аналитикам, копирайтерам, продактам и всем, кто хочет автоматизировать рутину. Qwen умеет всё, что и ChatGPT, но бесплатно, на русском и без зарубежной карты. Это сильный аргумент. Особенно, после того как ребята из обзора бесплатных альтернатив Claude Code начали массово переезжать на китайские LLM.
Если хочется освоить нейросети системно, посмотрите нашу подборку курсов по нейросетям и искусственному интеллекту: 316 программ от коротких интенсивов до годовых треков. А для тех, кто хочет точечно прокачать ремесло, отдельная подборка курсов по промпт-инжинирингу.
Дальше, по делу.
Главное за 60 секунд
Совсем коротко, если читать всё некогда:
- Qwen 3.6 Plus. флагман на май 2026. Через сайт и через API Alibaba. Платный, но дешевле GPT-5 в три раза. Подходит для длинных текстов, сложных рассуждений, аналитики, исследований.
- Qwen 3.6 27B. открытая модель, можно скачать и запустить на своей видеокарте. Чуть слабее Plus, зато бесплатна. Подходит почти всем.
- Qwen3-Coder. отдельная ветка для программирования и агентного кодинга. Если задача про код, берите её.
- Qwen Chat на сайте chat.qwen.ai. бесплатный чат-бот, работает из России без КВН. Это самый простой способ попробовать любую модель Qwen без регистраций и карт.
Если непонятно ничего из вышесказанного, заходите на chat.qwen.ai, регистрируйтесь через Google, переключите модель на «Qwen3.6-Plus» в выпадающем списке вверху и пробуйте. Дальше можно читать спокойно.
Как начать прямо сейчас: chat.qwen.ai за 3 минуты
Самый частый барьер у новичка с китайскими сервисами, страх «там всё на иероглифах, я заблужусь». Спойлер: с Qwen Chat этого не случится. Интерфейс на английском, переводится одной кнопкой на русский. Регистрация привычная, через Google. Карты не просят. КВН не нужен.
Полная пошаговая последовательность:
- Откройте chat.qwen.ai. Сайт открывается из любого региона России. Если страница не грузится, проверьте, что у вас нет блокировки cookies от сторонних сайтов и что КВН выключен (с КВН иногда наоборот не работает).
- Нажмите «Sign in» в правом верхнем углу. Появится окно с тремя вариантами: Google, GitHub, email. Самый быстрый, Google: одно нажатие, выбор аккаунта, готово.
- Сразу обратите внимание на верх окна. Под полем ввода, две кнопки. Слева выпадающий список моделей, справа, переключатель «Thinking». В списке по умолчанию стоит общая модель. Откройте его и выберите «Qwen3.6-Plus».
- Если предстоит сложная задача. рассуждения, длинная аналитика, разбор документа, включите «Thinking». Если простая, оставьте выключенным.
- Можно прикрепить файл. Кнопка с иконкой скрепки слева от поля ввода. Подходит PDF, Word, Excel, изображение, аудио. Qwen разберёт документ сам.
- Пишите запрос на русском. Qwen понимает русский на уровне ChatGPT и Claude. Никаких хитростей не нужно.
В интерфейсе чата есть три полезные настройки, которые стоит включить с первого дня:
- Web Search. Иконка глобуса под полем ввода. Когда включена, Qwen ищет в интернете и добавляет в ответ свежие данные. Без неё модель отвечает только из обучающих данных, и её знания обрезаны примерно на ноябре 2025.
- Code Interpreter. Запускает Python-код прямо внутри чата. Полезно для расчётов, анализа Excel-файлов, построения графиков.
- Image generation. Кнопка «Create image» в меню действий. Бесплатно, без лимитов, качество не уступает Midjourney v7.
Если уже сейчас хочется попробовать что-то конкретное, заберите наши готовые промпты. Для маркетинга работают 50 промптов для маркетолога, для разработчиков — 50 промптов для программистов. Шаблоны написаны для Claude и ChatGPT, но в Qwen работают без правок: просто копируйте и вставляйте.
Qwen: что это и почему все о ней говорят в 2026
Qwen (читается «Квен», полное название Tongyi Qianwen, 通义千问), это семейство больших языковых моделей от китайской компании Alibaba. Большая языковая модель (или LLM, Large Language Model), это нейросеть, обученная на гигантском объёме текстов, которая умеет отвечать на вопросы, писать тексты, программировать и разбираться с документами. Ровно то же самое, что и ChatGPT или Claude.
Первая Qwen вышла осенью 2023 года. С тех пор Alibaba отгружает новое поколение примерно раз в полгода. И каждое следующее поколение режет цены, добавляет функции и подтягивается ближе к лидерам рейтингов.
Кто такой Alibaba и зачем им свой ChatGPT
Alibaba, крупнейший китайский технологический гигант. У них есть AliExpress (тот самый), облачное подразделение Alibaba Cloud (китайский аналог Amazon Web Services) и собственный AI-отдел, который занимается Qwen.
Стратегия у Alibaba простая: догнать OpenAI и Anthropic качеством, обогнать ценой и сделать большинство моделей бесплатными для скачивания. У нас всё ещё думают, что китайские нейросети — это плохая копия. На самом деле к маю 2026 Qwen на многих задачах догнал, а на некоторых обогнал западные модели.
Что значит «семья моделей» на пальцах
Когда говорят «Qwen», имеют в виду не одну нейросеть. Это бренд, под которым выходит десяток разных моделей. У каждой свой характер и своё применение:
- Одни модели маленькие, их можно запустить на ноутбуке.
- Другие большие, для них нужна серверная видеокарта или подключение через API.
- Одни заточены под текст и рассуждения.
- Другие, под программирование.
- Третьи, под картинки и видео.
Внутри семьи Qwen есть несколько веток. Главная, Qwen 3.6 (чат и общие задачи). Отдельно идёт Qwen3-Coder (программирование), QwQ-32B (модель, которая умеет рассуждать вслух) и Qwen2.5-VL (для картинок). О каждой расскажем подробно ниже.
Чем Qwen отличается от ChatGPT и Claude
Если совсем коротко, тремя вещами:
- Цена. Qwen API в разы дешевле американских конкурентов. Qwen 3.6 Plus стоит около $1,3 за миллион входных токенов. GPT-5, около $5. Claude Opus 4.7, около $15. На длинных задачах разница огромная.
- Бесплатный чат без КВН. chat.qwen.ai работает из России напрямую, без обходных путей. ChatGPT и Claude из России без КВН не открываются.
- Открытые веса. Большинство моделей Qwen можно скачать с Hugging Face (репозиторий нейросетей) под свободной лицензией Apache 2.0 и запустить у себя на компьютере или сервере. ChatGPT и Claude так не умеют, там работа только через облако.
Компромисс есть. Qwen чуть слабее на самых сложных задачах: продвинутая аналитика, сложная математика, очень длинные рассуждения. Если вам нужна модель «лучшая в мире», это пока всё ещё Claude Opus 4.7 или GPT-5.2 Pro. Если нужна модель «достаточно хорошая для 90% задач, бесплатно и из России», это Qwen.
Семейство Qwen в 2026: карта поколений
Самая частая ошибка новичка, натолкнуться на статью про Qwen 2.5 в 2026 году и подумать, что речь о последней версии. Это давно не так. Поколения сменяют друг друга примерно каждые шесть месяцев, и то, что было свежим осенью 2024, сегодня, музей.
| Поколение | Дата | Статус в мае 2026 | Когда подходит |
|---|---|---|---|
| Qwen 1 / 1.5 | 2023 | Устарело | Не использовать |
| Qwen 2 / 2.5 | 2024 | Устарело для чата, актуально для Vision | Только Qwen2.5-VL для картинок |
| Qwen 3 | апрель 2025 | Прошлое поколение, всё ещё в ходу | Если уже работает у вас локально, можно оставить |
| Qwen 3 Coder | июль 2025 | Актуально | Для программирования и агентного кодинга |
| Qwen 3.5 / Plus | февраль 2026 | Прошлое поколение чата | Если 3.6 недоступен, можно как fallback |
| Qwen 3.6 | апрель 2026 | Текущий флагман | Берите по умолчанию |
| QwQ-32B | март 2025 | Актуально для рассуждений | Когда нужно «думать вслух» по сложной задаче |
Дальше, отдельный разбор каждой актуальной модели. Сначала Qwen 3.6, потом отдельные ветки.
Qwen 3.6 Plus: флагман для текстов, рассуждений и сложных задач
Qwen 3.6 Plus вышла 2 апреля 2026 года. Это закрытая модель, её нельзя скачать. Доступ только через сайт chat.qwen.ai или через API в Alibaba Cloud Model Studio (платформа Alibaba для подключения к их моделям программно).
Что внутри Qwen 3.6 Plus
Размер модели Alibaba не раскрывает — это коммерческая тайна. По косвенным признакам, около 400 миллиардов параметров общих и около 30 миллиардов активных. Контекстное окно, 1 миллион токенов. Это значит, что в модель за раз можно загрузить, скажем, всю «Войну и мир» вместе с комментариями. Или базу знаний компании. Или годовой отчёт в PDF целиком.
Plus поддерживает гибридный режим мышления (он же hybrid thinking mode). Это значит, что модель умеет работать в двух режимах прямо в одном разговоре:
- Thinking mode. модель сначала думает пошагово, иногда несколько минут, потом выдаёт ответ. Подходит для сложных задач: математика, аналитика, длинные рассуждения.
- Non-thinking mode. модель отвечает сразу, без раздумий. Подходит для простых запросов: «переведи фразу», «перепиши абзац», «дай идею для поста».
Переключатель режима живёт прямо в интерфейсе чата. Если задача простая, оставляйте non-thinking, ответ будет быстрее и дешевле. Если непонятно, какой режим взять, берите thinking, ничего страшного, кроме нескольких лишних секунд ожидания.
Где Plus незаменим
Список задач, где именно Plus имеет смысл, а не открытые модели:
- Анализ большого PDF целиком (учебник, годовой отчёт, многостраничный договор), благодаря контексту 1M токенов.
- Длинные тексты на русском, статья, лонгрид, серия постов в Telegram. Plus аккуратнее держит структуру и стиль на длинных дистанциях.
- Многошаговые рассуждения, задачи уровня «дано условие из 5 пунктов, сделай вывод».
- Финансовые расчёты и аналитика с несколькими переменными.
- Перевод и адаптация контента между языками (Plus поддерживает 119+ языков).
Где Plus: это перебор
Для простых задач Plus можно не брать:
- Короткие посты, идеи, brainstorm, справится бесплатный чат на любой Qwen.
- Перевод одной фразы, переплата.
- Программирование, берите Qwen3-Coder, он по коду сильнее.
- Картинки и видео, Plus текстовая, нужна Qwen2.5-VL.
Кейс редакции
Мы в Checkroi проверяли Plus на двух задачах. Первая, переписать 8000-словный обзор Cursor под новые тарифы. Plus справился за 40 секунд в non-thinking, сохранил структуру и 90% фактов. Пришлось вручную поправить пять чисел.
Вторая задача, разобрать 300-страничный годовой отчёт публичной компании и найти противоречия между разделом «Управление рисками» и фактическими решениями совета директоров. Plus в thinking mode потратил три минуты и нашёл четыре противоречия. Это уровень junior-аналитика за 15 минут работы. Стоимость задачи, около 50 рублей.
Qwen 3.6 27B: рабочая лошадка с открытыми весами
Qwen 3.6 27B вышла 22 апреля 2026. Это плотная (dense) модель на 27 миллиардов параметров. «Плотная» значит, что на каждый запрос работают все 27 миллиардов параметров одновременно. В отличие от MoE (Mixture of Experts), о которой ниже, плотная модель проще в запуске и стабильнее в качестве.
Что внутри 27B
Контекстное окно, 128 тысяч токенов. Это меньше, чем у Plus, но всё ещё много: примерно 300 страниц текста за раз. Модель, open-weights, под лицензией Apache 2.0. Это значит, что её веса можно скачать с Hugging Face или ModelScope (китайский аналог Hugging Face) и запустить локально. Бесплатно и без оглядки на сервер Alibaba.
Где 27B незаменим
- Сценарии, где важна приватность данных, медицина, юриспруденция, корпоративные документы. Модель работает на вашем сервере, ничего никуда не утекает.
- Стабильные пайплайны, когда нужна модель, которая отрабатывает один и тот же сценарий тысячи раз без сюрпризов.
- Замена платного API, если задача терпит, что ответ придёт за 5 секунд, а не за 2.
- Чат-боты в бизнесе, поставил один раз на сервер, дальше нет ежемесячных счетов.
Что нужно по железу
27B в полной точности (FP16) требует около 54 ГБ видеопамяти. Это две видеокарты RTX 4090 или одна A100. Дорого.
В квантизованном виде (Q4_K_M, это сжатие весов модели, чтобы они помещались в меньшую видеокарту с потерей качества около 2–3%), около 17 ГБ. Это уже один RTX 4090, RTX 4070 Ti Super или Apple M2 Max c 32 ГБ объединённой памяти. Звучит дороже, чем подписка ChatGPT Plus, но это разовая трата.
Где 27B: это перебор
Если у вас нет видеокарты от 16 ГБ VRAM, берите 27B через API провайдеров (есть несколько российских с оплатой в рублях) или через Qwen Chat на сайте Alibaba. Покупать карту специально под Qwen имеет смысл, если планируете гонять её десятки часов в неделю.
Qwen 3.6 35B-A3B: MoE для тех, у кого есть видеокарта
Qwen 3.6 35B-A3B вышла 16 апреля 2026, на неделю раньше 27B. Конструкция модели заметно отличается. Это MoE (Mixture of Experts), архитектура с «экспертами». В модели 35 миллиардов параметров всего, но на каждый запрос работают только 3 миллиарда, те, которые подходят под конкретный тип задачи. Поэтому маркировка «35B-A3B»: 35 всего, 3 активных (Active).
Зачем MoE
Преимущество MoE в скорости. Внутри модели сидят узкие «специалисты»: один лучше разбирается в программировании, другой, в литературе, третий, в математике. На вход приходит запрос, маршрутизатор выбирает 2–3 нужных эксперта, и дальше отвечает только их часть. Получается, по качеству модель близка к большой плотной 27B, но работает в 3–4 раза быстрее и на той же видеокарте.
Минус, модель чуть менее предсказуема. Иногда маршрутизатор отправляет запрос «не туда», и ответ выходит странным. На сложных задачах это заметнее, чем на простых.
Где 35B-A3B сильна
- Быстрые ответы на простые задачи в большом объёме, чат-бот поддержки, генерация тегов, классификация писем.
- Локальный pipeline, где скорость важна больше, чем стабильность.
- Видеокарты с 16–24 ГБ VRAM, модель в Q4 квантизации помещается легко.
Где 35B-A3B слабее
- Длинные рассуждения, берите 27B или Plus.
- Сложная математика, лучше QwQ-32B.
- Программирование, Qwen3-Coder.
Если непонятно, что брать: 27B или 35B-A3B
Простое правило: если у вас одна видеокарта на 16–24 ГБ VRAM и вы не уверены, берите 27B. Она стабильнее, проще в запуске, ведёт себя предсказуемее. 35B-A3B, для тех, кто уже знает, зачем ему нужна именно MoE.
Qwen3-Coder 480B-A35B-Instruct: для агентного программирования
Qwen3-Coder, отдельная ветка для разработчиков. Главная модель серии вышла в июле 2025, в 2026 году она всё ещё актуальна и конкурирует с Claude Sonnet 4.6 на задачах кодинга.
Что внутри
Полное название, Qwen3-Coder-480B-A35B-Instruct. 480 миллиардов параметров всего, 35 миллиардов активных. Архитектура MoE. Контекстное окно, 256 тысяч токенов нативно и до 1 миллиона при экстраполяции. Это значит, что модели можно скормить целую кодовую базу средней программы и попросить отрефакторить.
Модель открытая, лицензия Apache 2.0, веса на Hugging Face. Запустить её локально в полном размере почти нереально, нужно несколько A100. Но Alibaba также выпустила меньшие версии:
- Qwen3-Coder-30B-A3B-Instruct. 30 млрд параметров, 3 млрд активных. Помещается в один RTX 4090 в Q4.
- Qwen3-Coder-Next. экспериментальная компактная версия, дешевле всех через API.
Что значит «агентный кодинг»
Агентный режим — это когда модель не просто пишет код по запросу, а умеет сама запускать команды, читать ошибки, править файлы и идти по задаче до победного конца. Похоже на то, как работает Cursor в режиме Composer или Claude Code в терминале.
Qwen3-Coder специально дообучен под этот сценарий. У него хорошо отрабатывает tool calling (вызов внешних инструментов) и multi-step reasoning (многошаговые рассуждения). Alibaba дополнительно выпустила инструмент Qwen Code, это CLI-агент, аналог Claude Code, заточенный под Qwen3-Coder.
Где Qwen3-Coder незаменим
- Замена платного Claude Code, Cursor или GitHub Copilot, если хочется бесплатно.
- Локальная разработка в закрытом контуре, где код нельзя отправлять в облако.
- Рефакторинг больших кодовых баз благодаря контексту 256K–1M.
- Автоматизация рутинных задач, миграции, переписывание тестов, генерация заглушек.
Для подробного сравнения с Claude Code и Cursor посмотрите наш отдельный разбор «Claude Code vs Cursor», там же есть ссылки на бесплатные альтернативы, включая Qwen.
Где Qwen3-Coder слабее
- На очень редких языках программирования (Erlang, OCaml, Haskell), Claude чуть точнее.
- На задачах архитектуры и большого дизайна, Plus или Claude Opus справятся аккуратнее.
QwQ-32B: модель, которая умеет рассуждать вслух
QwQ (читается «Кью-Кью»), это reasoning-модель (модель для рассуждений) от Alibaba. Релиз, март 2025. На май 2026 это всё ещё лучшая компактная reasoning-модель в семействе Qwen, и она конкурирует с DeepSeek-R1 и OpenAI o4-mini.
Что значит reasoning
Reasoning-модель — это нейросеть, которую специально обучили думать пошагово перед ответом. У обычной модели весь процесс мышления спрятан, она просто выдаёт результат. У reasoning-модели видны все шаги: «Так, сначала разберём условие. Дано… Значит, нужно… Проверим вариант 1… Не подходит, потому что…». Это похоже на то, как студент решает задачу на бумаге.
Такой подход даёт огромный выигрыш на математике, логических задачах и многошаговом анализе. Расплата, модель отвечает медленнее и тратит больше токенов на «внутренние размышления».
Где QwQ-32B незаменим
- Олимпиадная математика и логические головоломки.
- Сложный анализ данных с несколькими шагами.
- Тонкая работа с условиями (например, юридический разбор контракта).
- Задачи с ловушками, где нужно проверять каждое допущение.
Что нужно по железу
QwQ-32B, open-weights, 32 миллиарда параметров, плотная архитектура. В Q4 квантизации помещается в 24 ГБ VRAM, то есть в RTX 3090, RTX 4090 или Apple M2/M3 Max. Если железа нет, модель доступна через API и бесплатно через chat.qwen.ai.
Что НЕ делать с QwQ
Простые задачи лучше отдавать обычным моделям. QwQ на запрос «придумай заголовок для поста» будет 30 секунд рассуждать, прежде чем выдать результат, и это будет дороже и медленнее, чем просто Qwen 3.6 27B.
Qwen2.5-VL: когда нужны картинки и видео
Qwen2.5-VL, это vision-модель, то есть модель, которая понимает не только текст, но и картинки. Аббревиатура VL = Vision-Language. Релиз, конец 2024 года, в 2026 году эта линейка по-прежнему актуальна. Свежее семейство Qwen 3.6 пока не получило vision-аналог.
Что умеет
- Распознавать содержимое картинок — «что на фото?», «прочитай этот скриншот», «опиши схему».
- Анализировать таблицы и графики на скриншотах.
- Читать рукописный текст и документы.
- Разбирать длинные видео, Qwen2.5-VL умеет работать с видео до часа.
- Управлять UI, у модели есть режим «агент в браузере и на телефоне», когда она видит экран и кликает по элементам.
Размеры
В линейке Qwen2.5-VL пять вариантов: 3B, 7B, 32B, 72B и Max (закрытая, через API). Для большинства задач хватает 7B, её можно запустить локально на 12 ГБ VRAM. Для серьёзной работы с документами, 72B через API.
Где Qwen2.5-VL незаменим
- Парсинг сканов документов, чеков, накладных.
- Описание товаров для интернет-магазина по фотографиям.
- Анализ скриншотов конкурентов в маркетинге.
- Поддержка пользователей, где они шлют скриншоты ошибок.
Что внутри Qwen: три вещи, которые надо понимать
Чтобы спокойно ориентироваться во всех моделях семьи, достаточно понять три концепции. Если их ухватить, дальше любая новая Qwen будет читаться как продолжение знакомой истории.
MoE простыми словами
MoE (Mixture of Experts), это архитектура, где модель внутри поделена на много мелких подсетей, каждая из которых стала «экспертом» в своей теме. Перед моделью стоит маршрутизатор (router), который читает входящий запрос и решает: «Этот вопрос про код, пусть отвечают эксперты 7, 12 и 28». Остальные эксперты остаются спать.
В обозначении «Qwen3-Coder-480B-A35B» 480B, общее число параметров (сколько весов хранится в модели), A35B, активные параметры (сколько работают на каждый запрос). По вычислительной нагрузке модель ведёт себя как 35B, а по широте знаний, как 480B. Это и есть главный фокус MoE.
Аналогия из жизни: у вас в офисе 100 сотрудников разных специальностей, но на каждое конкретное собрание приходят только 8 из них, которым тема релевантна. Зарплата всем, но на собрании нагрузка не 100 человек, а 8. Получается экономия и скорость без потери широты экспертизы.
Thinking mode и non-thinking mode
Это два режима работы одной и той же модели. Включаются переключателем в интерфейсе chat.qwen.ai или флагом в API-запросе.
- Non-thinking. модель сразу выдаёт ответ. Быстро, дёшево, подходит для простых задач.
- Thinking. модель сначала пишет «внутренний монолог» (его обычно скрывают от пользователя или показывают свёрнутым), а потом финальный ответ. Медленнее в 5–10 раз, токенов тратит больше, но качество на сложных задачах сильно лучше.
Правило простое: для коротких ответов, non-thinking. Для всего, где есть «надо подумать», thinking. На chat.qwen.ai режим обычно выбирается одной кнопкой.
Контекст 1M токенов и когда он нужен
Контекстное окно — это сколько текста модель может удержать в голове в рамках одного разговора. Один токен — это примерно 0,75 слова в английском или 0,5 слова в русском. То есть 1 миллион токенов — это примерно 500 тысяч русских слов или 1500 страниц текста.
Когда миллион пригодится:
- Анализ годового отчёта на 200 страниц.
- Загрузка корпоративной базы знаний целиком.
- Сравнение пяти длинных договоров между собой.
- Разбор большого исходного кода в одном разговоре.
Когда миллион не нужен:
- Любая задача из одного-двух абзацев.
- Большинство деловых писем, постов, статей.
- Программирование в небольшом проекте.
Для 90% задач хватает контекста 32–128 тысяч токенов — это уровень 27B и 35B-A3B. Платить за 1M есть смысл, когда вы упираетесь в ограничение.
Сравнение Qwen 3.6 Plus, 27B, 35B-A3B и Qwen3-Coder по 10 параметрам
| Параметр | Qwen 3.6 Plus | Qwen 3.6 27B | Qwen 3.6 35B-A3B | Qwen3-Coder 480B |
|---|---|---|---|---|
| Тип | Закрытая (API + чат) | Открытая, dense | Открытая, MoE | Открытая, MoE |
| Параметры (общие / активные) | ~400B / ~30B | 27B / 27B | 35B / 3B | 480B / 35B |
| Контекст | 1 000 000 | 128 000 | 128 000 | 256 000 (до 1M) |
| Гибридный режим | Да | Да | Да | Только non-thinking |
| VRAM для локала (Q4) | Невозможно | ~17 ГБ | ~20 ГБ | ~270 ГБ |
| Скорость инференса | Средняя | Средняя | Высокая | Средняя |
| Цена API вход | $1,3 / 1M | $0,05–0,30 | $0,05–0,18 | $0,11 / 1M |
| Цена API выход | $7,8 / 1M | $0,30–1,80 | $0,30–1,20 | $0,80 / 1M |
| Сильная сторона | Длинные тексты, рассуждения | Универсал на любом железе | Скорость, MoE-экономия | Программирование и агенты |
| Слабая сторона | Платная, закрытая | Не быстрее GPT-5 | Менее предсказуема | Не для текстов |
Бенчмарки: кто на цифрах лучше
Бенчмарки — это стандартные тесты, по которым принято сравнивать модели. Они дают объективный взгляд, но не заменяют живое тестирование под вашу задачу.
| Бенчмарк | Что мерит | Qwen 3.6 Plus | Qwen 3.6 27B | Qwen3-Coder 480B | QwQ-32B | GPT-5 | Claude Opus 4.7 |
|---|---|---|---|---|---|---|---|
| MMLU-Pro | Общие знания | 82 | 74 | 72 | 71 | 87 | 89 |
| HumanEval+ | Программирование | 88 | 76 | 92 | 74 | 92 | 94 |
| SWE-bench Verified | Реальные баги в коде | 54 | 38 | 70 | 40 | 72 | 78 |
| AIME 2024 | Олимпиадная математика | 68 | 52 | 50 | 85 | 78 | 82 |
| MATH-500 | Школьная математика | 89 | 83 | 80 | 91 | 92 | 94 |
| RULER 128K | Длинный контекст | 92 | 78 | 85 | 74 | 89 | 91 |
Главные выводы из цифр:
- На общих знаниях Qwen всё ещё отстаёт от GPT-5 и Claude Opus на 5–7 пунктов. В живой работе это заметно на узких темах.
- На программировании Qwen3-Coder уже на одном уровне с GPT-5 и близко к Claude Opus.
- На олимпиадной математике QwQ-32B обгоняет даже GPT-5 за счёт reasoning-режима.
- На длинном контексте Qwen 3.6 Plus идёт ноздря в ноздрю с конкурентами.
Цены: сколько Qwen стоит в долларах и рублях
Сразу важная оговорка. Цены на API дальше, официальные тарифы Alibaba Cloud в долларах. В России картой РФ напрямую оплатить Alibaba нельзя. Поэтому большинство пользуется одним из двух способов: бесплатный чат на chat.qwen.ai или российские провайдеры-посредники.
Тарифы API
| Модель | Вход за 1M токенов | Выход за 1M токенов | Бесплатный тариф |
|---|---|---|---|
| Qwen 3.6 Plus | $1,3 / ~120 ₽ | $7,8 / ~720 ₽ | 1M токенов для новых аккаунтов |
| Qwen 3.6 Max-Preview | $1,3 / ~120 ₽ | $7,8 / ~720 ₽ | 1M токенов |
| Qwen 3.5 Plus | $0,3 / ~28 ₽ | $1,8 / ~166 ₽ | 1M токенов |
| Qwen3-Coder 480B | $0,11 / ~10 ₽ | $0,8 / ~74 ₽ | 1M токенов |
| Qwen 3.6 27B (open) | $0,3 / ~28 ₽ | $1,8 / ~166 ₽ | Через российских провайдеров |
| Qwen 3.6 35B-A3B (open) | $0,18 / ~17 ₽ | $1,2 / ~110 ₽ | Через российских провайдеров |
| QwQ-32B | $0,2 / ~18 ₽ | $0,8 / ~74 ₽ | Бесплатно через chat.qwen.ai |
Курс взят 92 ₽ за доллар на середину мая 2026. У российских провайдеров цены обычно на 30–50% выше из-за маржи, но зато оплата в рублях картой РФ.
Бесплатный тариф Qwen Chat
Самое важное, на chat.qwen.ai можно бесплатно пользоваться всеми моделями семейства. Лимиты есть, но щедрые:
- Около 100 сообщений в день для Qwen 3.6 Plus.
- Безлимитно для меньших моделей.
- Бесплатная генерация картинок через встроенную модель.
- Бесплатная работа с документами и файлами.
Для большинства пользователей этого хватает с запасом. API нужен только тем, кто строит свои продукты или гоняет большие пайплайны.
Как оплатить API из России
Три рабочих способа на май 2026:
- Российские провайдеры-посредники. AITUNNEL, GPTunneL, ProxyAPI и ещё пара десятков сервисов. Принцип одинаковый: вы пополняете рублёвый баланс картой РФ, провайдер прокидывает ваши запросы в Alibaba и берёт комиссию. Минимальное пополнение, обычно 300–500 ₽.
- OpenRouter через зарубежную карту. OpenRouter, агрегатор, который объединяет все большие модели. Если у вас есть карта Казахстана, Армении, Грузии или Турции, можно платить напрямую.
- Прямой контракт с Alibaba Cloud. Подходит юрлицам, которые готовы оформить договор с китайским провайдером. Физикам из России, почти нереально.
Самый простой путь, через российского посредника. У большинства из них API совместим с OpenAI и Anthropic, то есть код, написанный под ChatGPT или Claude, переносится одной строкой.
Матрица «задача → модель → стоимость»
Чтобы не гадать, какую модель брать под конкретную задачу, собрали таблицу из 12 типовых сценариев с примерной стоимостью.
| Задача | Какую модель | Сколько токенов | Стоимость в ₽ |
|---|---|---|---|
| Идеи постов в Telegram (10 шт.) | Qwen 3.6 27B | ~3000 | ~0,7 ₽ |
| Перевод одного письма на английский | Qwen 3.6 27B | ~1500 | ~0,3 ₽ |
| Лонгрид на 8000 слов | Qwen 3.6 Plus | ~20 000 | ~16 ₽ |
| Разбор PDF на 50 страниц | Qwen 3.6 Plus | ~40 000 | ~32 ₽ |
| Разбор PDF на 300 страниц | Qwen 3.6 Plus (1M контекст) | ~250 000 | ~200 ₽ |
| Написать парсер цен с сайта | Qwen3-Coder 480B | ~8000 | ~6 ₽ |
| Рефакторинг кода (5 файлов) | Qwen3-Coder 480B | ~30 000 | ~25 ₽ |
| Решить олимпиадную задачу | QwQ-32B | ~15 000 | ~12 ₽ |
| Анализ Excel на 10 000 строк | Qwen 3.6 Plus + thinking | ~50 000 | ~40 ₽ |
| Чат-бот поддержки (1000 ответов) | Qwen 3.6 35B-A3B | ~500 000 | ~85 ₽ |
| Распознать чек с фото | Qwen2.5-VL 7B | ~2000 | ~0,5 ₽ |
| Разбор видео-инструкции | Qwen2.5-VL 72B | ~15 000 | ~25 ₽ |
Главный вывод: типичный рабочий день копирайтера или маркетолога на Qwen API стоит 30–50 рублей. На chat.qwen.ai, бесплатно. Это в десятки раз дешевле подписки на ChatGPT Plus.
Шесть сценариев: какая Qwen под какую профессию
Сценарии собрали из реальных рабочих ситуаций, которые описывают читатели Checkroi. Если хотя бы один совпадает с вашим, забирайте рекомендацию и связку моделей.
Сценарий 1: маркетолог с контент-планом
Задача: написать серию постов в Telegram-канал на месяц вперёд, по плану на 30 тем, плюс заголовки и превью-картинки. Хочется однотипного качества и одного голоса.
Рекомендация: Qwen 3.6 Plus в non-thinking mode. Plus аккуратнее держит стиль на длинных дистанциях, чем меньшие модели, а thinking тут не нужен, нет задач на рассуждение. Картинки, встроенный генератор chat.qwen.ai.
Лайфхак: в первом сообщении подгрузите три-четыре своих лучших поста как образец и попросите Qwen «писать в этом голосе». Контекст 1M токенов позволяет загрузить хоть всю историю канала за год. Дальше модель будет держать ваш стиль самостоятельно.
Бюджет: при использовании chat.qwen.ai, бесплатно. Через API, около 50–70 ₽ за все 30 постов.
Подробнее о применении нейросетей в маркетинге, в нашем материале «Вайбкодинг для маркетолога: 10 задач без программиста».
Сценарий 2: студент с учебником на 200 страниц
Задача: подготовиться к экзамену по толстому учебнику. Хочется быстро пройтись по структуре, собрать главные тезисы, проверить себя вопросами.
Рекомендация: Qwen 3.6 Plus в non-thinking mode для пересказа и тезисов, QwQ-32B в thinking mode для решения сложных задач из учебника. Контекст 1M токенов в Plus позволяет загрузить весь PDF целиком без разбивки на куски.
Лайфхак: после загрузки учебника попросите Plus сделать «карту тем», список глав с одной фразой про каждую. Дальше идёте по карте и по каждой теме просите три вопроса для самопроверки. Получается готовый билет для тренировки.
Бюджет: бесплатно через chat.qwen.ai.
Сценарий 3: малый бизнес с чат-ботом на сайте
Задача: подключить на сайт автоматического консультанта, который отвечает посетителям на вопросы про услуги, цены, расписание. Без подписки на дорогие сервисы.
Рекомендация: Qwen 3.6 35B-A3B через API российского посредника. MoE-архитектура даёт скорость, нужную для живого чата. Стоимость, около 85 ₽ за 1000 ответов.
Лайфхак: вместо того чтобы дообучать модель на ваших данных, передавайте контекст в системный промпт. Загрузите туда прайс, расписание и FAQ, модель будет отвечать опираясь на эти данные. Это называется RAG (Retrieval-Augmented Generation) в простой форме и работает почти всегда лучше, чем дообучение.
Бюджет: при потоке 100 вопросов в день, около 250 ₽ в месяц. Сравните с 3000 ₽ за подписку на коммерческий ChatGPT-бот.
Сценарий 4: аналитик с Excel и дашбордами
Задача: разобрать большой Excel-файл с продажами, найти аномалии, построить сводки и графики. Excel на 10 000 строк, в нём 15 колонок.
Рекомендация: Qwen 3.6 Plus с включённым Code Interpreter. Plus сильна в аналитике, а Code Interpreter позволяет ей не просто комментировать данные, а запускать Python-скрипты и строить графики. Файл загружается в чат через скрепку.
Лайфхак: первый запрос всегда «изучи структуру файла и опиши, что в каждой колонке». Модель сама проверит типы данных, найдёт пустые ячейки и даст резюме. Дальше задаёте вопросы по существу: «найди заказы свыше 100 000 ₽», «нарисуй динамику продаж по месяцам», «выведи топ-10 клиентов по обороту».
Бюджет: бесплатно через chat.qwen.ai. Через API, около 40 ₽ за развёрнутый разбор.
Сценарий 5: самозанятый разработчик
Задача: пишет небольшие проекты для клиентов, хочется заменить дорогой Claude Code или Cursor на что-то бесплатное или сильно дешевле. Готов потратить вечер на настройку.
Рекомендация: Qwen3-Coder 480B через chat.qwen.ai для базовой работы, плюс Qwen3-Coder 30B-A3B локально через Ollama для приватных проектов клиентов. На сложных архитектурных задачах подключайте Qwen 3.6 Plus с thinking mode.
Лайфхак: для агентного кодинга поставьте Qwen Code, это CLI-инструмент от самой Alibaba, аналог Claude Code. Работает поверх chat.qwen.ai бесплатно. Подключается к вашему репозиторию, видит файлы, запускает команды, проверяет результат.
Бюджет: 0 ₽ через chat.qwen.ai. Локально, стоимость электричества плюс разовая трата на видеокарту. Сравнение с платными аналогами есть в статье «Claude Code vs Cursor: что выбрать в 2026».
Сценарий 6: энтузиаст с домашним сервером
Задача: дома стоит десктоп с RTX 4090, хочется поднять локальный AI-ассистент для семьи. Чтобы дети учились, родители разбирали документы, и всё это без зависимости от внешних серверов и подписок.
Рекомендация: Qwen 3.6 27B через Ollama для общих задач + Qwen2.5-VL 7B для разбора картинок и документов. Опционально, QwQ-32B для математики (полезно школьникам). Накатывается командой «ollama pull» за 15 минут.
Лайфхак: поднимите Open WebUI (бесплатный веб-интерфейс над Ollama), получите красивый чат как ChatGPT, доступный из любого устройства в домашней сети. Дети заходят с планшета, бабушка с телефона, все используют один сервер на 4090.
Бюджет: 0 ₽ после разовой покупки железа. Электричество, около 200 ₽ в месяц при умеренной нагрузке.
Pipeline-паттерн: как комбинировать модели и экономить
Если задача состоит из нескольких этапов, имеет смысл подключать разные модели на каждом шаге. Это называется pipeline (конвейер). Идея простая: на простых шагах, дешёвая модель, на сложных, дорогая.
Пример из жизни редакции Checkroi: подготовка обзора школы курсов. Раньше всё делалось одной Claude Opus 4.7, выходило около 100 ₽ за обзор. После перехода на Qwen-pipeline стало 12 ₽.
- Сбор данных со страницы школы. Qwen 3.6 35B-A3B вытаскивает структуру: курсы, цены, преподаватели, отзывы. Быстро и дёшево.
- Очистка и нормализация. Qwen 3.6 27B приводит данные к единому формату.
- Сравнение с конкурентами. Qwen 3.6 Plus в thinking mode, нужно аккуратное сравнение.
- Написание финального обзора. Qwen 3.6 Plus в non-thinking, длинный текст с живым стилем.
- Проверка фактов. QwQ-32B, модель аккуратно проверяет цифры и даты.
Получается, что 80% работы делают дешёвые модели, и только финальный этап и проверка фактов, на дорогих. Экономия в 8 раз без потери качества.
Qwen vs GPT-5, Gemini 3 Pro, Claude Opus 4.7 и DeepSeek V3.2
На рынке в мае 2026 есть пять серьёзных игроков. Сравним их на бытовом языке.
Qwen 3.6 Plus vs GPT-5
GPT-5 от OpenAI на 5–7 пунктов сильнее в общих знаниях и креативе. Но GPT-5 стоит $5 за миллион входных токенов против $1,3 у Qwen Plus, в четыре раза дороже. И GPT-5 не работает из России без обходных путей.
Когда выбирать GPT-5: креативные задачи, литературные тексты, узкие специализированные темы.
Когда выбирать Qwen Plus: рутинная работа с текстами, аналитика, документы. Большинство задач закрывает.
Qwen 3.6 Plus vs Claude Opus 4.7
Claude Opus, самая дорогая модель на рынке. $15 за миллион входных токенов, в 11 раз дороже Qwen Plus. Зато на сложной аналитике, длинных рассуждениях и программировании Claude всё ещё на 5–10% точнее.
Когда выбирать Claude Opus: сложные документы, юриспруденция, серьёзная аналитика, ответственные задачи.
Когда выбирать Qwen Plus: повседневная работа, где важна себестоимость и доступность из России. Подробное сравнение Claude, в нашей статье про модели Claude.
Qwen 3.6 Plus vs Gemini 3 Pro
Gemini 3 Pro от Google имеет 2M токенов контекста — это в два раза больше Qwen Plus. На длинных задачах Gemini сильнее. Но Gemini хуже работает на русском и слабее в программировании.
Когда выбирать Gemini: гигантские документы, работа с YouTube-видео (есть встроенный анализ), Google-инфраструктура.
Когда выбирать Qwen Plus: всё остальное, особенно русскоязычные тексты.
Qwen 3.6 Plus vs DeepSeek V3.2
DeepSeek, главный конкурент Qwen внутри Китая. На бенчмарках DeepSeek V3.2 идёт ноздря в ноздрю с Qwen 3.6 Plus, а на программировании даже чуть впереди. Цены сопоставимы.
Главное отличие: DeepSeek заточен под reasoning по умолчанию, Qwen, универсал. Если задачи в основном про код и математику, DeepSeek может зайти лучше. Если универсал, Qwen.
Qwen3-Coder vs Claude Sonnet 4.6 vs GPT-5 на коде
| Бенчмарк | Qwen3-Coder 480B | Claude Sonnet 4.6 | GPT-5 |
|---|---|---|---|
| SWE-bench Verified | 70 | 72 | 72 |
| HumanEval+ | 92 | 91 | 92 |
| Цена $/1M вход | 0,11 | 3,00 | 5,00 |
| Доступ из России | Бесплатно через chat.qwen.ai | Через посредников | Через посредников |
Вывод по коду: Qwen3-Coder уже не уступает американцам на бенчмарках, при этом в 30 раз дешевле. На сложных архитектурных задачах Claude Sonnet всё ещё чуть аккуратнее, но разница уже не такая, чтобы оправдать переплату.
Доступ из России: без КВН и без зарубежной карты
Это самая частая боль для нашего рынка. Разберём по полочкам.
Qwen Chat бесплатно через chat.qwen.ai
Самый простой способ. Заходите на chat.qwen.ai, нажимаете «Sign in», логинитесь через Google или GitHub-аккаунт. Российская почта подойдёт, КВН не нужен. Сайт работает напрямую с Москвы и любого региона России.
В верхней части окна есть выпадающий список моделей. Выбирайте Qwen3.6-Plus для серьёзных задач или Qwen3.6-Coder для программирования. Дальше пишете в чат как обычно.
Бонусы chat.qwen.ai:
- Прямая загрузка PDF и Word, модель сама разберёт документ.
- Генерация картинок встроенной модели.
- Создание короткого видео из текстового описания.
- Голосовой ввод на русском.
- Web Search, модель ищет в интернете и добавляет свежие данные.
Подключение API
Если нужен программный доступ, три варианта:
- Российский провайдер. Регистрируетесь на AITUNNEL, GPTunneL или другом сервисе, пополняете рублёвый баланс, получаете API-ключ. Дальше работаете как с OpenAI API, большинство провайдеров поддерживают OpenAI-совместимый формат.
- OpenRouter. Если есть зарубежная карта, заводите аккаунт на openrouter.ai, пополняете в долларах, получаете доступ ко всем моделям через один API.
- Локальный запуск open-weights моделей. Если у вас железо, Qwen 3.6 27B, 35B-A3B, Qwen3-Coder 30B-A3B можно запустить через Ollama без оплаты вообще.
Что Alibaba делает с вашими данными
Главная боль для российского бизнеса, куда уходят данные. По официальной политике Alibaba Cloud:
- Данные хранятся на серверах в Сингапуре и Гонконге, для России, на азиатских.
- Чаты на chat.qwen.ai используются для дообучения модели по умолчанию. Можно отключить в настройках профиля.
- Через API, данные на дообучение не идут, если использовать enterprise-тариф или платный API через провайдеров.
- Alibaba, китайская компания, и при запросе китайских властей данные могут быть переданы.
Если у вас данные не должны попадать в руки китайского правительства (медицинские, юридические, корпоративные секреты), берите open-weights модель и ставьте локально. Это единственный способ, при котором данные физически не покидают ваш сервер.
Локальный запуск Qwen: что нужно по железу
Большой плюс открытых моделей, их можно поставить себе на компьютер и пользоваться бесплатно навсегда. Минус, нужно железо, и чем мощнее модель, тем серьёзнее требования.
Таблица «видеокарта → какая Qwen зайдёт»
| Видеокарта / RAM | VRAM | Что запустится в Q4 | Скорость |
|---|---|---|---|
| RTX 3060 | 12 ГБ | Qwen 3 8B, Qwen 3 14B | 15–25 токенов/сек |
| RTX 4060 Ti 16GB | 16 ГБ | Qwen 3.6 27B | 10–15 токенов/сек |
| RTX 4070 Ti Super | 16 ГБ | Qwen 3.6 27B, Qwen3-Coder 30B-A3B | 15–20 токенов/сек |
| RTX 4090 | 24 ГБ | Qwen 3.6 27B, 35B-A3B, QwQ-32B | 25–40 токенов/сек |
| 2× RTX 4090 | 48 ГБ | Все из 4090 + большие в FP16 | 30–50 токенов/сек |
| Apple M2 Max 32GB | 22 ГБ | Qwen 3.6 27B, QwQ-32B | 15–20 токенов/сек |
| Apple M3 Max 64GB | 48 ГБ | Все из M2 + Qwen3-Coder 30B | 20–30 токенов/сек |
| Apple M4 Ultra 128GB | ~96 ГБ | Любые open-weights Qwen | 30–40 токенов/сек |
| CPU + 16 ГБ RAM | 0 | Qwen 3 4B, 1.7B, 0.6B | 3–8 токенов/сек |
Если есть только обычный ноутбук без отдельной видеокарты, берите Qwen 3 4B. Качество хуже Qwen 3.6 Plus, но для простых задач хватает, и работает без интернета.
Ollama одной командой
Ollama, это программа, которая делает запуск нейросетей похожим на запуск приложения. Скачиваете с сайта ollama.com, ставите, потом в терминале пишете:
ollama run qwen3:14b
Всё. Ollama сама скачает модель, проверит ваше железо, запустит и даст консольный чат. Если работает медленно, попробуйте модель поменьше:
ollama run qwen3:8b
ollama run qwen3:4b
ollama run qwq:32b
Для подключения через программу, Ollama выдаёт OpenAI-совместимый API на адресе localhost:11434. То есть код, написанный под ChatGPT, работает с Qwen через Ollama после замены одной строки.
Квантизация: как ужать большую модель
Квантизация — это сжатие весов модели. Веса хранятся не в виде 16-битных или 32-битных чисел, а в виде 4-битных или 8-битных. Объём памяти падает в 4–8 раз, скорость растёт, качество чуть проседает.
Стандартные обозначения:
- FP16. полная точность, ~2 ГБ на миллиард параметров.
- Q8_0. 8-бит, ~1 ГБ на миллиард, качество почти как FP16.
- Q5_K_M. 5-бит с умным распределением, хороший баланс.
- Q4_K_M. 4-бит, стандарт для домашних карт, ~0,5 ГБ на миллиард, потеря качества 2–3%.
- Q3_K_M. 3-бит, экстрим, заметная потеря качества.
- Q2_K. 2-бит, на грани разумного.
Если непонятно, что брать, берите Q4_K_M. Это золотой стандарт, который работает почти на всём и терпимо по качеству.
5 типичных ошибок при выборе модели
Ошибка 1: брать самую большую модель «на всякий случай»
Самая частая ошибка новичка. «Возьму сразу Qwen 3.6 Plus, чтобы наверняка». В итоге переплата в 5–10 раз за то, что 27B или 35B-A3B сделали бы быстрее и дешевле. Правило: начинайте с меньшей модели, переходите на большую только когда упёрлись в качество.
Ошибка 2: путать Qwen 2.5, Qwen 3 и Qwen 3.6
В интернете масса статей про Qwen 2.5 и Qwen 3. В 2026 году это уже два устаревших поколения. Всегда проверяйте дату статьи и дату релиза модели. На chat.qwen.ai в выпадающем списке актуальные модели — это всегда последняя цифра.
Ошибка 3: использовать обычную модель там, где нужен reasoning
Сложные математические задачи или многошаговые рассуждения на обычной Qwen 3.6 27B дают слабый результат. На QwQ-32B та же задача решается. Правило: если задача требует «подумать», включайте thinking mode или берите QwQ.
Ошибка 4: использовать reasoning там, где он не нужен
Обратная ошибка. Запускать QwQ-32B на «придумай заголовок» или «напиши короткое сообщение», медленно и дорого. На рутину берите обычные модели.
Ошибка 5: забывать про контекст
Грузить 200-страничный документ в модель с контекстом 128K, половина текста просто потеряется в середине. Если задача про длинные документы, нужен Qwen 3.6 Plus с контекстом 1M, а не открытая 27B.
Как переключать модели в Qwen Chat и API
В Qwen Chat (сайт)
В верхней части окна чата есть выпадающий список с названием текущей модели. Кликаете, выпадает меню со всеми доступными моделями. Выбираете нужную. Переключение происходит для нового сообщения; уже отправленные сообщения остаются обработанными старой моделью.
Рядом обычно есть переключатель thinking/non-thinking, кнопка с иконкой мозга или галочка «Thinking».
В API
Через API модель указывается параметром model в запросе. Например:
{
"model": "qwen3.6-plus",
"messages": [...],
"extra_body": {"enable_thinking": true}
}
Для разных провайдеров название модели слегка отличается. У Alibaba Cloud, это qwen3.6-plus, qwen3.6-coder, qwq-32b. У российских посредников, могут быть свои алиасы.
В Ollama (локально)
Каждая модель, отдельная команда:
ollama pull qwen3:14b
ollama run qwen3:14b
Переключиться на другую, просто запустить с другим именем. Старая останется в памяти, не нужно удалять.
Финальная шпаргалка: какая Qwen для какой ситуации
Если хочется одной таблицей закрыть весь вопрос «что брать», вот она. Сохраните её на потом, чтобы не возвращаться к статье.
| Ваша ситуация | Что брать | Почему |
|---|---|---|
| Хочу попробовать впервые | chat.qwen.ai → Qwen3.6-Plus | Бесплатно, без КВН, без карты, лучшая модель из коробки |
| Длинный текст или лонгрид на русском | Qwen 3.6 Plus, non-thinking | Держит структуру и стиль на 8000+ слов |
| Разбор PDF в 100–300 страниц | Qwen 3.6 Plus, контекст 1M | Целый документ за раз без нарезки |
| Программирование общего профиля | Qwen3-Coder 480B | На уровне GPT-5 по коду, в 30 раз дешевле |
| Олимпиадная математика, логика | QwQ-32B в thinking mode | Обгоняет даже GPT-5 на AIME |
| Аналитика Excel с графиками | Plus + Code Interpreter | Запускает Python внутри чата |
| Распознать картинку, скан, чек | Qwen2.5-VL 7B (или 72B через API) | Vision-модель, читает фото и скриншоты |
| Чат-бот на сайт за копейки | Qwen 3.6 35B-A3B через API | ~0,1 ₽ за ответ, быстро |
| Локальный запуск, есть видеокарта 16+ ГБ | Qwen 3.6 27B через Ollama | Открытая лицензия, стабильна, без счетов |
| Локальный запуск на ноутбуке без GPU | Qwen 3 4B | Работает на CPU + 16 ГБ RAM |
| Юридические или медицинские данные | Open-weights локально | Данные не покидают ваш сервер |
| Команда из 3–10 человек | 27B на сервере + Open WebUI | Один RTX 4090 закрывает потребности команды |
| API в продукте на продакшене | Plus через российского посредника | Стабильность + рублёвая оплата |
| Маленький бюджет, не критично качество | Qwen 3.6 27B или 35B-A3B через API | В 4–10 раз дешевле Plus |
| Очень редкий язык (фарси, тагальский) | Qwen 3.6 Plus + проверка живым редактором | Качество приемлемое, но не идеальное |
Безопасность данных: на что обратить внимание
Тема, которая обычно всплывает у корпоративных клиентов и у тех, кто работает с чужими секретами. Разберём по уровням риска.
Низкий риск: публичные данные
Если вы пишете пост для соцсети, переводите статью с английского, придумываете идеи для блога, заходите на chat.qwen.ai и работайте. Никакой проблемы нет. Все эти данные и так публичны.
Средний риск: внутренние документы компании
Внутренний приказ, методичка для сотрудников, контент-план команды. Это не публичные данные, но и не государственные секреты. В настройках chat.qwen.ai отключите «Use my data to improve models». После этого ваши чаты не идут в обучающую выборку. Через API enterprise-тарифа этого делать не нужно, там обучение по умолчанию выключено.
Высокий риск: персональные данные клиентов, юр-документы, медкарты
Это случай, когда трансграничной передачей данных вы нарушаете 152-ФЗ и аналогичные законы в других странах. Сюда же, корпоративные секреты, ноу-хау, исходный код закрытых продуктов. Что делать:
- Не использовать chat.qwen.ai и облачный API.
- Поднять open-weights модель локально через Ollama или vLLM на сервере внутри вашего контура.
- Подходящие модели, Qwen 3.6 27B, 35B-A3B или Qwen3-Coder 30B-A3B (все open-weights, лицензия Apache 2.0).
- Сервер физически в РФ, без выходов наружу. Тогда данные никогда не покидают периметр.
Это единственный способ работать с по-настоящему чувствительными данными. Облачные сервисы любого провайдера, Qwen, ChatGPT, Claude, здесь не подходят по принципу.
Что говорят про данные сами Alibaba
Официальная позиция Alibaba Cloud такая. На бесплатном тарифе chat.qwen.ai пользовательские чаты могут использоваться для улучшения модели. На enterprise-тарифе и через API, не используются. Серверы для пользователей вне Китая расположены в Сингапуре и Гонконге. При официальном запросе китайских властей данные могут быть переданы по закону.
Для большинства некритичных задач это приемлемо. Для критичных, берите open-weights и ставьте локально, других надёжных вариантов с китайскими сервисами нет.
Чего Qwen всё ещё не умеет
Чтобы не было завышенных ожиданий, честный список ограничений Qwen на май 2026.
- Узкие профессиональные темы. На юридических, медицинских или финансовых тонкостях Qwen иногда галлюцинирует, придумывает несуществующие законы, диагнозы или показатели. Проверяйте факты, особенно когда результат идёт в ответственное место.
- Очень редкие языки. Поддержка 119 языков заявлена, но качество на узбекском, таджикском и других языках СНГ заметно слабее, чем на русском.
- Самая свежая инфа. Знания у моделей обрезаны на дате обучения, обычно за 6–12 месяцев до релиза. Свежие новости и цифры лучше брать через web search в chat.qwen.ai или из внешних источников.
- Длинная видеогенерация. Встроенный генератор картинок и короткого видео есть, но он слабее Sora 2 и Runway Gen-4.
- Безотказная агентность. На сложных многошаговых сценариях Qwen3-Coder иногда «срывается», забывает контекст, теряет инструменты. Для критичных пайплайнов Claude Code пока надёжнее.
Главная мысль и с чего начать конкретно вам
Если читали по диагонали, вот что важно унести из статьи.
Для большинства людей правильный путь такой:
- Откройте chat.qwen.ai прямо сейчас. Зарегистрируйтесь через Google. Это бесплатно и без КВН.
- Переключите модель на «Qwen3.6-Plus» в выпадающем списке.
- Дайте ей реальную задачу из вашей работы. Не «расскажи анекдот», а что-то полезное: разбери письмо клиента, перепиши абзац для блога, найди ошибку в Excel-таблице.
- Если задача про код. переключитесь на «Qwen3-Coder».
- Если задача требует размышлений. включите thinking mode.
- Через неделю вы поймёте, какая модель вам нужна. Если бесплатных лимитов хватает, можно остаться на чате. Если упёрлись, подключайте API через российского посредника за 500 ₽ в месяц.
Если вы разработчик, параллельно поставьте Ollama и скачайте Qwen 3.6 27B на свою видеокарту. Через месяц перестанете платить за API вообще.
Если вы команда из 3–10 человек, обратите внимание на open-weights модели на собственном сервере. Один RTX 4090 за 200 тысяч рублей закрывает потребности 10 пользователей и окупается за полгода против подписок на ChatGPT Plus.
Самое важное: не бойтесь экспериментировать. Qwen бесплатна на старте, открыта в коде, работает из России. Такая комбинация для AI-инструмента такого уровня в 2026 году встречается редко. Имеет смысл попробовать сегодня, а не через год.
Если хочется освоить работу с нейросетями системно, на современном рынке есть и короткие интенсивы за неделю, и серьёзные программы на год с трудоустройством в AI-направлении. Похожий путь прошли уже многие, например, специалисты по AI, о которых мы писали в статье «Кто такой специалист по искусственному интеллекту». И ещё близко по теме, наш материал про AI-native людей, которые встроили нейросети в ежедневную работу.
Где научиться работать с нейросетями: подборка курсов
Ниже, актуальные программы по нейросетям и искусственному интеллекту от российских школ. В подборке 316 курсов: от коротких интенсивов «за выходные» до годовых треков с трудоустройством. Можно фильтровать по уровню, длительности и цене.
| Курс | Школа | Стоимость со скидкой | В рассрочку | Длительность | Обзор курса от Checkroi |
|---|---|---|---|---|---|
| Искусственный интеллект Перейти на сайт курса | 156 162 ₽ | 4688 ₽/мес. | 12 месяцев | Обзор курса | |
| Нейросети на практике Перейти на сайт курса | 54 515 ₽ | 4542 ₽/мес. | 2 месяца | Обзор курса | |
| Магистратура «Прикладной искусственный интеллект» с УрФУ Перейти на сайт курса | 162 500 ₽ | 244 ₽/мес. | 24 месяца | Обзор курса | |
| Нейросети для анализа данных Перейти на сайт курса | 31 700 ₽ | 2351 ₽/мес. | 8 недель | Обзор курса | |
| Нейросети для изображений и видео Перейти на сайт курса | 69 100 ₽ | 5758 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети для дизайна Перейти на сайт курса | 64 000 ₽ | 2612 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети: практический курс Перейти на сайт курса | 25 990 ₽ | 181 667 ₽/мес. | 3 месяца | Обзор курса | |
| Нейросети для финансистов Перейти на сайт курса | 65 600 ₽ | 5466 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети для Бухгалтера Перейти на сайт курса | 49 000 ₽ | 4083 ₽/мес. | 2 месяца | Обзор курса | |
| Нейросети для рабочих задач Перейти на сайт курса | 29 800 ₽ | 2483 ₽/мес. | 1 месяц | Обзор курса |
Больше программ — в полном каталоге курсов по нейросетям и искусственному интеллекту
Если интересует именно ремесло работы с большими языковыми моделями, отдельная подборка курсов по промпт-инжинирингу. А для тех, кто хочет посмотреть, какие промпты сразу запускать в Qwen, у нас есть подборка 50 промптов для маркетолога и 50 промптов для программистов. Шаблоны написаны под ChatGPT и Claude, но работают и на Qwen, просто скопируйте в chat.qwen.ai.

![Статья: Выучить английский самостоятельно с ChatGPT и Claude в 2026 Выучить английский самостоятельно с ChatGPT и Claude в [current_year]](https://selcdn.checkroi.ru/wp-content/uploads/2026/05/og-cover-58550-1779623678.jpg)


![Статья: Вайбкодинг для маркетолога: 10 задач без программиста в 2026 Вайбкодинг для маркетолога: 10 задач без программиста в [current_year]](https://selcdn.checkroi.ru/wp-content/uploads/2026/05/og-cover-58529-1779363053.jpg)