Домой » Профессия Data Scientist: что это, чем занимаются и что делают, зарплата и как стать

Профессия Data Scientist: что это, чем занимаются и что делают, зарплата и как стать

от Ivan

Кажется, что из каждого утюга говорят про Data Science? Вам не кажется! Об этом действительно говорят, в том числе что это, без сомнения, профессия будущего. За последние годы количество вакансий в этой области выросло в несколько раз. В этой статье я расскажу вам о том:

Приступим к разбору.

Data Scientist – кто это?

Data Scientist - кто это?

Data Scientist — это эксперт по анализу массивов данных. Обычно имеет математический склад ума, понимает как работает статистический анализ и умеет видеть и находить закономерности. По большому счету у них нет определенной специализации для работы, так как массивы данных существуют в любой сфере. Задача Data Scientist заключается в том, чтобы с помощью анализа данных создавать модели для совершенствования рабочих процессов.

 

Чем занимаются и что делают Data Scientist?

Чем Data Scientist занимается больше всего?

Вне зависимости от специфики бизнеса, каждый специалист по Big Data занимается примерно одинаковыми вещами:

  • Сбор больших массивов данных и видоизменение их для удобной работы;
  • Решение бизнес-задач с помощью анализа данных;
  • Работа с языками программирования: SAS, R и Python;
  • Работа со статистикой;
  • Аналитика, в том числе машинное обучение и текстовая аналитика;
  • Выявление закономерностей, которые помогают достигнуть конечного бизнес-результата.

А уже исходя из специализации в результате работы получаются модели прогнозирующие поведение пользователей в сети, погоды, курсов валют. Рекомендации музыки и фильмов, исходя из ваших предпочтений — все это тоже Data Science.

Для эффективной работы хороший специалист должен знать:

  • статистику и машинное обучение;
  • языки программирования SAS, R или Python;
  • базы данных MySQL и Postgres;
  • технологии визуализации данных и отчетности;
  • Hadoop and MapReduce.

Как бы сложно это не звучало, всему можно научиться, причем довольно быстро. Но об этом позже, а пока поговорим про то, где может работать Data Scientist и сколько им за это платят.

 

Зарплата Data Scientist

Средняя зарплата Data Scientist в Москве

Если я скажу что Data Scientist работать можно везде — я не преувеличу. Нет такой сферы бизнеса, где бы нельзя было бы применить анализ данных. Фриланс, remote или работа в офисе — любой вариант доступен. Что же касается зарплаты, то здесь даже младший специалист получает больше, чем среднестатистический россиянин.

По данным hh.ru на ноябрь 2019 года получилась вот такая картина:

  • Москва: от 120 000 до 230 000 рублей;
  • Санкт-Петербург: от 70 000 до 180 000 рублей;
  • Регионы: от 40 000 до 120 000 рублей.

Очень много специалистов требуется в банковскую сферу, а это чаще всего подразумевает такие плюшки как белая зарплата, ДМС и официальный отпуск. Многие компании предлагают работать удаленно, поэтому если вы хороший спец, то не важно где вы проживаете — работать можно и на столичного работодателя.

 

Как стать Data Scientist: где учиться?

Мы подошли к самой главной части — где и как можно выучиться на специалиста по Big Data. Здесь пожалуй будет самый разнообразный топ онлайн школ предлагающих обучение. Поехали:
 

1. Профессия «Data Scientist» от Skillbox

Получить консультацию по профессии Data Scientitst от SkillboxДлительность: 15 месяцев (300 часов).

Уровень: с нуля.

Формат: вебинары + воркшопы + домашнее задание + преподаватель.

Особенности программы: выбор специализации во время обучения – уходите в анализ данных или машинное обучение.

Содержание:

  • Введение в Data Science: python; csv, xml и xlsx; визуализация данных и различные модели машинного обучения;
  • Выбор специализации: анализ данных или машинное обучение.

Полная программа курса: посмотреть.

Преподаватели:

  • Chief Data Scientist в Skillbox;
  • Главный методист технического направления в Skillbox;
  • Преподаватель НИУ ВШЭ;
  • Руководитель команды разработки рекомендательной системы в IVI.ru;
  • Deep Learning R&D инженер и менеджер в NVIDIA.

Ключевые навыки: владение языками программирования для анализа данных и машинного обучения; работа с различными источниками данных; работа с базами данных; проведение и организация A/B-тестирования; разработка аналитических панелей; использование научных и математических библиотек; использование современных фреймворков аналитики.

Инструменты: R и Python; Pandas; Jupyter; NumPy и SciPy; MongoDB, SQLite3, PostgreSQL и SQL; Plotly, Dash и Shiny; Scikit-learn; Matplotlib; CSV, XML, XLS, JSON и HDF5; Vertica, Exasol и ClickHouse:

Гарантии: гарантированное трудоустройство – 3 собеседования в компаниях-партнерах + помощь в составлении резюме + подготовка к собеседованию от профессиональных HR.

Бонусы: 2 месяца английского языка в подарок +

Итоги: диплом + проект для реального заказчика.

Цена:

  • Полная – 135 000 рублей в месяц;
  • Кредит от банка – 3 750 рублей в месяц.

Есть возможность начать оплачивать через 6 месяцев после начала курса.

Ссылка на курс: >>> перейти к обучению <<<

 

2. Профессия «Data Scientist» от Нетологии

Записаться на курс по Data Science от НетологииДлительность: 8 месяцев.

Уровень: с нуля.

Для кого подходит: новичкам, разработчикам, аналитикам и топ-менеджерам в IT.

Формат: вебинары + лекции в Москве + домашнее задание + преподаватель.

Содержание:

  • SQL и получение данных;
  • Python и математика для анализа данных;
  • Feature engineering и предобработка данных;
  • Построение модели;
  • Работа с заказчиком;
  • Рекомендательные системы;
  • Распознавание изображений, машинное зрение;
  • Обработка естественного языка (NLP).

Полная программа курса: посмотреть.

Преподаватели:

  • Data Scientist’ы из NVIDIA, Яндекс.Метрики, Google, Bi.zone;
  • Руководители различных направлений из «Сбербанк», АП «НПО автоматики» и «1C-Битрикс» ;
  • Разработчики из Eltex LTD, Яндекс, «ДомКлик.ру»;
  • Доцент Факультета компьютерных наук НИУ ВШЭ.

Ключевые навыки:

  • Сбор и подготовка данных для анализа;
  • Создание нейросетей;
  • Генерация текстов и изображений;
  • Создание рекомендательных систем;
  • Выбор и реализация алгоритма под задачу;
  • Выбор и создание фич для модели.

Инструменты: Python, Pandas, Scikit-learn, OpenCV, PostgreSQL, NLTK, Tensorflow.

Гарантии: профессиональные HR помогают составить резюме и консультируют по собеседованиям, а также предлагают вакансии в компаниях-партнерах + стажировка в проектах «Нетологии-групп».

Итоги: диплом и сертификат установленного образца + портфолио (нейросеть + чат-бот + классификатор изображений + рекомендательная система + ML-проект).

Цена:

  • Полная – 200 000 рублей;
  • Успей на скидку! – 140 000 рублей;

Возможна рассрочка без первого платежа – 16 667 рублей в месяц. Также можно вернуть 13% налогового вычета.

Ссылка на курс: >>> перейти к обучению <<<

 

3. Обучение профессии Data Scientist с нуля от Skillfactory

Получить программу обучения по Data Science от SkillfactoryДлительность: 1 год.

Уровень: с нуля.

Для кого подходит: новичок в IT, программист для смены направления и аналитик для повышения квалификации.

Формат: вебинары + онлайн-тренажер + общение в закрытом сообществе + ментор.

Содержание: программа состоит из 6 курсов:

  • Основы программирования на Python + Python для анализа данных;
  • Математика и статистика для Data Science;
  • Практический Machine Learning;
  • Deep learning и нейронные сети;
  • Data Engineering;
  • Менеджмент для Data Science.

Полная программа курса: посмотреть.

Преподаватели:

  • Автор более 30 научных работ;
  • Deep Learning R&D Engineer, NVIDIA;
  • Программист-аналитик Яндекс.Маркета;
  • старший разработчик в Яндекс.Дзен;
  • Бизнес-аналитик в Avito;
  • Исполнительный директор EORA Data Lab;
  • преподаватель НИУ ВШЭ;
  • Преподаватель МИЭФ ВШЭ;
  • Продуктовый аналитик в CoMagic;
  • Data Scientist в EORA Data Lab;
  • Основатель SkillFactory.

Ключевые навыки: навыки программирования и написания «чистого кода»; сбор данных из открытых источников (API сервисов, парсинг сайтов); кластеризация и классификация данных; работа со всеми типами данных; создание и визуализация отчетов; матанализ и методы оптимизации; использование теории вероятности и других математических и статистических методов; обработка данных и использование основных моделей машинного обучения; оценка качества алгоритмов; использование математических, статистических и научных фреймворков; создание нейронных сетей различного типа; анализ данных различными методами; оценка эффективности моделей и управление командой; общение с заказчиками.

Инструменты: Python, Numpy, Pandas, Matplotlib, Scikit-learn, Jupyter, SQL, NoSQL, Linux, HTTP/HTTPS, HTML, RESTFul API, Hadoop, Hive, HBase, Hue, Apache Spark, Kafka, MongoDB, Cassandra, RDBMS, Apache Zeppelin, QuickView, Hadoop, Spark, ETL и BI; AWS и Azure;

Гарантии: помощь в трудоустройстве и стажировке.

Бонусы: полезные знакомства.

Итоги: 6 сертификатов на русском и английском языках + проекты для портфолио и соревнования в kaggle.

Цена:

  • Полная – 150 000 рублей в месяц;
  • Успей на скидку! – 75 000 рублей в месяц.

Возможна оплата в рассрочка на год – 2 300 рублей в месяц.

Возможно обучение за счет работодателя.

Ссылка на курс: >>> перейти к обучению <<<

 

4. Факультет «Искусственного интеллекта» в GeekBrains

Получить программу факультета искусственного интеллекта от GeekBrainsДлительность: 1,5 года практического обучения (в резюме указывается опыт).

Уровень: с нуля, но надо посмотреть подготовительные видеокурсы по Python и Git.

Для кого подходит: для всех, кто хочет постигнуть Data Science.

Формат: видеолекции + вебинары + воркшопы + домашнее задание + преподаватель.

Содержание: 20 курсов в одной программе. Они разбиты на 6 четвертей:

  • Создание инфраструктуры;
  • Сбор данных и статистическое исследование;
  • Математикадля Data Scientist-a;
  • Машинное обучение. Совместно с компанией МегаФон;
  • Нейронные сети;
  • Задачи искусственного интеллекта. Совместно с компанией NVIDIA.

5 курсов вне четвертей + 2 дополнительных факультатива от компаний FIX и My.com.

Полная программа курса: посмотреть.

Преподаватели:

  • Python Developer с 20-летним опытом. Писал на 30 языках программирования. Разрабатывал решения для Министерства обороны РФ;
  • Data Scientist, применявший технологии в «Сбербанке», «Росбанке» и международных компаниях;
  • Python Developer, который разрабатывал BI-системы для правительства РФ и ФСБ;
  • Инженер-программист, который работал в АО «Государственный ракетный центр»;
  • Ведущий разработчик в MS Dynamics CRM;
  • Системный администратор в Mail.ru Group;
  • Разработчик военных систем связи;
  • Эксперт поддержки вычислительных платформ в ПАО «МТС».

Ключевые навыки: программирование на Python; алгоритмы и структуры данных; работа в любой операционной сети; проектирование архитектуры и использование шаблонов проектирование; «чистый» код; работа с нейронными сетями; все методы машинного обучения; машинное зрение и распознавание естественного языка; применение теории вероятности и математической статистики; линейная алгебра, математический анализ и методы оптимизации.

Инструменты: Python, Tensorflow, Keras, PyTorch, Numpy, Pandas, Matplotlib, Scikit-learn, Jupyter, SQL, nosql, Linux, HTML, HTTP/HTTPS, RESTful API.

Гарантии: стажировки в компаниях-партнерах.

Бонусы: 3 месяца обучения английскому; доступ к GeekClub; «Английский для IT-специалистов» в подарок.

Итоги: свидетельство установленного образца + сертификат + более 20 проектов в портфолио.

Цена:

  • Полная – 12 500 рублей в месяц;
  • Успей на скидку! – 10 666 рублей в месяц.

Возможен банковский кредит.

Ссылка на курс: >>> перейти к обучению <<<

 


 

Будущее за вами!

Выбирая обучение профессии Data Scientist вы выбираете будущее. Но отдавайте себе отчет в том, что это все же программирование, и для него необходимо обладать определенным складом ума. Но в любом случае после обучения, вас ждет огромный выбор вакансий, потому что пока на спецов по Big Data есть большой спрос. Поэтому не теряйте время и вливайтесь!

0 коммент
0

Почитаем еще?

Оставьте комментарий