itishaПодобрать курс
Профессия

Как стать data scientist с нуля

Data Scientist превращает массивы данных в работающие модели: оценивает риск выдачи кредита, рекомендует фильм, прогнозирует отток клиентов. Профессия требовательна ко входу — нужны математика, программирование на Python и понимание бизнеса. Но именно поэтому зарплаты здесь заметно выше, чем у соседей по аналитике.

Чем занимается

Чем занимается data scientist в типичный рабочий день

01

Формулирует задачу вместе с бизнесом

Принимает запрос вроде «снизить отток» и переводит его в задачу машинного обучения: что предсказываем, на каких данных, как измерим успех. Без этого этапа модель окажется бесполезной.

02

Готовит и исследует данные

Собирает выгрузки из разных источников, чистит пропуски, проверяет распределения, придумывает новые признаки. На эту часть уходит 60–70% времени, и от её качества зависит финальный результат больше, чем от выбора алгоритма.

03

Обучает и сравнивает модели

Перебирает алгоритмы — от линейной регрессии до градиентного бустинга и нейросетей, подбирает гиперпараметры, оценивает на отложенной выборке. Хорошая модель — та, что устойчива на новых данных, а не лучшая на обучении.

04

Передаёт модель в продакшн

Описывает, как модель должна использоваться, договаривается с инженерами о выкладке, следит за метриками после запуска. Если со временем точность падает — переобучает модель на свежих данных.

Навыки

Какие навыки нужны data scientist на входе

Python и его библиотеки для данныхБазовый язык профессии. Нужно уверенно работать с pandas (таблицы с данными), numpy (вычисления), scikit-learn (классические модели машинного обучения). Без этого набора в вакансии не пускают.

Математика и статистикаЛинейная алгебра, теория вероятностей, проверка гипотез. Не на уровне олимпиад, но достаточном, чтобы понимать, почему модель ошибается и как устроены метрики качества.

SQL — язык запросов к базам данныхБольшая часть данных лежит в реляционных базах. Без умения писать запросы и объединять таблицы вы будете зависеть от чужой выгрузки и медленнее коллег.

Машинное обучениеПонимание, когда применять регрессию, когда деревья, когда бустинг. Знание основных проблем — переобучение, утечка данных, дисбаланс классов — и способов их обходить.

Деловая коммуникацияОбъяснить продакту, почему модель с точностью 80% — это хорошо, а с 95% — подозрительно. Без этого навыка результаты работы не доходят до бизнеса.

Git и базовая инженерная культураРабота в команде требует версионирования кода, написания читаемых тетрадок Jupyter и хотя бы поверхностного понимания, как ваша модель будет жить в продукте.

Путь в профессию

Четыре шага от первого знакомства до первой работы

Сначала разведка и проверка интереса, потом систематическое обучение и практика на пет-проектах.

01

Подтяните математику и Python параллельно

Первые 2–3 месяца уходят на базу: Python до уровня уверенной работы с pandas и numpy, плюс повторение школьной и первокурсной математики. Без этого фундамента дальнейшее обучение превращается в зубрёжку рецептов.

02

Освойте классическое машинное обучение

Линейные модели, деревья решений, случайный лес, градиентный бустинг (XGBoost, CatBoost). Параллельно — SQL и базовая визуализация. Этого набора достаточно для 80% задач на позиции начинающего специалиста.

03

Соберите портфолио из 3–4 проектов

Не учебных задач из курса, а самостоятельных: предсказание цен на квартиры по открытым данным, классификация отзывов, простая рекомендательная система. Код выложите на GitHub, опишите ход рассуждений.

04

Тренируйтесь на собеседованиях

Технические интервью включают задачи на SQL, Python, классические алгоритмы и разбор ML-кейсов. Первые 5–10 собеседований чаще всего провальные — это нормальная часть процесса, а не повод останавливаться.

Хороший data scientist половину времени тратит не на модель, а на то, чтобы понять, какие данные у компании вообще есть и можно ли им верить

Календарь

Сколько занимает обучение и сколько платят

Реалистичный план для тех, кто учится в параллель с основной работой.

  1. junior

    Начинающий специалист (junior)

    Работает под присмотром старшего коллеги: готовит данные, обучает модели по уже сформулированной задаче, защищает результаты на внутренних встречах. Главная задача первого года — научиться доводить проект до конца, а не бросать на этапе baseline-модели.

  2. middle

    Специалист среднего уровня (middle)

    Самостоятельно ведёт задачи от постановки до выкладки в продакшн. Договаривается с продактами и инженерами, выбирает подход, оценивает реалистичность сроков. На этом уровне зарплата выходит на 200–245 тыс. ₽ — основной диапазон рынка.

  3. senior

    Опытный специалист (senior)

    Отвечает за направление целиком: какие задачи решать в первую очередь, какую инфраструктуру строить, как развивать команду. Часто становится тимлидом или уходит в смежную роль ML-инженера или руководителя ML-направления.

Зарплатная шкала по уровням

тыс. ₽ в месяц, гросс
Junior
110140
Middle
200245
Senior
260400

Источник: Профессия Data Scientist — зарплаты по уровням, hh.ru. Цифры — медианные диапазоны открытых вакансий, без бонусов и опционов.

Открытые вакансии

Реальные вакансии Data Scientist прямо сейчас

Свежая выборка с Хабр Карьеры — крупнейшего IT-каталога вакансий в России. Срез на 1 июня 2026

Источник: career.habr.com — живой поиск с фильтрами по уровню, формату и зарплате

Бесплатно подберите онлайн-курс по Data Science под ваш запрос

Подобрать курс
Подвохи

О чём не пишут в описаниях профессии

Профессия выглядит со стороны как работа со сложными моделями и нейросетями. На практике сложности другого рода и редко связаны с математикой.

Большая часть работы — рутина с даннымиЧистка, сборка таблиц, разбор странных значений. Если ждёте, что будете каждый день обучать нейросети, придётся скорректировать ожидания: это занимает меньшую часть времени.

Модель в проде живёт своей жизньюПосле выкладки точность падает, данные меняются, бизнес-процессы перестраиваются. Поддержка работающих моделей часто отнимает больше сил, чем разработка новых.

Бизнес не всегда готов к результатуМожно полгода строить модель оттока, а потом узнать, что отдел маркетинга не умеет её использовать. Поэтому навык согласования задач на берегу важнее очередной библиотеки.

Подборка

3 курса для входа в профессию

Программы выбраны под старт с нуля и темп, типичный для этой профессии. Цены актуальны на сегодня — тянутся напрямую из каталогов школ.

Сравнение программ

Сравнение программ обучения на Data Scientist

Лучшие курсы на Data Scientist от ведущих онлайн-школ — программы с поддержкой и трудоустройством, длительность, цена и формат рядом. По одной программе с минимальной ценой от каждой школы, чтобы удобно сравнить варианты под свой бюджет

Каталог по этой профессии

Что предлагает рынок по направлению «Data Scientist»

Цифры из живого каталога itisha — обновляются ежедневно вместе с импортом программ из официальных партнёрских фидов школ

Курсов
10
Школ
5
Длительность
818мес.
Цены
96212тыс. ₽

Самая короткая программа — 8 мес. у Eduson Academy, самая длинная — 18 мес. у Нетологии. Цены варьируются от 96 тыс. ₽ до 212 тыс. ₽, в среднем — 138 тыс. ₽.

Вопросы и ответы

Что обычно спрашивают про эту профессию

Собрали вопросы, которые чаще всего задают перед стартом обучения.

Кто такой Data Scientist простыми словами?

Это специалист, который с помощью данных и математических моделей помогает бизнесу принимать решения автоматически. Например, банк с его помощью оценивает, кому давать кредит, а онлайн-кинотеатр — что порекомендовать пользователю на главной.

Сколько зарабатывает Data Scientist в России?

Начинающие специалисты получают 110–140 тыс. ₽, средний уровень — 200–245 тыс. ₽, опытные — от 260 до 400 тыс. ₽ и выше. Цифры по уровням приведены в карточке профессии на hh.ru.

Чем Data Scientist отличается от аналитика данных?

Аналитик данных отвечает на вопросы бизнеса с помощью отчётов и дашбордов, Data Scientist строит предсказательные модели. У аналитика порог входа ниже, у data scientist — выше зарплата и требования к математике.

Можно ли стать Data Scientist без технического образования?

Можно, но придётся самостоятельно подтянуть математику до уровня первого-второго курса технического вуза. Гуманитариям обычно нужно на 2–3 месяца больше на старте, чем людям с инженерным или экономическим бэкграундом.

Сколько времени уходит на обучение с нуля?

Реалистичный срок до первого предложения о работе — 12–18 месяцев плотных занятий по 15–20 часов в неделю. Курсы обещают «за 9 месяцев», но это срок прохождения программы, а не выхода на работу — их обычно стоит закладывать с запасом.

Нужно ли высшее образование, чтобы устроиться Data Scientist?

Диплом не обязателен, но крупные компании вроде Сбера, Яндекса и Тинькофф чаще зовут на собеседования людей с техническим или математическим образованием. Если вуза нет, компенсировать его придётся сильным портфолио на GitHub, участием в соревнованиях на Kaggle и решёнными задачами по статистике на собеседовании.

Какие технологии и инструменты обязательны на старте?

Минимальный набор — Python с библиотеками pandas, numpy, scikit-learn, SQL для выгрузки данных и Jupyter Notebook для экспериментов. Дополнительно стоит освоить Git для версионирования кода и одну из библиотек визуализации — matplotlib или seaborn; всё остальное (PyTorch, Spark, Airflow) подтягивается уже на работе под задачи команды.

Чем Data Scientist отличается от ML-инженера?

Data Scientist чаще проверяет гипотезы и строит прототипы моделей в ноутбуках, а ML-инженер выводит эти модели в продакшен — упаковывает в сервисы, настраивает мониторинг и переобучение. В небольших командах роли совмещаются, в крупных — разделены, и зарплата ML-инженера обычно выше на 15–25%.

Берут ли в Data Science после 35–40 лет?

Возраст сам по себе не отсекает кандидата, особенно если у человека есть прикладной опыт в финансах, медицине, логистике или маркетинге — это становится преимуществом, потому что отрасль уже знакома. Сложнее другое: на джуниорские позиции (начальный уровень) откликается много молодых выпускников, поэтому взрослым кандидатам выгоднее искать стажировки внутри своей текущей компании или метить сразу в прикладного аналитика данных с переходом в DS.

Можно ли работать Data Scientist удалённо или на фрилансе?

Удалённый формат распространён: на hh.ru около трети вакансий по Data Science допускают полностью удалённую работу или гибрид. Фриланс встречается реже, потому что задачи завязаны на закрытые данные компании и длинный цикл обучения моделей; разовые проекты обычно идут через Upwork или Хабр Фриланс и подходят уже опытным специалистам.

Что спрашивают на собеседовании джуниора?

Стандартный круг тем: SQL-задачи с джойнами и оконными функциями, базовая теория вероятностей и статистики (распределения, проверка гипотез, A/B-тесты), классические алгоритмы машинного обучения — линейная и логистическая регрессия, деревья, градиентный бустинг. Часто дают тестовое задание на день-два: предсказать отток клиентов или спрогнозировать спрос на публичном датасете.

Сколько зарабатывают Data Scientist в регионах по сравнению с Москвой?

В Москве и Санкт-Петербурге зарплаты на 20–40% выше, чем в регионах: джуниор в столице получает 110–140 тыс. ₽, в Новосибирске или Казани — 80–110 тыс. ₽. Удалённые вакансии частично выравнивают разницу — крупные банки и IT-компании платят региональным сотрудникам по московским ставкам, если человек прошёл общий отбор.

Чем junior отличается от middle Data Scientist?

Джуниор работает по поставленной задаче: ему дают датасет, метрику качества и сроки, он подбирает модель и проверяет результат. Миддл сам формулирует задачу из бизнес-запроса, выбирает, какие данные собрать, оценивает экономический эффект модели и доводит её до внедрения вместе с разработчиками; переход с одного уровня на другой обычно занимает 1,5–2 года.

Реально ли войти в профессию полностью самостоятельно, без курсов?

Реально, если есть дисциплина и техническая база: бесплатные материалы вроде специализации «Машинное обучение и анализ данных» от МФТИ и Яндекса на Coursera, учебника ШАД и соревнований на Kaggle закрывают практически всю теорию. Минус самостоятельного пути — нет дедлайнов, проверки кода ревьюером и связей с однокурсниками, поэтому срок обучения растягивается до 18–24 месяцев.

Какие книги и каналы стоит читать новичку?

Из книг на старте полезны «Python и анализ данных» Уэса Маккинни и «Введение в статистическое обучение» Джеймса и Хасти — обе есть в русском переводе. Из русскоязычных ресурсов — раздел Машинное обучение на Хабре, Telegram-каналы команд Яндекса и Сбера по ML, а также блог ODS (Open Data Science) с разборами реальных задач.

Итог

Если коротко

Data Scientist — это длинный и требовательный путь, но один из самых высокооплачиваемых в IT. Закладывайте на подготовку год-полтора, бюджет на хороший курс — 100–180 тыс. ₽, и будьте готовы к тому, что первые 5–10 собеседований уйдут на тренировку. Если математика и алгоритмы пугают, разумнее начать с роли аналитика и перейти в Data Science через 1–2 года уже изнутри индустрии.

Постскриптум

Не уверены, какой онлайн-курс подойдет именно вам?

Сервис задаст 6 вопросов про опыт и предпочтения и соберёт подборку из 3 курсов с обоснованием. Бесплатно, без регистрации.

Об этом гиде

Гид написан редакцией itisha (айтиша) и обновляется раз в 2–3 месяца. Цифры по зарплатам и количеству вакансий проверены на момент последней редакции.

Проверено: 27 мая 2026.

Источники цифр: HeadHunter — поиск «Data Scientist» (Россия); HeadHunter — «Data Scientist», удалёнка (Россия); Профессия Data Scientist: навыки, обязанности, зарплаты и перспективы в 2026 — DTF; Профессия Data Scientist — зарплаты по уровням, hh.ru.

Список курсов отобран из каталога 1500+ программ 11 школ-партнёров с учётом релевантности профессии и опыта читателя.