По словам экс вице-президента Гугл Эрика Шмидта, сейчас за 2 дня человечество производит столько же информации, сколько накопило от зарождения цивилизации до 2003 года. В таком массиве данных мало просто уметь ориентироваться постфактум. Для бизнеса жизненно необходима возможность анализировать big data и принимать предиктивные решения на основании цифр. И в этом компаниях помогают представители профессии data scientist.
Это относительно новая, но уже востребованная специализация на рынке IT-услуг. По данным AIN, средняя зарплата этой категории специалистов — 112 тысяч гривен. Примечательно, что для 76% соискателей это либо первая работа в IT, либо их опыт в сфере меньше 6 лет — то есть порог вхождения в эту специальность невысокий и не требует глубоких технических знаний.
Где аналитик данных может пройти обучение и какие скилы нужны для работы в этой профессии — разбираемся.
Кто такой Data Scientist?
Data Scientist или исследователь данных — это специалист, который работает с аналитикой больших массивов данных. Как правило, в зону его ответственности входит:
- поиск определенных параметров или закономерностей в наборах данных;
- работа с сырыми данными, их выборка, очистка, форматирование, поиск общих признаков;
- визуализация информации в виде отчетов и дашбордов;
- создание и развитие модели машинного обучения.
Простыми словами, работа специалиста — анализировать большие массивы данных и вытаскивать оттуда информацию, необходимую бизнесу.
Data scientist: с чего начать
Must have навыков для тех, кому интересно, как стать дата сайентист:
- программирование. Специалист в области цифровых наук должен ориентироваться в чужом коде и уметь создавать собственный;
- математика. Без хорошего математического бэкграунда и знаний в области математического анализа, статистики и линейной алгебры составлять прогнозы и находить закономерности в наборах данных будет нелегко;
- машинное обучение — один из ключевых инструментов в работе;
- английский язык. Как и для многих вакансий в сфере ИТ, без английского не обойтись.
Хотите узнать, как стать data scientist с нуля и где учиться big data? Следующая подборка курсов data science для вас.
Data science курсы для начинающих
Введение в науку о данных от Coursera и IBM
Формат обучения: онлайн.
Кому подходит: новичкам, которые хотят разобраться и начать карьеру в Data Science.
Стоимость: есть возможность присоединиться бесплатно.
Длительность обучения: 4 месяца
Есть возможность получить сертификат о завершении курса от Coursera и цифровой значок от IBM, который подтверждает, что вы являетесь специалистом по основам науки о данных. Прохождение курса может приравниваться к профессиональному сертификату IBM Data Science Professional.
Поддержка при трудоустройстве: нет.
Программа курса
Курс дает базовые навыки в области науки о данных. Во время учебы студенты разберутся:
- что такое наука о данных;
- что такое машинное обучение;
- инструменты для работы с массивами данных (JupyterLab, R Studio, GitHub и Watson Studio);
- специфика работы и задачи специалистов по данным;
- что такое big Data;
- статистический анализ.
По окончанию курса по аналитике данных студенты получают теоретическую базу, необходимую для дальнейшего развития в области аналитики данных и практический опыт на реальных кейсах и задачах, который можно добавить в портфолио.
Особенности: это первый из 4 курсов по обучению работе в сфере Data Science от Coursera и IBM.
Machine Learning Crash Course от Google
Формат обучения: онлайн курс, рассчитанный на 15 уроков.
Кому подойдет: тем, кто хочет начать карьеру в Data Science или начал ее недавно.
Стоимость: бесплатно.
Длительность обучения: 20 часов работы в теории и практике.
Сертификат: нет.
Поддержка при трудоустройстве: нет.
Программа курса
Crash Course — возможность изучить и применить фундаментальные концепции машинного обучения и получить реальный опыт работы с Kaggle — системой организации конкурсов по исследованию данных.
На выходе студенты получают теоретическую базу и первые навыки работы с массивами данных в формате Data Science.
Особенности курсов: работа с инструментами Tensorflow.
Формат обучения: онлайн-курс, рассчитанный на 8 недель обучения.
Кому подойдет: новичкам в сфере Data Science.
Стоимость: бесплатно без экзамена или 149 долларов в расширенной версии с экзаменом и обратной связью.
Длительность обучения: 16 часов работы в теории и практике.
Сертификат: профессиональный сертификат в области науки о данных.
Поддержка при трудоустройстве: нет.
Ментор: Рафаэль Ирризари, профессор биостатистики в Гарварде.
Программа курса:
- работа с основами программирования R;
- функции и типы данных R;
- как работать с векторами и когда использовать расширенные функции, такие, как сортировка;
- как применять общие функции программирования: команды «if-else» и «for loop»;
- как анализировать и визуализировать данные с помощью ggplot2;
- работа с dplyr;
- организацию файлов с помощью UNIX/Linux;
- контроль версий с помощью git и GitHub;
- подготовка документов с помощью RStudio.
Особенность курса: практические занятия проходят на основе реальных данных о преступности в США.
Формат обучения: онлайн-курс из 30 уроков.
Кому подойдет: новичкам в сфере Data Science.
Стоимость: бесплатно.
Длительность обучения: 30 уроков, 9 часов видео, 54 теста, 21 интерактивная задача.
Сертификат: сертификат Института биоинформатики.
Поддержка при трудоустройстве: нет.
Программа курса:
- методы машинного обучения: деревья решений и нейронные сети;
- библиотеки для анализа данных на языках Python — Pandas и Scikit-learn;
- работа c кодом, базами данных;
- работа с Big Data;
- работа c Linux, удаленными серверами, Git.
Особенность курса: подготовлен на базе программы Института биоинформатики.
Курс по машинному обучению от Geek University
Формат обучения: онлайн-курс с живыми вебинарами и лекциями в записи. Курс рассчитан на 1,5 лет.
Кому подойдет: новичкам в сфере Data Science.
Стоимость: 1699 грн/месяц.
Длительность обучения: 30 уроков, 9 часов видео, 54 теста, 21 интерактивная задача.
Сертификат: сертификат Geek University.
Поддержка при трудоустройстве: команда Geek University поможет составить резюме и подберет вакансии из пула тех, что находятся в свободном доступе.
Программа курса
380 часов обучающего контента и 2 вебинара в неделю.
Студенты изучают:
- основы математики;
- основы программирования;
- основы языка Python;
- Git;
- создание рабочей станции в Linux;
- создание серверов в облачных сервисах AWS;
- поиск информации и основные операции с файлами;
- мониторинг работы сервера;
- язык запросов SQL;
- создание и оптимизацию сложных запросов;
- библиотеки языка Python, предназначенные для Data Science: Numpy, Pandas, Matplotlib, SciKit-Learn.
Особенности курса: 14 практических проектов в портфолио
Data Science от Skillbox
Формат обучения: живой онлайн-курс с практическими задачами.
Кому подойдет: новичкам, разработчикам и начинающим аналитикам.
Стоимость: 2445 грн/месяц.
Длительность обучения: 24 месяца.
Сертификат: сертификат Skillbox.
Поддержка при трудоустройстве: нет.
Программа курса включает в себя изучение базовых знаний по специальности (основы статистики и теории вероятности, основы математики) и углубленное изучение материала по одной из выбранных специальностей, Machine Learning, Data Engineering или Data Analytics.
Особенности курса: бонусные бесплатные курсы “Английский для разработчиков”, “Система контроля версий”, советы по трудоустройству и 3 проекта по выбранной специальности — вводный, Junior- и Middle-уровня для портфолио.
Формат обучения: онлайн-курс с практическими задачами и записью лекций.
Кому подойдет: бизнес-аналитикам и новичкам в сфере Data Science.
Стоимость: 9200 грн.
Длительность обучения: 7 трехчасовых занятий.
Сертификат: сертификат ITEA.
Поддержка при трудоустройстве: есть. Студентов с наивысшими баллами могут порекомендовать компаниям-партнерам, также обучающий центр помогает составить первое резюме.
Во время обучения студенты:
- разберутся в таких базовых понятиях, как Big Data, Business Intelligence, Data Mining, Data Science, Machine Learning, Artificial Intelligence;
- изучат популярные фреймворки и инструменты для Data Science решений;
- узнают и на практике применят подходы и методики для визуализации данных (Power BI и R).
Особенности курса: практика на реальных проектах.
Курс Big Data Lab от Vodafone
Формат обучения: онлайн-вебинары и записи лекций.
Кому подойдет: специалистам с опытом в Data Science.
Стоимость: 59 000 грн.
Длительность обучения: 6 месяцев.
Сертификат: сертификат Vodafone.
Поддержка при трудоустройстве: нет.
Программа курса
Во время обучения студенты разберутся, как стать аналитиком big data, узнают про основные методы вычислений (линейная алгебра, математический анализ, математическая статистика, теория вероятности), получат базовые навыки в процессах машинного обучения и нейронных сетях, разберутся в специфике big data анализа данных.
Особенности: большое количество практики на реальных проектах.
Стажировка по Data Science от WinstarsTechnology
Формат обучения: онлайн и офлайн занятия в Виннице.
Кому подойдет: студентам или выпускникам технических университетов, IT-школ, начинающим специалистам.
Стоимость: бесплатно, есть возможность получить оплачиваемую стажировку.
Длительность обучения: 3 месяца по 20 часов в неделю.
Сертификат: WinstaTechnology.
Поддержка при трудоустройстве: оплачиваемая стажировка и места в компании для лучших выпускников.
Программа стажировки подразумевает обучение анализу данных, полное погружение в реальные проекты и большой объем практики.
Особенности: возрастные ограничения для участников — 18-25 лет.
Data Science Bootcamp от DEVrepublik
Формат обучения: онлайн-курс.
Кому подойдет: начинающим специалистам.
Стоимость: бесплатно.
Длительность обучения: 6 месяцев.
Сертификат: нет.
Поддержка при трудоустройстве: нет.
Программа курса:
- Python та SQL для Data Science;
- Математика и статистика для Data Science;
- Machine Learning.
Особенности: защита реального проекта в финале обучения.
Python for Data Science от robot dreams
Формат обучения: онлайн-курс.
Кому подойдет: начинающим специалистам, аналитикам и разработчикам.
Стоимость: 2200 грн/месяц.
Длительность обучения: 16 онлайн-занятий.
Сертификат: да.
Поддержка при трудоустройстве: нет.
За время обучения студенты:
- научатся очистке данных и поиску отсутствующих значений;
- разберутся в прогнозировании и классификации;
- изучат кластерный анализ данных и поиск взаимосвязей;
- узнают о запуске a/b-тестирований и валидации гипотез, отборе признаков и
- разберут построение моделей machine learning;
- научатся работать с цифрами и математическими формулами в NumPy, с табличными данными ― в Pandas, с визуализациями ― в Matplotlib, Seaborn и Plotly;
- освоят 6 библиотек Python для Data Science.
Особенности: сложные домашние задания и фидбек от лектора по каждому из них.
Machine Learning от Hillel
Формат обучения: онлайн или оффлайн-курс в Киеве.
Кому подойдет: IT-специалистам и инженерам любой специальности, знающих Python, линейную алгебру, математический анализ и статистику на уровне первого курса технического вуза.
Стоимость: уточняется.
Длительность обучения: 20 занятий.
Сертификат: есть,от Hillel.
Поддержка при трудоустройстве: нет.
Программа курса
Студенты получат базовые знания выборе и настройке параметров модели, простейших, рекуррентных и сверточных нейронных сетях и их альтернативах, автокодировщиках и кластеризации.
Особенности: записи уроков остаются у студентов после окончания курса.
Профессия Data Scientist — возможность уже сегодня “заглядывать” в будущее и получать реалистичные четкие прогнозы, которые очень ценит бизнес. Если работа с большими массивами данных вам нравится, а высшая математика вызывает восхищение, а не ужас, то стоит попробовать себя в новой специализации. Удачи!