Обработка больших объемов структурированных и неструктурированных данных (включая Big Data) в IT-технологиях с целью получения инсайтов называется Data Science.
К данным, используемым для получения значимой информации, относятся:
Основные способы обработки этой информации — метод математической статистики и машинное обучение. Ведь необходимо не только структурировать данные, но и выявить закономерности в соответствии с заданием заказчика.
IT-специалист, имеющий со всем этим дело, именуется Data Scientist’ом. Его задача — на основе анализа обработанной информации построить прогнозную модель. Содержание прогнозов зависит от поставленных заказчиком задач.
Примечательно, что единого термина для обозначения Data Scientist’а в русском языке нет. Используемые варианты названий разнообразны:
Востребована также профессия помощника Data Scientist’а.
С прогнозными моделями, написанными Data Scientist’ом, рядовой пользователь сталкивается уже на этапе получения итогов запроса из поисковика.
Помимо алгоритмов поиска, к результатам работы специалиста по анализу данных могут относиться алгоритмы для:
И это далеко не полный перечень результатов работы Data Scientist’а.
Некоторые этапы работы IT-специалиста этой сферы могут отличаться из-за специфики компании, в которой он работает. Но основные заключаются в следующем:
Так как основной материал деятельности Data Scientist — массивы данных, а задача — анализ данных и разработка прогнозной модели, то одни из базовых навыков — математические познания (например, понятие о дифференциалах, производных, определителях матрицы) и умение работать с большими объемами информации.
К необходимым знаниям относятся:
Важнейший навык — не просто понимание алгоритмов и методов машинного обучения, но и умение применять их в практической деятельности. Также Data Scientist должен уметь визуализировать результаты своей работы.
Мы подготовили ответы на распространенные вопросы о Data Scientist’ах. Если вам понадобится больше информации — просто свяжитесь с нами.
1. Как найти специалиста Data Science?
2. Какими навыками должен обладать опытный Data Scientist?
3. Легко ли обучиться навыкам Data Science?
4. Чем отличается бизнес-аналитик от Data Scientist’а?