Обробка великих обсягів структурованих і неструктурованих даних (включаючи Big Data) в IT-технологіях з метою отримання інсайтів називається Data Science.
До даних, які використовуються для отримання значимої інформації, належать:
Основні способи обробки цієї інформації — метод математичної статистики і машинне навчання. Адже необхідно не тільки структурувати дані, але і виявити закономірності відповідно до завдання замовника.
IT-фахівець, який має справу з усім цим, іменується Data Scientist'ом. Його завдання — на основі аналізу обробленої інформації побудувати прогнозну модель. Зміст прогнозів залежить від поставлених замовником завдань.
Показово, що єдиного терміна для позначення Data Scientist'а в українській мові немає. Використовувані варіанти назв різноманітні:
Затребувана також професія помічника Data Scientist'а.
З прогнозними моделями, написаними Data Scientist'ом, пересічний користувач стикається вже на етапі отримання результатів запиту до пошукової системи.
Крім алгоритмів пошуку, до результатів роботи фахівця з аналізу даних можуть належати алгоритми для:
І це далеко не повний перелік результатів роботи Data Scientist'а.
Деякі етапи роботи IT-фахівця цієї сфери можуть відрізнятися через специфіку компанії, в якій він працює. Але основні полягають в наступному:
У зв’язку з тим, що основний матеріал діяльності Data Scientist'а — масиви даних, а завдання — аналіз даних і розробка прогнозної моделі, то одна з базових навичок — вільне оперування такими математичними категоріями, як диференціал, похідна, визначник матриці, і бажання працювати з великими обсягами інформації.
До необхідних знань відносяться:
Найважливіший навик — не просто розуміння алгоритмів і методів машинного навчання, а й уміння застосовувати їх в практичній діяльності. Також Data Scientist повинен вміти візуалізувати результати своєї роботи.
Ми підготували відповіді на поширені питання про Data Scientist'ів. Якщо вам знадобиться більше інформації — просто зв'яжіться з нами.
1. Як знайти фахівця Data Science?
2. Якими навичками повинен володіти досвідчений Data Scientist?
3. Чи можна навчитися навичкам Data Science?
4. Чим відрізняється бізнес-аналітик від Data Scientist'а?