В настоящее время наукой о данных интересуются практически все. СМИ и мир вокруг так сильно раздули тему, что каждый, кого вы встретите, захочет запачкать руки в некоторых данных, хотя им может не хватать необходимых навыков.

Что такое Data Science
Данные - это информация, ее много. Но «наука» исходит из правил предсказания, степени свободы, моментов, проверки гипотез, изучения теорий и многого другого.
Почему это фасад
За последние 5 лет это направление приобрело бешеную популярность. Окружающие быстро заполнили спрос МООК и живыми курсами. Но помните - статистика - это отдельная область. Это не то, что можно освоить за 3 месяца. Ни один MOOC не сделает из вас специалиста по данным за 3 или 6 месяцев, если вы раньше были разработчиком программного обеспечения. Чтобы развить интуицию, нужны годы обучения статистике.
Проблема смены домена
Переходя с таких факультетов, как «Электротехника» или «Машиностроение», будет сложно понять статистическую математику. Вам будет не хватать обучения на уровне бакалавра, и вы будете напрямую заниматься курсами уровня магистра - что непросто в любом смысле.
Помимо простого применения алгоритма обучения в куча данных. Не понимая этих нюансов (все они лежат в статистике), вам сложно понять, что вы делаете.
Обмануть себя
Прочтите следующие вопросы:
- Вы знаете, что такое байесовский риск?
- Вы знаете, как проводить проверку гипотез на ваших данных?
- Вы знакомы с Anova?
- Знаете ли вы, когда разница между удержанием и перекрестной проверкой?
Все это темы в статистике. Многие из них преподаются на уровне бакалавра в университетах. Если вы изо всех сил пытаетесь ответить на вышеперечисленные вопросы, спросите себя, почему вы попадаете в Data Science?
Поддерживаете ли вы причудливые термины, предлагаемые СМИ - машинное обучение, случайный лес и нейронные сети?
Это потому, что каждая компания, которую вы видите, ищет специалиста по данным?
Вы занимаетесь этим из любви к предмету?
Ответь себе честно. Если вы ответили утвердительно на любой из вопросов, кроме последнего, значит, вы попали в него по неправильной причине.
Настоящий специалист по данным не ответит утвердительно ни на один вопрос, кроме последнего.
Время как ресурс
С годами я понял, что чем раньше мы чем-то займемся, тем лучше мы добьемся этого. Опыт почти во всем напрямую зависит от количества часов, которые мы вкладываем в это. Нет никакого ярлыка.
Следовательно, переключая наш фокус, меняя сферу деятельности или смещая сферу нашей деятельности, мы каждый день перенастраиваем одни и те же 24 часа на новые области и карьерные интересы. Это ограничивает наш рост в любой конкретной области.
Из этого прямо следует, что люди, занимающиеся статистикой или математикой намного дольше вас, определенно будут лучше вас.
Сообщение
Знайте, что легко обмануть себя, думая, что вам нравится. Причина, по которой вы хотите заняться наукой о данных, не должна заключаться в том, что все остальные занимаются наукой о данных, или по какой-либо из причин, указанных выше. Делайте это из любви к предмету и не меньше!
Хочешь оставаться на связи? Или просто хотите протянуть руку помощи? Найди меня в Твиттере