Программа Data Analyst Nanodegree от Udacity была одной из первых онлайн-программ по науке о данных в революции онлайн-образования. Он направлен на то, чтобы убедиться, что вы овладеете точными навыками, необходимыми для построения карьеры в области науки о данных. Достигает ли он своей цели? Это лучший вариант?

Я завершил программу осенью 2016 года. Вдохновленный шаблоном обзора открытого исходного кода Class Central, вот мой обзор программы Udacity Data Analyst Nanodegree.

ОБНОВЛЕНИЕ: в сентябре 2017 года программа Data Analyst Nanodegree пополнилась новым контентом и услугами для студентов. Подробности здесь. Меня также взяли на борт, чтобы я помог воссоздать часть этого нового контента. Большая часть этого обзора осталась без изменений. Фактические обновления выделены курсивом.

Исходная информация

Что заставило меня пойти по этой программе?

В начале 2016 года я начал создавать свою собственную магистерскую программу по наукам о данных, используя онлайн-ресурсы. (Вы можете прочитать об этом здесь.) Я записался на программу Data Analyst Nanodegree по нескольким причинам:

  • Мне нужно было руководство для введения в науку о данных.
  • Мне нужна была целостная программа, а не отдельные курсы от разных провайдеров.
  • Он получил звездные отзывы.
  • Раньше я посещал несколько курсов Udacity и был поклонником их стиля преподавания.

Каковы были мои цели?

Хотя программа может служить мостом к работе (подробнее об этом позже), я хотел использовать ее как введение в более сложный материал. Этот «более сложный материал» относится как к предметам, которые включены в программу, так и к предметам, которые не включены.

Что такое программа Udacity Nanodegree?

Udacity - один из ведущих провайдеров онлайн-образования. Себастьян Трун, бывший профессор Стэнфордского университета и основатель Google X, основал компанию и занимается инновациями в Udacity в качестве президента и председателя. Виш Махиджани - генеральный директор.

Программы Nanodegree - это онлайн-учетные данные, предоставленные Udacity. Это компиляции курсов Udacity (некоторые из них доступны бесплатно, другие нет), к которым прикреплены проекты, которые проверяются платными рецензентами Udacity. Они также предлагают множество студенческих услуг.

Slack используется в качестве инструмента сообщества, с помощью которого студенты Udacity могут общаться с другими студентами, а также с инструкторами своей программы и другими сотрудниками Udacity. В большинстве программ студенты назначают наставников и общаются с ними через частный канал чата, который всегда доступен в классе Udacity.

Программа Data Analyst Nanodegree была первоначально выпущена в 2014 году. Это была вторая программа Nanodegree от Udacity. Несмотря на то, что с годами она претерпела некоторые изменения, ядро ​​программы осталось неизменным.

Кто такие инструкторы и каков их опыт?

Поскольку программа Data Analyst Nanodegree представляет собой сборник курсов Udacity (опять же, одни бесплатные, другие нет), есть несколько инструкторов. Их резюме часто включают престижные должности в крупных технологических компаниях и дипломы ведущих школ США.

Они не являются «инструкторами» сами по себе, но рецензенты проектов Udacity, наставники и сотрудники по обучению студентов (которые следят за Slack вместе с инструкторами) входят в число людей, с которыми вы общаетесь больше всего. Они такие, такие полезные. Подробнее об этом позже.

Расходы

Программа состоит из двух частей. Первый семестр стоит 499 долларов США. Второй семестр стоит 699 долларов. Если вы хорошо разбираетесь в навыках, которым обучали в первом семестре, вы можете пропустить его, пройти только второй семестр и при этом получить аттестат.

Рекомендуемые предпосылки

Для семестра 1 Udacity рекомендует студентам ознакомиться с описательной статистикой и иметь некоторый опыт работы с данными в электронных таблицах или SQL.

Для семестра 2 учащиеся должны иметь опыт анализа данных с использованием Python, а также хорошо разбираться в статистике вывода и ее приложениях.

Мой опыт / навыки участия в программе

Я начал программу в мае 2016 года, когда у меня был несколько месяцев опыта программирования, в основном на C и Python. Подавляющее большинство этого опыта я получил от связующего модуля для моей магистерской программы по науке о данных, где я взял Гарвардский CS50: Введение в информатику и Введение в программу Udacity по программированию на нанодипломах.

Я также закончил бакалавриат по программе химического машиностроения и имел 24-месячный опыт работы в области количественной оценки. Это означало, что я прошел несколько курсов по статистике и чувствовал себя комфортно с данными.

Программа

Состав

Программа Data Analyst Nanodegree состоит из двух частей. Каждый семестр состоит из трех курсов и четырех проектов (дополнительный проект представляет собой вводный проект, который помогает вам привыкнуть к учебной среде Udacity). Мэт Леонард, руководитель учебной программы на момент обновления, присутствует на протяжении всей программы, рассказывая о каждом курсе, его цели и инструкторах.

Содержание курса состоит из видео, текста и викторин. Видео обычно длится от 30 секунд до пяти минут, в зависимости от стиля Udacity. За этими короткими видео часто следуют автоматически оцениваемые викторины. Эти викторины обычно представляют собой множественные варианты ответов, заполнение пустых полей или небольшие задачи программирования. После приобретения CloudLabs эти задачи программирования теперь выполняются в Jupyter Notebook и средах программирования SQL в классе Udacity.

Опять же, у каждого раздела есть оцениваемый проект. Эти проекты и отзывы оплачиваемых рецензентов Udacity - это то, что представляет большую ценность для студентов.

Учебный план

Моя редакция программы состояла из семи частей:

  • P1: Описательная и логическая статистика
  • P2: Введение в анализ данных (с NumPy и pandas)
  • P3: обработка данных с помощью MongoDB (или SQL)
  • P4: Исследовательский анализ данных (с R)
  • P5: Введение в машинное обучение
  • P6: Визуализация данных с помощью D3.js
  • P7: Разработайте A / B-тест

Первый термин новой программы называется Анализ данных с помощью Python и SQL. Курсы и проекты включают:

  • Вступительный проект: изучайте тенденции погоды. SQL и электронные таблицы (или Python / R, если вы уже знакомы) используются для анализа и визуализации данных о температуре.
  • Курс: Введение в Python. Проект: Изучите данные Bikeshare в США.
  • Курс: Введение в анализ данных, который включает процесс анализа данных и SQL для анализа данных. Проект: исследование набора данных.
  • Курс: Практическая статистика. Проект: анализ результатов A / B-тестирования.

Второй термин называется Расширенный анализ данных. Курсы и проекты включают:

  • Вступительный проект: Тестирование феномена восприятия. Вычислите описательную статистику и проведите статистический тест с набором данных на основе психологического феномена, называемого эффектом Струпа.
  • Курс: обработка данных (с Python). Проект: разбирать и анализировать данные. Это курс и проект, который я создал. 😊
  • Курс: Исследовательский анализ данных (с R). Проект: изучение и обобщение данных.
  • Курс: повествование данных (с Tableau). Проект: создание игровой истории.

Большие изменения, подробности которых описаны в этом сообщении блога:

  • Теперь в программе преподается Python.
  • Машинное обучение и A / B-тестирование теперь включены в качестве дополнительных материалов и больше не являются обязательными для завершения программы. Обоснование: «Цель этой программы - подготовить вас к работе аналитика данных. Наше исследование показывает, что машинное обучение не является обязательным требованием для подавляющего большинства должностей аналитиков данных ». Основы A / B-тестирования теперь описаны в новом практическом курсе статистики, что дает учащимся знания, которые им понадобятся на работе.
  • Новые курсы и проекты. В частности, Введение в анализ данных (который включает Python для анализа данных и SQL для анализа данных), практическая статистика (преподается Себастьяном Траном) и анализ данных.

Оценка

Проекты оцениваются по принципу «прошел / не прошел» (официально «соответствует спецификациям» и «требует изменений») в соответствии с уникальной рубрикой. Ваш проект должен соответствовать всем разделам рубрики. Если все ваши проекты соответствуют требованиям, вы заканчиваете учебу. Это означает, что автоматически выставленные оценки не учитываются в вашей оценке.

Если для подачи проекта требуются изменения, ваш рецензент предоставит вам полезный отзыв. После того, как вы внесете эти изменения, вы можете повторно отправить. Нет ограничений на отправку.

Мой опыт

Лента новостей

По оценкам Udacity, когда я начинал, программа Data Analyst Nanodegree составляла 378 часов, а это означало, что на ее выполнение студентам требовалось в среднем 6–7 месяцев. Согласно Toggl (приложение для учета рабочего времени), вся программа заняла у меня 369 часов за пять месяцев. Этот график включал в себя посвящение серьезного времени созданию качественного портфолио моих проектов, а не созданию минимума, удовлетворяющего критерию прошел / не прошел.

Программа была сокращена в обновлении осени 2017 года. Новый расчетный срок составляет 260 часов. Каждый семестр рассчитан на 10 часов в неделю в течение 13 недель, хотя студентам дается 19 недель на прохождение каждого семестра.

Каким был курс?

В моем выпуске программы содержание курсов из P1 (Статистика), P2 (Введение в анализ данных), P4 (Исследовательский анализ данных), P5 (Машинное обучение) и P7 (A / B-тестирование) получает пять звезд. пять от меня. P3 (Data Wrangling) и P6 получают три с половиной звезды.

Содержание исследовательского анализа данных с сотрудниками Facebook (P4) было очень полезным. Введение в курс машинного обучения с Себастьяном Труном и Кэти Мэлоун (P5) было самым интересным из всех онлайн-курсов. Контент A / B-тестирования с сотрудниками Google (P7) настолько уникален. Я бы поставил этим трем курсам шесть звезд, если бы мог.

Содержание SQL и Data Wrangling (P3) не впечатлило. То же самое и с содержимым визуализации данных (P6), хотя, вероятно, это было связано с тем, что D3.js очень сложно обучить новичкам JavaScript. Согласно обзорам Class Central для этих курсов, такие мнения не редкость. Посмотрите их здесь и здесь.

Этот не замечательный контент из старой программы был удален при обновлении осенью 2017 года. Обновленный контент для введения в анализ данных, SQL, статистику, обработку данных и визуализацию данных теперь включен. Содержание Практическая статистика сосредоточено на статистических выводах, при этом описательная статистика является обязательным условием и преподается в программе Основы данных Nanodegree. Курс визуализации данных теперь преподается с помощью Tableau вместо D3.js.

Как прошли проекты?

Опять же, проекты - это то, чем Udacity выделяется среди остальных платформ онлайн-образования. Они вкладывают средства в процесс рассмотрения своего проекта, и это окупается. Программа Data Analyst Nanodegree не стала исключением.

Все проекты усиливают содержание, которое вы узнали в видео. Рецензенты проекта знают свое дело. Они расскажут вам, в чем вы преуспели, а где ваши ошибки и / или упущения. Контролируемое обучение на практике. Оно работает.

Форумы и их наставники особенно полезны, когда вы застряли. Поищите на форумах, не является ли ваша проблема распространенной (обычно это так). Не повезло? Задайте себе новый вопрос. Есть один наставник форума, Майлс Каллан, который, кажется, знает все обо всем и отвечает в течение нескольких часов. Я сомневаюсь, что он спит.

Хотя форумы все еще существуют и работают, Slack и классные наставники теперь рекомендуются для поддержки. Учащиеся могут задавать вопросы, и ответы предоставляются с такой же или большей степенью оперативности (в течение нескольких часов, а часто и раньше). Сообщество Slack контролируется инструкторами Udacity, а также их студенческим персоналом, который обеспечивает своевременное рассмотрение вопросов, комментариев и т. Д. Студентов. Знаменитый Майлз Каллан стал наставником.

Если вам интересно посмотреть, как выглядят эти проекты, загляните в этот репозиторий Github.

Насколько это было тяжело?

Со статистикой мне было легко, потому что я прошел несколько курсов по статистике в бакалавриате. Вероятно, это было бы верно для каждой темы в программе Nanodegree, если бы у вас был предыдущий опыт в ней.

Я бы отнес большую часть программы к средней сложности. Содержание лекции, в котором не так много викторин (хотя они часто бывают), может быть пустяком, что не обязательно плохо. Проекты тренируют ваш мозг. На каждое из них у вас уйдет больше двадцати часов, если вы хотите быть внимательными.

Самым сложным оказался проект исследовательского анализа данных. У меня ушло 3,5 подачи. Загляните в эту ветку Twitter для получения более подробной информации.

Можете ли вы подать заявление о приеме на работу сразу после окончания учебы?

Вы можете. Программа должна вооружить вас необходимыми навыками для роли аналитика данных начального уровня, если вы относитесь к ней серьезно. Эли Кастелейн - прекрасный тому пример. Подробнее о его истории вы можете прочитать ниже.



Вы также можете продолжить обучение на более продвинутых курсах как по предметам, охватываемым программой, так и по другим предметам. Это то, что я выбрал.

Последние мысли

Мог бы я снова пройти программу, зная то, что я знаю сейчас?

Где-то ближе к концу программы я начал создавать Руководство по карьере в области науки о данных для Class Central. Это повлекло за собой изучение каждого онлайн-курса, предлагаемого по каждому предмету в области науки о данных.

Хотя мне понравилось большинство курсов в рамках программы Nanodegree (обновлено: новые курсы заменили те, которые мне не нравились), есть курсы от других поставщиков, которые получают лучшие отзывы по определенным предметам. Статистика, например. Если бы у меня был доступ к моему руководству, когда я начинал, я бы подумал о маршруте с отдельным курсом для каждого предмета. Услуги для студентов и процесс рассмотрения проектов Udacity настолько эффективны для обучения, что я все равно выберу программу Data Analyst Nanodegree.

Если вы из тех людей, которые хотят получить 100% индивидуальный опыт онлайн-образования, но хотят воспользоваться преимуществами проектов и услуг Udacity, исследуя свои любимые курсы по каждому предмету (я рекомендую использовать Class Central), а затем записаться в программу Nanodegree. для завершения проектов есть что подумать.

Альтернативы

Вот пять альтернативных программ, которые я рассматривал, когда записывался в программу Data Analyst Nanodegree:

Примечание. Я удалил свои комментарии к этим программам из-за политики Udacity в отношении комментариев к другим поставщикам.

Заключение

Программа Udacity Data Analyst Nanodegree дает вам базовые навыки, необходимые для карьеры в области науки о данных. После окончания учебы вы сможете определить свои сильные и слабые стороны и при необходимости дополнить свое обучение. Кроме того, вы уйдете с несколькими готовыми портфолио.

Мне он понравился, как и другим.

★★★★¾