Публикации по теме 'data'


Девять уроков, извлеченных за мой первый год работы специалистом по данным
Полное раскрытие информации, я не знаю, считаю ли я себя настоящим специалистом по данным. Фактически, я бы сказал, что не существует истинного, общепринятого определения Data Scientist - название должности является жертвой чрезмерного использования, его значение искажено потоком маркетинговой шумихи и мании модных словечек. Мне нравится рассматривать себя как решателя проблем, где данные - это мой язык, наука о данных - мой инструментарий, а результаты бизнеса - моя движущая сила...

Новый тренинг SF по Agile Data Science 2.0, 6–8 мая 2019 г.
Доступен новый учебный курс по теории и практике agile data science, основанный на моей книге Agile Data Science 2.0 , в Сан-Франциско 6–8 мая. Курс начинается с интерактивной лекции на полдня о том, как применять гибкую науку о данных с точки зрения команды. Затем следуют два с половиной дня демонстраций и упражнений с использованием живого кода. Весь класс проводится в Jupyter Notebooks с использованием экземпляров EC2 на реальных данных авиакомпаний. Студенты выйдут из курса с..

Прогнозирование оттока клиентов с помощью Spark
Приведенное ниже обсуждение представляет собой отчет о моем завершающем проекте Udacity Data Science Nanodegree. Репозиторий git можно найти по адресу https://github.com/bdfaus/Sparkify . Sparkify — это вымышленное приложение для потоковой передачи музыки, созданное Udacity. Как и в большинстве потоковых сервисов, пользователи могут повышать и понижать уровень своего сервиса. Ниже я исследую свои попытки использовать данные из Sparkify для прогнозирования пользователей, которые..

25 горячих новых инструментов для работы с данными и чего они не делают
«Подождите, инструмент X и инструмент Y работают вместе? Я думал, что они конкурентоспособны ». Сегодня в быстрорастущей экосистеме данных появились десятки новых инструментов. Вместе они меняют работу с данными интересным, продуктивным и часто удивительным образом. Семена ландшафта данных на следующее десятилетие посеяны, и они быстро разрастаются. Оказывается, создание новой экосистемы - дело непростое. Путаница Одним из симптомов беспорядка является то, что многие из этих..

Изучите науку о данных в 2019 году
Наука о данных - это не просто знание некоторых языков программирования, математики, статистики и «знание предметной области». Как известно, 2019 год - это эпоха машинного обучения, глубокого обучения, разработки под Android и iOS. В этом году Rust, Python, Scala, R, JavaScript станут намного более популярными среди разработчиков, и будет представлено множество новых технологий. Поскольку данные увеличиваются день ото дня, каждую секунду, а также количество интернет-пользователей..

Обнаружение скрытых закономерностей в многомерных временных рядах
Привычки могут измениться. Иногда они резко меняются в ответ на решение или изменение окружающей среды. Но часто они меняются регулярными циклами. Например, я довольно предсказуемо умею ездить на велосипеде в хорошую погоду; В теплые месяцы катаюсь, а на долгую зиму уезжаю в метро. Сервисы, которые предвосхищают подобные модели, могут лучше обслуживать пользователей каждый день, неделю и год. В этом посте я описываю метод поиска циклических закономерностей в многомерных данных...

Призыв к пробуждению для Европы
Поскольку конкуренция между Китаем и США способствует быстрой эволюции машинного обучения, Европа должна адаптироваться, иначе она рискует остаться позади. ПАРИЖ. В 1950-х годах президент Франции Шарль де Голль понимал, что если Франция хочет создать свое собственное пространство для суверенных действий в мире, в котором доминируют Соединенные Штаты и Советский Союз, она должна обладать собственной ядерной силой. Сегодня, в формирующемся глобальном порядке, в котором доминируют..