Публикации по теме 'data'
Девять уроков, извлеченных за мой первый год работы специалистом по данным
Полное раскрытие информации, я не знаю, считаю ли я себя настоящим специалистом по данным. Фактически, я бы сказал, что не существует истинного, общепринятого определения Data Scientist - название должности является жертвой чрезмерного использования, его значение искажено потоком маркетинговой шумихи и мании модных словечек. Мне нравится рассматривать себя как решателя проблем, где данные - это мой язык, наука о данных - мой инструментарий, а результаты бизнеса - моя движущая сила...
Новый тренинг SF по Agile Data Science 2.0, 6–8 мая 2019 г.
Доступен новый учебный курс по теории и практике agile data science, основанный на моей книге Agile Data Science 2.0 , в Сан-Франциско 6–8 мая.
Курс начинается с интерактивной лекции на полдня о том, как применять гибкую науку о данных с точки зрения команды. Затем следуют два с половиной дня демонстраций и упражнений с использованием живого кода. Весь класс проводится в Jupyter Notebooks с использованием экземпляров EC2 на реальных данных авиакомпаний.
Студенты выйдут из курса с..
Прогнозирование оттока клиентов с помощью Spark
Приведенное ниже обсуждение представляет собой отчет о моем завершающем проекте Udacity Data Science Nanodegree. Репозиторий git можно найти по адресу https://github.com/bdfaus/Sparkify .
Sparkify — это вымышленное приложение для потоковой передачи музыки, созданное Udacity. Как и в большинстве потоковых сервисов, пользователи могут повышать и понижать уровень своего сервиса. Ниже я исследую свои попытки использовать данные из Sparkify для прогнозирования пользователей, которые..
25 горячих новых инструментов для работы с данными и чего они не делают
«Подождите, инструмент X и инструмент Y работают вместе? Я думал, что они конкурентоспособны ».
Сегодня в быстрорастущей экосистеме данных появились десятки новых инструментов. Вместе они меняют работу с данными интересным, продуктивным и часто удивительным образом. Семена ландшафта данных на следующее десятилетие посеяны, и они быстро разрастаются.
Оказывается, создание новой экосистемы - дело непростое.
Путаница
Одним из симптомов беспорядка является то, что многие из этих..
Изучите науку о данных в 2019 году
Наука о данных - это не просто знание некоторых языков программирования, математики, статистики и «знание предметной области».
Как известно, 2019 год - это эпоха машинного обучения, глубокого обучения, разработки под Android и iOS. В этом году Rust, Python, Scala, R, JavaScript станут намного более популярными среди разработчиков, и будет представлено множество новых технологий.
Поскольку данные увеличиваются день ото дня, каждую секунду, а также количество интернет-пользователей..
Обнаружение скрытых закономерностей в многомерных временных рядах
Привычки могут измениться. Иногда они резко меняются в ответ на решение или изменение окружающей среды. Но часто они меняются регулярными циклами. Например, я довольно предсказуемо умею ездить на велосипеде в хорошую погоду; В теплые месяцы катаюсь, а на долгую зиму уезжаю в метро. Сервисы, которые предвосхищают подобные модели, могут лучше обслуживать пользователей каждый день, неделю и год.
В этом посте я описываю метод поиска циклических закономерностей в многомерных данных...
Призыв к пробуждению для Европы
Поскольку конкуренция между Китаем и США способствует быстрой эволюции машинного обучения, Европа должна адаптироваться, иначе она рискует остаться позади.
ПАРИЖ. В 1950-х годах президент Франции Шарль де Голль понимал, что если Франция хочет создать свое собственное пространство для суверенных действий в мире, в котором доминируют Соединенные Штаты и Советский Союз, она должна обладать собственной ядерной силой. Сегодня, в формирующемся глобальном порядке, в котором доминируют..