Публикации по теме 'data-science'


Обзор: программа Udacity Data Analyst Nanodegree
Программа Data Analyst Nanodegree от Udacity была одной из первых онлайн-программ по науке о данных в революции онлайн-образования. Он направлен на то, чтобы убедиться, что вы овладеете точными навыками, необходимыми для построения карьеры в области науки о данных . Достигает ли он своей цели? Это лучший вариант? Я завершил программу осенью 2016 года. Вдохновленный шаблоном обзора открытого исходного кода Class Central , вот мой обзор программы Udacity Data Analyst Nanodegree...

Ваш путеводитель по проверке гипотез и P-значениям
Большой шанс, что вы встретили одно из этих модных словечек и у вас есть вопросы. Если это вы, то вы попали в нужное место. В этой статье мы собираемся объяснить Проверка гипотез, доверительные интервалы, статистическая значимость и P-значения в действительно простой способ. Так что оставайтесь здесь, потому что мы собираемся копаться в каждом из них. Проверка гипотезы Проверка гипотез - это научный процесс проверки того, правдоподобна ли гипотеза (другими словами, это..

Не бойтесь - узнайте, как запустить AWS на локальном компьютере с помощью LocalStack
Руководство экономного программиста по использованию API AWS без нарушения банковского счета Облако AWS стало практически нормой: более миллиона компаний по всему миру создают на нем приложения. В своей карьере в какой-то момент вам придется или придется что-то развернуть в этой экосистеме: это неизбежно, что показывает, насколько далеко досягаемость AWS. Одна из самых больших проблем при попытке создать облако - это огромное количество сервисов, доступных в вашем распоряжении, и..

Создайте систему рекомендаций на Python
Введение в ARM с последующим примером кодирования Создайте систему рекомендаций на Python Используйте ассоциативный анализ правил, чтобы распутать закономерности Что такое Association Rule Mining (ARM)? Это метод машинного обучения без учителя, цель которого - выявить интересные закономерности и взаимосвязи в наборе данных. Например, мы можем попытаться определить, какие продукты обычно покупают вместе в продуктовом магазине. Это может помочь нам расположить товары в..

Создавайте целевые страницы для ваших проектов с помощью GitHub Pages
Продемонстрируйте свою работу на веб-сайте индивидуального проекта Я вырос в экспериментальной науке, где мы имеем дело с множеством самодельных экспериментальных установок и сценариев анализа данных. Часто результатом этого может быть плохо документированный и сложный в использовании код, особенно после того, как первоначальный аспирант (который написал его) закончил учебу и ушел. По этой причине, когда я разработал несколько сценариев анализа данных во время моего исследования в..

РЕАЛИЗАЦИЯ PANDAS В МАШИННОМ ОБУЧЕНИИ НА ХАКВЕДЕ!!!
→ Итак, давайте теперь кратко расскажем, что такое PANDAS: Pandas – это программная библиотека, написанная для языка программирования Python для обработки и анализа данных. Он предлагает структуры данных и операции для работы с числовыми таблицами. Pndas – это модуль Python, который делает науку о данных простой и эффективной. Pandas работает со структурами данных программирования * Серия * DataFrame а. Серии : одномерный помеченный массив, способный хранить..

Эволюция современного хранилища данных
Существует множество определений хранилища данных . Я взял случайное определение из Интернета. Это соответствует общему пониманию в индустрии управления данными того, что такое хранилище данных, а что нет. Это тоже неправильно. «Хранилище данных - это технология, которая объединяет структурированные данные из одного или нескольких источников, чтобы их можно было сравнивать и анализировать для большей бизнес-аналитики». Если вы смотрите на это определение и думаете: «Мне это..