Публикации по теме 'data-science'
Обзор: программа Udacity Data Analyst Nanodegree
Программа Data Analyst Nanodegree от Udacity была одной из первых онлайн-программ по науке о данных в революции онлайн-образования. Он направлен на то, чтобы убедиться, что вы овладеете точными навыками, необходимыми для построения карьеры в области науки о данных . Достигает ли он своей цели? Это лучший вариант?
Я завершил программу осенью 2016 года. Вдохновленный шаблоном обзора открытого исходного кода Class Central , вот мой обзор программы Udacity Data Analyst Nanodegree...
Ваш путеводитель по проверке гипотез и P-значениям
Большой шанс, что вы встретили одно из этих модных словечек и у вас есть вопросы. Если это вы, то вы попали в нужное место. В этой статье мы собираемся объяснить Проверка гипотез, доверительные интервалы, статистическая значимость и P-значения в действительно простой способ. Так что оставайтесь здесь, потому что мы собираемся копаться в каждом из них.
Проверка гипотезы
Проверка гипотез - это научный процесс проверки того, правдоподобна ли гипотеза (другими словами, это..
Не бойтесь - узнайте, как запустить AWS на локальном компьютере с помощью LocalStack
Руководство экономного программиста по использованию API AWS без нарушения банковского счета
Облако AWS стало практически нормой: более миллиона компаний по всему миру создают на нем приложения. В своей карьере в какой-то момент вам придется или придется что-то развернуть в этой экосистеме: это неизбежно, что показывает, насколько далеко досягаемость AWS.
Одна из самых больших проблем при попытке создать облако - это огромное количество сервисов, доступных в вашем распоряжении, и..
Создайте систему рекомендаций на Python
Введение в ARM с последующим примером кодирования
Создайте систему рекомендаций на Python
Используйте ассоциативный анализ правил, чтобы распутать закономерности
Что такое Association Rule Mining (ARM)?
Это метод машинного обучения без учителя, цель которого - выявить интересные закономерности и взаимосвязи в наборе данных. Например, мы можем попытаться определить, какие продукты обычно покупают вместе в продуктовом магазине. Это может помочь нам расположить товары в..
Создавайте целевые страницы для ваших проектов с помощью GitHub Pages
Продемонстрируйте свою работу на веб-сайте индивидуального проекта
Я вырос в экспериментальной науке, где мы имеем дело с множеством самодельных экспериментальных установок и сценариев анализа данных. Часто результатом этого может быть плохо документированный и сложный в использовании код, особенно после того, как первоначальный аспирант (который написал его) закончил учебу и ушел. По этой причине, когда я разработал несколько сценариев анализа данных во время моего исследования в..
РЕАЛИЗАЦИЯ PANDAS В МАШИННОМ ОБУЧЕНИИ НА ХАКВЕДЕ!!!
→ Итак, давайте теперь кратко расскажем, что такое PANDAS:
Pandas – это программная библиотека, написанная для языка программирования Python для обработки и анализа данных.
Он предлагает структуры данных и операции для работы с числовыми таблицами.
Pndas – это модуль Python, который делает науку о данных простой и эффективной.
Pandas работает со структурами данных программирования
* Серия
* DataFrame
а. Серии : одномерный помеченный массив, способный хранить..
Эволюция современного хранилища данных
Существует множество определений хранилища данных . Я взял случайное определение из Интернета. Это соответствует общему пониманию в индустрии управления данными того, что такое хранилище данных, а что нет.
Это тоже неправильно.
«Хранилище данных - это технология, которая объединяет структурированные данные из одного или нескольких источников, чтобы их можно было сравнивать и анализировать для большей бизнес-аналитики».
Если вы смотрите на это определение и думаете: «Мне это..