Публикации по теме 'data'
3 тревожных последствия неэтичного использования данных
Технология находится на перепутье.
Мы видели это раньше: разрабатывается что-то новое, и есть спешка, чтобы это одобрить и использовать как можно скорее. Например, после того, как ДДТ был использован для борьбы с сыпным тифом и малярией во время Второй мировой войны, возникло стремление найти для него больше применений. В конце войны Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) одобрило его использование в качестве пестицида без тщательного..
Новые методы в геометрическом глубоком обучении, часть 2 (машинное обучение)
Контролируемая фильтрация трактограмм с использованием геометрического глубокого обучения (arXiv)
Автор: Пьетро Астольфи , Рубен Верхаген , Лоран Пети , Эмануэле Оливетти , Сильвио Саруббо , Джонатан Маски , Давиде Боскаини , Паоло Авесани .
Аннотация: Трактограмма представляет собой виртуальное представление белого вещества головного мозга. Он состоит из миллионов виртуальных волокон, закодированных в виде трехмерных полилиний, которые аппроксимируют пути аксонов белого..
Data Scientist будущего, по версии Microsoft
Недавно я построил прогностическую модель, которая вскоре принесет огромную пользу, но я не специалист по данным и не имею формального образования в области науки о данных. Это заставило меня задуматься; почему так много промышленности и образования существует вокруг такой специализированной науки о данных? Еще в 2012 году в Harvard Business Review была опубликована статья, в которой Data Scientist провозглашается самой сексуальной профессией 21 века . С тех пор тысячи рабочих мест были..
тип алгоритмов, которые специалисты по данным используют в своей повседневной работе
Специалисты по данным используют различные алгоритмы в своей повседневной работе. Некоторые из наиболее распространенных алгоритмов включают в себя:
Линейная регрессия. Этот алгоритм используется для прогнозирования непрерывного значения на основе набора независимых переменных. Например, вы можете использовать линейную регрессию для прогнозирования цены дома на основе его квадратных метров, количества спален и местоположения. Логистическая регрессия . Этот алгоритм используется для..
Инструментарий аналитиков данных: модели
Вы очистили свои данные и провели предварительный анализ данных. Что теперь? Как аналитики данных, у нас есть много инструментов в нашем наборе инструментов, но точно так же, как отверткой можно забить гвоздь, это не лучший инструмент для работы. Наши инструменты - это модели или, если вы предпочитаете математический термин, алгоритмы. Они позволяют нам анализировать собранные данные и делать прогнозы.
В зависимости от типа данных существует три основных типа моделей. Для..
Повышение градиента: что должен знать каждый специалист по данным
Повышение градиента — это метод машинного обучения, который используется как в программах классификации, так и в программах регрессии. Это один из самых мощных алгоритмов предиктивного обучения, хорошо известный своей точностью и скоростью. GBM отлично подходят для больших и сложных наборов данных и обладают универсальностью для обработки нулевых значений, высокой кардинальности в категориальных переменных и выбросов. Создание моделей повышения градиента очень просто с помощью XGBoost или..
Типы данных - объекты и атрибуты R
R Программирование объектов и атрибутов
В этой статье мы рассмотрим важную проблему для R. Мы поговорим о различных типах данных, используемых в R. Мы также узнаем о некоторых основных операциях с типами данных.
Если готовы, приступим:
Объекты
Все, чем вы манипулируете в R, все, что мы встречаем в R, объекты, которые можно назвать объектами, все объекты могут быть разных типов, содержать все разные типы данных. Но все в R - объект. Итак, в R есть пять основных классов атомарных..