Публикации по теме 'statistics'


Случайная смесь статистических методов
Пытаюсь почистить здесь свои заметки — определенно, я не так много технической работы, как раньше, но что-то всегда может пригодиться. Просто выкладываю эти вещи сюда. Это случайный набор статических методов, которые я прочитал или использовал за последние несколько лет: Нежное введение в оценку максимального правдоподобия Многомерное распределение Гаусса НЛП в R Обзор литературы по моделированию поднятия Контрфактическая оценка и оптимизация показателей кликов..

Является ли специалист по данным только созданием моделей прогнозирования?
Этот пост предназначен для людей, которые плохо знакомы с областью науки о данных или хотят сменить карьеру и заинтересованы в использовании наборов данных Kaggle, чтобы получить практический опыт работы с алгоритмами и построить модели статистического прогнозирования в качестве ключевого шага к тому, чтобы стать специалистом по данным. ученый Наука о данных — это область, которая включает в себя извлечение идей и знаний из данных. Конечной целью науки о данных является создание..

Байесовское мышление: атаки акул, зомби и принятие лучших решений
Как причудливая концепция статистики может помочь вам принимать лучшие решения в повседневной жизни Подумайте о том, как вы принимаете решения. Если вы похожи на меня и большинство людей. Вам, наверное, хреново. Теперь вы, вероятно, спорите со мной, говоря: «Стивен, я действительно отлично умею принимать решения». Поверьте мне, здесь вы ошибаетесь. Причина, по которой мы плохо принимаем решения, заключается в том, что наш мозг не создан для этого. Наш мозг фантастичен в одних..

Помимо R²
Разоблачение обманчивой стороны метрик данных Являетесь ли вы новичком в мире статистического анализа (или науки о данных, анализа данных, машинного обучения и т. д.) или опытным ветераном; тогда шансы — одна из первых вещей, о которых вы узнали, — это линейный регрессионный анализ. Также весьма вероятно, что среда (без каламбура), в которой вы узнали о регрессии, реализовала метрику R² во время оценки модели. Хотя R² является популярной метрикой для оценки регрессионных моделей,..

Случайные переменные
Интересно, что случайная переменная не является ни переменной, ни случайной. Всякий раз, когда вы проводите случайный эксперимент, большую часть времени вас будет интересовать функция результатов, а не фактические результаты. Рассмотрим пример броска двух игральных костей. Здесь вас может заинтересовать сумма граней = 7. Это может произойти из-за возможных исходов, таких как (1,6), (2,5), (3,4)… Здесь нас не волнуют отдельные исходы. Нас интересует только сумма результатов двух костей..

Байесовские приемы на каждый день
Изучите пару полезных вероятностных трюков, чтобы безопасно ориентироваться в море неполной информации Иногда нам хотелось бы знать что-то, чего мы не знаем. К сожалению, во многих случаях нет времени или даже нет возможности изучить то, что нам нужно. Тем не менее, решения и оценки должны приниматься только на основе одноразовых знаний. Хотя многим из нас кажется пугающим ориентироваться в тумане неполной информации, те, кто понимает природу неопределенности, могут использовать ее в..

Доверительные интервалы Вопросы для интервью
Доверительный интервал . Доверительный интервал в статистике означает вероятность того, что параметр генеральной совокупности окажется между двумя заданными значениями. Доверительные интервалы измеряют степень неопределенности или определенности метода выборки. Доверительный интервал может принимать любое количество вероятностей, наиболее распространенным из которых является доверительный уровень 95% или 99%. Расчет доверительного интервала (теория) Предположим, группа исследователей..