Публикации по теме 'kaggle'


Изучение табличного вопроса конкурса Kaggle за апрель 2022 г.
Я всегда с нетерпением жду начала каждого месяца, потому что могу участвовать в ежемесячном табличном соревновании Kaggle. Конкурс на апрель 2022 года — это задача классификации временных рядов. Тысячи шестидесятисекундных последовательностей данных биологических сенсоров, записанных от нескольких сотен участников, которые могли находиться в одном из двух возможных состояний активности. Ключ к…

«Титаник» — «Машинное обучение на основе катастроф»
Ссылка на Jupyter Notebook Кратко о проблеме Я пробую практические основы машинного обучения и нашел эту задачу Титаника одной из лучших для практики. Это одна из легендарных задач на платформе Kaggle. Задача касается одного из самых печально известных исторических событий — кораблекрушения Титаника. Во время своего первого путешествия 15 апреля 1912 года «Титаник», считавшийся непобедимым, затонул, столкнувшись с айсбергом. К сожалению, недостаточное количество имевшихся на..

Deezer @ Kaggle Days Paris - 5 выводов из презентаций и конкурса
Мне посчастливилось побывать на втором мероприятии Kaggle Days, которое проходило в Париже в январе. 200 Data Scientist со всего мира собрались в течение двух дней на захватывающие конференции, семинары, мозговые штурмы, посвященные науке о данных, и ... и офлайн-конкурс Kaggle! Если вы еще не слышали о Kaggle, это известная онлайн-платформа, посвященная проектам Data Science. На мой взгляд, это идеальное место, чтобы узнать и быть в курсе последних тенденций в области науки о данных,..

История продолжается…
Момент, которого мы все ждали… Наконец… Я уверен, что вы следили за каждым эпизодом, но если нет, то последний раз мы остановились, когда готовились раскрыть результаты нашего представления. У нас нет монтажа, как в тех причудливых телешоу, поэтому, если вы действительно пропустили его, просто нажмите здесь или здесь . К счастью, наша техническая команда, я, усердно работала и даже смогла предоставить нам ссылку на наш последний эпизод. "Здесь"… Удивительно, на что способны..

Начало изучения науки о данных и машинного обучения
Я планирую изучать машинное обучение и науку о данных, потому что хочу работать удаленно. Я прошел несколько курсов Python год назад, теперь я понимаю синтаксис Python и правила работы со строками, переменными, списками, словарями, функциями, классами, методами и атрибутами и так далее. Я понял, что английский язык поможет вам понять Python лучше, чем другие переводные языковые курсы, после того, как я изучил курс письма на английском языке и курс письма на китайском языке. Поэтому начинаю..

Как я использовал байесово-гауссовскую модель для решения неконтролируемого табличного соревнования Kaggle в июле 2022 года
Kaggle предложила свой первый вопрос о соревновании без присмотра в табличном соревновании 22 июля. Участникам не сообщалось, сколько кластеров содержится в предоставленном наборе данных, и они должны были сделать наилучшее предположение. Существуют модели, которые могут создавать кластеры, когда количество кластеров неизвестно, например, dbscan или иерархический…

Предсказание поддельной работы с помощью машинного обучения
В машинном обучении проблемы классификации, вероятно, являются первыми, с которыми люди сталкиваются при первом изучении области. Я начинаю свой путь в качестве Data Scientist, поэтому для практики сегодня мы будем использовать известную библиотеку для задач машинного обучения, которая предоставляет десятки встроенных моделей, Scikit-learn. Для наших данных мы собираемся использовать набор данных Fake Jobs от Kaggle , чтобы увидеть некоторые из моих знаний на данный момент. Идея..