На этой неделе мы реализовали базовую версию части проекта дерева решений и интерпретировали наши результаты. Наше дерево решений реализовано на языке R.

Мы исключили столбцы HiTemp и LowTemp из нашего набора данных, потому что эти два столбца слишком сильно коррелируют с выходными данными (перекрывают данные). Наш алгоритм построил дерево максимальной глубины 8. Доверительный интервал дерева 95%.

Прогнозы в основном основывались на функции WindChill. HeatIndex, Humidity, Windspeed также оказали большое влияние на прогнозы. Другие функции были не такими эффективными, как упомянутые здесь. Результаты показали, что мы можем извлекать признаки и оптимизировать набор данных и алгоритм.

На следующей неделе у нас есть планы по оптимизации деревьев решений и внедрению нейронных сетей, чтобы завершить этап кодирования и тестирования проекта.