Potężne podejście do korekcji skośności, gdy zawodzi skaler Standard lub MinMax.

Witam, dzisiaj przyjrzymy się kolejnemu interesującemu tematowi o nazwie Power Transformer.

Zwykle mamy do czynienia z bardzo wypaczonymi danymi i prawie niemożliwe jest ich skorygowanie, a wiele modeli liniowych wymaga pewnej transformacji cech numerycznych, aby uzyskać rozkład normalny ze względu na założenia dotyczące modelowania liniowego.

StandardSCaler i MinMaxSclaer działają dobrze w przypadku większości rozkładów, ale nie w przypadku danych silnie skośnych, ponieważ ma to wpływ na podstawowe metryki rozkładu, takie jak wartości średnie, mediana, minimalne i maksymalne.

Zastosowanie sklearn PowerTransformer użyje transformacji logarytmicznej, aby przekształcić dowolną skośną cechę w rozkład normalny tak blisko, jak to możliwe.

Zobaczmy jak to działa.

import seaborn as sns
diamonds = sns.load_dataset("diamonds")
diamonds[["price", "carat"]].hist(figsize=(10, 5));

#Obydwa są mocno przekrzywione. Naprawmy to za pomocą transformacji logarytmicznej

from sklearn.preprocessing import PowerTransformer
pt = PowerTransformer()
diamonds.loc[:, ["price", "carat"]] = pt.fit_transform(diamonds[["price", "carat"]])
diamonds[["price", "carat"]].hist(figsize=(10, 5));

Oto jesteśmy……. zbliżony do rozkładu normalnego.

W ten sposób pomoże to naszemu modelowi osiągnąć większą dokładność.

Wspaniale jest znać takie nowe, zaawansowane techniki. Dzięki sklearnowi. Następnie zajmiemy się innym zaawansowanym wariantem regresji liniowej o nazwie Theil Sen Regresor

Jeszcze raz dziękuję za poświęcony czas. Jeśli spodobał Ci się ten krótki artykuł, w moim średnim repozytorium dostępnych jest mnóstwo tematów z zakresu zaawansowanej analityki, analizy danych i uczenia maszynowego. https://medium.com/@bobrupakroy

Niektóre z moich alternatywnych obecności w Internecie Facebook, Instagram, Udemy, Blogger, Issuu, Slideshare, Scribd i nie tylko.

Dostępne również w Quora @ https://www.quora.com/profile/Rupak-Bob-Roy

Daj mi znać jeśli czegoś potrzebujesz. Porozmawiamy wkrótce.