Powiązane publikacje 'data'
3 Niepokojące konsekwencje nieetycznego wykorzystania danych
Technologia jest na rozdrożu.
Widzieliśmy to już wcześniej: powstaje coś nowego i spieszymy się, aby to zatwierdzić i jak najszybciej wykorzystać. Na przykład po zastosowaniu DDT do walki z tyfusem i malarią podczas II wojny światowej zaczęto szukać dla niego większej liczby zastosowań. Pod koniec wojny FDA zatwierdziła jego użycie jako pestycydu, bez solidnych testów i przepisów… i spowodował raka u tysięcy ludzi.
Podobnie, gdy ścigamy się w opracowywaniu aplikacji na potrzeby..
Nowe metody w geometrycznym głębokim uczeniu się, część 2 (uczenie maszynowe)
Nadzorowane filtrowanie traktogramów przy użyciu głębokiego uczenia geometrycznego (arXiv)
Autor: Pietro Astolfi , Ruben Verhagen , Laurent Petit , Emanuele Olivetti , Silvio Sarubbo , Jonathan Masci , Davide Boscaini , Paolo Avesani
Streszczenie: Traktogram to wirtualna reprezentacja istoty białej mózgu. Składa się z milionów wirtualnych włókien, zakodowanych jako polilinie 3D, które przybliżają ścieżki aksonów istoty białej. Jak dotąd traktogramy są najdokładniejszą..
Według Microsoftu analityk danych przyszłości
Niedawno zbudowałem model predykcyjny, który wkrótce przyniesie ogromną wartość, ale nie jestem analitykiem danych ani nie mam żadnego formalnego szkolenia w zakresie analityki danych. To dało mi do myślenia; dlaczego wokół tak wyspecjalizowanej nauki o danych istnieje tak wiele przemysłu i edukacji? W 2012 roku w czasopiśmie Harvard Business Review opublikowano artykuł uznający analityka danych za „najseksowniejszy zawód XXI wieku”. Od tego czasu utworzono tysiące stanowisk pracy w..
rodzaj algorytmów, z których badacze danych korzystają w swojej codziennej pracy
Analitycy danych wykorzystują w swojej codziennej pracy różnorodne algorytmy. Do najpopularniejszych algorytmów należą:
Regresja liniowa: ten algorytm służy do przewidywania wartości ciągłej na podstawie zestawu niezależnych zmiennych. Można na przykład zastosować regresję liniową, aby przewidzieć cenę domu na podstawie jego powierzchni, liczby sypialni i lokalizacji. Regresja logistyczna: ten algorytm służy do przewidywania wartości binarnej (takiej jak tak/nie lub prawda/fałsz) na..
Zestaw narzędzi analityków danych: modele
Oczyściłeś swoje dane i przeprowadziłeś eksploracyjną analizę danych. Co teraz? Jako analitycy danych mamy w swoim zestawie wiele narzędzi, ale podobnie jak śrubokręt może wbić gwóźdź, tak nie jest to najlepsze narzędzie do tego zadania. Nasze narzędzia to modele lub, jeśli wolisz termin matematyczny, algorytmy. Pozwalają nam zrozumieć zebrane dane i dokonać przewidywań.
Istnieją trzy podstawowe typy modeli, w zależności od rodzaju danych. W przypadku ciągłych danych liczbowych..
Wzmocnienie gradientowe: co powinien wiedzieć każdy analityk danych
Wzmacnianie gradientowe to technika uczenia maszynowego stosowana zarówno w programach klasyfikacyjnych, jak i regresyjnych. Jest to jeden z najpotężniejszych algorytmów uczenia się predykcyjnego i jest dobrze znany ze swojej dokładności i szybkości. GBM doskonale sprawdzają się w przypadku dużych i złożonych zbiorów danych i charakteryzują się wszechstronnością w zakresie obsługi wartości null, dużej liczności zmiennych kategorycznych i wartości odstających. Budowanie modeli wzmacniania..
Typy danych — R Obiekty i atrybuty
R Programowanie obiektów i atrybutów
W tym artykule poruszymy ważną dla R kwestię. Porozmawiamy o różnych typach danych wykorzystywanych w R. Dowiemy się także o kilku podstawowych operacjach na typach danych.
Jeśli jesteś gotowy, zaczynajmy:
Obiekty
Wszystko, czym manipulujesz w R, wszystko, co spotykamy w R, obiekty, które można nazwać obiektami, obiekty mogą być różnych typów, zawierać różne typy danych. Ale wszystko w R jest obiektem. Zatem R ma pięć podstawowych klas..