Porozmawiajmy o MLOps. Ale żeby to zrobić, musimy wiedzieć, co to jest.
MLOps oznacza operacje uczenia maszynowego. Niektórzy eksperci twierdzą, że jest to podzbiór ModelOps.
ModelOps to praktyka współpracy i komunikacji między analitykami danych i specjalistami ds. operacji, która pomaga zarządzać cyklami życia uczenia maszynowego (ML).
Ale nie bądźmy zbyt techniczni.
Poniższy diagram pokazuje świetne przedstawienie MLOps:
Dlaczego ten diagram jest ważny?
Skalowanie stało się trudnym procesem dla analityków danych, zwłaszcza jeśli chodzi o przenoszenie modeli ML ze środowiska programistycznego do środowiska produkcyjnego.
Ponadto interesariusze w organizacji są zwykle umieszczani w różnych zespołach o różnych obowiązkach. Powoduje to wydłużenie czasu dostawy w celu wdrożenia modelu ML do produkcji.
MLOps został opracowany w celu optymalizacji cyklu życia ML. Proces komunikacji i wdrażania pomiędzy zainteresowanymi stronami jest usprawniony i bardziej efektywny dzięki MLOps.
Przy tak dużej liczbie interesariuszy w cyklu życia uczenia maszynowego śledzenie, kto co robi, może być trudne. Należy pamiętać, że te obowiązki mogą się różnić w różnych organizacjach, ale nadal są takie same we wszystkich organizacjach.
Interesariusze cyklu życia ML
Ekspert merytoryczny (MŚP)
- Zadaje istotne pytania biznesowe
- Zapewnia, że wydajność modelu spełnia potrzeby/cele biznesowe
Analityk danych
- Zajmuje się analizą danych i eksploracyjną analizą danych
- Pomaga w opracowywaniu funkcji do wykorzystania modelu ML
- Optymalizuje i tworzy ekstrakcję danych do wykorzystania w procesach ML (ETL)
Inżynier danych
Analityk danych
- Opracowuje modele odpowiadające na pytania biznesowe zgłaszane przez MŚP
- Odpowiedzialny za testowanie modeli i dostarczanie ich do produkcji w celu wytworzenia wartości biznesowej
- Przegląda wyniki modeli, ich dokładność i ponowne uczenie modeli
Inżynier oprogramowania
- Tworzy interfejsy API lub aplikacje współpracujące z modelami ML
- Sprawdza, czy modele ML działają poprawnie z innymi platformami oprogramowania
Architekt uczenia maszynowego
- Umożliwia skalowanie modeli ML w środowisku produkcyjnym
- Poprawia i optymalizuje architekturę modeli ML w produkcji
Inżynier DevOps
- Zarządza bezpieczeństwem i wydajnością architektury obsługującej modele ML
- Obsługuje potoki ciągłej integracji/ciągłego wdrażania (CI/CD) dla modeli uczenia maszynowego we wszystkich środowiskach
Jak wspomniano wcześniej, interesariusze są zazwyczaj podzieleni na różne grupy i zespoły. Jednak dzięki praktyce MLOps zainteresowane strony mogą oceniać i ograniczać ryzyko dla organizacji jako grupy współpracującej. Zwłaszcza, że istnieją różne poziomy ryzyka wdrażania modeli uczenia maszynowego i zarządzania nimi.
Podział cyklu życia ML
W jaki sposób zainteresowane strony współpracują, aby wdrożyć zdrowy i spójny cykl życia uczenia maszynowego z wprowadzonymi mechanizmami kontroli i równowagi? Rozłóżmy cykl życia ML.
- Pytania biznesowe
Kogo to dotyczy? Eksperci merytoryczni (MŚP) - Transformacja danych
Cykl pozyskiwania danych → Transformacja danych - Kogo to dotyczy?
Analityków Danych - Rozwój modelu
Cykl inżynierii cech → Trenowanie/eksperymentowanie modeli → Ocena i porównanie modeli → Transformacja danych → powrót do Inżynieria cech - Kogo to dotyczy?
Naukowcy zajmujący się danymi - Inżynierowie danych
- Eksperci w danym temacie
- Pakowanie modelu
Środowisko wykonawcze - Ocena ryzyka/QA
- Kogo to dotyczy?
Inżynierów oprogramowania - ML Architekci
- Rozwój do produkcji
Skalowanie - Ciągła integracja/ciągłe wdrażanie (CI/CD)
- Kogo to dotyczy?
DevOps - Monitorowanie
Rejestrowanie - Alerty
- Dryf wydajności
- Kogo to dotyczy?
Naukowcy zajmujący się danymi - DevOps
Wniosek
W cyklu życia ML jest wiele ruchomych elementów. Od zadawania właściwych pytań biznesowych po transformację danych, rozwój modelu, monitorowanie, rozwój, produkcję i pakowanie modeli w całość.
Czy jesteś gotowy, aby „rozpocząć podróż do ML”? Czy zamierzasz podjąć się tego rozległego procesu samodzielnie? A może chciałbyś nawiązać współpracę z doświadczoną firmą?