Walton Electronics Co., Ltd.
Skontaktuj się z nami

Osoba kontaktowa : Walton-cara

Numer telefonu : 15986872308

Free call

Uczenie maszynowe wymaga wielu kroków

July 18, 2022

Wstęp

Wdrażanie uczenia maszynowego (ML) to proces wieloetapowy.Polega na wybraniu modelu, przeszkoleniu go pod kątem określonego zadania, walidacji z danymi testowymi, a następnie wdrożeniu i monitorowaniu modelu w środowisku produkcyjnym.Tutaj omówimy te kroki i podzielimy je, aby przedstawić Ci ML.ML odnosi się do systemów, które bez wyraźnej instrukcji są zdolne do uczenia się i doskonalenia.Systemy te uczą się na podstawie danych, aby wykonać określone zadanie lub funkcję.W niektórych przypadkach nauka.lub bardziej szczegółowe szkolenie odbywa się w sposób nadzorowany, w którym nieprawidłowe wyniki powodują dostosowanie modelu w celu przesunięcia go w kierunku prawidłowych wyników.W innych przypadkach uczenie nienadzorowane ma miejsce, gdy system organizuje dane w celu ujawnienia wcześniej nieznanych wzorców.Większość modeli uczenia maszynowego jest zgodna z tymi dwoma paradygmatami (nadzorowane i nienadzorowane uczenie się).Przyjrzyjmy się teraz, co oznacza model, a następnie zbadajmy, w jaki sposób dane stają się paliwem do uczenia maszynowego.Model uczenia maszynowego Model jest abstrakcją rozwiązania do uczenia maszynowego.Model definiuje architekturę, która po przeszkoleniu staje się implementacją.Dlatego nie wdrażamy modeli.Wdrażamy implementacje modeli wytrenowanych z danych (więcej na ten temat w następnym rozdziale).Tak więc modele plus dane plus uczenie równych instancji rozwiązań ML (rysunek 1).wymagane jest tłumaczenie.Na przykład przesyłanie danych tekstowych do sieci głębokiego uczenia wymaga zakodowania słów w postaci liczbowej, która jest zwykle wektorem wielowymiarowym, biorąc pod uwagę różne słowa, których można użyć.Podobnie wyniki mogą wymagać przetłumaczenia z formy numerycznej z powrotem na formę tekstową.Modele ML występują w wielu typach, w tym modele sieci neuronowych, modele bayesowskie, modele regresji, modele klastrowe i inne.Wybrany model opiera się na bieżącym problemie.W kontekście sieci neuronowych modele wahają się od płytkich sieci wielowarstwowych do głębokich sieci neuronowych, które obejmują wiele warstw

wyspecjalizowanych neuronów (jednostek przetwarzania).Głębokie sieci neuronowe oferują również szereg modeli dostępnych w zależności od aplikacji docelowej.

Na przykład:

●Jeżeli aplikacja koncentruje się na identyfikowaniu obiektów na obrazach, idealnym modelem jest splotowa sieć neuronowa (CNN).CNN zostały zastosowane do wykrywania raka skóry i przewyższają przeciętnego dermatologa.

●Jeżeli aplikacja obejmuje przewidywanie lub generowanie złożonych sekwencji (takich jak zdania w języku ludzkim), idealnymi modelami są sieci neuronowe rekurencyjne (RNN) lub sieci pamięci długoterminowej (LSTM).LSTM zostały również zastosowane do maszynowego tłumaczenia ludzkich języków.

●Jeżeli Twoja aplikacja wymaga opisu zawartości obrazu w ludzkim języku, możesz użyć kombinacji CNN i LSTM (gdzie obraz jest wprowadzany do CNN, a wyjście CNN reprezentuje dane wejściowe do LSTM, co emituje sekwencje słów).

●Jeżeli Twoja aplikacja wymaga generowania realistycznych obrazów (takich jak krajobrazy lub twarze), wówczas generatywna sieć przeciwników (GAN) reprezentuje aktualny, najnowocześniejszy model.Modele te reprezentują niektóre z bardziej popularnych obecnie używanych architektur głębokich sieci neuronowych.Głębokie sieci neuronowe są popularne, ponieważ mogą akceptować nieustrukturyzowane dane, takie jak obrazy, wideo lub informacje audio.Warstwy w sieci tworzą hierarchię cech, która pozwala im klasyfikować bardzo złożone informacje.Głębokie sieci neuronowe wykazały się najnowocześniejszą wydajnością w wielu obszarach problemowych.Ale podobnie jak inne modele ML, ich dokładność zależy od danych.Przyjrzyjmy się teraz temu aspektowi.

Dane i szkolenia

Dane są paliwem, które napędza uczenie maszynowe, nie tylko podczas działania, ale także konstruowania rozwiązania ML poprzez trenowanie modeli.W kontekście danych uczących dla głębokich sieci neuronowych ważne jest, aby zbadać niezbędne dane w kontekście ilości i jakości.Głębokie sieci neuronowe wymagają do uczenia dużych ilości danych.Jedna z ogólnych zasad klasyfikacji opartej na obrazach to 1000 obrazów

na klasę.Ale odpowiedź zależy od złożoności modelu i tolerancji błędu.Niektóre przykłady z produkcyjnych rozwiązań ML dają spektrum rozmiarów zestawów danych.System wykrywania i rozpoznawania twarzy wymagał 450 000 obrazów, a chatbot pytań i odpowiedzi został przeszkolony z 200 000 pytań połączonych z 2 milionami odpowiedzi.Mniejsze zestawy danych mogą również wystarczyć w oparciu o rozwiązywany problem.Rozwiązanie analizy sentymentu, które określa polaryzację opinii z tekstu pisanego, wymagało tylko dziesiątek tysięcy próbek.Jakość danych jest tak samo ważna jak ilość.Biorąc pod uwagę duże zbiory danych wymagane do uczenia, nawet niewielkie ilości błędnych danych uczących mogą prowadzić do słabego rozwiązania.W zależności od rodzaju niezbędnych danych, Twoje dane mogą przejść proces oczyszczania.Gwarantuje to, że zestaw danych jest spójny, nie zawiera zduplikowanych danych, jest dokładny i kompletny (brak nieważnych lub niekompletnych danych).Istnieją narzędzia wspierające ten proces.Weryfikacja danych pod kątem stronniczości jest również ważna, aby upewnić się, że dane nie prowadzą do stronniczego rozwiązania ML.Szkolenie ML działa na danych liczbowych, więc etap wstępnego przetwarzania może być wymagany w zależności od rozwiązania.Na przykład, jeśli twoje dane są ludzkim językiem, muszą najpierw zostać przetłumaczone na formę liczbową do przetworzenia.Obrazy mogą być wstępnie przetwarzane w celu zapewnienia spójności.Na przykład obrazy wprowadzone do głębokiej sieci neuronowej zostałyby przeskalowane i wygładzone w celu usunięcia szumu (między innymi operacjami).Jednym z największych problemów w ML jest pozyskiwanie zestawu danych do trenowania rozwiązania ML.Może to być największe przedsięwzięcie w zależności od problemu, ponieważ może nie istnieć i wymagać osobnego wysiłku

łapać, chwytać.Wreszcie zbiór danych należy podzielić na dane treningowe i dane testowe.Część ucząca służy do uczenia modelu, a po przeszkoleniu dane testowe są wykorzystywane do sprawdzania dokładności rozwiązania

 

Skontaktuj się z nami

Wpisz swoją wiadomość