Meta, spółka matka Facebooka, wprowadziła nowy model sztucznej inteligencji o nazwie „Ewaluator samouk”, mające na celu znaczne ograniczenie wkładu ludzkiego w szkolenie i ocenę sztucznej inteligencji.
Według raportu Reuters rozwój ujawniony w piątek podkreśla zaangażowanie Meta w rozwój autonomicznych systemów sztucznej inteligencji.
W przeciwieństwie do tradycyjnych modeli, które w celach szkoleniowych opierają się na danych generowanych przez człowieka, osoba oceniająca-samouk została przeszkolona w całości przy użyciu danych wygenerowanych przez sztuczną inteligencję.
To przełomowe podejście eliminuje potrzebę interwencji człowieka na etapie szkolenia, oferując potencjalną ścieżkę do w pełni autonomicznych agentów AI zdolnych do samouczenia się i korygowania.
Według badaczy Meta narzędzie AI może uczyć się na własnych błędach, co pozycjonuje je jako ważny krok naprzód w dziedzinie sztucznej inteligencji. Jason Weston, jeden z głównych badaczy projektu Meta, podkreślił znaczenie tego modelu.
„Mamy nadzieję, że w miarę jak sztuczna inteligencja stanie się coraz bardziej nadludzka, będzie coraz lepiej sprawdzała swoje działanie, tak aby faktycznie była lepsza od przeciętnego człowieka.
„Pomysł bycia samoukiem i umiejętnością samooceny jest w zasadzie kluczowy dla osiągnięcia tego rodzaju nadludzkiego poziomu sztucznej inteligencji” – powiedział Weston.
Meta wyjaśniła w publikacji z zeszłego miesiąca, że ewaluator-samouk opiera się na technice „łańcucha myślenia”.
Technika ta polega na dzieleniu złożonych problemów na mniejsze, logiczne kroki, co poprawia dokładność w takich dziedzinach, jak kodowanie, matematyka i nauki ścisłe.
Zmniejszanie zależności od informacji zwrotnych od ludzi
Oczekuje się, że osoba oceniająca-samouk zmniejszy zależność od procesu znanego jako uczenie się przez wzmacnianie na podstawie informacji zwrotnej od ludzi (RLHF), który wymaga od ekspertów-ludzi oznaczania danych i weryfikowania odpowiedzi.
- Proces ten jest często kosztowny i czasochłonny.
- Narzędzie AI Meta ma jednak na celu wykorzystanie uczenia się przez wzmocnienie na podstawie informacji zwrotnych AI (RLAIF), koncepcji, która umożliwia systemom sztucznej inteligencji udoskonalanie swoich reakcji bez udziału człowieka.
- Może to zrewolucjonizować szkolenie i rozwój sztucznej inteligencji, obniżając koszty i poprawiając wydajność.
- Wraz z wprowadzeniem nowego modelu sztucznej inteligencji Meta zbliża się do celu, jakim jest opracowanie autonomicznych asystentów cyfrowych zdolnych do wykonywania złożonych zadań bez nadzoru człowieka.
- Podczas gdy inne firmy, takie jak Google i Anthropic, również badały RLAIF, Meta wyróżnia się udostępnianiem swoich modeli do użytku publicznego.
- Samouk oceniający pokazuje ciągłe dążenie Meta do większej dostępności w rozwoju sztucznej inteligencji, co odróżnia ją od konkurencji, która dba o prywatność swoich modeli.