Wróć
07.11.2022

DeepMind na drodze ku uniwersalnej sztucznej inteligencji?

Wykorzystanie Machine Learning

DeepMind na drodze ku uniwersalnej sztucznej inteligencji?

W połowie maja znany z przełomowych osiągnięć w obszarze sztucznej inteligencji DeepMind, ogłosił kolejny sukces – model sztucznej inteligencji nazwany GATO, który jest w stanie wykonywać ponad 600 różnych zadań. GATO może między innymi grać w gry Atari, podpisywać obrazki, rozmawiać z człowiekiem i układać kolorowe klocki za pomocą ramienia robota. Co więcej, w wielu z tych zadań radzi sobie lepiej niż człowiek. Wraz z publikacją opisującą GATO, DeepMind ogłosiło, że jest to krok w kierunku tak zwanej uniwersalnej sztucznej inteligencji (ang. Artificial General IntelligenceAGI), a sama gra o palmę pierwszeństwa w stworzeniu tego rodzaju modelu, jest w zasadzie skończona. Stwierdzenie to wywołało szeroki odzew na całym świecie – być może nawet większy niż wywołałby sam model GATO. Pojawiło się wiele krytycznych głosów, które zwracają uwagę, że do uniwersalnej sztucznej inteligencji jeszcze GATO daleko. Czy rzeczywiście?

Co kryje się w GATO?

GATO jest przedstawiona jako sieć multimodalna, wielozadaniowa, z wieloma wcieleniami (ang. multimodal, multitask, multiembodiment). Oznacza to, że ta sama sieć (tj. pojedyncza architektura z jednym zestawem wag) może wykonywać wszystkie z ponad sześciuset opanowanych zadań – i to pomimo różnych rodzajów danych wejściowych i znacznego zróżnicowania w tym, co znajduje się na wyjściu z modelu. Inspiracji do stworzenia GATO dostarczył postęp w wielkoskalowym modelowaniu języka naturalnego, a sam model jest oparty na podobnym koncepcie, tyle, że wychodzi poza sferę przetwarzania tekstu. GATO, podobnie jak inne systemy uczenia maszynowego, uczy się na przykładzie, wykorzystuje przy tym tak zwane uczenie multimodalne, które polega na konsolidacji niezależnych danych z różnych źródeł w jeden model AI. W myśl tego konceptu, aby możliwe było wykonywanie szerokiego zestawu zadań, przewodnią zasadą projektowania GATO było szkolenie na możliwie najszerszej gamie odpowiednich danych, takich jak obrazy, tekst, momenty skrętu stawów, naciśnięcia przycisków oraz inne dyskretne i ciągłe obserwacje i działania. Model podejmuje decyzje o tym, co tak naprawdę powinien wykonać na podstawie kontekstu. Zasadniczo zatem GATO obsługuje równocześnie rodzaje danych wejściowych i decyduje z kontekstu, czy wyprowadzić zrozumiały tekst (na przykład, aby porozmawiać, podsumować lub przetłumaczyć tekst), siły momentu obrotowego (dla siłowników ramienia robota), czy też naciśnięcia przycisków (aby grać w gry).

Wyjątkowy?

Do tej pory każdy pojedynczy rodzaj zadania, przykładowo klasyfikacja obiektów na obrazach lub gra w szachy, wymagał tworzenia osobnego modelu uczenia maszynowego. Nawet jeśli model, tak jak na przykład wcześniejsze słynne dzieło DeepMind, AlphaZero, był w stanie opanować grę w Go, szachy i shogi, istnieje zasadnicza różnica pomiędzy nim a GATO. AlphaZero za każdym razem musiał był wyuczony od nowa i niejako „zapominał” tego, czego nauczył się wcześniej, tymczasem siła GATO tkwi w jednej kluczowej rzeczy: nigdy nie zapomina, czego go nauczono. Co jeszcze bardziej niezwykłe, GATO ma liczbę parametrów o rzędy wielkości mniejszą niż systemy jednozadaniowe, w tym GPT-3. GPT-3 ma ponad 170 miliardów parametrów, a GATO tylko 1,2 miliarda. Jako, że parametry to elementy systemu poznane na podstawie danych szkoleniowych, które zasadniczo opisują zdolność systemu do rozwiązania danego problemu, takiego jak na przykład generowanie tekstu, znaczna redukcja w liczbie parametrów dla modelu wielozadaniowego, budzi uzasadniony podziw. Co więcej, wyniki osiągane przez GATO potwierdzają również wcześniejsze ustalenia, że szkolenie z danych o różnym charakterze skutkuje lepszym przyswajaniem dostarczanych informacji. Tak jak ludzie uczą się z wielu równoczesnych i różnorodnych źródeł informacji. Czy zatem GATO jest pierwszym krokiem do uniwersalnej sztucznej inteligencji?

Uniwersalna sztuczna inteligencja

AGI to termin używany zasadniczo do określenia modelu, który może nauczyć się każdego zadania intelektualnego, jakie może wykonać człowiek. Mamy przez to na myśli system, który może elastycznie i zaradnie rozwiązywać problemy, z którymi wcześniej nie miał do czynienia, i który robi to w niezawodny sposób. I chociaż nie ma powszechnie akceptowanej definicji AGI, zaproponowano różne testy, które nadałyby sztucznej inteligencji status uniwersalnej. Jeden z protoplastów informatyki, Alan Turing zasugerował, że aby być uznaną za myślącą, sztuczna inteligencja powinna być w stanie zwieść człowieka co do swej natury podczas rozmowy. Innymi słowy, według Turinga, o komputerze można powiedzieć, że „myśli”, jeśli człowiek przeprowadzający eksperyment nie jest w stanie stwierdzić poprzez konwersację czy ma do czynienia z człowiekiem czy z maszyną. Steve Wozniak, współzałożyciel Apple, powiedział, że uzna AGI za prawdziwą, jeśli AI będzie w stanie wejść do przypadkowego domu i dowiedzieć się, jak zrobić kubek kawy. Inne proponowane testy, to wysyłanie sztucznej inteligencji na uniwersytet i sprawdzanie, czy może zdać na stopień naukowy, lub testowanie, czy może z powodzeniem wykonywać zadania w świecie rzeczywistym.

Przełom?

GATO co prawda nie był (jeszcze) testowany w przedstawiony wyżej sposób, ale biorąc pod uwagę jego przedstawione możliwości, może niekoniecznie być w stanie zdać zaproponowane dla AGI testy. Pojawiły się także głosy, że samo uczenie głębokie może nie być dobrą drogą ku uniwersalności AI i aby ją osiągnąć, konieczne będzie przyjęcie zupełnie innego, nieznanego dotąd konceptu. DeepMind twierdzi natomiast, że opracowanie uniwersalnej sztucznej inteligencji jest teraz po prostu kwestią tworzenia większych i wydajniejszych modeli AI oraz dostarczania większej ilości danych treningowych. W tym momencie trudno orzec, kto ma rację i jak długo przyjdzie nam poczekać na rozstrzygnięcie. Jednak niezależnie od tego, czy uznamy, że GATO jest przełomem na drodze do uniwersalnej sztucznej inteligencji, czy nie, z pewnością jest to model imponujący. I z pewnością DeepMind nie powiedział jeszcze ostatniego słowa w kwestii tworzenia coraz bardziej niesamowitych modeli AI.

W TIDK także pozostajemy na fali najnowszych zdobyczy informatyki, przystosowując je do potrzeb współczesnych organizacji. Jeśli jesteś zainteresowany najnowszymi zdobyczami AI oraz nowoczesną analityką i wdrożeniem ich w swojej firmie, zapraszamy do kontaktu!

Partnerstwa

tidk logo

Bałtycka 6
61-013 Poznań