Wróć
08.10.2022

Fake it till you make it nabiera nowego, pozytywnego znaczenia

Symulator

Fake it till you make it nabiera nowego, pozytywnego znaczenia

Kontrowersyjna koncepcja opisana przez angielski aforyzm Fake it till you make it jest zapewne większości znana. Niedawno Microsoft udowodnił, że takie udawanie działa – przynajmniej, jeśli mowa o analizie twarzy.

W przypadku problemów uczenia maszynowego, największym wyzwaniem nie jest wybranie właściwego modelu ML, ale znalezienie odpowiedniego zbioru danych treningowych. Trudności te są szczególnie duże w przypadku wykorzystywania obrazów z wizerunkiem ludzi. Alternatywą może być stworzenie sztucznego zbioru danych – i takie właśnie podejście wykorzystał Microsoft w swoim niedawno opublikowanym przedsięwzięciu.

Wygenerowali 100 000 sztucznych twarzy, różniących się wieloma cechami, automatycznie dokładnie je opisali, a następnie wyuczyli model przy użyciu tak przygotowanego zbioru danych. Wyniki? Okazało się, że model wykrywa charakterystyczne cechy twarzy lepiej, niż gdyby do trenowania użyto prawdziwych zdjęć.

Wykorzystanie syntetycznych, automatycznie opisanych danych ma wiele zalet:

  • sprawia, że mamy większą kontrolę nad różnorodnością i zmiennością zbioru danych;
  • pozwala podejść do problemów, w których jak dotąd dostępność danych treningowych była bardzo ograniczona, lub zwyczajnie ich brak;
  • pozwala rozszerzyć dotychczasowe zbiory danych o przypadki wygenerowane sztucznie, zwiększając w ten sposób zbiór danych;
  • umożliwia pozbycie się szumu związanego z błędnym przypisaniem etykiet do poszczególnych elementów;
  • pozwala generować bogate etykiety, niemożliwe do zastosowania w przypadku ręcznego etykietowania zbioru danych.

Ale czy rzeczywiście jest to takie proste? Renderowanie realistycznie wyglądających twarzy jest jednym z najtrudniejszych wyzwań grafiki komputerowej. Nie inaczej było w przypadku zbioru danych stworzonego przez Microsoft. Aby stworzyć naturalnie wyglądających ludzi użyto odpowiednich modeli 3D, które następnie były dywersyfikowane.

Wyzwanie stanowiło także rozpoznawanie elementów twarzy, uwzględniające ich różnorodność. Wszystko to znalazło odzwierciedlenie w wysokim koszcie obliczeniowym, przekładającym się na znaczny koszt rzeczywisty. Rozwiązanie, jak sami autorzy przyznają, jest też niezbyt ekologiczne, ponieważ do wygenerowania modeli użyto 3,000 kWh, co oznacza wyprodukowanie około 1.37 tony CO2.

Zaprezentowane przez Microsoft wyniki z pewnością wytyczają przyszłość uczenia maszynowego, zwłaszcza, że na szali jest cała gama korzyści z potencjalnie lepszymi uzyskiwanymi wynikami na ich czele.

Chcesz dowiedzieć się więcej jak innowacyjne podejście do uczenia maszynowego może pomóc Twojej organizacji?

Umów się na spotkanie!

Partnerstwa

tidk logo

Bałtycka 6
61-013 Poznań