Elektroda.pl
Elektroda.pl
X
Elektroda.pl
Please add exception to AdBlock for elektroda.pl.
If you watch the ads, you support portal and users.

Algorytmy AI od Nvidii syntezują obrazy dzieł sztuki z minimalnym treningiem

ghost666 10 Dec 2020 18:08 9957 0
  • Algorytmy AI od Nvidii syntezują obrazy dzieł sztuki z minimalnym treningiem
    Na NeurIPS Nvidia zaprezentowała nową metodę tworzenia wysokiej jakości obrazów syntetycznych przy użyciu generatywnej sieci współzawodniczącej (GAN) wyszkolonej na zaledwie 1500 obrazach źródłowych. Sieć neuronowa StyleGAN2 zwykle wymaga zestawu danych szkoleniowych obejmującego dziesiątki lub setki tysięcy obrazów, aby uzyskać wysokiej jakości syntetyczne obrazy. W badaniach Nvidii wykorzystano zbiór zaledwie 1500 zdjęć twarzy z Metropolitan Museum of Art, aby stworzyć nowe obrazy, które naśladują dzieła sztuki z kolekcji Muzeum. Chociaż można to wykorzystać do odtworzenia stylu dzieł sztuki i tworzenia nowych obrazów, istnieją szersze implikacje dla tej technologii.

    Kluczowym problemem, przed którym stoją medyczne modele AI, jest brak dostępnych danych szkoleniowych, m.in. ze względu na problemy z prywatnością oraz z faktu, że w przypadku rzadkich chorób wymagane ok. 100 tysięcy obrazów określonego rodzaju choroby może nawet nie istnieć. Technikę Nvidii można wykorzystać do generowania syntetycznych obrazów dla rzadkich chorób w oparciu o tylko kilka rzeczywistych obrazów. Te syntetyczne dane można następnie wykorzystać jako zbiór danych do szkolenia klasycznych modeli sztucznej inteligencji do wykrywania tej choroby.

    Tę samą metodę można zastosować w przypadku każdego problemu, w którym duże ilości danych szkoleniowych są trudne do uzyskania. Nvidia ma nadzieję, że nowa technika przyspieszy badania nad sztuczną inteligencją w obszarach, w których danych treningowych jest niewiele.

    Generator a dyskryminator

    Wynalezione w 2014 r. generatywne sieci współzawodniczące (GAN) stały się głównym sposobem tworzenia syntetycznych obrazów przy użyciu AI. Jak sama nazwa wskazuje, ogólna koncepcja opiera się na dwóch agentach AI (dwóch oddzielnych sieciach neuronowych), które współzawodniczą. Sieć generatora wytwarza syntetyczne obrazy na podstawie danych uczących, a dyskryminator patrzy na obrazy generowane przez generator i zgaduje, czy są one prawdziwe, czy fałszywe. Ocena jest przesyłana w pętli sprzężenia z powrotem do generatora do momentu, aż dyskryminator nie jest już w stanie odróżnić obrazu od zbioru danych uczących. Technika ta stoi m.in. za obrazami typu deep fake.

    Problem z GAN polega na tym, że wymagają one ogromnych zestawów danych szkoleniowych, aby uzyskać wysokiej jakości wyniki - często w zakresie od 50 000 do 100 000 obrazów. Nie ma problemu, jeśli chcesz tworzyć nowe zdjęcia zwierząt; w internecie nie brakuje zdjęć kotów. Ale w aplikacjach, w których obrazy źródłowe są ograniczone, GAN nie mogą być używane. Jeśli w szkolącym zestawie danych jest zbyt mało obrazów, dyskryminator może skutecznie zapamiętać cały zestaw danych. Uniemożliwia to dostarczanie przydatnych informacji zwrotnych do generatora, ponieważ odrzuca wszystkie syntetyczne obrazy jako fałszywe.

    Technika Nvidii polegająca na zmniejszeniu ilości wymaganych danych szkoleniowych w rzeczywistości mnoży ilość danych dostępnych do uczenia, tworząc tablicę „nowych” danych z każdego istniejącego obrazu. Pomysł opiera się na metodzie stosowanej wcześniej w widzeniu maszynowym, w której losowe transformacje lub zniekształcenia są stosowane do obrazów źródłowych lub fragmentów tych obrazów. To szybko tworzy duży zbiór danych - odwróconych, obróconych, kolorowych lub przekrzywionych wersji oryginalnych obrazów, które można wykorzystać do trenowania GAN (patrz zdjęcia poniżej).

    Algorytmy AI od Nvidii syntezują obrazy dzieł sztuki z minimalnym treningiem


    "Możesz dodawać do nich szumy, wycinać z nich bloki, przesuwać obraz, obracać go, mieszać, odwracać jak negatyw fotograficzny i tak dalej" powiedział David Luebke, wiceprezes ds. badań graficznych w firmie Nvidia. "Możesz myśleć o tym jako o zbiorze rzeczy, które można łatwo zrobić w Photoshopie. Teraz masz bogactwo obrazów, możesz je skonfigurować tak, aby twój GAN trenował nie tylko na małym zestawie danych treningowych, ale na tym efektywnie nieskończonym zestawie obrazów szkoleniowych, które możesz stworzyć z tego małego zestawu".

    Źródło: https://www.eetimes.com/nvidia-ai-synthesizes-images-with-very-little-training-data/

    Cool! Ranking DIY
    About Author
    ghost666
    Translator, editor
    Offline 
    Fizyk z wykształcenia. Po zrobieniu doktoratu i dwóch latach pracy na uczelni, przeszedł do sektora prywatnego, gdzie zajmuje się projektowaniem urządzeń elektronicznych i programowaniem. Od 2003 roku na forum Elektroda.pl, od 2008 roku członek zespołu redakcyjnego.
    ghost666 wrote 10183 posts with rating 8453, helped 157 times. Live in city Warszawa. Been with us since 2003 year.
  • CSICSI