logo elektroda
logo elektroda
X
logo elektroda

[AI] Generator grafiki i zdjęć na własnym komputerze - interfejs WWW dla Stable Diffusion

p.kaczmarek2  58 7890 Fajne? (+7)
📢 Słuchaj (AI):

TL;DR

  • Fooocus to darmowy, otwarty interfejs WWW dla Stable Diffusion XL działający 100% lokalnie na komputerze, służący do generowania i edycji obrazów.
  • Obsługuje prompt expansion przez GPT2, upscaling, outpainting, inpainting, variation, image prompt, describe image, negatywny prompt oraz dodatki LoRA i style.
  • Na laptopie z Intel Core i7-6700HQ, 64 GB RAM i GeForce GTX 1060 pojedyncza generacja trwała około trzy minuty.
  • W testach wychodziły atrakcyjne krajobrazy i postacie, ale też błędy w detalach, artefakty oraz kompletnie zniekształcony tekst w scenach i schematach.
Wygenerowane przez model językowy.
Interfejs Fooocus do generowania obrazków z chatką w zimowym lesie.
Jak generować obrazki na własnym komputerze? Jak zmienić zawartość zdjęcia? Czy AI jest w stanie zaproponować szkic interfejsu dla kontrolera inteligentnego domu? To tutaj postaram się właśnie sprawdzić, a to wszystko dzięki prostemu w użyciu interfejsowi web bazującemu na architekturze Stable Diffusion XL.

Prezentowany tu Fooocus to całkowicie darmowe, otwarte i działające 100% lokalnie (bez Internetu, na Twoim komputerze) środowisko do tworzenia obrazów za pomocą modelów AI bazujących na Stable Diffusion. Fooocus oferuje m. in:
- generowanie obrazów w oparciu o prompty
- rozwinięcie promptu w oparciu o GPT2
- upscaling obrazu, czyli zwiększenie rozdzielczości
- outpainting, czyli dodawanie części obrazu poza jego ramami
- inpainting, czyli edycja części obrazu
- variation, czyli tworzenie różnych wersji obrazu
- image prompt, czyli promptowanie obrazek
- describe image, czyli opisywanie obrazu do promptu wybranego modelu
- negatywny prompt, czyli to czego nie chcemy mieć na obrazie
- możliwość integracji dodatków LORA, stylów oraz ustawienia ich wag, co daje nam większą kontrolę nad tym co generujemy

Instalacja i uruchomienie
Pobieramy paczkę z repozytorium, wypakowujemy, odpalamy run.bat:
Foldery Fooocus, python_embedded i plik run.bat w eksploratorze plików komputera.
W nowszych wersjach będą też osobno skrypty run_realistic.bat oraz run_anime.bat, działają one analogicznie - po prostu wybierają na starcie styl grafik.
Po chwili w przeglądarce otworzy nam się strona Fooocusa:
Interfejs aplikacji Fooocus do generowania obrazów na komputerze.
Pora zacząć zabawę.

Pierwsze generacje
Na początku muszę ostrzec, że grafiki generują się dość długo. U mnie na Intel (R) Core(TM) i7-6700HQ CPU @ 2.60GHz, 64GB RAM, GeForce GTX 1060 generują się około trzy minuty.
Po prostu wpisujemy prompt i dobieramy opcje. Czasem trzeba się nakombinować by otrzymać pożądany efekt. Dodatkowo użyte słowa kluczowe wpływają na styl całego obrazka, więc ciężko jest zrobić jedną "serię" grafik. Ale spróbujmy, najpierw przykładowe prompty. Wszystko wygenerowane przez mój laptop.
Użyty model: juggernautXL_v8Rundiffusion.safetensors

A cozy cabin in a snowy forest at sunset, warm light glowing from the windows, smoke rising from the chimney

Drewniana chatka w zaśnieżonym lesie o zachodzie słońca, z ciepłym światłem w oknach i dymem unoszącym się z komina. Drewniana chata w zaśnieżonym lesie o zachodzie słońca z dymem unoszącym się z komina. Domek w zaśnieżonym lesie o zachodzie słońca z dymem unoszącym się z komina.
Całkiem nieźle, ale czemu komin się pali?



Futuristic city skyline at night, neon lights reflecting on wet streets, flying cars in the sky

Futurystyczne miasto nocą z neonowymi światłami odbijającymi się na mokrej ulicy, latające samochody na niebie. Futurystyczne miasto nocą z neonowymi światłami odbijającymi się na mokrych ulicach i latającymi samochodami. Futurystyczne miasto nocą z neonowymi światłami i latającymi samochodami nad mokrą ulicą.
Kolorystyka świetna, ale sens pojazdów i tła szybko się gubi.



Astronaut floating peacefully above Earth, with stars and galaxies in the background, contemplative mood

Astronauta unoszący się w kosmosie na tle Ziemi i gwiazd. Astronauta unoszący się w przestrzeni kosmicznej nad Ziemią, w tle widoczna galaktyka. Astronauta w skafandrze kosmicznym unoszący się nad Ziemią w przestrzeni kosmicznej.
Znów dziwne detale.



A cat café with cozy decor, wooden furniture, and playful cats lounging around while people sip coffee

Kawiarnia kotów z kotami na półkach i stole. Przytulna kawiarnia pełna kotów z drewnianymi meblami, gdzie ludzie piją kawę. Wnętrze przytulnej kawiarni dla kotów z różowym wystrojem i kotami na meblach.
Tu znacznie mocniej widać artefakty, często się tak kończy próba generowania sceny z wieloma postaciami.



A cute fox wearing a small backpack, wandering through an autumn forest filled with orange and red leaves

Ilustracja liska w plecaku spacerującego po jesiennym lesie. Pluszowy lisek z plecakiem spacerujący po jesiennym lesie Uroczy lisek z plecakiem spacerujący po jesiennym lesie pokrytym pomarańczowymi liśćmi.
Dość niezłe, tylko zawsze postać jest nieco inna.



A massive floating island with waterfalls cascading into the clouds, bioluminescent plants glowing softly

Latająca wyspa z wodospadami i bioluminescencyjnymi roślinami. Wisząca wyspa z wodospadami i bioluminescencyjnymi roślinami Latająca wyspa z wodospadami i bioluminescencyjnymi roślinami.



A colossal mechanical dragon flying over a steampunk city, gears and smoke in the background

Mechaniczny smok latający nad steampunkowym miastem Gigantyczny mechaniczny smok szybuje nad steampunkowym miastem. Olbrzymi mechaniczny smok w locie nad steampunkowym miastem.


Elektronika oczami AI
Z czystej ciekawości - czy AI wie jak wygląda Arduino?

	arduino, electronics, table

Dwa mikrokomputery Arduino z kablami na drewnianym stole. Zestaw elementów elektronicznych na brązowym stole, w tym płytki Arduino i różnokolorowe przewody. Układ elektroniczny na drewnianym stole z podłączonymi przewodami i komputerem w tle.
Coś musiało w danych uczących być, ale i tak wychodzi herezja...
A schematy?

schematic, full bridge rectifier, graetz, electronics

Skomplikowany schemat elektryczny z dziwnie wyglądającymi napisami.
Skomplikowany schemat elektryczny z nieczytelnymi oznaczeniami.
Nie oczekiwałem wiele, ale ta czcionka też jest fajna. Jeszcze ten
"RECCTITICIFER".
Kolejna generacja zrobiła... zdjęcie elementu:
Trzy mostki prostownicze z nieczytelnymi napisami leżące na szarej powierzchni.
A może AI wygeneruje nam sprzęt retro?
unitra, radio, retro, table, receiver

Stylowe retro radio z drewnianą obudową i metalowymi pokrętłami. Stare radio Unitra z drewnianą obudową i klasycznym panelem. Retro radio na drewnianym stole z charakterystycznym okrągłym pokrętłem.
To może jeszcze jeden dziwny eksperyment...

polish car, fiat 126p, retro, polish city, street

Mały retro samochód jadący ulicą z zabytkowymi budynkami w tle. Pomarańczowy samochód retro zaparkowany na brukowanej ulicy z kolorowymi budynkami w tle. Retro samochód stojący na brukowanej ulicy w mieście, z klasyczną architekturą w tle.

Inpainting
Inpainting pozwala zmodyfikować lub całkiem zmienić część zawartości obrazu. Przykładowo możemy dodać naszemu lisowi towarzysza podróży. W celu użycia inpainting należy włączyć opcję "input image" oraz przeciągnąć tam obraz, który chcemy edytować. Potem zaznaczamy strefy, które poddamy edycji.
Animowany lisek z plecakiem spacerujący po jesiennym lesie
Prompt podałem podobny jak wcześniej, tylko że teraz zawierał słowo "owl".
Dwa pierwsze z brzegu rezultaty:
Lisek z plecakiem w jesiennym lesie z sową Pluszowy lis z plecakiem spacerujący jesiennym lasem.

Próby zastosowania w praktyce
Na koniec spróbowałem użyć tego generatora w celu utworzenia szkiców/propozycji różnego rodzaju urządzeń dla "inteligentnego domu", przykładowo może jakiegoś kontrolera nagrzewania, stacji pogodowej czy tam innego typu panelu dotykowego. Wiem, że tekstu te modele nie generują czytelnego, ale może jakiś pomysł mi poddadzą?

smart home, ui, design, chart, heater, interface, screenshot

Interfejs użytkownika na dużym ekranie z wykresami i tekstem w nieczytelnym języku. Wyświetlacz interfejsu inteligentnego domu z wykresami i grafikami. Inteligentny panel sterowania na ścianie z interfejsem graficznym Smartfon wyświetlający interfejs użytkownika aplikacji domowej. Interfejs użytkownika na urządzeniu mobilnym dla inteligentnego domu. Interfejs panela grzewczego z wykresami i wskaźnikami Widok ekranu tabletu z interfejsem użytkownika inteligentnego domu z wykresami i statystykami. Osoba używająca interfejsu na tablecie z wykresami i ikonami dotyczącymi inteligentnego domu. Ścienny panel kontrolny z kolorowym wykresem i okrągłym pokrętłem pod spodem.
Z daleka to jeszcze coś przypomina, kolorystyka chyba też ok, ale tekst i szczegóły są całkowicie błędnie narysowane.

Podsumowanie
To była krótka prezentacja pokazująca jakie obrazki można łatwo generować na typowym sprzęcie konsumenckim. Wcale nie okazało się być to takie trudne a i efekty są całkiem niezłe, choć z pewnością opinie będą podzielone. Z ciekawości próbowałem też pogenerować nieco bardziej praktyczne rzeczy, ale pod tym kątem użyty model kuleje więc nie oczekiwałbym od niego dużo.
Ostateczny werdykt zostawię Wam, jedynie tutaj podkreślę, że całość generacji odbywa się 100% lokalnie, jak również jest wysoce konfigurowalna i modyfikowalna, więc może jest warto czym się zainteresować, chociażby z troski o prywatność.
Czy korzystacie z generatorów grafik a jeśli tak to do czego?

O autorze
p.kaczmarek2
Inżynier programista z wieloletnim doświadczeniem embedded i full stack developer. Specjalizuje się w: embedded, Full-Stack Developer p.kaczmarek2 napisał 14403 postów o ocenie 12336 , pomógł 650 razy. Jest z nami od 2014 roku.

Komentarze

VIGOR_PICTURES 18 Mar 2025 00:22

Fajna sprawa. Aż sobie jutro przetestuję na "stacjonarce". Szczególnie ciekawie prezentują się te dodatkowe opcje poza zwykłym generowaniem obrazka. Może się człowiek przyzwyczai i sobie będzie życie ułatwiał... [Czytaj dalej]

p.kaczmarek2 18 Mar 2025 07:37

Na pewno musisz uzbroić się w cierpliwość, bo wygenerowanie dobrej grafiki może zająć nieco więcej prób niż w przypadku gotowych, zamkniętych generatorów które nie są dostępne do pobrania. Na początek... [Czytaj dalej]

speedy9 18 Mar 2025 09:39

Najbardziej podoba mi się plecak w kształcie sowy (coś tutaj poszło nie tak ;) ) i ten kot: https://obrazki.elektroda.pl/7909671700_1742286449_thumb.jpg https://obrazki.elektroda.pl/5886031800_1742286461_thumb.jpg... [Czytaj dalej]

VIGOR_PICTURES 18 Mar 2025 09:54

Przed chwilką zainstalowałem sobie fooocusa z domyślymi modelami (w zasadzie to sam zainstalował). Byłem ciekaw najbardziej jaka będzie różnica w czasie generowania pomiędzy laptopową kartą GTX1060 a... [Czytaj dalej]

p.kaczmarek2 18 Mar 2025 10:09

Typowym przykładem są dłonie (palce) postaci, a jak testowałem, to też przewody sprawiają problemy. Im bardziej złożony koncept tym gorzej, ale też zależy co było w danych uczących. Mnie najbardziej... [Czytaj dalej]

speedy9 18 Mar 2025 10:24

Lol, dobre! Ani Bing ani ChatGPT faktycznie nie potrafią (oba to model DALL E). Nawet po wskazaniu błędu i prośbie o podniesienie poziomu wina o 100%,. Kieliszek zawsze jest napełniony do połowy. [Czytaj dalej]

OPservator 18 Mar 2025 10:53

Podobno ChatGPT 4o ma możliwość generowania prostych szablonów do druku 3D, sprawdzał ktoś jak bardzo to odstaje albo się nadaje? Dajmy na to prosty stand pod telefon... [Czytaj dalej]

speedy9 18 Mar 2025 11:02

Jest takich generatorów trochę, ale nie testowałem, nie mam drukarki :) Np. meshy.ai [Czytaj dalej]

p.kaczmarek2 18 Mar 2025 11:45

To obrazuje jak duży wpływ mają dane uczące. Manipulując danymi uczącymi, można mocno wpływać na działanie modelu. To nie jest taka "prawdziwa" inteligencja, jak to niektórzy myślą, tylko bardziej model... [Czytaj dalej]

speedy9 18 Mar 2025 11:53

Niestety masz rację, i to jest największe zagrożenie ze strony każdego AI. Jeśli ludzie zaczną bezkrytycznie wierzyć temu co generuje AI, czy jeśli chodzi o informacje czy obrazy, to jest to bardzo prosta... [Czytaj dalej]

andrzejlisek 18 Mar 2025 17:40

Moim zdaniem, dobrym testem tych generatorów są prośby o grafiki techniczne i użytkowe, np. "widmo wysokopreżnej lampy sodowej", "wykres fazowy wody", "wnętrze rezonatora kwarcowego", które można łatwo... [Czytaj dalej]

gulson 18 Mar 2025 22:06

Brakuje modelu do rysunków technicznych, nie mówiąc o schematach. Jest tutaj spora nisza, ciekawe, czy kiedyś się nad tym pochylą. Chociaż nie będzie łatwo, bo jak stworzyć dane treningowe z schematów... [Czytaj dalej]

OPservator 19 Mar 2025 09:07

Jakby karmić AI opisanymi schematami to być może by coś pojęła. Na ten moment na podstawie zdjęcia potrafi dobrać część do motocykla i nawet określić markę, nie dostrzega co prawda np. różnicy w długości... [Czytaj dalej]

Belialek 19 Mar 2025 10:24

Zabawa w AI na karcie graficznej z VRAM=6GB musiała się tak skończyć :) Na tym sprzęcie odpalasz SD 1.4 albo 1.5 - czyli relatywnie "słabo wyedukowane" modele, sprzed 2-3 lat. SDXL 1.0 już potrzebuje 8GB... [Czytaj dalej]

OPservator 19 Mar 2025 10:30

Popyt na AI definitywnie wpłynął negatywnie na ceny GPU, na czym oczywiście klasycznie tracą gracze. [Czytaj dalej]

Belialek 19 Mar 2025 10:54

Wpływ na to ma wiele czynników, AI jest tylko (albo aż) jednym z nich. Ja osobiście mam pecha, z powodu awarii musiałem kupić grafikę w 2022r. (szczyt kopania kryptowalut + covid) i zamiast rekomendowanych... [Czytaj dalej]

OPservator 19 Mar 2025 10:58

Ja żałuję że nie sprzedałem mojej RTX 3070 w peaku jak używane chodziły po 6-7k, kupiłem ją dosłownie przed wzrostem cen, bo w grudniu 2019 :D Jakbym sprzedał ją wtedy, to teraz pewnie bym miał 4080. ... [Czytaj dalej]

p.kaczmarek2 19 Mar 2025 11:06

Raczej nie oczekiwałbym prędko dobrego modelu AI do rysunków technicznych/schematów. Tekst jest łatwiej generować, bo wystarczy po kolei przewidywać kolejne tokeny, ale rysunek techniczny? Schemat, taki... [Czytaj dalej]

Belialek 19 Mar 2025 11:30

Żeby nie szukać daleko - model o1 na mój prompt: "Wygeneruj schemat układu elektronicznego, który podłączony do zasilania AC 230V będzie mrugał czerwoną diodą LED w systemie 2 sekundy zapalona, 1 sekunda... [Czytaj dalej]

%}