Google Whisk

Google Whisk képgenerátor

2 perc olvasási idő.

A Google sem szeretne lemaradni a képgenerálós versenyből, és bár még csak egy apró és vékony szeletkéje van, de igyekszik. Láthatóan erősítenek ezen a vonalon és vannak próbálkozások. Azért nevezem próbálkozásnak, mert a többi versenytárssal összevetve azért valljuk be van még mit csiszolni a technikán.

Az Imagen 3 a Google saját kis AI képgenerátora, amit (mint mindenki más a konkurensek közül) finomítgat, fejlesztget, adatbázist bővítget, tanítgat. Most egy olyan feature-t mutatott be nekünk a keresőóriás (hopp ez a kifejezés is véges már), aminek segítségével kép(ek) feltöltésével tudsz generáltatni vele egy új képet. Amolyan modell betanítás feeling, csak ők másképp nevezték el, de lényegében erről van szó (a szerk.). Ez pedig a Google Whisk (nincs magyar fordítása).

Ez egyelőre természetesen még csak az USA-ban érhető el, a Google Labs oldalán keresztül, szóval mi ne is próbálkozzunk vele egyelőre.

A Whisk a Google fejlett Imagen 3 képgeneráló modelljét használja képek létrehozására, amelyet az eszköz megjelenésével nagyjából egyidejűleg jelentettek be. A generálási folyamat úgy zajlik, hogy a felhasználó egy vagy több képet tölt fel vizuális mintaként, opcionálisan szöveges leírásokkal kiegészítve. Ezután a Whisk elemzi ezeket a bemeneteket, hogy megértse a kívánt témákat, jeleneteket és stílusokat, és egy promptot hoz létre, amely irányítja a képgenerálási folyamatot.

Az eszköz több variációt generál a vizuális és szöveges bemenetek alapján, és a felhasználók számára egy válogatást kínál az AI által generált képekből, mindegyikhez tartozó szöveges promptokkal együtt. A felhasználók ezután finomíthatják eredményeiket az alapvető promptok szerkesztésével vagy különböző bemeneti képkombinációkkal való kísérletezéssel, elősegítve egy iteratív és felfedező jellegű kreatív folyamatot. Az eszköz felületén található egy praktikus dobókocka ikon, amely véletlenszerű képi javaslatokat generál azok számára, akik nem rendelkeznek forrásképekkel. A végeredményt berakhatod kedvencekbe, letöltheted, a promptot kimásolhatod, újat generálhatsz.

Az nem derült ki, hogy maga a rendszer milyen alapon működik (esetleg ingyenes a bevezető időszakban), az sem derült ki, hogy a generált képeket miképpen exportálhatom, és az sem, hogy nagyítható -e AI segítségével. Az sem világos, hogy ha egy kép majdnem tetszik, akkor hogyan tudok rajta finomítani anélkül, hogy az egészet újra kezdené.

Továbbá az sem világos (nekem), hogy ez tulajdonképpen mire jó? Miért jobb ez a képes megközelítés, mint a promtp generálású változat?

Te ki fogod próbálni? Írd meg kommentben.

Forrás: https://petapixel.com/2024/12/17/googles-new-ai-image-tool-whisk-lets-you-use-photos-as-prompts/

Vélemény, hozzászólás?