Érkezik a ChatGPT5
Szakmai berkekben már hetek óta beszélnek arról, hogy a ChatGPT legújabb verziója mikorra érkezhet. Sam Altman az OpenAI (chatgpt cége) fő embere nagyon szegényesen tolja a marketinget a legújabb, korábban egekig magasztalt új hiperokos modelljükkel kapcsolatban, és ez felveti azt a kérdést is, hogy akkor ezek szerint még vannak bőven fejlesztésre szoruló részek, és érthetően addig nem akarják kiengedni a szellemet a palackból, amíg nem adnak megnyugtató eredményt a tesztek.
Szakértők szerint ez a modell már nagyon közel lesz az emberi agy szimulációjához, de szerencsénkre azért még van időnk, amíg ez a rendszer élesbe kifut.
Ebben a cikkben egy rövid áttekintést olvashatsz a ChatGPT5 beépített képgenerátorával kapcsolatban.
A GPT-5 beépített képgenerátoráról jelenleg a következő részletek ismertek:
- A GPT-5 egységes modell-architektúrával működik, amely szöveg, kép, hang és videó feldolgozására is alkalmas egyetlen összefüggő kontextusban (felületen). Ez azt jelenti, hogy a modell képes természetes módon váltani a különböző modalitások között, így a képgenerálás is szerves része lett a rendszernek.
- Képgenerálási technikai paraméterek:
- Modellek: A beépített képgenerátor a „gpt-image-1” nevű modellt használja, illetve a DALL·E 2/3 technológiáit is támogatja bizonyos API végpontokon keresztül
- Képminőség és méret:
- Választható méretek: például 1024×1024 vagy 1024×1536 pixel. Nagyjából marad a korábbiakhoz hasonlóan.
- Minőségi opciók: „low”, „medium”, „high”. Több minőség paraméterrel lehet befolyásolni a renderelés minőségét, ez arányos a token költséggel is.
- Háttér: kérhető átlátszó („transparent”) vagy egyszínű háttérrel, PNG vagy WebP esetén.
- Fájlformátumok: alapértelmezett a PNG, de támogatott a JPEG és WebP is, ezeknél beállítható a tömörítés mértéke is.
- Képszerkesztés és variáció:
- Szerkesztés: már meglévő képek is módosíthatók szöveges prompt alapján (például extra objektumok beillesztése, háttér eltávolítása, stb.). Ez már most is van, de reméljük, hogy tovább lesz fejlesztve és felhasználóbarátabb is lesz a szerkesztő felület
- Variáció: egy meglévő kép alapján tud a rendszer új, hasonló képeket generálni. Ha ez valóban így lesz, az nagy előrelépés, mert egészen eddig nem tudta ezt a rendszer
- Token-felhasználás: A képek előállításának token költsége változik a kép felbontása és minősége szerint. Például egy 1024×1024 pixeles, „high quality” kép generálása akár 4,000 tokenbe is kerülhet (becslés, a valós számok eltérhetnek)
- Speciális képességek:
- Magasabb pontosságú szöveg-renderelés: A modell képes rövid szövegeket precízen megjeleníteni, ami a korábbi generátoroknál még problémás volt
- Többlépcsős (multi-turn) szerkesztés: Egy kép generálása után a felhasználó újabb prompttal tovább szerkesztheti a képet, mindezt egy folyamatban
- Képek és szövegek együttes kezelése: A modell figyelembe tudja venni a vizuális kontextust akár feltöltött képből, akár korábban generált vizuális tartalomból, és szöveges vagy képi kimenetet is tud adni
- Mire lesz képes a képgenerátor?
- Egyedi művészi képek, egyszerű technikai ábrák, logók, illusztrációk pontos elkészítése
- “Visszaemlékszik” az előzőleg készített képekre, így következetes képsorozatok vagy animációs fázisok is készíthetőek egy beszélgetésen belül
- Fejlett szerkesztői lehetőségek (pl. háttér eltávolítása, tárgyak áthelyezése, több forráskép kombinálása)
- Várható újdonságok:
- A multimodális architektúra lehetővé teszi, hogy jövőben ne csak képet, hanem komplex vizuális workflow-kat is kezeljen (pl. táblázat generálása, diagram szerkesztése)
- Konzisztencia megtartása, tehát újabb kép generálásánál, ugyanazon téma esetén megtartja a vonásokat (pl. portré). Vannak azonban tiltó elemek, amiket eleve nem vagy hiányosan, finomítva generál le. Ilyen gyenge pont lehet a politikai ábrázolás, etikai kérdéseket felvető alkotások, stb.
A fentiek azonban a megjelenésig mind csak spekulációk, találgatások, amik egy része vélhetően benne lesz.
Te milyen funkciókat látnál szívesen a ChatGPT képgenerátorában?
Írd meg kommentben.

![AI világnap - július 16. - beküldte: Petyusz<span class="bp-verified-badge"></span> ai vilagnap | MIfoto.hu - a [ MI ] közösségünk!](https://www.mifoto.hu/wp-content/uploads/2025/07/ai-vilagnap-150x150.png)

Nekem alapból nem tetszik a Gpt képgenerátora. Ok értem azt, hogy ez alapjában véve ez egy LLM modell, ezért nem is acélos a képgenerálásban, de hogy egyszerre csak 1 képet generál eléggé frusztráló. Ezen már évek óta semmit nem módosítottak.
A várható bejelentése a ChatGPT 5-ös verziónak valamikor augusztusban esedékes. Szóval már tényleg nem kell sokat várni rá.
Én némi árcsökkenést várnék a havídíjaikban.
Csökkenni egy jó ideig sajnos biztosan nem fog, pláne, ha jön az újabb verzió, de szerintem ár-érték arányban korrekt az a havi 20 dolcsi. Persze ez szubjektív, hogy ki mennyire tudja kihasználni a rendszert.
Én nem tartom korrektnek, ha csak 1024×1536 pixel képméretet nyújt. Inyenes verziónál OK ez a képméret, de ha fizetek érte, egy vicc.