Name: MIfoto.hu - a digitális online ai közösség
Price range: $$

✨A cikk részben vagy egészben AI eszközzel készült, emberi ellenőrzés mellett.

Érkezik a ChatGPT5

Szakmai berkekben már hetek óta beszélnek arról, hogy a ChatGPT legújabb verziója mikorra érkezhet. Sam Altman az OpenAI (chatgpt cége) fő embere nagyon szegényesen tolja a marketinget a legújabb, korábban egekig magasztalt új hiperokos modelljükkel kapcsolatban, és ez felveti azt a kérdést is, hogy akkor ezek szerint még vannak bőven fejlesztésre szoruló részek, és érthetően addig nem akarják kiengedni a szellemet a palackból, amíg nem adnak megnyugtató eredményt a tesztek.

Szakértők szerint ez a modell már nagyon közel lesz az emberi agy szimulációjához, de szerencsénkre azért még van időnk, amíg ez a rendszer élesbe kifut.

Ebben a cikkben egy rövid áttekintést olvashatsz a ChatGPT5 beépített képgenerátorával kapcsolatban.

A GPT-5 beépített képgenerátoráról jelenleg a következő részletek ismertek:

A GPT-5 egységes modell-architektúrával működik, amely szöveg, kép, hang és videó feldolgozására is alkalmas egyetlen összefüggő kontextusban (felületen). Ez azt jelenti, hogy a modell képes természetes módon váltani a különböző modalitások között, így a képgenerálás is szerves része lett a rendszernek.
Képgenerálási technikai paraméterek:
- Modellek: A beépített képgenerátor a „gpt-image-1” nevű modellt használja, illetve a DALL·E 2/3 technológiáit is támogatja bizonyos API végpontokon keresztül
- Képminőség és méret:
  - Választható méretek: például 1024×1024 vagy 1024×1536 pixel. Nagyjából marad a korábbiakhoz hasonlóan.
  - Minőségi opciók: „low”, „medium”, „high”. Több minőség paraméterrel lehet befolyásolni a renderelés minőségét, ez arányos a token költséggel is.
  - Háttér: kérhető átlátszó („transparent”) vagy egyszínű háttérrel, PNG vagy WebP esetén.
  - Fájlformátumok: alapértelmezett a PNG, de támogatott a JPEG és WebP is, ezeknél beállítható a tömörítés mértéke is.
- Képszerkesztés és variáció:
  - Szerkesztés: már meglévő képek is módosíthatók szöveges prompt alapján (például extra objektumok beillesztése, háttér eltávolítása, stb.). Ez már most is van, de reméljük, hogy tovább lesz fejlesztve és felhasználóbarátabb is lesz a szerkesztő felület
  - Variáció: egy meglévő kép alapján tud a rendszer új, hasonló képeket generálni. Ha ez valóban így lesz, az nagy előrelépés, mert egészen eddig nem tudta ezt a rendszer
- Token-felhasználás: A képek előállításának token költsége változik a kép felbontása és minősége szerint. Például egy 1024×1024 pixeles, „high quality” kép generálása akár 4,000 tokenbe is kerülhet (becslés, a valós számok eltérhetnek)
Speciális képességek:
- Magasabb pontosságú szöveg-renderelés: A modell képes rövid szövegeket precízen megjeleníteni, ami a korábbi generátoroknál még problémás volt
- Többlépcsős (multi-turn) szerkesztés: Egy kép generálása után a felhasználó újabb prompttal tovább szerkesztheti a képet, mindezt egy folyamatban
- Képek és szövegek együttes kezelése: A modell ﬁgyelembe tudja venni a vizuális kontextust akár feltöltött képből, akár korábban generált vizuális tartalomból, és szöveges vagy képi kimenetet is tud adni
Mire lesz képes a képgenerátor?
- Egyedi művészi képek, egyszerű technikai ábrák, logók, illusztrációk pontos elkészítése
- “Visszaemlékszik” az előzőleg készített képekre, így következetes képsorozatok vagy animációs fázisok is készíthetőek egy beszélgetésen belül
- Fejlett szerkesztői lehetőségek (pl. háttér eltávolítása, tárgyak áthelyezése, több forráskép kombinálása)
Várható újdonságok:
- A multimodális architektúra lehetővé teszi, hogy jövőben ne csak képet, hanem komplex vizuális workflow-kat is kezeljen (pl. táblázat generálása, diagram szerkesztése)
- Konzisztencia megtartása, tehát újabb kép generálásánál, ugyanazon téma esetén megtartja a vonásokat (pl. portré). Vannak azonban tiltó elemek, amiket eleve nem vagy hiányosan, finomítva generál le. Ilyen gyenge pont lehet a politikai ábrázolás, etikai kérdéseket felvető alkotások, stb.

A fentiek azonban a megjelenésig mind csak spekulációk, találgatások, amik egy része vélhetően benne lesz.

Te milyen funkciókat látnál szívesen a ChatGPT képgenerátorában?
Írd meg kommentben.

5 hozzászólás

Nekem alapból nem tetszik a Gpt képgenerátora. Ok értem azt, hogy ez alapjában véve ez egy LLM modell, ezért nem is acélos a képgenerálásban, de hogy egyszerre csak 1 képet generál eléggé frusztráló. Ezen már évek óta semmit nem módosítottak.

A várható bejelentése a ChatGPT 5-ös verziónak valamikor augusztusban esedékes. Szóval már tényleg nem kell sokat várni rá.

Én némi árcsökkenést várnék a havídíjaikban.

Petyusz szerint:

július 27, 2025 5:08 du.

Csökkenni egy jó ideig sajnos biztosan nem fog, pláne, ha jön az újabb verzió, de szerintem ár-érték arányban korrekt az a havi 20 dolcsi. Persze ez szubjektív, hogy ki mennyire tudja kihasználni a rendszert.

Bejelentkezés a válaszhoz
1. István Három szerint:
  
  július 27, 2025 5:20 du.
  
  Én nem tartom korrektnek, ha csak 1024×1536 pixel képméretet nyújt. Inyenes verziónál OK ez a képméret, de ha fizetek érte, egy vicc.
  
  Bejelentkezés a válaszhoz

Válasz megszakítása

A hozzászóláshoz be kell jelentkezned.

Isti szerint:

július 27, 2025 6:24 du.

Nekem alapból nem tetszik a Gpt képgenerátora. Ok értem azt, hogy ez alapjában véve ez egy LLM modell, ezért nem is acélos a képgenerálásban, de hogy egyszerre csak 1 képet generál eléggé frusztráló. Ezen már évek óta semmit nem módosítottak.

Bejelentkezés a válaszhoz
Petyusz szerint:

július 27, 2025 5:06 du.

A várható bejelentése a ChatGPT 5-ös verziónak valamikor augusztusban esedékes. Szóval már tényleg nem kell sokat várni rá.

Bejelentkezés a válaszhoz
István Három szerint:

július 27, 2025 1:38 du.

Én némi árcsökkenést várnék a havídíjaikban.

Bejelentkezés a válaszhoz
1. Petyusz szerint:
  
  július 27, 2025 5:08 du.
  
  Csökkenni egy jó ideig sajnos biztosan nem fog, pláne, ha jön az újabb verzió, de szerintem ár-érték arányban korrekt az a havi 20 dolcsi. Persze ez szubjektív, hogy ki mennyire tudja kihasználni a rendszert.
  
  Bejelentkezés a válaszhoz
  1. István Három szerint:
    
    július 27, 2025 5:20 du.
    
    Én nem tartom korrektnek, ha csak 1024×1536 pixel képméretet nyújt. Inyenes verziónál OK ez a képméret, de ha fizetek érte, egy vicc.
    
    Bejelentkezés a válaszhoz