Érkezik a ChatGPT5

3 perc


chatGPT5

Érkezik a ChatGPT5

Szakmai berkekben már hetek óta beszélnek arról, hogy a ChatGPT legújabb verziója mikorra érkezhet. Sam Altman az OpenAI (chatgpt cége) fő embere nagyon szegényesen tolja a marketinget a legújabb, korábban egekig magasztalt új hiperokos modelljükkel kapcsolatban, és ez felveti azt a kérdést is, hogy akkor ezek szerint még vannak bőven fejlesztésre szoruló részek, és érthetően addig nem akarják kiengedni a szellemet a palackból, amíg nem adnak megnyugtató eredményt a tesztek.

Szakértők szerint ez a modell már nagyon közel lesz az emberi agy szimulációjához, de szerencsénkre azért még van időnk, amíg ez a rendszer élesbe kifut.

Ebben a cikkben egy rövid áttekintést olvashatsz a ChatGPT5 beépített képgenerátorával kapcsolatban.

A GPT-5 beépített képgenerátoráról jelenleg a következő részletek ismertek:

  • A GPT-5 egységes modell-architektúrával működik, amely szöveg, kép, hang és videó feldolgozására is alkalmas egyetlen összefüggő kontextusban (felületen). Ez azt jelenti, hogy a modell képes természetes módon váltani a különböző modalitások között, így a képgenerálás is szerves része lett a rendszernek.
  • Képgenerálási technikai paraméterek:
    • Modellek: A beépített képgenerátor a „gpt-image-1” nevű modellt használja, illetve a DALL·E 2/3 technológiáit is támogatja bizonyos API végpontokon keresztül
    • Képminőség és méret:
      • Választható méretek: például 1024×1024 vagy 1024×1536 pixel. Nagyjából marad a korábbiakhoz hasonlóan.
      • Minőségi opciók: „low”, „medium”, „high”. Több minőség paraméterrel lehet befolyásolni a renderelés minőségét, ez arányos a token költséggel is.
      • Háttér: kérhető átlátszó („transparent”) vagy egyszínű háttérrel, PNG vagy WebP esetén.
      • Fájlformátumok: alapértelmezett a PNG, de támogatott a JPEG és WebP is, ezeknél beállítható a tömörítés mértéke is.
    • Képszerkesztés és variáció:
      • Szerkesztés: már meglévő képek is módosíthatók szöveges prompt alapján (például extra objektumok beillesztése, háttér eltávolítása, stb.). Ez már most is van, de reméljük, hogy tovább lesz fejlesztve és felhasználóbarátabb is lesz a szerkesztő felület
      • Variáció: egy meglévő kép alapján tud a rendszer új, hasonló képeket generálni. Ha ez valóban így lesz, az nagy előrelépés, mert egészen eddig nem tudta ezt a rendszer
    • Token-felhasználás: A képek előállításának token költsége változik a kép felbontása és minősége szerint. Például egy 1024×1024 pixeles, „high quality” kép generálása akár 4,000 tokenbe is kerülhet (becslés, a valós számok eltérhetnek)
  • Speciális képességek:
    • Magasabb pontosságú szöveg-renderelés: A modell képes rövid szövegeket precízen megjeleníteni, ami a korábbi generátoroknál még problémás volt
    • Többlépcsős (multi-turn) szerkesztés: Egy kép generálása után a felhasználó újabb prompttal tovább szerkesztheti a képet, mindezt egy folyamatban
    • Képek és szövegek együttes kezelése: A modell figyelembe tudja venni a vizuális kontextust akár feltöltött képből, akár korábban generált vizuális tartalomból, és szöveges vagy képi kimenetet is tud adni
  • Mire lesz képes a képgenerátor?
    • Egyedi művészi képek, egyszerű technikai ábrák, logók, illusztrációk pontos elkészítése
    • “Visszaemlékszik” az előzőleg készített képekre, így következetes képsorozatok vagy animációs fázisok is készíthetőek egy beszélgetésen belül
    • Fejlett szerkesztői lehetőségek (pl. háttér eltávolítása, tárgyak áthelyezése, több forráskép kombinálása)
  • Várható újdonságok:
    • A multimodális architektúra lehetővé teszi, hogy jövőben ne csak képet, hanem komplex vizuális workflow-kat is kezeljen (pl. táblázat generálása, diagram szerkesztése)
    • Konzisztencia megtartása, tehát újabb kép generálásánál, ugyanazon téma esetén megtartja a vonásokat (pl. portré). Vannak azonban tiltó elemek, amiket eleve nem vagy hiányosan, finomítva generál le. Ilyen gyenge pont lehet a politikai ábrázolás, etikai kérdéseket felvető alkotások, stb.

A fentiek azonban a megjelenésig mind csak spekulációk, találgatások, amik egy része vélhetően benne lesz.

Te milyen funkciókat látnál szívesen a ChatGPT képgenerátorában?
Írd meg kommentben.


Hogy tetszik?

vicces vicces
1
vicces
gyenge gyenge
0
gyenge
közepes közepes
0
közepes
imádom imádom
3
imádom

5 hozzászólás

  1. Nekem alapból nem tetszik a Gpt képgenerátora. Ok értem azt, hogy ez alapjában véve ez egy LLM modell, ezért nem is acélos a képgenerálásban, de hogy egyszerre csak 1 képet generál eléggé frusztráló. Ezen már évek óta semmit nem módosítottak.

Petyusz<span class="bp-verified-badge"></span>

Okleveles fotográfusként (is) dolgozom elsősorban portré vonalon, illetve mentorálok kezdőket. Mérföldkövek az életemben webes vonalon: 2009 – 2023. Újbuda Közösségi Portál (közönségtalálkozók, kisebb rendezvények, 11. kerületi Önkormányzat együttműködések)… 2011 – FotosHirek.hu – fotós szakmai hírportál 2018 – saját fotós weboldalam üzemeltetése és fotózások, mentorálások 2024 – új közösségi platform létrehozása (MIfoto.hu)
Rövidírek
Adobe Firefly Custom Models SD 3.5 Flash modell 2026-os ai vizuális trendek Képgenerálás a böngészőben? Megvolt az idei első AI kiállítás Terjed az AI a marketingben Deepfake képek árasztják el a netet Nano Banana 2 Flash Új trendek jönnek Adobe Firefly Custom Models SD 3.5 Flash modell 2026-os ai vizuális trendek Képgenerálás a böngészőben? Megvolt az idei első AI kiállítás Terjed az AI a marketingben Deepfake képek árasztják el a netet Nano Banana 2 Flash Új trendek jönnek
×

✨ Legújabb Fejlesztések

× 💸

Ezzel a cikk olvasással épp most buktál el 1 pontot!

A közösség tagjai (szinte) minden aktivitásért pontot kapnak, ami gyűlik az adatlapjukon. Ezt értékes kedvezményekre tudják beváltani partnereinknél. Ne hagyd veszni a pontjaidat!

Köszi, csatlakozom a közösséghez →