Anthropic (Claude) update csomag
Az Anthropic bejelentette a Claude 3.5 nyelvi modellcsalád frissítését, mely magában foglalja a továbbfejlesztett Claude 3.5 Sonnet-et és az új Claude 3.5 Haiku-t. A legnagyobb újdonság a „computer use„ (számítógép-használat) béta verziója, amivel a Claude modellek képesek számítógépeket használni emberi módon: képernyőt nézni, kurzort mozgatni, gombokra kattintani és szöveget gépelni. Kb. úgy kell elképzelni, mint egy távoli elérést, azt hogy ez mennyire jó, hasznos és biztonságos, majd a jövő megmondja.
Claude 3.5 Sonnet:
- Jelentős fejlesztéseken ment keresztül, különösen a kódolás terén, ahol már eddig is vezető szerepet töltött be.
- A SWE-bench Verified teszten 33.4%-ról 49.0%-ra javult a teljesítménye, megelőzve minden nyilvánosan elérhető modellt, beleértve az OpenAI o1-preview-t és a speciális kódoló rendszereket.
- A TAU-bench teszten, ami az eszközhasználatot méri, szintén javulást mutatott.
- A GitLab, a Cognition és a The Browser Company visszajelzései alapján a modell jelentős előrelépést jelent az AI-alapú kódolásban.
- Az új modell ugyanazon az áron és sebességgel érhető el, mint elődje.
- A US AI Safety Institute (US AISI) és a UK Safety Institute (UK AISI) is tesztelte a modellt a bevezetés előtt.
Claude 3.5 Haiku:
- A leggyorsabb modelljük következő generációja.
- Ugyanazon az áron és hasonló sebességgel érhető el, mint a Claude 3 Haiku, de minden területen jobb teljesítményt nyújt, sőt, sok intelligencia-benchmarkon felülmúlja a korábbi legnagyobb modelljüket, a Claude 3 Opus-t.
- Különösen erős a kódolási feladatokban.
- Alacsony késleltetésű, jobb utasításkövetéssel és pontosabb eszközhasználattal rendelkezik.
- Ideális felhasználóbarát termékekhez, speciális részfeladatokhoz és személyre szabott élmények generálásához nagy mennyiségű adatból.
- Később jelenik meg, kezdetben csak szöveges modellként, majd képfeldolgozási képességgel bővítve.
Számítógép-használat (Computer Use):
- Forradalmi újítás, amivel a Claude modellek képesek általános számítógépes készségeket elsajátítani, és standard eszközöket, szoftvereket használni, mint az emberek.
- Az API-n keresztül a fejlesztők utasíthatják a Claude-ot, hogy hajtson végre számítógépes parancsokat, például töltsön ki űrlapokat online adatok alapján.
- Az OSWorld teszten, ami a számítógép-használatot méri, a Claude 3.5 Sonnet jobban teljesített, mint bármely más AI rendszer.
- A képesség még fejlesztés alatt áll, bizonyos műveletek, mint a görgetés, húzás, zoomolás még nehézséget okozhatnak.
- A számítógép-használat új lehetőségeket nyit a spam, félretájékoztatás és csalás terén is, ezért az Anthropic új osztályozókat fejlesztett ki ezek azonosítására.
- A fejlesztők visszajelzése alapján a technológia folyamatosan fejlődik.
Te használod a Claude valamelyik szolgáltatását?



0 hozzászólás