Magazin & Tudásbázis

Legfrissebb MI hírek, tesztek, tudásbázis.

Tevékenység

  • Petyusz állapotfrissítést küldött be a következő csoportba: Csevegős 7 hónap

    A Hangzhou-i székhelyű vállalat először hozta nyilvánosságra, hogy R1 érvelési modelljének betanítása mindössze 294 000 dollárba került, míg az alapmodell költsége körülbelül 6 millió dollár volt. Ez az összesen nagyjából 6,3 millió dollár éles ellentétben áll az amerikai technológiai cégek rivális modelljeihez becsült több tízmillió dolláros költségekkel.

    A DeepSeek fő újítása abban rejlik, hogy az R1 létrehozásához a kutatók által „tiszta megerősítő tanulásnak” nevezett módszert alkalmazzák, ezzel eltérve a hagyományos, ember által készített példákra épülő felügyelt tanulási megközelítésektől. A folyamat a helyes válaszok eléréséért jutalmazza a modellt, ahelyett hogy ember által kiválasztott érvelési minták követésére tanítaná.

    forrás: nature.com