Tevékenység
-
A Hangzhou-i székhelyű vállalat először hozta nyilvánosságra, hogy R1 érvelési modelljének betanítása mindössze 294 000 dollárba került, míg az alapmodell költsége körülbelül 6 millió dollár volt. Ez az összesen nagyjából 6,3 millió dollár éles ellentétben áll az amerikai technológiai cégek rivális modelljeihez becsült több tízmillió dolláros költségekkel.
A DeepSeek fő újítása abban rejlik, hogy az R1 létrehozásához a kutatók által “tiszta megerősítő tanulásnak” nevezett módszert alkalmazzák, ezzel eltérve a hagyományos, ember által készített példákra épülő felügyelt tanulási megközelítésektől. A folyamat a helyes válaszok eléréséért jutalmazza a modellt, ahelyett hogy ember által kiválasztott érvelési minták követésére tanítaná.
forrás: nature.com

Talán erre szokták azt mondani, hogy van pénz lovéra… 👀