Tevékenység

  • Petyusz állapotfrissítést küldött be a következő csoportba: Csevegős csoport logójaCsevegős 2 hónap, 1 hete

    A Hangzhou-i székhelyű vállalat először hozta nyilvánosságra, hogy R1 érvelési modelljének betanítása mindössze 294 000 dollárba került, míg az alapmodell költsége körülbelül 6 millió dollár volt. Ez az összesen nagyjából 6,3 millió dollár éles ellentétben áll az amerikai technológiai cégek rivális modelljeihez becsült több tízmillió dolláros költségekkel.

    A DeepSeek fő újítása abban rejlik, hogy az R1 létrehozásához a kutatók által “tiszta megerősítő tanulásnak” nevezett módszert alkalmazzák, ezzel eltérve a hagyományos, ember által készített példákra épülő felügyelt tanulási megközelítésektől. A folyamat a helyes válaszok eléréséért jutalmazza a modellt, ahelyett hogy ember által kiválasztott érvelési minták követésére tanítaná.

    forrás: nature.com