BİZE ULAŞIN

Gün: 27 Mayıs 2025

rlvr-ile-matematiksel-akil-yurutme

RLVR ile matematiksel akıl yürütme nasıl gelişiyor

RLVR ile matematiksel akıl yürütme modellerde büyük sıçrama sağladı. Qwen ailesinde RLVR ile matematiksel akıl yürütme odaklı yöntemlerle spurious sinyaller bile ciddi performans artışı sağladı.

Read More
deepseek-r1-modeli-hugging-face

DeepSeek R1 modeli Hugging Face’de yayınlandı

DeepSeek R1 modeli güncellendi ve Hugging Face’de yayınlandı. DeepSeek R1 modeli, MIT lisansı ile ticari kullanıma da uygun. DeepSeek R1 modeli gelişmeleri burada.

Read More