entitas

MMLU

MMLU (Massive Multitask Language Understanding) adalah benchmark yang digunakan untuk mengukur pengetahuan model AI. Hunyuan T1 mencetak 87.2 poin dalam pengujian ini.
AI reasoning rivals: Tencent mengklaim kinerja model baru mereka lebih baik daripada DeepSeek-R1.SCMP
Teknologi
1 bulan lalu

AI reasoning rivals: Tencent mengklaim kinerja model baru mereka lebih baik daripada DeepSeek-R1.