第三十五篇-各大模型测评地址和说明集合

llm任务进行基准测试,包括AI2推理挑战、HellaSwag、MMLU等。_lmarena.ai官网...