OlympicArena:为超级智能AI基准测试多学科认知推理能力
一、结论写在前面下面介绍的论文来自上海交大、上海AIlib。论文标题:OlympicArena:BenchmarkingMultidisciplineCognitiveReasoningforSuperintelligentAI论文链接:https:arxiv.orgpdf2406.12753项目链接:https:gairnlp.github.ioOlympicArena图1:AI从高考[57]现场参与奥运会为了全面评估当前模型在认知推理能力方面的表现,论文引入了OlympicArena,这是一个包含11,163个双语文本问题的基准,涵盖纯文本和...