Loading...

热门

C-Eval：一个适用于大语言模型的多层次多学科中文评估套件，可以评估模型在不同领域和任务上的性能，并提供结果提交功能

AI大模型10个月前发布阿强

C-Eval是一个适用于大语言模型的多层次多学科中文评估套件，旨在提供一个全面的评估框架，以评估中文语言模型在不同领域和任务上的性能。

C-Eval有哪些功能？

1. 多层次评估：C-Eval提供了多个层次的评估指标，包括整体评估、领域评估和任务评估，可以全面评估模型在不同层次上的表现。

2. 多学科评估：C-Eval涵盖了STEM（科学、技术、工程和数学）、社会科学、人文科学和其他领域的评估指标，可以评估模型在不同学科上的表现。

3. 结果提交：用户可以通过C-Eval的结果提交功能，提交模型的预测结果进行评估，并获得相应的评估分数。

应用场景：

C-Eval适用于评估中文语言模型在各种任务和领域上的性能，包括但不限于文本生成、问答系统、对话系统等。

C-Eval：https://cevalbenchmark.com/static/leaderboard_zh.html

C-Eval：一个适用于大语言模型的多层次多学科中文评估套件，可以评估模型在不同领域和任务上的性能，并提供结果提交功能插图

# AI大模型 # AI资源

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

美图影像研究院：MT Lab是美图公司的核心研究部门，拥有强大的研发实力和数亿用户验证，致力于人脸技术、图像处理、图像生成等领域的研究和开发

121 0

H2O LLM Eval：一个用于评估和比较不同语言模型的工具，基于Elo排名算法，帮助用户选择最适合自己需求的模型

40 0

LLMEval-3：一个专业知识能力评测系统，提供相对得分和绝对得分排行榜，以及各学科得分排行榜。用户可以通过该系统评估不同模型在专业知识能力上的表现

42 0

商量大语言模型：商汤科技研发的一款基于自然语言处理技术的人工智能大语言模型，具备超凡的语言理解、生成能力，将科技与人文相互交融

72 0

依图语音开放平台：提供短语音听写、长语音转写、实时语音转写等功能

55 0

美图AI开放平台：美图公司推出的人工智能开放平台，提供高质量、可靠、易用的人工智能技术和服务，以满足开发者和企业在智能识别、语音识别、机器翻译、自然语言处理等方面

118 0

暂无评论

暂无评论...