新浪科技讯 4月30日下午消息,百川智能今日披露了一份由国内大模型评测机构SuperCLUE发布的评测报告,结果显示,在报告选取的国内外具有代表性的32个大模型4月份的版本中,通过多维度综合性测评,Baichuan 3在国内大模型中排名第一,在知识百科能力上Baichuan 3以82分的成绩超越了GPT-4-Turbo,位列第一。
SuperCLUE是国内知名通用大模型综合性测评基准,其前身是第三方中文语言理解测评基准CLUE(The Chinese Language Understanding Evaluation)。据介绍,为更真实反映大模型通用能力,SuperCLUE本次测评由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等,题目为多轮开放式简答题,评测集共2194题。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:何俊熹
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)