“弈衡”评测是打造中国移动权威第三方评测机构的项目,旨在评测公司“一体五环”重点产品和能力。评测涉及领域广泛,包括文本类、语句类、图像类、语音类等。评测工具包括深度学习、数据库、多线程等,评测方式包括代码生成、基础任务、应用任务等。评测指标包括功能性、准确性、可靠性、安全性、应用性、交互性、多模态能力、任务丰富度、支持完备度、准确度、不确定性、抗攻击性、鲁棒性、社会偏见、合法合规、隐私保护、生态商用、实时性、丰富性、连续性、规范性、公平性、流畅性等。评测场景包括文本分类、目标检测、智能客服等。评测维度包括功能性、准确性、可靠性、安全性、应用性、交互性、多模态能力、任务丰富度、支持完备度、准确度、不确定性、抗攻击性、鲁棒性、社会偏见、合法合规、隐私保护、生态商用、实时性、丰富性、连续性、规范性、公平性、流畅性等。评测工具包括深度学习、数据库、多线程等。评测方式包括代码生成、基础任务、应用任务等。评测指标包括功能性、准确性、可靠性、安全性、应用性、交互性、多模态能力、任务丰富度、支持完备度、准确度、不确定性、抗攻击性、鲁棒性、社会偏见、合法合规、隐私保护、生态商用、实时性、丰富性、连续性、规范性、公平性、流畅性等。
1“弈衡”评测厚积薄发
2大模型发展趋势洞察
3下一步发展展望
打造中国移动权威第三方评测机构
愿景:成为中国移动核心技术能力的度量衡和磨刀石目标:以公司“一体五环”重点产品和能力评测为中心,打造中国移动权威、中立、客观的第三方技术能力评测机构
涉及领域广
搭建中国移动技术能力评测图谱,全面助力公司打造优质产品
专委会副主任郭嘉丰向中国移动技术能力评测中心主任刘伟东授牌
以 测 选 优
以 评 促 研
积极促进自有大模型提升
遴选应用外部优质模型
1“弈衡”评测厚积薄发
2大模型发展趋势洞察
3下一步发展展望
1“弈衡”评测厚积薄发
2大模型发展趋势洞察
3下一步发展展望
正在征集首批联盟单位,欢迎大家踊跃报名!
联系邮箱:zgydjsnlpczxfs@chinamobile.com
中国移动希望与产业界和学术界携手,共同构建大模型评测合作生态,推进大模型蓬勃发展