行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

文心一言、GPT3.5及GPT-4的应用测评对比

2023-04-11 - 国金证券 John

本报告对比了百度发布的生成式大模型“文心一言”和OpenAI发布的多模态大模型GPT-4的问答表现。测评涉及常识和创作、归纳和推理、数学和代码、应用等方面。在常识和创作类问题中，三大模型均能正确回答客观常识类问题，文心一言的分词功能有待提升，GPT-4尚未开放图像生成外部测试，文心一言的图像生成能力较为出色。在归纳和推理类问题中，文心一言在演绎推理、逻辑推理等领域表现略逊于GPT系列模型，但在归纳总结类任务中表现较好。在数学和代码类问题中，GPT-3.5有更好的数学能力表现，GPT-3.5及GPT-4模型均完成了代码生成问题，但并非最优解，文心一言代码问题识别能力有待加强。在应用场景测试中，三大模型均能较好地完成AI生活助手、售后客服、产品推荐、办公场景文本生成等任务，但在文言文和古诗词理解运用方面表现不佳。随着百度文心及OpenAI合作生态伙伴数量快速增长、训练数据量和模型训练能力持续提升，各模型性能都有望实现进一步优化完善。建议关注在AI领域进行持续布局且拥有成熟应用场景的公司。

需要全面及时的研报资源，就选择发现报告（www.fxbaogao.com）。平台专注深耕金融研报服务领域多年，研报覆盖面广、库存报告数量极其丰富，积累了海量长期信赖的行业用户。专为金融从业者和投资者量身打造，依托智能检索技术，轻松提取有效数据，完成深度市场分析工作。

点击免费查看完整报告

文心一言、GPT3.5及GPT-4的应用测评对比

你可能感兴趣

文心一言、GPT3.5及GPT-4的应用测评对比

传媒行业周报2023年11期：GPT-4、文心一言发布，应用端落地可期

GPT-4及百度“文心一言”相继发布，微软GDC开幕在即

GPT-4及百度文心一言将于下周发布，国家数据局成立

国君：产业调研-百度文心一言与GPT-4的差距有多大？20230319

计算机行业周观点：Office 365 Copilot全面接入GPT-4，百度“文心一言”正式发布

鸿蒙即将开启NEXT新篇章，已与18个领域的开发者及伙伴展开原生应用全面合作，该公司已通过Open Harmony兼容性测评

AIGC行业快评：GPT-4、文心一言陆续发布，场景落地逐步成为AIGC产业核心

计算机行业周报：关注GPT-4和百度文心一言发布

【机构龙虎榜解读】互联网金融+信创+数据要素，与文心一言合作打造金融行业深度应用人工智能解决方案及服务，还与华为积极合作，机构净买入这家企业