报告总结:
报告对比了文心一言、GPT-3.5和GPT-4在各领域的性能差异。在常识和创作类问题中,三大模型均能正确回答客观常识类问题,但文心一言的分词功能有待提升;在归纳和推理类问题中,文心一言在演绎推理、逻辑推理等领域表现略逊于GPT系列模型,但在归纳总结类任务中表现较好;在数学和代码类问题中,GPT-3.5有更好的数学能力表现;在应用场景测试中,三大模型均能较好地完成AI生活助手、售后客服、产品推荐、办公场景文本生成等任务,但在文言文和古诗词理解运用方面表现不佳。报告认为,随着百度文心及OpenAI合作生态伙伴数量快速增长、训练数据量和模型训练能力持续提升,各模型性能都有望实现进一步优化完善。建议关注在AI领域进行持续布局且拥有成熟应用场景的公司。