OpenAIday2更新发布,强化微调计划扩展 —计算机行业点评报告 事件 推荐(维持) 当地时间12月4日,人工智能头部公司OpenAI宣布,从当地时间12月5日开始,将在12天内进行12场发布会直播,期间将展示公司的新产品、新技术和新功能。直播第二日,OpenAI发布了强化微调技术,并邀请机构、学校和企业参与研究计划。 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn联系人:谢孟津S1050123110012xiemj@cfsc.com.cn 行业相对表现 投资要点 ▌强化微调技术发布,内测结果出色 12月7日,在发布会的第二场直播上,OpenAI发布强化微调(Reinforcement Fine-Tuning)技术,强化微调是一种模型定制技术,能够帮助开发人员、研究人员及机器工程师利用强化学习创建在特定领域完成任务的专家模型。 微调技术迭代更新,模型自主强化学习。OpenAI在去年年初曾推出过监督微调,即让模型模仿输入的文本或图像的特征,可用于修改模型的语气、样式或响应格式等。最新推出的强化微调则更进一步,不仅可以模仿输入,更是教会模型以新的方式在自定义领域中进行推理,强化正确答案的思维路径,抑制错误答案的思路。具体而言,开发人员可以使用数十到数千个高质量任务来定制模型,并根据提供的参考答案对模型的响应进行评分。这项技术强化了模型如何推理类似问题,并提高其在该领域特定任务上的准确性。 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:豆包大模型家族迎来全面升级,视觉理解模型迈入“厘时代”》2024-12-222、《计算机行业周报:豆包稳居MAU国内第一,谷歌Gemini2.0聚焦智能体》2024-12-173、《计算机行业点评报告:谷歌(GOOGL.0):净利润强劲增长,AI全面赋能业务》2024-12-10 实例测试强化微调,输出结果表现出色。发布会上,研究人员通过罕见遗传病的预测展示了强化微调技术的强大功能。向o1-mini提供一份约1100个示例的数据集,其中的病例报告包含了患者症状描述和非该病症的症状列表,向模型输入指令(输出可能导致该遗传病的基因及原因),并提供一份正确答案(训练时不向模型展示,用于检查模型输出答案的正确性),最后对模型结果进行评分。从测试结果可以看到,在推理遗传病基因任务的top@1指标上,经过强化微调的o1-mini准确率能够达到31%,超出初始o1-mini的17%和o1的25%,在top@5、top@max指标上依旧表现优异。 ▌强化微调研究计划助力开发人员处理特定任务 强化微调技术将于明年正式推出,OpenAI正在扩展强化微调研究计划,致力于使开发人员和机器学习工程师能够创建经过微调的专家模型,以处理特定领域的复杂任务。OpenAI已向研究机构、大学和企业发出邀请,特别鼓励那些目前由专家领导执行复杂任务,并将从AI协助中受益的企业申请该项研究计划。这项计划预计在法律、保险、医疗保健、金融和工程等领域有积极结果,因为强化微调擅长那些结果为大多数专家所认同的客观“正确”的任务。 ▌投资建议 OpenAI发布活动显示技术更新迅速。我们认为,随着强化微调的进一步推进与应用,AI技术的深度整合预计将带动部分科技公司的长期增长。 此外,科技巨头在AI及云计算领域的领先地位有望助力其在未来信息产业中的稳步增长,可继续关注谷歌(GOOGL.0)和微软(MSFT.0)。 ▌风险提示 宏观经济波动导致市场需求不足预期;未来AI研发进展不及预期;端侧AI产品销售业绩不及预期。 计算机&AI小组、计算机&中小盘组介绍 宝幼琛:本硕毕业于上海交通大学,多次新财富、水晶球最佳分析师团队成员,7年证券从业经验,2021年11月加盟华鑫证券研究所,目前主要负责计算机与中小盘行业上市公司研究。擅长领域包括:云计算、网络安全、人工智能、区块链等。 任春阳:华东师范大学经济学硕士,6年证券行业经验,2021年11月加盟华鑫证券研究所,从事计算机与中小盘行业上市公司研究 周文龙:澳大利亚莫纳什大学金融硕士 陶欣怡:毕业于上海交通大学,于2023年10月加入团队。谢孟津:伦敦政治经济学院硕士,2023年加入华鑫证券。 证券分析师承诺 本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。 证券投资评级说明 以报告日后的12个月内,预测个股或行业指数相对于相关证券市场主要指数的涨跌幅为标准。 相关证券市场代表性指数说明:A股市场以沪深300指数为基准;新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;香港市场以恒生指数为基准;美国市场以道琼斯指数为基准。 免责条款 华鑫证券有限责任公司(以下简称“华鑫证券”)具有中国证监会核准的证券投资咨询业务资格。本报告由华鑫证券制作,仅供华鑫证券的客户使用。本公司不会因接收人收到本报告而视其为客户。 本报告中的信息均来源于公开资料,华鑫证券研究部门及相关研究人员力求准确可靠,但对这些信息的准确性及完整性不作任何保证。我们已力求报告内容客观、公正,但报告中的信息与所表达的观点不构成所述证券买卖的出价或询价的依据,该等信息、意见并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对任何人的个人推荐。投资者应当对本报告中的信息和意见进行独立评估,并应同时结合各自的投资目的、财务状况和特定需求,必要时就财务、法律、商业、税收等方面咨询专业顾问的意见。对依据或者使用本报告所造成的一切后果,华鑫证券及/或其关联人员均不承担任何法律责任。本公司或关联机构可能会持有报告中所提到的公司所发行的证券头寸并进行交易,还可能为这些公司提供或争取提供投资银行、财务顾问或者金融产品等服务。本公司在知晓范围内依法合规地履行披露。 本报告中的资料、意见、预测均只反映报告初次发布时的判断,可能会随时调整。该等意见、评估及预测无需通知即可随时更改。在不同时期,华鑫证券可能会发出与本报告所载意见、评估及预测不一致的研究报告。华鑫证券没有将此意见及建议向报告所有接收者进行更新的义务。 本报告版权仅为华鑫证券所有,未经华鑫证券书面授权,任何机构和个人不得以任何形式刊载、翻版、复制、发布、转发或引用本报告的任何部分。若华鑫证券以外的机构向其客户发放本报告,则由该机构独自为此发送行为负责,华鑫证券对此等行为不承担任何责任。本报告同时不构成华鑫证券向发送本报告的机构之客户提供的投资建议。如未经华鑫证券授权,私自转载或者转发本报告,所引起的一切后果及法律责任由私自转载或转发者承担。华鑫证券将保留随时追究其法律责任的权利。请投资者慎重使用未经授权刊载或者转发的华鑫证券研究报告。