
源起:从GPT-1到ChatGPT,商用化进程逐渐开启 从GPT-1到GPT-3.5,模型持续迭代。GPT(Generative Pre-Trained Transformer)系列是OpenAI公司的一系列预训练模型 ,通过Transformer为基础模型,使用预训练技术得到通用的文本模型。目前已经公布论文的有文本预训练GPT-1,GPT-2,GPT-3,以及图像预训练iGPT,而ChatGPT和今年年初公布的InstructGPT是在GPT-4之前发布的预热模型,也被叫做GPT-3.5。ChatGPT和InstructGPT在模型结构,训练方式上都完全一致,即都使用了指示学习和人工反馈的强化学习来指导模型的训练,它们不同的仅仅是采集数据的方式上有所差异。与之前的模型相比,ChatGPT做到了在内容生成上的有用性,真实性和无害性,实现了算法和用户体验上的创新。 微软全线产品整合,ChatGPT开启商用化进程。OpenAI公司宣布推出ChatGPT的新订阅计划,起价为每月20美元,可以享受更快的响应时间和优先访问。2月2日,微软CEO宣布继搜索引擎必应、Office办公软件之后,将在云计算平台Azure中整合ChaGPT,标志着微软有望实现ChatGPT在全线产品中的整合。我们认为ChatGPT的商用化进程逐渐开启。 技术:预训练模型+人工精标+强化学习,实现NLP技术创新 从技术角度来看,ChatGPT的模型实现主要分为三个步骤,合称为RLHF(Reinforcement Learning by Human Feedback)技术: 1)SFT(SupervisedFineTuning):基于GPT-3的预训练模型,采集新的数据用GPT-3的训练方式对模型进行微调,这些数据一部分来自使用OpenAI的PlayGround用户,另一部分来自OpenAI雇佣的40名标注工(labeler); 2)训练RM(Reword Model):在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。 最终这些标注数据用来训练Reward奖励模型。通过人工标注的方式来提供这个奖励,可以给那些涉及偏见的生成内容更低的分从而鼓励模型不去生成这些人类不喜欢的内容,实现模型的有用、真实和无害。 3)PPO(Proximal Policy Optimization):随机抽取新的样本,用第二阶段的Reward Model给产生的回答打分。这个分数即回答的整体Reward,进而将此Reward回传,由此产生的策略梯度可以更新PPO模型参数。整个过程迭代数次直到模型收敛。强化学习算法可以通过调整模型参数,使模型得到最大的奖励(Reward),最大奖励意味着此时的回复最符合人工的选择取向。 我们认为ChatGPT的算法创新主要在于,采用人工标注排序的方式构建强化学习的奖励模型,从而实现了预训练模型和强化学习的融合。 另一方面,第一阶段GPT-3的大模型以及高质量人工标注数据的微调也促使了模型更加有效。 投资机会:布局NLP算法+数据标注+算力设施 从对于ChatGPT技术上的分析,我们可以看到自然语言处理技术的持续迭代升级,对应到当前市场来看,我们认为主要的发展方向和投资机会在于三个方向: 1)NLP技术:由于ChatGPT主要基于自然语言处理,因为在NLP领域沉淀较多的企业有望率先实现功能的部分复现,建议关注科大讯飞、拓尔思。 2)数据标注:在ChatGPT的训练过程中,加大了人工标注的力度和精度,代表着未来在人工智能领域,优质的数据源和强大的标注能力将成为行业的基础设施,利好人工智能数据标注企业如海天瑞声。 3)算力设施:我们可以看到ChatGPT主要源于GPT-3的预训练模型,而GPT-3相比于此前的模型,最大的不同在于模型体量的大幅提升,根据OpenAI的数据,GPT-3的参数量达到1750亿个,训练数据量达到45TB,而GPT-2参数仅有15亿个,40GB数据。因此,我们认为人工智能的跨越式发展,将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长,建议关注润泽科技等。 建议关注 基础工具:普源精电-U、鼎阳科技、坤恒顺维、霍莱沃、概伦电子、华大九天。 智能汽车:德赛西威、中科创达、四维图新、道通科技、虹软科技、万集科技。 工业软件:宝信软件、中望软件、中控技术、赛意信息、能科科技、鼎捷软件。 数字能源:朗新科技、国能日新、南网科技、龙软科技、国网信通、远光软件。 人工智能:科大讯飞、海康威视、大华股份、奥普特、商汤-W、寒武纪。 网络安全:深信服、安恒信息、启明星辰、天融信、奇安信-U、信安世纪。 风险提示 1)疫情加剧降低企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。 1.本周行业观点 源起:从GPT-1到ChatGPT,商用化进程逐渐开启 从GPT-1到GPT-3.5,模型持续迭代。GPT(Generative Pre-Trained Transformer)系列是OpenAI公司的一系列预训练模型,通过Transformer为基础模型,使用预训练技术得到通用的文本模型。目前已经公布论文的有文本预训练GPT-1,GPT-2,GPT-3,以及图像预训练iGPT,而ChatGPT和今年年初公布的InstructGPT是在GPT-4之前发布的预热模型,也被叫做GPT-3.5。ChatGPT和InstructGPT在模型结构,训练方式上都完全一致,即都使用了指示学习和人工反馈的强化学习来指导模型的训练,它们不同的仅仅是采集数据的方式上有所差异。与之前的模型相比,ChatGPT做到了在内容生成上的有用性,真实性和无害性,实现了算法和用户体验上的创新。 微软全线产品整合,ChatGPT开启商用化进程。OpenAI公司宣布推出ChatGPT的新订阅计划,起价为每月20美元,可以享受更快的响应时间和优先访问。2月2日,微软CEO宣布继搜索引擎必应、Office办公软件之后,将在云计算平台Azure中整合ChaGPT,标志着微软有望实现ChatGPT在全线产品中的整合。我们认为ChatGPT的商用化进程逐渐开启。 技术:预训练模型+人工精标+强化学习,实现NLP技术创新 从技术角度来看,ChatGPT的模型实现主要分为三个步骤,合称为RLHF(Reinforcement Learning by Human Feedback)技术: 1)SFT(Supervised Fine Tuning):基于GPT-3的预训练模型,采集新的数据用GPT-3的训练方式对模型进行微调,这些数据一部分来自使用OpenAI的PlayGround用户,另一部分来自OpenAI雇佣的40名标注工(labeler); 2)训练RM(Reword Model):在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练Reward奖励模型。 通过人工标注的方式来提供这个奖励,可以给那些涉及偏见的生成内容更低的分从而鼓励模型不去生成这些人类不喜欢的内容,实现模型的有用、真实和无害。 3)PPO(Proximal Policy Optimization):随机抽取新的样本,用第二阶段的Reward Model给产生的回答打分。这个分数即回答的整体Reward,进而将此Reward回传,由此产生的策略梯度可以更新PPO模型参数。整个过程迭代数次直到模型收敛。强化学习算法可以通过调整模型参数,使模型得到最大的奖励(Reward),最大奖励意味着此时的回复最符合人工的选择取向。 我们认为ChatGPT的算法创新主要在于,采用人工标注排序的方式构建强化学习的奖励模型,从而实现了预训练模型和强化学习的融合。另一方面,第一阶段GPT-3的大模型以及高质量人工标注数据的微调也促使了模型更加有效。 投资机会:布局NLP算法+数据标注+算力设施 从对于ChatGPT技术上的分析,我们可以看到自然语言处理技术的持续迭代升级,对应到当前市场来看,我们认为主要的发展方向和投资机会在于三个方向: 1)NLP技术:由于ChatGPT主要基于自然语言处理,因为在NLP领域沉淀较多的企业有望率先实现功能的部分复现,建议关注科大讯飞、拓尔思。 2)数据标注:在ChatGPT的训练过程中,加大了人工标注的力度和精度,代表着未来在人工智能领域,优质的数据源和强大的标注能力将成为行业的基础设施,利好人工智能数据标注企业如海天瑞声。 3)算力设施:我们可以看到ChatGPT主要源于GPT-3的预训练模型,而GPT-3相比于此前的模型,最大的不同在于模型体量的大幅提升,根据OpenAI的数据,GPT-3的参数量达到1750亿个,训练数据量达到45TB,而GPT-2参数仅有15亿个,40GB数据。因此,我们认为人工智能的跨越式发展,将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长,建议关注润泽科技等。 2.市场行情回顾 2.1.本周板块指数涨跌幅 本周上证综指下跌0.04%,创业板指下跌0.23%,沪深300指数下跌0.95%。计算机行业指数上涨4.88%,跑赢上证综指4.92%,跑赢创业板指5.11%,跑赢沪深300指数5.83%。横向来看,本周计算机行业指数在中信30个行业指数中排名第2,在TMT四大行业(电子、通信、计算机、传媒)中位列第1。 表1:本周各类指数行情统计 图1.本周各行业涨跌幅统计 2.2.本周计算机个股表现 从涨跌幅情况来看,本周计算机板块整体表现较好。展望2023年,我们仍建议关注景气度向上的智能网联汽车、人工智能、工业软件和网络安全等产业的投资机会。 表2:本周计算机个股涨跌幅统计 从陆港通资金持股情况来看,本周持仓市值前十不变,同花顺代替神州泰岳进入持仓占比前十。从增持比例来看,同花顺、楚天龙和中望软件增持比例最多。 表3:本周陆港通持股情况统计 3.重要行业新闻 3.1.数字金融 2022年,券商发力金融科技步入“新基建”时代,试图构建体系化的数智金融服务能力,通过战略、组织、思维、文化、工具、模式等来全面推进数字化转型。数字化时代,新技术的应用和创新无疑是决定证券公司金融科技交付水平的胜负手,也为券商在数字化转型这场“军备竞赛”中提供了降维打击的致胜能力。(来源:金融科技研究公众号) 近日,平安银行股份有限公司与本源量子首次牵手合作,根据合作协议,双方将共同开展量子金融算法在金融风控等领域的研究与落地,并使用量子计算机真机验证,合作探索量子算法在金融具体业务场景上的应用,有望在将来极大提升在反欺诈、反洗钱等业务领域的计算速度,大幅提高银行金融服务的智能化水平、进一步提升金融服务实体经济的能力。(来源:金融科技时代公众号) 3.2.网络安全 2023年2月1日,FreeBuf咨询发布《CCSIP(China Cyber Security Panorama)2022中国网络安全行业全景册(第五版)》,在原有的94个细分领域的基础上,新增5个细分领域,分别为:软件成分分析SCA、模糊测试、应用加固、API安全以及威胁狩猎,旨在为企业安全建设及产品选型提供参考。(来源:FreeBuf) 近日,IDC发布《中国公共事业IT安全硬件市场份额》研究报告。报告对2021年中国公共事业IT安全硬件市场的规模、增长速度、主要玩家、市场与技术发展趋势等内容进行了详细研究。IDC数据显示,2021年市场总规模超过2亿美元,同比增长21.5%。(来源:IDC咨询) 3.3.工业软件与数字化转型 近日,云南省工信厅公布2022年云南省制造业数字化转型标杆企业名单和工业互联网示范平台名单,10户制造业数字化转型标杆企业和5个工业互联网特色示范平台入选。(来源:云南日报) 根据中国连锁经营协会与麦肯锡共同发布的《20