您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东吴证券]:计算机行业深度报告:AI偏向科普性报告,围绕算法、算力、数据和应用 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业深度报告:AI偏向科普性报告,围绕算法、算力、数据和应用

信息技术2023-04-06东吴证券张***
计算机行业深度报告:AI偏向科普性报告,围绕算法、算力、数据和应用

证券研究报告·行业深度报告·计算机 东吴证券研究所 1 / 19 请务必阅读正文之后的免责声明部分 计算机行业深度报告 AI偏向科普性报告:围绕算法、算力、数据和应用 2023年04月06日 证券分析师 王紫敬 执业证书:S0600521080005 021-60199781 wangzj@dwzq.com.cn 研究助理 王世杰 执业证书:S0600121070042 wangshijie@dwzq.com.cn 行业走势 相关研究 《华为盘古大模型产业链梳理》 2023-03-27 《数据安全,为数据要素市场发展保驾护航》 2023-03-24 增持(维持) [Table_Tag] [Table_Summary] 投资要点 ◼ 大模型是AI开发的新范式,是人工智能迈向通用智能的里程碑:大模型指通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型,本质依旧是基于统计学的语言模型,只不过“突现能力”赋予其强大的推理能力。现有的大模型的框架在本质上是一致的,几乎所有参数规模超过千亿的大语言模型都采取GPT模式,但是不同类型的企业给予自己所在领域的优势,开发的大模型在功能上还是有所差异。技术对大模型的效果具有决定作用,因此未来竞争格局也依赖于技术突破。 ◼ 算力是AI时代的“石油”:大模型的训练和推理都会用到AI芯片的算力支持,在数据和算法相同情况下,算力是大模型发展的关键,是人工智能时代的“石油”。我们假设GPT-3训练时间为一个月,则需要843颗英伟达A100芯片。我们假设GPT-3每日日活为5000万,则需要约16255颗英伟达A100芯片。GPT-4为多模态数据,我们预计算力需求量是GPT-3的10倍以上。中国大厂相继布局大模型,我们测算,仅十家头部厂商大模型1年内有望增加约20万片A100需求量。长期来看,则需求量有望超200万片,新增算力需求将使算力市场增长2倍以上。2021年,中国加速卡市场中Nvidia占据超过80%市场份额,国产AI芯片性能与海外仍有差距,国产大模型推出有望加快国产芯片发展。 ◼ 数据资源是AI产业发展的重要驱动力之一:数据集作为数据资源的核心组成部分,是指经过专业化设计、采集、清洗、标注和管理,生产出来的专供人工智能算法模型训练的数据。大规模语言模型性能强烈依赖于参数规模N,数据集大小D和计算量C,训练数据主要来自于维基百科、书籍、期刊、Reddit社交新闻站点、Common Crawl和其他数据集, GPT4依靠大量多模态数据训练。未来AI模型的竞争力或体现在数据质量和稀缺性,发展数据要素市场,促进相关公共、企业、个人数据的进一步放开,将为国内AI发展提供重要支撑。 ◼ AI赋能各行各业,未来是AI应用的星辰大海:AI堪比第四次技术革命,本轮最直接的应用在内容创作领域,打开产业的想象边界。我们应该去寻找在AI赋能下,应用功能显著改善、客户粘性显著提升,市场空间大幅提升的领域,主要有内容创作,办公软件,ERP,机器人以及芯片设计领域。当前部分大模型厂商已经开启产业化应用,但是算力依旧是限制AI大规模商业化落地的主要原因,一旦解决,直接受益AI+的将是信息化行业,因此我们看好各行业信息化领域处于优势地位的龙头公司。 ◼ 投资建议:算法上,我们建议关注已经有先发优势的大模型公司:三六零、科大讯飞、同花顺等,此外还有一些实施企业,如软通动力、润和软件、汉得信息等;算力上,我们推荐景嘉微、中科曙光、神州数码,建议关注海光信息、寒武纪、四川长虹、拓维信息等;数据上,我们推荐各细分赛道的信息化龙头企业,如久远银海、容知日新、中控技术,建议关注国能日新、千方科技等;应用上,我们推荐在具备“杀手级”应用潜能的厂商金山办公、用友网络、恒生电子,建议关注广联达、石基信息等。 ◼ 风险提示:政策推进不及预期;行业竞争加剧 -23%-18%-13%-8%-3%2%7%12%17%22%27%2022/4/62022/8/52022/12/42023/4/4计算机沪深300 请务必阅读正文之后的免责声明部分 东吴证券研究所 行业深度报告 2 / 19 内容目录 1. 算法:大模型——人工智能迈向通用智能的里程碑 ...................................................................... 4 2. 算力:AI训练的基础设施 ................................................................................................................. 8 3. 数据:AI发展的驱动力 ................................................................................................................... 11 4. 应用:AI的星辰大海 ....................................................................................................................... 14 5. 投资建议与相关标的 ........................................................................................................................ 18 6. 风险提示 ............................................................................................................................................ 18 nOnRoQsOtOsNoQsRsOsPrO6M9R9PsQnNmOpMfQpPmQiNrRtN8OoPqPwMmQrNNZoMqQ 请务必阅读正文之后的免责声明部分 东吴证券研究所 行业深度报告 3 / 19 图表目录 图1: 大语言模型................................................................................................................................... 4 图2: Transformer引领了大模型的爆发 .............................................................................................. 5 图3: GPT-4多语言性能表现优秀 ....................................................................................................... 5 图4: GPT-4的文字输入限制 ............................................................................................................... 5 图5: 大模型评估框架V1.0 .................................................................................................................. 6 图6: 大模型的投入成本....................................................................................................................... 6 图7: 百度文心一言............................................................................................................................... 7 图8: 华为盘古....................................................................................................................................... 7 图9: OpenAI-ChatGPT ......................................................................................................................... 8 图10: Google-BERT ............................................................................................................................. 8 图11: 用时1个月训练 ChatGPT-3需要英伟达A100芯片数量 ..................................................... 9 图12: 维持 ChatGPT-3 每日5000万月活运营需要英伟达 A100 芯片数量 ................................ 9 图13: A800和A100性能对比 .......................................................................................................... 10 图14: 国产AI芯片产品算力对比 .................................................................................................... 11 图15: 大模型训练数据来源统计(表中数字单位为GB) ............................................................ 12 图16: 数据采集示意图....................................................................................................................... 13 图17: 三次工业革命带来下游应用技术爆发................................................................................... 14 图18: GPT-4画出了《三体》中的罗辑 ........................................................................................... 15 图19: AI生成不同的3D建筑风格 ....................................................................................