研究背景 迅猛发展的⼈⼯智能成为今年两会备受关注的热议话题之⼀。3⽉5⽇,国务院总理李强在政府⼯作报告中提出,要⼤⼒推进现代化产业体系建设,加快发展新质⽣产⼒,同时,要深化⼤数据、⼈⼯智能等研发应⽤,开展“⼈⼯智能+”⾏动,打造具有国际竞争⼒的数字产业集群。 在这个过程中,⽣成式⼈⼯智能将成为产业创新的关键抓⼿之⼀,与实体经济的融合也将成为新质⽣产⼒发展的引擎。 作为新兴领域,⽣成式⼈⼯智能尚处于起步发展期,InfoQ研究中⼼发起了本次《中国⽣成式AI开发者洞察2024》的研发和撰写计划,希望以⽣成式AI开发者的⻆度为⾏业⼴⼤从业者、希望进⼊该⾏业的个⼈或机构,以及关注⽣成式AI领域的⼤众⼈群提供清晰的⾏业洞察,并解答以下问题: Ø当下⽣成式AI开发者是哪些⼈?从业需要具备什么技能?使⽤哪些⼯具?关注哪些领域的哪些应⽤? Ø⽣成式AI开发者具有哪些需求?⽣态⼯作者能够为⽣成式AI开发者提供什么样的帮助? Ø企业如何升级⽣成式AI建设?建设路线都有哪些? 研究⽅法说明 3⽤户调研 2专家访谈 1桌⾯研究 InfoQ研究中⼼针对本次研究需求在InfoQ技术社区、公众号、TGO等技术社区开展了相关⽤户调研,共回收920份有效样本,样本覆盖31个省级⾏政单位、受访⽣成式AI开发者来⾃近百座中国城市。 InfoQ研究中⼼针对本次研究定向邀请了多位资深⽣成式AI开发者、应⽤领域企业的业务负责⼈、科技领域⾏业研究员等各⽅⾯专家; 通过对⾏业公开信息进⾏桌⾯研究,资料包括但不限于专业机构研究报告、政府机构披露的数据和政策内容、⽣成式AI相关⽹站及专家公开演讲内容等; 研究定义 ⼤众开发者 ⽣成式AI开发者 •在各个⾏业从事⽣成式AI技术研发⼯作,或利⽤AI⼯具进⾏⼯作,且具备专业技术能⼒的⼈员。这其中包含传统意义上的AI领域程序员⼈群,也包括借助AI来完成⼯作的数据分析、运营、市场、测试等⼈员,但后者需要具备专业开发能⼒。⽽不具备专业开发能⼒的数据分析、运营、市场、测试等⼈员,即使借助AI进⾏⽇常⼯作,也不属于本报告中的⽣成式AI开发者。⽣成式AI开发者既包括在企业机构中任职的在职⼈员,也包括未在企业机构中⼊职的个⼈从业者和学⽣群体。 •各个⾏业正在或有意愿通过AI辅助⼯作的⼈员,或有意愿进⼊⽣成式AI领域⼯作的⼈员,或以娱乐为⽬的尝试通过AI进⾏内容⽣成的技术爱好者等各类关注⽣成式AI领域的⼈群,且不具备或具备很少量专业技术研发能⼒。⼤众开发者既包括在企业机构中任职的在职⼈员,也包括未在企业机构中⼊职的个⼈和学⽣群体,既包括以⼯作为⽬的也包括以兴趣或尝鲜为⽬的的关注⽣成式AI领域的⼈群。 核⼼结论 ⼀、⼈⼯智能产业规模快速增⻓,吸引了⼤量⼈才为其创新续航 2023年全球⼈⼯智能市场收⼊同⽐增⻓20.7%,中国成为⼈⼯智能发展最快的市场之⼀。在⽣成式⼈⼯智能⽅⾯,未来10年,⽣成式AI有望创造1.3万亿美元收⼊,占科技领域总⽀出的10%-12%,复合年增⻓率预计达到约42%; 国内来看,⽣成式⼈⼯智能逐渐进⼊政策红利期,政策覆盖了从基础设施布局到核⼼领域应⽤的多个层⾯,为企业引才聚智提供政策保障。但由于⾏业发展较新,⽣成式AI领域存在专业⼈才⽋缺问题,就业市场对⾼学历毕业⽣的需求量出现⼤幅增⻓,同时也成为对应届⽣最具有吸引⼒的⾏业之⼀。 ⼆、⽣成式AI开发者特征 •⽣成式AI开发者画像解读 作为新兴⾏业从业者,⽣成式AI开发者普遍相关⼯作年限较短,但属于⾼薪⼈群,⽬前⼈均年收⼊为36.7万,50万以上年薪占⽐⾼达25.3%,北京⽣成式AI开发者规模最⼤,但上海⼈均薪资更⾼; 算法⼯程师、产品经理是⽬前市场最为紧缺的⼈才类型,⼤模型研发和业务复合型能⼒是市场核⼼竞争⼒。 •⽣成式AI开发者⼯作特征 近6成⽣成式AI开发者研发⽅向超过2个,应⽤⼯具、⼤语⾔模型、数据科学/数据挖掘/数据分析、语⾔/语义理解类应⽤和图像识别类应⽤是最主要的五个⽣成式AI开发者研发⽅向; 核⼼结论 GPT、⽂⼼、通义⼤模型是⽣成式AI开发者使⽤率最⾼的⼤模型,⽣成式AI开发者或企业对⼤模型的要求不仅是实现通⽤功能,还需要能够在特定领域、特定场景具备应⽤价值,真正解决业务痛点; 在⼯具使⽤⽅⾯,代码⽣成⼯具和ChatBot使⽤率最⾼,智能化办公⼯具使⽤时间最⻓。⽣成式AI开发者⼈均使⽤AI辅助编程⼯具已花费328.8元,使⽤GitHub Copilot⼈群⽐例最⾼,但对Cursor的付费⽔平最⾼。⼯具链、落地实践和技术课程⽅⾯的⽀持最受⽣成式AI开发者⻘睐。 三、⽣成式AI研发团队洞察 •企业⽣成式AI开发团队 ⽣成式AI开发者所在⾏业较为集中,由于应⽤尚处于起步期,较少⽣成式AI开发者就职于应⽤领域企业,中⼩企业占据半壁江⼭,20⼈以下⼩规模团队成为“标配”; “懂场景”、“懂模型”、“懂开发”是团队⼈才三要素,年轻、有顶尖名校背景、具备世界知名科技企业或机构核⼼业务⼯作经验的技术⼈才成为团队中坚⼒量。在领导者选择⽅⾯,由于⾏业对资⾦投⼊⼒度和技术能⼒要求⾼,领导者需要具备相关领域深厚的技术实⼒以及科技巨头企业领导层经验。 •企业⽣成式AI研发基础设施 多数企业使⽤云服务或部分⾃建算⼒设施。采买或调⽤商业⼤模型和基于开源构建专属⼤模型是主流⽅式,⼤型应⽤侧企业更偏好基于开源构建⾃⼰的专属⼤模型。近三成企业⽋缺⽣成式AI⼯具使⽤导向,基础设施存在较多问题,主要体现在GPU资源紧张、数据存在合规⻛险、缺乏业务场景、⼈才少企业重视不⾜等⽅⾯。 核⼼结论 •企业⽣成式AI研发实践 ⽣成式AI的⾏业应⽤正在全⾯铺开,重塑⼯作⽅式并提升效率是最主要的AI实践⽬的。因此,⽣成式AI开发者最为注重办公场景的应⽤。但⽬前来看,企业赋能⽔平仍有较⼤空间,⽣成式AI开发者企业普遍处于基础探索期,主要赋能情况为单节点业务合作。但由于部分企业⽣成式AI开发者指数较⾼,整体升级速度会较快,企业正在努⼒迈向复杂应⽤期。 四、⽣成式AI开发者发展预测 在晋升⽅⾯,⽣成式AI开发者中的初⼊者未来具有4条进阶路线成为⾏业资深⼈⼠; 在技能⽅⾯,⽣成式AI开发者未来希望通过获取权威认证提升就业竞争⼒; 在产品⽅⾯,⽣成式AI开发者购买相关产品的付费意愿强烈,并且产品收⼊规模已呈现持续扩⼤趋势,市场潜⼒巨⼤; 在就职⽅⾯,⽣成式AI开发者未来将逐渐从供应侧企业向应⽤侧企业迁移; 全⺠开发时代即将到来,⽣成式AI开发者画像将继续拓展,复合型⼈才成为⼤众开发者进阶⽬标。 ⽬录CONTENT 01⽣成式AI开发者研究背景 02⽣成式AI开发者特征 03⽣成式AI研发团队洞察 04⽣成式AI开发者发展预测 ⽣成式AI开发者研究背景 ⼈⼯智能产业规模快速增⻓,为⼈才市场带来新机遇 n信通院指出,2023年全球⼈⼯智能市场收⼊预计达5132亿美元,同⽐增⻓20.7%。截⾄2023年三季度,全球⼈⼯智能企业达到29,542家,中国企业数量仅低于美国,占全球总数的15%; n彭博⾏业研究数据显示,随着企业改变经营⽅式并对产品和服务进⾏强化,未来10年,⽣成式AI有望在硬件、软件、服务、⼴告、游戏等众多领域创造1.3万亿美元收⼊,占科技领域总⽀出的10%-12%,复合年增⻓率预计达到约42%。 政策指引⽣成式⼈⼯智能应⽤创新,⿎励企业汇聚⼈才 ⽣成式⼈⼯智能逐渐进⼊政策红利期,从完善基础设施布局到核⼼领域应⽤,政策密集出台,多部⻔协同发⼒,以组合拳促发展。 ⾏业的蓬勃发展吸引了⼤量⼈才为其创新续航 ⽣成式AI的蓬勃发展产⽣了⼤量⼈才需求,在2023届应届⽣投递⼈数增⻓最多的TOP10赛道中,⽣成式AI和AI⼤模型分别排名第⼆和第三,其中⽣成式AI增⻓率⼤幅超越其他赛道。AI⼤模型、⽣成式AI、芯⽚对硕博应届⽣的需求增⻓可观,其中AI⼤模型对博⼠⽣的招聘需求更是增⻓了430.0%。 ⽣成式AI开发者特征 ⽣成式AI开发者画像解读 作为新兴⾏业从业者,⽣成式AI开发者普遍相关⼯作年限较短 ⽣成式AI开发者50万以上年薪占⽐⾼达23.3% 2023年⽣成式AI开发者薪资⽔平 InfoQ调研统计,2023年⽣成式AI开发者⼈均年收⼊为36.7万,相关⼯作经验在3年以上⽣成式AI开发者的年收⼊超越均值,近4成⽣成式AI开发者年收⼊处于20-50万区间,远超2023年上半年北京招聘平均薪资(18976元/⽉)。由于AI应⽤范围⼴、技术含量⾼、供需两旺等因素,互联⽹企业、科技企业、初创企业展现出强⼤的招聘势头,即使是⼯作年限较短的⽣成式AI开发者,薪资⽔平也超越北京平均招聘薪资⽔平。 北京⽣成式AI开发者规模最⼤,但上海资深⽣成式AI开发者更多且⼈均薪资更⾼ n⽣成式AI开发者主要集中在北京,⼴东省和上海属于第⼆梯队的相关⼈才聚集地; 北京的⽣成式AI开发者中,超过三成为资深研发⼈员,⼈均年薪为44.2万,⼈均⼯作年限为2.6年,近六成就职于信息传输、软件和信息技术服务业企业; ⼴东省的⽣成式AI开发者中,近四成为资深研发⼈员,⼈均年薪为39.9万,⼈均⼯作年限为2.7年,六成就职于信息传输、软件和信息技术服务业企业; n上海的⽣成式AI开发者中,超过四成为资深研发⼈员,⼈均年薪为50.4万,⼈均⼯作年限为3.3年,近七成就职于信息传输、软件和信息技术服务业企业。 算法⼯程师、产品经理是⽬前市场最为紧缺的⼈才类型 在新发职位最多的TOP5职能中,除了算法⼯程师,产品经理占⽐最多: p在偏向技术类的岗位职责中,熟悉常⻅的机器学习和深度学习算法、熟悉常⻅的⽣成式模型、熟悉Python/Java/C++等⾄少⼀种以上后端语⾔、熟悉SQL编程成为硬性要求;有相关⽅向顶级会议/期刊论⽂或竞赛经验是就职加分项。 p在偏向应⽤类的岗位职责中,有AI基础能⼒(了解NLP、机器学习、深度学习的⼤致原理、熟悉主流算法、熟悉⾄少⼀种编程语⾔)、能够与技术⽆障碍沟通、了解AI在特定⾏业的应⽤、熟悉⾄少⼀种⼤语⾔模型的能⼒边界及应⽤场景成为硬性要求,有对接算法和⼯程经验或有海外互联⽹App产品经验是就职加分项。 ⼤模型研发和业务复合型能⼒是市场核⼼竞争⼒ 01 基础研发能⼒:算法⼯程师或数据科学家 n第⼀类紧缺⼈才为具备基础研发能⼒的专业技术⼈员,以算法⼯程师或数据科学家为主,需要熟悉⽣成式AI技术原理,了解如何去做⼤模型架构搭建、模型推理及训练,同时需要关注业务上下游环节,能够与团队⻬头并进。 复合能⼒:产品经理或跨领域⼈才02 n第⼆类紧缺⼈才为掌握基础技术且了解某个⾏业的复合型⼈才。需要知道⼤模型能够实现的需求和实现程度,既熟悉⽣成式AI基础原理,也了解某个⾏业某类业务的解决⽅案,知道AI在特定⾏业的应⽤。能够将⼤模型融⼊到企业的整个⽣产流程中,成为企业产品的⼀部分。技术能⼒结合⾏业能⼒帮助企业快速将产品AI化。 ⽣成式AI开发者⼯作特征 近6成⽣成式AI开发者研发⽅向超过2个,整体⼈才呈现短缺状态 n应⽤⼯具(如智能编码⼯具)、⼤语⾔模型、数据科学/数据挖掘/数据分析、语⾔/语义理解类应⽤(如对话机器⼈)和图像识别类应⽤(如拍照搜图)是最主要的五个⽣成式AI开发者研发⽅向; 近四成⽣成式AI开发者⼯作内容集中在特定⽅向,其中应⽤⼯具和语⾔/语义理解类应⽤是主要聚焦⽅向。 GPT、⽂⼼、通义⼤模型是⽣成式AI开发者使⽤率最⾼的⼤模型 n⽣成式AI开发者或企业对⼤模型的要求不仅是实现通⽤功能,还需要能够在特定领域、特定场景具备应⽤价值,真正解决业务痛点。因此,⽣成式AI开发者和企业逐渐产⽣更多⾃建模型的需求,或者通过使⽤多个⼤模型综合解决业务难点; n对⽐国内外⼤模型,在某些细分领域,国内⼤模型能够更好理解使⽤者指令,⽣成式AI开发者会⽐较输出结果选择与需求更契合的⼤模型。 代码⽣成⼯具和ChatBot使⽤率最⾼,智能化办公⼯具使⽤时间最⻓ InfoQ调研统计,202