您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国软件行业协会]:2024人工智能大模型的技术岗位与能力培养研究报告 - 发现报告
当前位置:首页/行业研究/报告详情/

2024人工智能大模型的技术岗位与能力培养研究报告

2024人工智能大模型的技术岗位与能力培养研究报告

1 人工智能大模型的技术岗位与能力培养研究报告 2 前言 随着人工智能技术的迅速发展和应用,大模型作为其中的重要组成部分,正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力,广泛应用于自然语言处理、计算机视觉、智能推荐等领域,为各行各业带来了革命性的改变和机遇。 根据中国软件行业协会教育与培训分会(简称教培分会)的信息搜集、数据分析与走访调研,本研究报告旨在深入探讨人工智能大模型技术岗位以及相关的能力培养问题,帮助企业和机构了解当前大模型行业的现状与未来发展趋势,为人才的培养和发展提供参考和指导。 在本报告中,我们将首先对人工智能大模型的概念和特点进行阐述,并介绍国内大模型发展的情况,同时对大模型面临的挑战与趋势进行探讨。 接着,本报告将重点关注人工智能大模型涉及的关键技术、关键技术岗位图谱。我们将对这些技术岗位的具体要求和职责进行详细解析。 除了技术岗位分析,本报告还将探讨人工智能大模型的能力培养问题。随着大模型的不断演进和应用拓展,如何培养具备相关技能的人才成为关键。我们将结合当前人工智能人才供需的现状,国家人才政策与部署、企业人才需求与培养模式,探讨如何结合现状与挑战,提高人才的应用能力和创新能力。 在报告编写过程中,教培分会通过对行业、企业、院校与劳动者的调研与访谈结果进行多维度分析,研究当前人工智能大模型发展趋势,企业人才供需、人才培养模式与产教融合现阶段的情况,并对不同群体的需求归纳与总结,提出了对AI大模型技术人才培养与服务模式的分析、意见与建议,供大家参考,并希望给予指正。 3 目录 一、 人工智能大模型行业展现状 ................................... 4 1. 大模型的概念与发展过程 ....................................... 4 2. 国内大模型的发展现状 ......................................... 6 3. 大模型面临的挑战与发展趋势 .................................. 10 二、 大模型相关的技术岗位图谱与知识技能 ........................ 13 1. 大模型相关的关键技术 ........................................ 14 2. 大模型相关的技术岗位图谱 .................................... 15 3. 大模型相关的技术岗位知识与技能 .............................. 15 三、 大模式技术人才供需与培养模式思考 .......................... 33 1. 国家层面的人工智能人才培养工作 .............................. 33 2. 人工智能人才供需与培养现状分析 .............................. 35 3. 大模型技术人才培养模式思考 .................................. 38 参考资料 ........................................................ 43 4 一、 人工智能大模型行业展现状 1. 大模型的概念与发展过程 ChatGPT(全名:Chat Generative Pre-trained Transformer),是美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布 。发布后迅速引起了社会、产业与技术界对于大模型与人工智能的发展与应用的新热潮。作为世界上首款正式开发的大数据模型,ChatGPT给大家带来了前所未有的冲击和影响。 首先我们看看ChatGPT如何描述自己 针对大模型ChatGPT也给出了它的理解, 5 参考IDC发布的《2022中国大模型发展白皮书》中对于大模型的定义,以及针对大模型相关的研究与概念界定,教培分会对大模型得出以下理解,AI大模型是一种基于海量多源数据打造的预训练模型,通过对原有算法模型的技术升级和产品迭代,用户可以通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,从而实现更优的识别、理解、决策和生成效果,同时也降低了开发部署的成本。 大模型的核心作用在于突破数据标注的困境。通过学习海量无标注的数据进行预训练,大模型拓展了整体模型前期学习的广度和深度,从而提升了大模型的知识水平。这种方式使得大模型能够在后续下游任务中以低成本且高适应性的方式发挥应用价值。 在实践中,大模型首先通过基于海量数据的自监督学习阶段完成了“通识”教育。接着,通过“预训练+精调”等模式,在共享参数的情况下,根据具体应用场景的特性,用少量数据进行相应微调。这种方式使得大模型可以高水平地完成任务,为各种领域带来了更准确、高效的解决方案。 6 图1:训练大模型“预训练+精调”模式 2. 国内大模型的发展现状 根据中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超 80%,美国在大模型数量方面居全球之首。有专家披露,据不完全统计,目前中国10亿参数规模以上的大模型已发布79个。 《报告》显示,我国14个省市和地区在开展大模型研发,第一梯队是北京、广东、浙江、上海;其中北京已发布38个大模型。在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。 《报告》认为,国内通用类大模型正在持续拓展应用领域,包括文心一言、通义千问、星火认知等一批通用大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等行业加速渗透。同时,垂直领域专业类大模型也在不断深化落地,一批针对生物制药、遥感、气象等垂直领域的大模型,发挥其领域纵深优势,提供针对特定业务场景的高质量专业化解决方案。 (1)百度——“文心一言”大模型 2023年3月16日,百度正式发布了面向中文用户的大语言模型和生成式AI 7 产品——"文心一言"。仅发布首日,就吸引了超过60万人申请测试。短短两天内,已有12家企业完成首批签约合作,同时有近9万家企业申请百度智能云文心一言API调用服务测试。 "文心一言"是一款高度本土化的AI模型,更加符合中文环境的使用习惯。作为百度主打的搜索业务,它不仅能够提供丰富的基础数据,还在中文搜索领域具有显著优势。近期在AGIEval、C-Eval等中英文权威测试集以及MMLU英文权威测试集中,"文心一言"以超过ChatGPT和LLaMa、ChatGLM等其他大模型的分数表现,中文评测中更是超越了GPT-4。这些优势使得"文心一言"在中文用户中备受欢迎,尤其是在古汉语的应用方面,显示出了独特的优势,被视为真正属于国人的AI工具。考虑到中文是全球使用人数最多的语言,未来必定会带来更大的商机。 百度智能云将通过提供服务来支持"文心一言"的应用,助力企业构建自己的模型和应用,涵盖农业、工业、金融、教育、医疗、交通、能源等重要领域。在百度庞大的移动生态系统的支持下,"文心一言"已经积累了庞大的用户基础。目前,已有超过650家企业宣布接入"文心一言"生态,百度大语言模型"文心一言"的App也已经上架苹果App Store,百度的AICG(人工智能、云计算、大数据、区块链)生态圈正逐渐形成。作为国内AICG领域的先驱者,百度已经在国内同类企业中取得了相当的先发优势。 (2)阿里——“通义千问”大模型 2023年4月7日,阿里云推出了名为"通义千问"的大语言模型,并开始邀请测试。仅仅四天后,在阿里云峰会上,他们正式宣布推出"通义千问",并表示将对阿里巴巴旗下的所有产品进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。据数据显示,已经有超过20万家企业申请接入"通义千问"进行测试。 作为一款大语言模型,"通义千问"与ChatGPT类似,支持多轮交互及复杂指令理解、多模态融合以及外部增强API,能够实现多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。阿里云智能集团CTO周靖人介绍说,"通义千问"作为通用大模型,并不会根据某个具体业务问题进行优化或定制。这一开放的能力意味着企业无需从头开始训练大模型,而是能够在 8 "通义千问"的基础之上,结合企业自己的应用场景、知识体系、行业特殊需求等,打造出适用于自身企业的大模型。比如,每个企业都可以开发自己的智能客服、智能导购、智能语音助手、自动驾驶模型等。 "通义千问"的推出将为企业提供更加便捷高效的大模型应用方案,促进了人工智能技术在企业和产品中的广泛应用。阿里云的举措在大模型技术领域展现了强大的实力和引领力,为中国企业在人工智能领域的发展带来了新的机遇。随着"通义千问"的广泛应用,将不断推动产业创新和智能化升级,为用户带来更便捷智能的体验 (3)腾讯——“混元助手”大模型 腾讯的混元大模型是一项集成计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的重要技术。这些技术已广泛应用于腾讯旗下微信搜索、腾讯广告等业务场景,为用户提供更智能化和个性化的体验。混元大模型是建立在腾讯自有的强大底层算力和低成本高速网络基础设施之上。它得益于腾讯自研的太极机器学习平台的支持和承载。在混元大模型中,包含了NLP大模型、CV大模型、多模态大模型、文生图大模型等多个子领域的模型,这些模型相互协作,构成了一个完整的智能系统。 其中,值得一提的是HunYuan-NLP 1T,这是国内首个低成本且可直接应用的NLP万亿大模型。在自然语言理解任务榜单CLUE中,它荣登榜首,表现非常出色。这个成就标志着腾讯在大模型领域取得了重要的突破,对于推动自然语言处理的发展具有重要意义。它的运用不仅提升了腾讯的产品和服务,还为用户提供了更加智能、高效的信息处理和交互体验。 (4)华为——“盘古”大模型 盘古大模型是一款汇聚深度学习技术的大规模AI模型,其独特之处在于采用了三层体系结构,包括L0基础大模型、L1行业大模型和L2场景模型。其设计目标是推动AI工业化进程,为各行业提供强大的技术支撑。 盘古大模型3.0是面向行业的大模型系列,采用了“5+N+X”的三层架构。为了更好地适配不同行业的多变需求,盘古大模型采用了完全的分层解耦设计。客户可以根据自身需求,灵活地对大模型进行升级和定制。他们既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,甚至单 9 独升级特定能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件。借助这个套件,客户可以对自有数据进行二次训练,从而获得专属于自己行业的大模型。这种定制化的方案能够更好地满足客户的特殊需求和业务场景。 盘古大模型还着重考虑了客户数据安全与合规诉求,为此提供了多样化的部署形态。客户可以根据自身情况选择公用云、大模型云专区或混合云等部署方式,从而确保数据的安全性和合规性。 盘古大模型的灵活性、可定制性以及对行业的深度适配使其在不同领域具备广泛的应用潜力。作为华为云强大的AI技术支持,盘古大模型将继续推动AI技术的产业化和工业化进程,为各行业提供先进的智能解决方案,促进数字化转型和创新的蓬勃发展。 (5)科大讯飞——“讯飞星火”大模型 科大讯飞的星火认知大模型采用了创新的“1+N”架构,其中“1”代表通用认知智能大模型算法研发及高效训练底座平台,“N”则代表专用大模型版本,适用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域。2023年4月24日,科大讯飞星火认知大模型官网正式上线,并开始开放需求调研。 讯飞星火认知大模型聚焦于实用场景,包括知识问答、代码编程、数理推算、创意联想、语言翻译等。通过海量文本、代码和