AI智能总结
01序言 0309071/ 全球重要 AI 应用示例2/ AI 应用的演进方向3/ AI 应用发展趋势 钉钉 AI 应用特点14 15181/ AI 应用的开发者画像2/ AI 应用的特点 从 1955 年起,“人工智能”(Artificial Intelligence) 被第一次提出, 如今AI 已不再是未来的科幻概念,正逐渐走进社会各行各业,成为推动社会变革的新引擎。随着互联网、大数据和算法等技术普及,AI 技术取得突破式发展。以 ChatGPT 为代表,2023 年全球顶尖科技公司纷纷推出 AI大模型,在图文、视频、代码等领域展现出强大能力。而 2024 年则是“AI应用元年”,在大模型基础上,大量 AI 应用不断涌现,快速渗透进生产制造、办公管理、科研教学、日常生活的方方面面。 在这场由 AI 技术引领的“第四次科技革命”中,各类 AI 应用的开发者既有专业 IT 人士,各行各业的企业和组织,也包括非 AI 专业的普通人,他们借助 AI 工具解决生产问题,提高工作效率和生活质量。仅在 GPTStore 上,就有超过 3 万个创作者发布了基于 GPT 技术的 AI 应用,涉及聊天机器人、搜索引擎、学术研究、绘画、厨艺等领域。 作为国内重要的 AI 应用厂商之一,钉钉在 2023 年 4 月宣布接入通义千问大模型,开启全面智能化。2024 年初,钉钉正式发布智能化产品——AI 助理,并于 4 月 18 日上线 AI 助理市场(AI Agent Store),首批将推出超过 200 个 AI 助理,进一步降低 AI 使用门槛,推动 AI 成为普惠性的生产力工具。目前超过 220 万家企业在钉钉上使用 AI。 想象力就是生产力。2024 年 3 月,钉钉在全国发起“AI 助理大赛”,面向科研机构、高等院校,创新企业及个人开发者开放报名,人人都可以借助钉钉 AI 能力,创造研发具备高度智能化、个性化特点的 AI 助理产品,为企业生产办公、日常学习生活等场景,打造更高效、更人性化的提升方案。 全球重要 AI 应用示例 2016 年 3 月,AlphaGo 第一次打败职业围棋世界冠军,让全世界意识到AI 强大的学习能力。此后,AI 技术及其实际应用不断取得突破性发展,频频引发社会关注,属于 AI 的时代已经到来。 Midjourney,Midjourney,2022 年 3 月 基于生成对抗网络 (GAN) 的图像生成工具,用户输入文字描述后,自动生成照片及逼真图像。Midjourney 汇聚了上百亿张高质量图片数据,核心优势是图像质量高,能够模仿各种艺术风格和已知艺术家的作品风格,生成具有类似特征的新图像。 ChatGPT,OpenAI,2022 年 11 月 基于 Transformer 网络模型的自然语言处理工具,AI 领域里程碑式的聊天机器人。ChatGPT 基于预训练阶段学习的大量语言模式和语法规则生成回答,根据聊天上下文进行互动,展现出强大的语言理解和生成能力。应用场景包括处理各种自然语言文本,完成撰写论文、邮件、脚本、文案、翻译、代码等任务,并应用于智能客服、智能家居、自然语言生成等领域,帮助企业和个人实现自动化服务和智能化控制。GPT-4 的发布,标志着OpenAI 向通用人工智能 (AGI) 迈进新篇章。 钉钉 AI 助理,钉钉,2023 年 4 月 融合了钉钉平台多项 AI 产品功能,辅助企业日常工作流程、沟通协调等众多应用场景的智能化产品,提供内容生成与摘要,知识库回答办公常见问题,长文本理解与生成等智能助手服务。自 2023 年 4 月 18 日宣布接入通义千问大模型,开启全面智能化战略一年后,钉钉 AI 助理、文档 AI、宜搭 AI、智能 OA 等产品正在深入千行百业。截至 2024 年 3 月底,钉钉 AI 已超过 220 万家企业使用,月活跃企业超过 170 万家。 Pi, Inflection AI,2023 年 5 月 由 Inflection LLM 驱动的聊天机器人,注重情感陪伴和自然流畅对话,提供情绪价值和全方位生活服务的个人 AI 伴侣,以友善、幽默和富有同情心等特质,与同类产品形成差异化,每日使用时长达到 33 分钟,超过Instagram。2023 年获得微软、英伟达等机构的 13 亿美元投资,估值超过 40 亿美元。 WarrenQ,恒生聚源,2023 年 6 月 包含两款 AI 工具产品——WarrenQ-Chat 和 ChatMiner。WarrenQ-Chat 是一款金融垂直领域的 Chat 产品,利用大模型叠加搜索和恒生聚源金融数据库,通过对话指令,获得金融行情、资讯和数据,可以生成金融专业报表,生成对话均支持原文溯源。ChatMiner 是基于大模型和向量数据库构建的金融文档挖掘器,可以根据用户对话指令对指定文档进行快速解读,提供精准检索与定位,提取关键信息,将信息进行整合归纳或拓展,处理海量文本数据。 豆包,字节跳动,2023 年 8 月 基于云雀模型开发的 AI 工具,具有语音识别和自然语言处理能力,支持多种交互方式,包括语音、触摸、手势等。豆包能够理解用户指令,进行对话并回答问题,帮助用户获取信息或完成特定任务。具备视觉识别和人脸识别技术,可以识别和跟踪人物、物体、场景以及用户面部特征。提供作业批改助手、全能写作助手、英语学习助手等实用工具。背靠抖音 C 端流量导入,豆包 2024 年 1 月的月活数达到 1757 万,位列中国 AIGC 应用月活跃用户数排行榜第一。 Voyager,英伟达,2023 年 9 月 将 GPT-4 模型与 Minecraft 游戏结合的游戏智能体,通过黑盒子查询与 GPT-4 进行交互,能够根据游戏反馈自主训练,自行编写代码推动游戏任务,在游戏中进行全场景终身学习。在游戏《我的世界》里,Voyager 获得独特物品、行进距离和解锁关键科技树里程碑的速度,比此前技术增加了多倍。Voyager 展示了 AI 与游戏产业的深度结合,引发人们对未来游戏的猜想,即大模型驱动提高 NPC 水平,打造更加精细、多样化的沉浸式游戏世界。 Kimi 智能助手,月之暗面,2023 年 10 月 中国首个支持输入 200 万汉字的智能助手产品,核心优势是对超长文本的无损处理和指令遵循能力,能够快速对大量文献和报告进行摘要和提炼,并支持多种文件格式,包括 PDF、Word 文档、PPT 幻灯片和 Excel 电子表格等,根据文件内容和类型进行自动分类。Kimi 智能助手还具备联网搜索功能以搜集用户所需信息,能够将复杂数据整理成表格并进行数据分析,辅助理解和编写代码,覆盖 Python、C++、Java 等多种编程语言。2024 年完成超 10 亿美元融资,目前估值 25 亿美元。 Sora,OpenAI,2024 年 2 月 基于 Transformer 架构的文本生成视频模型。用户输入简单文字描述,能够生成具有视觉质量和连贯性的视频,包含多个角色、动作等元素。Sora 的优势在于能够降低视觉数据的维度,生成不同分辨率的内容,使生成视频更加逼真和生动。在游戏开发领域可以生成角色动画、各类高度逼真的场景效果,提升游戏沉浸感和真实感。 AI 应用的演进方向 从产品形态上,业内普遍认为 AI 应用将沿着 AIGC( 内容生成 )、Copilot ( 智能助手 )、Insight( 知识洞察 )、Agent( 智能体 ) 四个重要的方向演进。(参考《QuestMobile 生成式 AI 及 AIGC 应用洞察》报告) AIGC 指利用生成式 AI 技术,根据用户的输入或要求,自动生成各种形式的内容,包括文字、图像、音频、视频、代码、3D 模型等。越来越多企业和机构已经开始尝试使用 AIGC,快速且低成本地生成大量内容。 AIGC/ 内容生成 / 目前,文本生成已广泛应用于媒体广告、教育和法律。例如 AIGC 可以根据给定的主题或关键词,自动生成新闻报道、文章摘要、广告文案等文本内容。图像、视频和 3D 模型生成,则在营销、影视创作和游戏等领域得到应用。只需要一张照片、一段语音或一个视频,生成式 AI 就能创造出一个能开口说话、做出表情的数字人。 通过大模型整合大量数据、信息和知识,从而为用户提供准确的研究分析和辅助决策,主要应用于制造、教育、金融、医疗和军事等领域。 Insight/ 知识洞察 / 在医疗领域,AI 技术可以协助医生分析大量的医疗数据,包括病历、影像资料等,从而快速识别出特定病灶或潜在的健康风险,有助于医生制定更精准的诊断方案和治疗计划,提高医疗质量和效率。在金融领域,证券 AI 智能投研可以生成研报、财务数据查询、盈利预测、投资组合建议;银行智能风控通过对客户的信用历史、行为特征等数据进行分析,挖掘风险因素,实现信贷风险、反欺诈、反洗钱等行为预警。 Copilot 指将生成式 AI 技术融入各种应用场景,根据用户给出的具体任务或问题,能够像助手一样理解需求和意图,并提供相应的解决方案,是最广泛的 AI 应用形态。Copilot 应用多落地于协同办公场景,例如微软推出的 AI助理 Copilot Pro,赋能 Office 套件,可以作为用户的智能办公助手,自动生成 Word 文档、Excel 图表、PPT 演示文稿,根据用户邮件内容自动提供回复建议或安排日程。 Copilot/ 智能助手 / Agent 则是融合感知、分析、决策和执行能力的智能体,具有自主决策和行动能力,可以理解并适应复杂环境,根据目标,自主思考、制定计划并执行相应任务。相较于 Copilot 的工具型辅助能力,Agent 更注重对环境的实时感知和判断,更像人类一样形成独立的决策和行动方案。 Agent/ 智能体 / IDC 调研显示,Agent 被普遍认为是 AI 应用发展的趋势性方向,50% 的企业已经在某项工作中进行了 AI Agent 的试点,另有 34% 的企业正在制定 AI Agent 的应用计划,主要应用于智能终端、智能座舱、汽车自动驾驶、工业机器人和人形机器人等领域。目前已发布的 AI Agent 以通用 AIAgent 居多,在使用成本、速度、技术成熟度上仍存在一定的局限,未来突破的关键在于计算机视觉等底层技术的突破。 AI 应用发展趋势 1/ 从赶时髦、谈概念,到真正实用 ChatGPT、Sora 等 AI 应用的出现,让一场生成式 AI 的狂欢接续而来。人们对 AI 的预期也不再满足于体验、接受 AIGC 带来的震撼,而是希望看到 AI 能力从大模型落地到应用场景。一个应用的核心目标,是好用、易用、实用。AI 不再停留在概念层面,而是转动行业齿轮的链条。 AI 能力具象为 AI 应用工具,提高个人和企业效率 正如行业所期待的,AI 不光能生成图文视频,也要能推理、能决策;不光要能艺术创作,也要能深入垂直行业,降本增效、带来实际价值。AIGC 面向 C 端普惠,个人率先将 AI 工具使用在工作和 B 端场景,也令 B 端企业认识到 AI 的实际效用,开始拥抱 AI。与此同时,抽象的大模型能力加速具象化,出现了一批需求、效果极其细分的 AI 应用。不仅掌握工具的员工效率更高,企业也开始重视接入 AI 应用工具降本增效。比如 AI 抠图、AI 一键修图能够有效节省设计师的重复劳动,提高图片设计产出速度和质量,为设计公司带来人效提升。 AI PaaS 能力内化,推动大模型进入垂直行业 AI 大模型强大的归纳、生成、推理能力令人印象深刻,但进入 B 端垂直行业应用场景,必须保证结果的严谨一致,以满足企业乃至行业对安全性和准确性的要求。IDC 调研表明,企业高层普遍担心 AIGC 带来的运营成本不可预测、隐私 / 合规风险以及客户预期管理等有关的不可控局面。使用 PaaS 手段接入大模型,同时通过 PaaS 层调用大模型接口,对大模型进行逻辑、结果管控,形成基于 A