构建中国最好大模型底座,帮助大众轻松普惠的获取世界知识和经验 @北京百川智能科技有限公司 01产业趋势企业底蕴商业速度百川的发展 02百川的零售实践 应用场景赋能实效 百川智能-构建中国最好大模型底座,帮助大众轻松普惠的获取世界知识和经验 王小川创始人、CEO •搜狗创始人兼CEO•国际信息学奥赛金牌•清华大学天工智能计算研究院联席院长•清华大学计算机系博士 公司使命:帮助大众轻松、普惠的获取世界知识和经验 -公司致力于通过语言AI的突破,构建中国最好的大模型底座 -以实现AGI为最终理想,持续提供用户价值,打造体验标杆 专家智囊团 联创团队 王小川具有丰富的创业经验,是一位优秀的企业家。新创建的百川公司的团队很强,我相信能够完成这个使命。在未来的发展中有什么需要的话,我将给予全力支持。“” 茹立云联合创始人运营负责人 洪涛联合创始人商业负责人 •中国科学院院士、俄罗斯自然科学院外籍院士•清华大学人工智能研究院院长,德国汉堡大学自然科学名誉博士•吴文俊人工智能最高成就奖•CCF终身成就奖获得者,国家科技进步奖•智能技术与系统国家重点实验室主任 张钹院士AI算法顶级专家 •原搜狗公司COO•北京市科学技术奖一等奖•CCF杰出工程师奖•清华大学计算机博士•长江商学院EMBA•浙江省高考状元•清华大学天工智能研究院副院长 •原搜狗科技CMO•腾讯PCG商业化GM•搜狗商业化体系10亿+缔造者•上亿互联网C端流量操盘经验•清华大学电子工程系本科•长江商学院EMBA 我相信,王小川新成立的公司一定能够做出更适合中国特色的产品,高性能所一定会全力配合支持王小川。“” 3•中国工程院院士、清华大学高性能所所长•享受国务院政府特殊津贴,曾任中国计算机学会理事长•获国家科技进步一等奖1项、二等奖2项、国家技术发明二等奖1项,何梁何利科技进步奖、ACM戈登·贝尔奖 郑纬民院士Infra顶级专家 伙伴 工具 陪伴·知识·经验·服务 连接·信息 百川商业速度-源自全栈五维的技术底蕴积累 •海量优质数据源判断和储备•万亿级页面及千万亿级Token语料抽取、结构化、质量评估全流程经验•千亿级多粒度的大规模聚类系统 •千亿参数大语言模型的训练与调优经验•千亿参数模型下高效并行训练的SFT和RL算法的经验 •1.2万张GPU算力高效调度和推理优化经验 •千亿级索引、秒级实时更新、亿级并发、毫秒级响应•对话交互产品百亿级会话管理、意图识别、回应生成•十亿级医疗问答与百亿级医疗搜索构建医疗知识体系 •20年的信息内容服务安全运营经验•具备全套安全管理、审核、监测预警、应急处置和技术保障能力 Baichuan4-文科能力全球第一,理科能力国内第一 •在SuperCLUE综合基准上的评测中,Baichuan4以总得分80.64分刷新了国内记录。 •在文科任务中,Baichuan 4取得了83.13高分,文科能力全球第一,比GPT-4-Turbo-0125高出5.33分;在理科能力方面,Baichuan 4得分76.90分,国内模型中排名第一,略高于SenseChatV5,较GPT-4-Turbo-0125低4.23分。 •Baichuan 4多模态能力的一大亮点为支持任意分辨率的图像输入,无须引入任何参数就能高效地将图像token压缩至传统方法的20%,而不损失任何信息,从而实现了跨模态的无缝协同与知识整合。 百小应-懂搜索、会提问的AI伙伴 多轮搜索:针对市场调研、产业分析等复杂场景,可以更有效地获取更专业、更有深度的信息。 定向搜索:准定位问题领域,直接访问权威站点,保证搜索及回复的精确性。 会提问:引导用户进行更准确的表达,帮助用户寻找到自己想要的信息。 文档速读:支持上传PDF/Word/URL/PPT/Excel/TXT等文档格式,适合阅读长篇幅文献/报告及解析复杂数据表格的金融数据等。 基于Baichuan4开发的百小应,多模态能力仅次于GPT-4V 百川大模型ToB商业化 百川提供全方位、端到端的模型定制化训练服务 基座模型 可提供2B-177B多尺寸模型,覆盖端侧到千亿模型全范围。 API平台 用户可以直接通过API调用基础大模型,Agent,知识库等 通用数据 提供通用数据,混合客户行业数据进行模型训练。 MAAS和APE平台 L2模型训练 L1模型训练 工具链&工具箱 MAAS(模型即服务)和APE(自动提示词工程)平台,提供从数据、模型到应用服务的全周期管理和工具。 提供全流程工具链与工具箱,快速开发模型及应用。 算法咨询和培训 Agent平台 百川可派出顶级专家为客户提供专业培训。 用户可高效地执行和处理复杂的工作任务。 备案服务 科研课题共建 可为客户提供备案咨询服务,加速客户通过备案流程。 为客户内部项目提供支持,与客户共研科研课题。 算力 百川及合作伙伴可为客户提供算力,采购及租赁等形式。 百川提出“搜索增强”的技术路线,为行业大模型打造提供新思路 长上下文窗口(内存) 检索增强 (硬盘) 百川安全-具备完整的价值观对齐与安全增强能力 完整覆盖大模型预训练、精调、推理全周期的安全增强,包括数据训练阶段违规数据清洗、微调模型后的合规检测、安全强化学习、推理服务输入输出过滤服务等,可以提供给客户/合作伙伴安全保护。 全训练周期优化,系统性价值观对齐[预训练正能量数据加入、微调特别增强、安全强化学习] 多类型价值观设计,大量红蓝攻防数据训练[6种攻击方式, 100+细粒度类型, 200k训练数据] 有用性无害性平衡,多阶段多目标强化学习[融合helpfu和harmless目标;多阶段多算法(DPO PPO)安全强化] 01百川的发展 产业趋势企业底蕴商业速度 零售电商营销服务难点解析 客服侧:效率低 消费者侧:体验差 管理侧:运营难 •客服渠道分散:咨询渠道众多,缺乏统一的客服平台,客服人员需要频繁切换后台系统,导致工作效率低下。 •咨询响应速度慢:在活动期间,咨询排队等待时间过长,导致客服响应不及时,影响用户体验和满意度。 •缺乏实时监管:无法实时监控客服情况,导致问题无法在第一时间得到有效处理,影响客户体验并可能造成负面影响。 •促销期间客服负荷过重:促销活动期间,消费者咨询量激增,人工客服难以应对,服务质量难以保证。 •客服服务时间有限:人工客服的工作时间固定,导致在非工作时间内消费者的咨询无法得到及时处理。 •依赖传统人工质检:传统的人工质检方式容易出现疏漏,服务质量难以保证和提升。 •客服人员流动性高:客服工作性质特殊,人员流动大,招聘难度高,反复培训增加了企业成本。 •重复问题耗时:客服每天需要花费大量时间处理重复性问题,消耗大量时间和精力。 •缺乏快捷导航:用户在咨询时无法快速找到所需信息,操作体验不够便捷。 •服务情况不透明:无法及时获取客服人员的工作状态、工作效率以及客户满意度等关键信息,影响管理决策。 •咨询流程繁琐:商品相关问题的咨询流程复杂,需要多次发送商品链接和订单确认信息,用户体验不理想。 •夜间无法及时响应:夜间无人值守,消费者的问题无法得到及时处理,影响用户体验。 •商品信息繁多:商品亮点多且复杂,客服人员记忆和掌握难度大,增加了工作负担。 •多渠道系统独立:传统多渠道客服系统相互独立,消费者信息分散且孤立,难以进行全面统计分析和发现潜在问题。 •无法快速识别紧急问题:系统难以识别消费者的紧急问题,不能及时转接到人工客服进行处理。 百川零售行业解决方案-商品描述生成 •商品描述是电商平台中吸引用户的重要元素。传统的商品描述通常需要人工编写,耗时且成本高,而且质量参差不齐。百川大模型通过分析商品属性和用户评价,能够自动生成生动、吸引人的商品描述,极大地提升了电商平台的运营效率和用户体验。 •应用场景:电商平台可以引入百川大模型,当供应商上传商品图片和基本信息后,系统会自动对这些数据进行深入分析,包括商品的外观、功能、使用场景等多个维度。同时,系统还会结合用户的评价和反馈,提炼出商品的特点、优势和用户利益点。基于这些分析,百川大模型能够生成富有吸引力和说服力的商品描述文本,帮助用户更全面地了解商品。 利用大模型技术,分析商品属性和用户评价。 根据分析结果,AI生成具有吸引力的商品描述。 生成的内容经过人工审核,确保准确性和合规性。 收集商品的基本信息,如名称、规格、品牌等。 百川零售行业解决方案-商品分类与标签生成 •在现代电商平台中,商品分类和标签系统对于帮助用户快速找到所需商品至关重要。百川大模型能够根据商品特征自动进行精准的分类和标签生成,从而大幅提升用户搜索和浏览的效率。 •应用场景:对于拥有数以万计商品的电商平台来说,手动管理商品分类和标签不仅费时费力,还容易出现错误和不一致。百川大模型能够自动识别新上架商品的特征,准确判断其所属类别,并生成相关的标签。例如,当新商品上架时,系统能够迅速分析商品描述、图片等信息,自动为其分配到合适的类别,如“家居用品”、“电子产品”等,并生成具体的标签如“智能家电”、“节能环保”等。 提取商品的关键特征,如颜色、款式、材质等。 大模型通过图像理解技术,分析商品图片。 根据特征,AI将商品归入相应的分类。 自动生成描述商品特征的标签。 百川零售行业解决方案-商品推荐系统 •商品推荐系统是提升用户购物体验和增加销售额的重要工具。百川大模型能够根据用户的行为和偏好,生成高度个性化的商品推荐,为每个用户提供量身定制的购物建议。 •应用场景:当用户在浏览电商平台时,百川大模型会实时分析用户的浏览历史、购买记录、搜索习惯等多种数据。通过对这些数据的深度学习和模式识别,大模型能够准确预测用户的兴趣和需求,进而推荐用户可能感兴趣的商品。例如,如果用户经常浏览和购买健身器材,系统会优先推荐新的健身设备、运动服饰和相关配件。此外,如果用户搜索某款智能家电,系统会推荐与之功能相似或相关的其他智能家电产品。 收集和分析用户的浏览、搜索和购买行为。 构建用户偏好模型,识别用户的兴趣点。 根据用户偏好,匹配合适的商品。 生成个性化的商品推荐列表。 百川零售行业解决方案-用户评价分析与生成 •用户评价是影响其他用户购买决策的重要因素。百川大模型能够分析大量的用户评价,提取关键信息,并生成简洁明了的摘要或新的推荐,帮助用户快速了解商品的优缺点。 •应用场景:电商平台可以利用百川大模型来自动分析用户评价。每当有新评价上传时,系统会立即对评价内容进行深入分析,识别出其中的关键信息,如商品的优点、缺点、使用体验等。通过对这些信息的整合和处理,系统能够生成清晰的评价摘要,帮助其他用户在短时间内获取有价值的信息,从而做出明智的购买决策。 运用大模型技术,分析评价的情感倾向。 生成简洁的评价摘要,展示商品的主要特点和用户反馈。 收集用户对商品的评价和反馈。 提取评价中的关键信息和常见问题。 百川零售行业解决方案-AI零售教练,提高员工专业能力,提升业绩 n模拟实训:人机对练,要点提示,打造解锁制练习模式 学员训练详情分析 逐级解锁,清晰化任务清单 数据报告 章节解锁 开关设置,关闭后通关练习 答题分析 除了标准八大维度展示外,提供阶段解锁模式下的业务维度分值,便于直观展示分析结果 AI形象 客户形象与场景模拟:根据不同商品,生成逼真的客户形象和声音,提供更真实的训练场景。 答题回顾 展示所有题目得分,便捷化了解待提升内容 音频回听 训练考核 展示问题及语音转译结果及本题得分 训练模式:模拟问答,答题后给与AI解析结果、得分和要点提示,便于初步学习考核模式:关闭要点提示,检验学习结果题目过关:自定义过关分值,便于加深学习记忆机器人接入:根据学员要求,自定义学习清单 关键词 展示关键词及命中结果 话术剖析 从八个维度