您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东兴证券]:声网:成为OpenAI公司合作伙伴,为AI大模型语音交互提供低延迟能力 - 发现报告

声网:成为OpenAI公司合作伙伴,为AI大模型语音交互提供低延迟能力

2024-10-15石伟晶东兴证券单***
AI智能总结
查看更多
声网:成为OpenAI公司合作伙伴,为AI大模型语音交互提供低延迟能力

2024年10月15日 事件:美国OpenAI公司发布RealtimeAPI公开测试版。LiveKit、Agora、Twilio成为OpenAI公司合作伙伴,旗下产品可与实时API集成,为AI大模型语音交互提供低延迟能力。 公司简介: 2014年公司正式成立,致力于为企业开发者提供可调用的实时互动SDK,实现在应用内构建实时音视频互动场景。资料来源:公司公告 点评: 未来3-6个月重大事项提示: Realtime API赋予AI理解人类情感的能力。此前,开发者开发基于语音对话的AI应用,需要先通过speech-to-text(STT)模型将用户语音转写为文字,将文字输入大语言模型完成推理,再通过text-to-speech(TTS)模型转换为语音。这个过程中,用户语音中大量的情绪、语气和重音强调等信息会丢失,并且延时往往比较高。而Realtime API可以直接将语音作为输入与输出模态,给用户带来更自然的对话体验。该过程中,要让AI模拟人类的情感和对话流程,需要超低延迟的实时网络,从而保证自然良好的语音交互体验。 无 发债及交叉持股介绍: 无 Agora为开发者调用Realtime API提供低延时、高可用、高音质的传输服务。OpenAI于今年5月份推出全球首个端到端多模态大模型GPT-4o并表示此后将开放API接口,开发者可以将GPT-4o的基础能力应用在多个场景。10月1日,OpenAI正式发布GPT-4o的低延时多模态API接口,称为Realtime API。Agora作为OpenAI推荐的合作伙伴,在Conversational AI SDK中集成了OpenAI的Realtime API,为开发者调用Realtime API提供了低延时、高可用、高音质的传输服务,同时在设备端侧提供了回声消除、降噪等功能。开发者需要分别在OpenAI与Agora开通账号并获得API key,并基于用量分别向OpenAI与Agora付费。 Realtime API调用价格较高,应用场景使用量短期预计有限。OpenAI按照文字token数量与音频token数量收费,其中音频token价格为每100万个音频输入token为100美元,每100万个音频输出token为200美元。大致换算为分钟数,大约为每1000分钟音频输入收费60美元,每1000分钟音频输出收费240美元。Agora的收费方式为按照时长收费,每1000分钟0.99美元。Agora和OpenAI将各自向开发者客户发布账单,双方之间互相不做收入分成。我们认为,考虑到目前Realtime API相对较高的价格,短期内只会在少数高附加值场景如客服、教育、情感陪聊等有实际应用,其他场景的开发者可能初期只会进行集成测试,等待未来价格下降后再进行大规模推广应用。 资料来源:恒生聚源、东兴证券研究所 分析师:石伟晶021-25102907shi_wj@dxzq.net.cn执业证书编号:S1480518080001 与OpenAI合作体现Agora公司在海外具有较强的竞争力。人与AI语音交互同样面临网络时延与最后一公里网络质量不佳问题。LiveKit、Agora、Twilio成为OpenAI公司合作伙伴,为AI大模型语音交互提供低延迟能力,三家定位有所差异。Twilio的Voice API主要用于AI应用和电信网络之间的通讯;LiveKit和Agora的SDK主要用于基于互联网传输的实时音频通话场景,其中LiveKit的定位为开源方案提供商,需要开发者具备一定的二次开发能力。Agora公司是专业的第三方RTC服务商,凭借自身构建的软件定义实时网(SD-RTN),为企业开发者提 供可调用的实时互动SDK,实现在应用内构建实时音视频互动场景。根据Agora公司官方披露,公司SD-RTN具备低延时、高覆盖、高可用等特性,覆盖200+国家与地区/1000万并发能力/登录成功率>99%/可用性>99.99%/端到端时延76ms(中位数)。 盈利预测与评级:实时音视频场景持续扩大以及公司全球市场布局,公司发展潜力较强。我们预计2024-2026年公司营收分别为1.36亿美元(yoy-3.8%)、1.48亿美元(yoy+8.4%)、1.66亿美元(yoy+12.3%),归母净利润分别为-32.6百万美元、-19.6百万美元和-10.4百万美元,Non-GAAP归母净利润分别为-18.0百万美元、-5.8百万美元和4.0百万美元,维持“推荐”评级。 风险提示:国内RTC PaaS服务市场竞争加剧;新场景落地不及预期;公司技术优势缩小;公司管理效率下降。 分析师简介 石伟晶 首席分析师,覆盖传媒、互联网、云计算、通信等行业。上海交通大学工学硕士。8年证券从业经验,曾供职于华创证券、安信证券,2018年加入东兴证券研究所。 分析师承诺 负责本研究报告全部或部分内容的每一位证券分析师,在此申明,本报告的观点、逻辑和论据均为分析师本人研究成果,引用的相关信息和文字均已注明出处。本报告依据公开的信息来源,力求清晰、准确地反映分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。 风险提示 本证券研究报告所载的信息、观点、结论等内容仅供投资者决策参考。在任何情况下,本公司证券研究报告均不构成对任何机构和个人的投资建议,市场有风险,投资者在决定投资前,务必要审慎。投资者应自主作出投资决策,自行承担投资风险。 免责声明 本研究报告由东兴证券股份有限公司研究所撰写,东兴证券股份有限公司是具有合法证券投资咨询业务资格的机构。本研究报告中所引用信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。 我公司及报告作者在自身所知情的范围内,与本报告所评价或推荐的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,我公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。本报告版权仅为我公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为东兴证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。 本研究报告仅供东兴证券股份有限公司客户和经本公司授权刊载机构的客户使用,未经授权私自刊载研究报告的机构以及其阅读和使用者应慎重使用报告、防止被误导,本公司不承担由于非授权机构私自刊发和非授权客户使用该报告所产生的相关风险和责任。 行业评级体系 公司投资评级(A股市场基准为沪深300指数,香港市场基准为恒生指数,美国市场基准为标普500指数):以报告日后的6个月内,公司股价相对于同期市场基准指数的表现为标准定义: 强烈推荐:相对强于市场基准指数收益率15%以上;推荐:相对强于市场基准指数收益率5%~15%之间;中性:相对于市场基准指数收益率介于-5%~+5%之间;回避:相对弱于市场基准指数收益率5%以上。 行业投资评级(A股市场基准为沪深300指数,香港市场基准为恒生指数,美国市场基准为标普500指数):以报告日后的6个月内,行业指数相对于同期市场基准指数的表现为标准定义: 看好:相对强于市场基准指数收益率5%以上;中性:相对于市场基准指数收益率介于-5%~+5%之间;看淡:相对弱于市场基准指数收益率5%以上。 东兴证券研究所 深圳福田区益田路6009号新世界中心46F邮编:518038电话:0755-83239601传真:0755-23824526 上海虹口区杨树浦路248号瑞丰国际大厦23层邮编:200082电话:021-25102800传真:021-25102881 北京西城区金融大街5号新盛大厦B座16层邮编:100033电话:010-66554070传真:010-66554008