您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[维深 Wellsenn XR]:AI智能眼镜白皮书 - 发现报告

AI智能眼镜白皮书

2024-08-31-维深 Wellsenn XR健***
AI智能总结
查看更多
AI智能眼镜白皮书

AI智能眼镜白皮书 维深信息技术有限公司 AlsmartglassesReport 全球领先的XR产业研究机构 MellsennXR 前言 编制单位:深圳市维深信息技术有限公司 人工智能是一类广泛的技术,自1956年发展至今,人工智能技术早已深入到各行各业,衍生出许多基于人工智能算法的应用。随若人工智能技术的发展,生成式人工智能则逐渐成为人工智能技术中的焦点。 编写成员单位:深圳市增强现实技术应用协会深圳市眼镜行业协会 生成式人工智能的部署,离不开相关硬件的支持,大型语言模型的竞争,推动若人工智能硬件载体的送代,各路商品不断推出,有从传统消费电子上发展生成的硬件载体,如AI手机、AI电脑等;有从传统消费品上发展生成的硬件载体,如AI智能镜子、AI智能枕头等;还有基于人工智能应用发展生成的专用硬件载体,如AI智能眼镜。 编写负责人:何万城钟建辉蔡斌 AI智能眼镜作为基于传统眼镜上发展的送代品,具有传统眼镜所具备的视力辅助效果,同时嵌入了耳机、摄像头、WiFi蓝牙模块等相关硬件,同时具备音频、拍摄、无线通讯等功能,再基于嵌入的生成式人工智能模型应用,依靠眼镜长时间侗戴的属性,能够极大地发挥生成式人工智能模型的优势。 编写小组成员:李浩斌王颖 AI智能眼镜融合了多种硬件的优点,作为传统眼镜上发展出的智能穿戴产品,具备信息获取和交互的便捷性,相比于手机、电脑等传统电子终端,AI智能眼镜能够解放用户双手,提供更具沉浸式的交互体验,是未来发展下A部署的最佳载体。 眼晴作为人类日常生活交互的主要感官之一,其衍生的眼镜是极具重要性的物品。无论是近视眼镜还是太阳镜,在全球的范围内都有成熟的产业链以及庞大的市场规模,根据维深信息调研数据显示,2023年全球传统眼镜销量超15亿。而作为在传统眼镜上发展而成的AI智能眼镜,同样具有庞大的市场规模。 目录 三、AI智能眼镜趋势与展望 一、AI奇点临近 (一)AI推动人类进入第四次工业革命01(二)从简单工作到深度学习,AI能力越来越强021、人工智能发展历程022、从判别式人工智能到生成式人工智能0 33、大模型帽起,从单一模态到多模态(三)AI产业快速发展041、ChatGPT发展开启大模型竞争开端042、海外大模型引领AI产业进化053、中国大模型快速跟上054.大模型竞争意演愈烈065、大模型竞争带来价格竞争,促进商业化落地07(四)从简单工作到深度学习,AI能力越来越强071、AI赋能一切072、A函需寻找硬件载体落地60(1)AI赋能传统消费电子09(2)A赋能新型消费电子103、AI智能眼镜,AI最好的载体11(1)与眼晴视觉结合11(2)与耳朵听觉结合12(3)与嘴巴语言结合12(4)赋能视觉、听觉、语言、大脑13 (一)传统智能眼镜行业基数庞大、市场广阔251、全球人口及视力受损人群规模庞大252、全球近视眼镜销量及规模263、全球太阳眼镜销量及规模264、全球眼镜市场销量及规模275、中国人口及近视人群规模286、中国近视眼镜销量及规模297、中国太阳眼镜销量及规模298、全球传统眼镜规模庞大,为AI智能眼镜提供了广阔的土壤309、传统眼镜产业链结构成熟完善3110、AI智能眼镜产业链结构成热完善32(二)AI眼镜发展趋势321、在基础眼镜上做加法32(1)基础眼镜(2)音频·34(3)图像34(4)交互35(5)传感器36(6)显示362、AR+AI眼镜是下一代通用计算终端373、AI+AR智能眼镜场景落地展望384、AI智能眼镜的销量规模和预测39 二、AI智能眼镜未来已来 图支1:A推动人类进入第四次工业平命图表2:人工智能发展历程国表3:从判到元人工智丽利生就式人工智国表4:从羊一模态大模型到多模态大模型团表5:ChatGPI发展开启大核型竞争开部国表6:海外大模型引领AI产业进化国安了:中国大模重快速跟!国表B:大快军意学息演您烈图表11:AI赋能传统清费电子图表10:AI赋能一切图表13:AI最好的款体AI智能眼镜图表15:AI智眼镜与耳朵听觉结合用表14二A|智能明镜与股视觉结合智能眼镜联能视觉、听觉、大陷图表17:AI智带眼镜关键技术特征国表18:AI智谐限交互方式图表19:AI智选限镜构江超频智能体国表20:AI邮署端云协同图表22:AI智盗限顿功能时比国23:MCU统别S0C图表25:带摄像头智能取德方案图表24:系统级别50C因表26:系统级50C方案图表27:MCU级SOC方案 图表29:AI智能眼镜方系能力对比图表28:SOC+MCU方案国表30:带摄仪头智能限镜基本功能和构造国表31:全球人口及视力受指人群规模围表32:全球近视限领销量及规模图表33:全球太阳限镜销量及规模膜区表34:全球限段市场销量及规积图表35:中国人口及近视人群规!医表38:全球近视眼德+太阳德销鱼图表39:全球近视眼德+太阳德销量西表40:传超取键产业销图表41:A智能眼镜产业链图表44:音频功能发展方向还础眼镜发展方向国表45:图保功能发展方向区表47:代传器发展方店国表49:AR智能限镜集成多种更件属性压表48:显示功蓬发展方息国表50:AI+AR智请限领销量规和预测图表51:传统限镜销量与智能限镜钥量 (一)AI智能眼镜的关键技术特征131、基础服务132、独立生态143.融合感知144.多模态交互145、超级智能体156、端云协同167、隐私安全17(二)AI智能眼镜发展进度与分类171、AI智能眼镜发展分类17182、AI智能眼镜功能对比(三)带摄像头AI智能眼镜方案191、MCU级别SOC192、系统级别SOC203、带摄像头智能眼镜方案2121(1)系统级SOC方案(2)MCU级SOC方案+ISP22(3)SOC+MCU方案224、AI智能眼镜方案能力对比23(四)带摄像头AI智能眼镜基本功能和结构24 MellsennXR (二)从简单工作到深度学习,AI能力越来越强1、人工智能发展历程 、AI奇点临近 (一)AI推动人类进入第四次工业革命 人工智能发展经历了多个阶段,有浪潮,有低谷,人工智能发展至今,用于构建实现的硬件、用于应对任务的能力都发生了翻天覆地的变化,较成熟的商业模式也已经推动落地。 第一次工业革命机械化,机器替代人力,机器生产方式代替手工生产方式,生产力大幅度提升,劳动方式以体力劳动为主,机器是主要生产力。 第二次工业革命电气化,电力成为主要能源,生产力远超蒸汽时代,工业更心由轻工业转为重工业,电力大幅度提升生产效率,同时促进新的信息传输方式出现,如电报、无线电通讯等,信息传输效率显著提高。 1956-1980年,受限于理论基础以及硬件基础的发展,人工智能应用只能处理简单的应用,如对军队地图上的符号进行分类,识别Fortran编码表上的手写字符,基于预设的回复或其他用户的输入实现的语音聊天等。这阶段的人工智能由人主导,机器只是执行指令完成任务。 第三次工业革命信息化,原子能,电子计算机、微电子技术、航天技术、分子生物学和遗产工程等科技发展,信息传输效率大幅度提高,信息成为重要资源,以信息技术为主导的工业体系出现。劳动生产率进一步提高,社会生产力进一步发展,大量脑力劳动出现。社会结构和生活方式也发生极大改变。 1980-1993年,得益于计算机技术的发展,理论基础的推成出新,处理相对复杂任务所需的算力、存储、方法都得到了保障,人工智能应用可处理特定的任务。用知识库中得出的逻辑规则来回答问题或解决有关特定知识领域的问题,如通过光谱仪读数识别化合物,诊断传染性血液疾病等。这阶段的人工智能由人主导,机器辅助完成住务。 第四次工业革命智能化,信息化的发展促进数据成为重要资源,以数据展开的机器人学、人工智能、量子电脑、生物科技、(工业)物联网、分散式共识、5G、全自动驾驶汽车和虚拟技术等新兴科技的突破成为工业转变的下一步方向。 1993-2010年,基于互联网技术的发展,互联网终端的送代升级,算力、存储等硬件基础发展,人工智能应用可处理复杂的任务。利用数据库训练得出决策依据,以此实现分类、识别、预测等能力,如图像识别、语音识别、人脸识别等。这阶段人工智能应用由人辅助,机器主导完成任务。 以数据为中心,各学科交叉融合,脑力需求大幅度提高,提供大量脑力成为迫切需要,解放替代人类体力和脑力的智能化技术成为主导因素,现阶段,人工智能技术是智能化的主要体现,也是第四次工业革命的主要中心点。 2010年后,人工智能技术高速发展,人工智能应用可处理复杂的任务并生成新的数据利用数据库训练得出决策依据和生成模型,实现创造性的生成能力,如文字编写、图像创作、视频生成等。这阶段的人工智能由人监督,机器可自主完成任务。 MellsennXR 2、从判别式人工智能到生成式人工智能 生成式模型是大语言模型建立的基石,通过生成式模型,大语言模型可生成并输出文本、图像、视频或其他类型的数据。 人工智能的发展主要有三个阶段:规则型人工智能阶段、判别式人工智能阶段以及生成式人工智能阶段。 基于生成式模型的人工智能应用为生成式人工智能。生成式人工智能可以是单模态的,只接受一种类型的输入,如大语言模型GPT-3等,也可以是多模态的,可接收多种类型的输入,如GPT-4等。 早期大模型崛起时,是单模态的大模型,且几乎都是文本类型,通过自然语言处理,基于生成式模型输出特定的文本数据。随若技术的发展,单模态的大模型不足以满足用户的需求,则出现了多模态的大模型。多模态大模型可同时处理用户输入的文本和图像信息或其他信息,并具备跨模态识别和理解能力,生成用户需要的数据。 第一阶段人工智能主流为规则型人工智能,基于定义好的规则,通过逐步推理的匹配机制解决问题,代表应用如专家系统。缺点是缺乏通用性和灵活性,且有很大的局限性,规则的定义需要人工干预,难解性和组合炸的问题难以解决,复杂的问题也无法应对。 第二阶段人工智能主流为判别式人工智能。1990年后,基于硬件和理论基础的发展,依靠机器学习方法,规则型人工智能转变为判别式人工智能。判别式人工智能可从输入数据和输入标签中学习模式和规律,根据其映射关系构建对应特征,基于特征库实现分类、识别和预测等任务,具有快速收敛和解释性强的特性,且模型简单。代表应用如图像识别、语音识别、自然语言处理等。缺点是对于非线性可分或复杂模型的场景效果不好,不能反映训练数据本身的特性,且不能生成新的数据。 第三阶段人工智能主流为生成式人工智能。2014年后,变分自动编码器和生成对抗网络等技术催生的生成模型深度神经网络薪露头角,该深度生成模型不仅输出图像的类别标签,还输出了整幅图像。随后生成式模型不断改进,由生成式模型发展出生成式人工智能。 生成式人工智能盲在从输入数据中学习理解并模拟数据的生成过程,从而生成与训练数据相似的输出,包括个性化内容和创造性内容。生成式模型可用于数据不完整的情况,通过增强学习强化模型,且生成式模型根据贝叶斯公式可以得到判别式模型。代表应用如文案生成,图片生成,音频,视频生成,3D生成等。 2018年,基于生成式模型和Transformer框架,OpenAl发布了第一个大型语言模型GPT1,该模型参数量1.17亿,预训练数据量4.5GB。经过不断的送代改进,到2024年5月份,GPT1经过GPT2、GPT3、GPT3.5、GPT4四个版本,发展到了GPT4o:参数量也由最初的亿量级发展到万亿量级。 ChatGPT是OpenAI开发的人工智能聊天机器人,于2022年11月30日发布,基于当时的GPT3.5大型语言模型,利用监督学习和基于人类的强化学习微调得出。该应用一经发布,迅速促成了大量A1领域的关注和投资,到2023年1月就拥有了超过1亿用户,截至2023年12月,ChatGPT已拥有1.8亿用户,平均每月产生17亿次网站浏览量(数据来源于AIPRM网站统计) ChatGPT的发布预示着大模型竞争的开端。在ChatGPT的刺激下,大量竞品相应发布,包括Gemi