核心观点与关键数据
- 数字化数据的重要性:数字化数据对企业的重要性体现在自动化流程、提升质量、加速处理速度和缩短客户响应时间。智能技术通过识别流程瓶颈和改进领域,帮助企业提供端到端业务解决方案。然而,当前多数企业面临的最大挑战是将数据转化为结构化格式,因为大部分数据是非结构化的。
- 解决方案:自动化结合机器学习和认知解决方案是关键。认知机器阅读(CMR)和机器学习(ML)能够处理包括图像、手写、签名等非结构化数据,而传统的光学字符识别(OCR)仅限于结构化数据。CMR通过内容对象检索方法进行模式匹配,有效实现全格式数据数字化、提取和结构化,并支持快速下游处理。
- 企业转型与CMR应用:企业正从低成本劳动密集型转向高价值数字化工作,CMR成为实现端到端流程自动化和业务流程重塑的关键技术。CMR能够处理表格、复选框、手写、图像和签名等多种数据类型,实现不间断的端到端自动化。企业需发展数据分析和知识管理技能,并利用数字化和自动化提升客户体验和收入。
- 数据挑战与IA工具:非结构化数据是主要挑战,而嵌入智能自动化(IA)工具如过程发现、过程挖掘和数据发现也带来新问题。这些工具虽能促进自动化,但非结构化数据的分析仍因缺乏规则、自然语言、结构或元数据而困难。机器学习(ML)和CMR是解决方案,ML通过模式识别提升准确性,CMR则通过内容对象检索方法实现高精度数据提取。
- 案例研究:某美国金融机构在COVID-19期间利用XtractEdge平台处理17万份贷款申请,实现90%的准确率。平台通过爬取数据库、提取必要文档、处理多样化格式并自动完成贷款审批,显著加速流程并满足风险和审计要求。
- CMR与RPA/OCR对比:CMR通过数字化文档和验证数据,去除人工干预,而RPA和OCR仅是短期解决方案。RPA虽能集成应用与遗留系统,但无法处理非结构化数据。OCR依赖模板和区域定位,对非标准文档需人工处理且准确率仅50%。企业需整合认知技术如数据捕获、智能文档处理等,实现数据自由流动和算法驱动决策。
研究结论
- 数字化趋势:企业需从扫描文档转向正确数字化,即通过CMR实现数据在入口处的数字化和自动化决策执行。数据清洁和格式化是自动化和下游系统的基础,而“数据卫生”对组织至关重要。
- 未来方向:机器学习虽能克服规则限制,但需数据科学家和业务专家支持数据标注和模型训练。尽管多数企业认识到非结构化数据挑战,近半数仍未制定应对策略。未来需通过智能文档处理实现从入口到输出的全流程自动化,以预测需求、满足客户并加速增长。