行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯云TI-OCR训练平台产品介绍

2024-01-10 腾讯喵小鱼

传统OCR深度学习模型与OCR大模型进行对比，OCR大模型展现出更广泛的应用场景和更强的性能。OCR大模型的特点包括适用场景多样，涵盖票据识别、表格识别、文档识别和自然场景识别。腾讯云OCR大模型家族主要包括DocLM、DocQA和MLLM三个模型。

DocLM是端到端文档图像理解模型，具有图像到文字直接生成、单模型支持多任务、效果更优和场景泛化能力等特点，且数据与推理成本低。DocLM核心技术包括结构化理解、内容感知和多任务融合。DocLM模型效果在结构化指标、自然场景支持和任务泛化方面表现优异。

DocQA是阅读理解问答模型，同步提升结构化和阅读理解任务能力，并支持基于检索的知识库问答。DocQA核心技术包括知识检索和阅读理解融合。DocQA模型效果在封闭式问答和文本摘要能力上表现突出。

MLLM是多模态大模型，从支持自然场景扩展至文档场景，并在结构化任务上表现优异。MLLM核心技术包括多模态融合和外部知识生成。MLLM模型效果在归纳、理解和基于外部知识生成能力上表现优异。

TI-OCR支持OCR大模型精调，提供精调所需资源。典型案例展示了OCR大模型在实际应用中的效果。

传统OCR深度学习模型 ➢ ➢ OCR大模型 OCR大模型的特点 ➢ OCR大模型适用场景--票据识别 ➢➢➢ OCR大模型适用场景-表格识别 OCR大模型适用场景-文档识别 OCR大模型适用场景--自然场景识别腾讯云OCR大模型家族 DocLM--端到端文档图像理解 ⚫图像到文字直接生成，内容感知和具体任务解耦⚫单模型&多任务：单模型支持多种类型任务，任务间能力互补⚫效果更好&场景泛化：结构化指标更优，支持自然场景⚫数据&推理成本低：与多阶段结构化方案持平 DocLM核心技术 DocLM模型效果 ➢➢➢➢ DocQA--阅读理解问答 ⚫阅读理解任务能力同步提升：结构化&阅读理解⚫基于检索的知识库问答 DocQA核心技术 DocQA模型效果封闭式问答能力文本摘要能力 MLLM--多模态大模型 ⚫从支持自然场景扩展至文档场景 ⚫Few-Shot Learning（ICL）在结构化等任务上表现优异 MLLM核心技术 MLLM模型效果归纳&理解能力基于外部知识生成能力 TI-OCR支持OCR大模型精调 TI-OCR支持OCR大模型精调 OCR大模型精调所需资源典型案例典型案例典型案例

点击免费查看完整报告

腾讯云TI-OCR训练平台产品介绍

你可能感兴趣

腾讯云大模型知识引擎产品介绍及客户案例

腾讯云实时音视频产品介绍

腾讯云数据库AI服务产品介绍

腾讯云ClawPro产品介绍（OpenClaw企业版）

腾讯云智能体开发平台产品手册

【财联社早知道】重磅!谷歌正在开发安卓原生的卫星通信功能，这家公司已形成“芯片模块终端平台系统解决方案”的全产业链;这家GPU龙头面向Al训练、AI推理等领域的高性能智算模块及整机产品研发成功-20240313

【风口研报·公司】基于英伟达DGX打造自动驾驶工具平台，这家公司提供“数据采集+数据处理+模型训练”以支持自动驾驶系统产品开发，前瞻布局车联网打开第二增长曲线

腾讯云峰会发布人工智能云产品，以腾讯云为平台输出人工智能技术能力

签约鸿蒙生态公司、绑定开源鸿蒙引领成长，这家公司OpenHarmony产品已在诸多场景商业化落地，还推出算力平台以满足深度学习、AR VR、AI训练推算需求

金蝶AI苍穹新一代企业级AI平台产品介绍册