OmniAgent · 不止于回答,而是执行
读取你的文件 · 接管你的浏览器 · 操作你的软件 —— 从指令到交付,全程自主完成
不止于对话
打开你的共享盘、遍历本地目录、批量处理文件 —— 不是"帮你想",是直接上手替你做

不止于文本
VL 视觉理解扫描件、拍照件、合同与发票 —— 看懂版面结构、印章位置、手写批注,不只是逐行读字

不止于建议
接管浏览器登录企业系统、RPA 操作财务软件、自动填报表单 —— 直接输出可交付的成果文件

Omni|核心能力架构

部署在你的设备上,而非云端对话框。
拥有与你相同的系统操作权限——
读取文件 · 操控软件 · 登录系统 · 填写表单。
你描述目标,Agent 完成交付。
任务驱动执行引擎
CORE描述目标,Agent 自动规划路径、拆解步骤、逐一执行并验证结果——你收到的不是建议清单,而是已完成的交付物。
多模态视觉理解
HOT不依赖固定模板 OCR,VL 模型直接「看懂」扫描件与复杂表单——版面层级、印章位置、手写批注一并语义理解。
无接口跨系统操控
HOT目标系统没有开放 API?Agent 像人一样操作浏览器、登录企业软件、填写表单——全程无需二次开发与系统对接。
多 Agent 协同调度
超大任务自动拆分为并行子流程,由专长各异的 Agent 协同推进——审计 Agent 整理底稿的同时,核对 Agent 已在比对流水。
持续记忆与上下文
跨任务记住你的科目体系、文件命名规则与操作习惯——第二次执行同类任务时自动复用经验,而非每次从零开始。
行业场景深度适配
PRO内置审计、财务、法律、申报等行业专属工作流与合规规则——不是通用模型套壳,是真正理解你行业逻辑的专属 Agent。
真实场景与效果
用户指令
含共享目录、系统地址、账号与浏览器/客户端接管(示意),非纯网页对话
刚接到的这个年审项目有点头疼——客户把一年的东西一股脑全丢过来了,300 多个文件、1200 多页,银行对账单、回单、增值税发票、合同、出入库单、固定资产卡片、费用报销单、关联方清单……总共 17 种单据全混在一起,有的是 PDF 有的是扫描图片还有几份是拍照的。全堆在项目 NAS `\\审计NAS\2024年审\A科技\01-原始资料\`,客户后来又补了一批放在百度企业网盘 `https://pan.example.com/s/xxxx`(示意),说让我们自己下载。项目经理让我明天出底稿初稿,根本来不及一张一张看。你先把网盘那批下载到 `02-补资料\`,然后把 300 多个文件全过一遍,按类型和期间分拣清楚,该识别的识别、该汇总的汇总,最后建出凭证级到科目级的多层台账,跟账面数对一下看差多少。拿不准的你标出来我复核就行。
Agent 执行步骤
- 1**环境准备与补充资料拉取**:确认 NAS 路径可访问(312 个文件 · 1,236 页),同时用浏览器下载客户补充资料 ZIP(38 个文件 · 142 页)解压至 `02-补资料\`,合并得到 **350 个文件 · 1,378 页**待处理
- 2**大规模 VL 分类引擎**:对全部 1,378 页启动 VL 语义理解(非逐字 OCR)——先按首页版式做粗分类(银行回单 vs 发票 vs 合同 vs 费用单据),再按内页特征细分为 17 类;处理过程中修正 48 处旋转 / 倾斜 / 骑缝章遮挡问题,23 处手写批注做联合推理识别
- 3**结构化字段批量抽取**:每类单据执行专属抽取模板——发票抽取票号/税率/金额/购销方、银行回单抽取流水号/收付方/金额/日期、合同抽取编号/甲乙方/标的/履约节点……共产出 **5,200+ 条结构化记录**,19 处低置信度条目进入复核队列
- 4**多层台账构建**:① 原始凭证与影像索引台账(文件→页→字段三维索引)→ ② 明细分类台账(按客户/供应商/项目/期间切面)→ ③ 科目余额衔接表(12 个审计科目)→ ④ 试算平衡与交叉勾稽层
- 5**科目级汇总与勾稽比对**:将台账第③层与客户提供的总账 / 明细账做多轮比对——货币资金核银行流水、应收核发票与合同与对账函、存货核出入库与成本结转、固定资产核卡片与折旧测算;输出 6 大科目的差异明细
- 6**异常标记与复核清单**:汇总 3 类典型异常(应付差异 ¥12,300 / 发票时点异常 2 笔 / 大额无凭证流出 ¥380,000),生成带穿透链接的复核清单供项目经理签字确认
示例输出清单
版式与字段为示意;附件名、页数与指标为演示数据。
📊 审计底稿自动整理报告(演示)
说明: 以下为演示数据,用于展示 Agent 对海量混合单据的 VL 分类、结构化抽取与多层台账自动构建能力;正式审计底稿以注册会计师复核签署为准。
被审计单位: A 科技有限公司 · 审计期间: 2024-01 ~ 2024-12 资料体量: 350 个文件 · 1,378 页 · 17 类单据 处理方式: 多模态 VL 批量语义理解(非传统 OCR)
一、资料识别与分类总览
| 文档类型 | 文件数 | 页数 | VL 准确率 | 提取记录数 | 典型字段 |
|---|---|---|---|---|---|
| 银行对账单 / 回单 | 68 | 302 | 99.5% | 4,860 条流水 | 流水号/收付方/金额/日期/摘要 |
| 增值税发票(专票+普票) | 92 | 438 | 99.1% | 412 张 | 票号/税率/金额/购销方/货物名 |
| 合同 / 订单 | 45 | 210 | 98.8% | 62 份 | 编号/甲乙方/标的/履约节点/付款条件 |
| 费用报销单 | 38 | 76 | 98.2% | 38 笔 | 报销人/日期/金额/审批人/附件数 |
| 出入库单 | 32 | 96 | 97.9% | 128 条 | 物料/数量/单价/出入方向/仓库 |
| 固定资产卡片 | 18 | 54 | 98.5% | 18 项 | 资产名/编号/原值/折旧方法/残值率 |
| 关联方清单及其他 | 57 | 202 | 97.3% | 若干 | 关联方名称/关系/交易内容/金额 |
| 合计 | 350 | 1,378 | 平均 98.8% | 5,200+ 条 | — |
Agent 在 VL 过程中自动修正了 48 处版式问题(旋转/倾斜/骑缝章遮挡),23 处手写批注通过 VL 联合推理识别为审批意见或金额修正;19 处低置信度条目已标注进入复核队列。
二、多层台账结构
台账采用 4 层递进架构,每层可穿透至下层原始影像坐标:
| 层级 | 名称 | 记录量 | 说明 |
|---|---|---|---|
| L1 | 原始凭证与影像索引 | 5,200+ 行 | 文件→页→字段三维索引,支持点击跳转至扫描件坐标 |
| L2 | 明细分类台账 | 约 2,800 行 | 按客户/供应商/项目/期间多维切面汇总 |
| L3 | 科目余额衔接表 | 12 科目 × 14 期间 | 借/贷发生额、期初/期末余额、与总账轧差 |
| L4 | 试算平衡与交叉勾稽 | 6 组对照 | 收入↔应收↔税金、采购↔应付↔存货等交叉校验 |
三、科目级汇总与比对
| 审计科目 | 底稿编号 | 台账汇总金额 | 账面金额 | 差异 | 状态 |
|---|---|---|---|---|---|
| 货币资金 | A1-1 | ¥18,456,230.00 | ¥18,456,230.00 | — | ✅ 核对一致 |
| 应收账款 | A2-1 | ¥5,832,100.00 | ¥5,832,100.00 | — | ✅ 核对一致 |
| 存货 | A3-1 | ¥3,215,680.00 | ¥3,215,680.00 | — | ✅ 核对一致 |
| 固定资产 | A4-1 | ¥2,180,000.00 | ¥2,180,000.00 | — | ✅ 核对一致 |
| 应付账款 | B1-1 | ¥4,139,800.00 | ¥4,127,500.00 | ¥12,300 | ⚠️ 需穿透 |
| 营业收入 | C1-1 | ¥24,680,000.00 | ¥24,680,000.00 | — | ✅ 核对一致 |
四、异常发现
⚠️ 在多层级汇总与交叉核对中发现 3 类典型异常:
| 异常类型 | 具体描述 | 涉及金额 | 穿透路径 | 建议处理 |
|---|---|---|---|---|
| 应付差异 | 台账与账面差 ¥12,300 | ¥12,300 | L3 → L2 → L1 定位至 12 月暂估入库凭证 | 追查暂估冲回分录 |
| 发票时点异常 | 2 张进项票开票日早于合同签署日 | ¥86,500 | L1 发票影像 ↔ 合同影像对比 | 触发穿行测试 |
| 大额无凭证流出 | 银行流出 ¥380,000 未找到匹配凭证 | ¥380,000 | L1 银行回单 → L3 科目台账无对应 | 向客户函证确认 |
五、成果小结
以上为演示数据 · 不替代注册会计师的专业审计意见
演示数据页面中的数值、图表与附件名为效果示意;关键节点支持人工复核与覆盖。不替代注册会计师、律师等专业人士的签字与法定意见。
产品矩阵|文档理解与系统操控
免费或付费,按需选择
社区版
个人首选 · 永久免费
适合初尝试 Agent 自动化的用户,用自然语言描述任务即可体验。
¥0/永久
- 一键启动 AI Agent(开箱即用)无需复杂配置,安装即可使用,3分钟上手你的第一个 Agent
- 内置基础 Skills 与插件开箱即用常用能力,覆盖日常办公与简单自动化需求
- 支持接入主流模型(可扩展)可自由配置 API Key,按需使用不同模型能力
- 完全免费使用(无时间限制)无试用期、无功能锁定,长期免费使用核心能力

专业版
专业版订阅 · 支持多档选择
适合已经决定长期使用 Agent 的专业用户,可根据单台设备的预计用量选择合适的订阅档位。
¥500起
- 高阶 Skills 能力体系覆盖文档生成、数据处理、批量任务、自动整理等真实业务场景
- 长任务持续运行(自动产出结果)支持长时间任务执行,无需人工干预,适合复杂业务流程
- 高额度 Tokens 与稳定算力满足高频使用与复杂任务需求,无需频繁充值或中断
- 一对一技术支持(直连工程师)针对实际问题提供解决方案,而非标准化客服回复
- 企业级合规支持(发票与采购)支持正规发票与企业采购流程,适配公司报销与合规要求
企业版
大中型企业 · 深度落地
覆盖从业务流程到落地支持的全栈能力。
联系我们/单独报价
- 私有化部署 & 数据主权支持本地/专有云部署,数据、模型、流程全链路可控
- 深度系统集成能力(ERP / CRM / 行业系统)打通企业核心系统,实现AI“可执行”,而非仅对话
- 行业能力定制(MCP / Skill Graph)基于行业图谱构建专属能力,而非单点工具
- AI落地咨询 + 流程重构从业务流程出发,设计可持续的AI应用体系


