在日常审计工作中,审计底稿的整理与校验是一项耗时极长、重复性极高的任务。审计人员往往需要从成百上千个扫描件、发票、合同和询证函中提取关键数据,然后再逐一录入到审计系统或 Excel 汇总表中。
传统的方法不仅效率低下,而且容易出错。而使用传统的 RPA(机器人流程自动化)工具,又会面临“系统无 API 接口”、“扫描件识别率低”以及“流程规则一旦发生微调就需要重新编写代码”的痛点。
针对这些痛点,三函代码(上海)科技有限公司推出的 OmniAgent 本地 AI 智能体提供了一种全新的解决方案。作为一款全能智能体,它不仅能理解你的自然语言指令,更能够直接在你的电脑上执行任务。
一、 为什么选择本地 AI 智能体(OmniAgent)?
在审计行业,数据安全与隐私保护是红线。使用在线的 AI 助手(如 ChatGPT 或其他云端大模型)处理含有客户机密信息的审计底稿,存在极大的合规风险。
OmniAgent 核心优势:
- 数据不出本地:OmniAgent 采用本地私有化部署模式。所有的文档处理、视觉识别(VL)以及步骤规划均在本地运行,零数据外流。
- 多模态视觉理解(VL):无需复杂的 OCR 规则配置。OmniAgent 可以像人类一样直观地“看懂”扫描件、手写发票、合同文本及复杂的表格。
- 任务驱动执行引擎:无需编写代码或画流程图。你只需要告诉它:“请帮我把这个文件夹里的所有发票金额提取出来,并填入 Excel 的对应列中”,智能体就会自动进行任务拆解与执行。
二、 审计底稿整理实操步骤
下面我们以“跨系统发票真伪核验与底稿自动生成”为例,演示如何使用 OmniAgent 自动化完成这一过程。
准备工作
- 安装并启动 OmniAgent 客户端。
- 在配置中心中,接入你偏好的本地大模型或符合合规要求的企业大模型 API(如 Claude、GLM 等)。
步骤 1:下达自然语言指令
在 OmniAgent 的任务对话框中输入你的目标:
“读取
D:\2026审计资料\发票扫描件文件夹下的所有发票图片。使用浏览器打开国家税务总局发票查询系统,依次输入发票代码和号码进行查验。将查验结果截图保存,并将发票金额与查验状态汇总到D:\2026审计资料\审计底稿汇总.xlsx表格中。”
步骤 2:智能体自动规划与拆解
OmniAgent 接收到指令后,会自动规划出如下执行路径,并在交互界面中直观展示:
- 文件读取:扫描指定文件夹,获取图片列表。
- 视觉识别:调用本地多模态模型,提取每张发票的“发票代码”、“发票号码”、“开票日期”和“金额”。
- 浏览器接管:自动打开 Chrome 浏览器,导航至发票查询系统。
- 无接口填报:通过模拟键盘鼠标操作,自动定位输入框并填写发票信息,完成验证码人工辅助录入(或自动识别)。
- 截图与导出:自动截取查验成功的网页页面,保存到指定目录。
- 数据回写:打开本地 Excel,在末尾追加写入识别数据和查验状态。
步骤 3:查看可交付成果
在整个执行过程中,你可以通过 OmniAgent 的可视化面板实时看到浏览器被操控的画面。任务执行完毕后,智能体将输出:
- 一份填写完整的
审计底稿汇总.xlsx - 一个存放了所有查验截图的文件夹
三、 从“回答”到“执行”:全能智能体带来的效率革命
很多用户问,OmniAgent 与市面上常见的 AI Chat 聊天工具有什么区别?
- Chat 工具:你输入发票信息,它只能告诉你“这是一张发票,金额是XXX”,接下来你依然需要手动复制粘贴。
- OmniAgent 全能智能体:它不止于回答,而是执行。它拥有独立的浏览器操控器、文件读写器和系统交互器,能够替你完成“读文件 -> 填表 -> 点击 -> 截图 -> 汇总”的完整闭环工作。
四、 总结与展望
通过引入三函代码的 OmniAgent 本地 AI 智能体,审计团队可以将繁琐的底稿录入时间缩短 80% 以上,让审计师能够将宝贵的时间投入到风险判断和增值咨询中。
如果你也希望体验本地 AI 智能体为办公自动化带来的改变,欢迎访问 三函代码官网 (sanhan.cc) 下载 OmniAgent 社区版,个人用户永久免费使用。