搜索文档

输入关键词,回车打开结果

OmniAgent 文档

启动智能体

一句话下达目标,Agent 自主规划、拆解、执行并交付——全程思维链可视,每一步都在你的掌控之中。

你说目标,它交结果

这不是一个等你逐步追问的聊天框。你只需要用自然语言描述最终目标——Agent 会自主规划执行路径、拆解子任务、调用技能与工具、操作文件和系统,直到把成果交到你手上。整个过程的思维链、执行日志、文件变更全部实时可视,随时可以介入修正或终止。

一、下达任务

在 OmniAgent 的中央指令区,像跟同事交代工作一样输入你的目标。写得越具体,Agent 执行得越精准。

任务输入界面

核心操作

  • 选择上下文:输入框上方的下拉菜单指定 Agent 的工作目录——这决定了它能"看到"哪些文件。
  • 任务描述:在中央编辑框内下达指令,支持最高 2000 字。建议写清文件路径、操作目标和期望产出。
  • 快捷引用
    • 输入 /:调出技能选择面板,让 Agent 使用特定技能执行(如 Excel 处理、VL 识别)。
    • 输入 @:引用当前工作目录内的具体文件,精确定位操作对象。
  • 发送启动:点击绿色箭头(或按 Enter)正式启动。Agent 将立即开始规划并执行。

好的指令长什么样?

不要写"帮我处理一下报表",而是写"读取 D:\财务\202503\ 下所有 Excel,按客户汇总应收金额,生成一张汇总表保存到同目录"。路径、范围、产出三要素越清晰,Agent 越不需要反复确认。


二、执行监控——全程透明的思维链

任务启动后,界面自动进入执行监控模式。与黑箱不同,OmniAgent 将 Agent 的每一步思考与动作全部可视化呈现。

运行监控界面

1. 任务拆解看板(悬浮面板)

Agent 会将你的目标自动拆解为多个子任务(如:扫描文件结构 → 识别单据类型 → 生成汇总台账 → 校验勾稽关系),每一项都实时显示进度。

  • 实时状态:清晰标识当前正在执行哪一步,以及该步的完成百分比。
  • 动态调整:随着任务深入,Agent 会根据实际发现(如遇到异常文件、识别出新的子类型)动态增补或调整后续步骤——这正是 Agent 与脚本的本质区别。

2. 多轮思维链(Thought Chain)

中央区域按「轮次」展示 Agent 的完整推理过程:

  • 思考阶段:展示 Agent 在该轮的逻辑分析——它在判断什么、为什么选择这个策略、发现了哪些异常。让你了解"它为什么要这么做",而非只看到结果。
  • 执行阶段:实时滚动展示调用的命令、脚本输出、系统反馈、文件读写操作。每一行都有时间戳,可回溯复盘。

3. 运行指标与控制

  • 顶部看板:累计耗时、预估费用、Token 消耗一目了然。
  • 运行控制
    • 中断(黄色):暂停执行,你可以观察当前状态、审查已产出的文件,决定是否继续。
    • 结束(红色):强制终止所有活动,Agent 已完成的部分文件会保留在工作目录中。

随时介入,不必等到最后

执行过程中你可以随时查看 Agent 生成的代码和文件变更。发现方向偏离?直接在对话框输入修正指令,Agent 会即时调整策略继续执行——不需要终止重来。

文件实时预览

任务执行过程中产生的任何文件变更(新建、修改、生成报表等),都可以点击工作区中的文件即时预览,无需等待整个任务结束。


建议您下一步

  • 查看 任务历史 找回并重演之前已完成的高价值任务。
  • 了解 定时任务 让 Agent 按周期自动执行,实现无人值守。

On this page