启动智能体
一句话下达目标,Agent 自主规划、拆解、执行并交付——全程思维链可视,每一步都在你的掌控之中。
你说目标,它交结果
这不是一个等你逐步追问的聊天框。你只需要用自然语言描述最终目标——Agent 会自主规划执行路径、拆解子任务、调用技能与工具、操作文件和系统,直到把成果交到你手上。整个过程的思维链、执行日志、文件变更全部实时可视,随时可以介入修正或终止。
一、下达任务
在 OmniAgent 的中央指令区,像跟同事交代工作一样输入你的目标。写得越具体,Agent 执行得越精准。

核心操作
- 选择上下文:输入框上方的下拉菜单指定 Agent 的工作目录——这决定了它能"看到"哪些文件。
- 任务描述:在中央编辑框内下达指令,支持最高 2000 字。建议写清文件路径、操作目标和期望产出。
- 快捷引用:
- 输入
/:调出技能选择面板,让 Agent 使用特定技能执行(如 Excel 处理、VL 识别)。 - 输入
@:引用当前工作目录内的具体文件,精确定位操作对象。
- 输入
- 发送启动:点击绿色箭头(或按
Enter)正式启动。Agent 将立即开始规划并执行。
好的指令长什么样?
不要写"帮我处理一下报表",而是写"读取 D:\财务\202503\ 下所有 Excel,按客户汇总应收金额,生成一张汇总表保存到同目录"。路径、范围、产出三要素越清晰,Agent 越不需要反复确认。
二、执行监控——全程透明的思维链
任务启动后,界面自动进入执行监控模式。与黑箱不同,OmniAgent 将 Agent 的每一步思考与动作全部可视化呈现。

1. 任务拆解看板(悬浮面板)
Agent 会将你的目标自动拆解为多个子任务(如:扫描文件结构 → 识别单据类型 → 生成汇总台账 → 校验勾稽关系),每一项都实时显示进度。
- 实时状态:清晰标识当前正在执行哪一步,以及该步的完成百分比。
- 动态调整:随着任务深入,Agent 会根据实际发现(如遇到异常文件、识别出新的子类型)动态增补或调整后续步骤——这正是 Agent 与脚本的本质区别。
2. 多轮思维链(Thought Chain)
中央区域按「轮次」展示 Agent 的完整推理过程:
- 思考阶段:展示 Agent 在该轮的逻辑分析——它在判断什么、为什么选择这个策略、发现了哪些异常。让你了解"它为什么要这么做",而非只看到结果。
- 执行阶段:实时滚动展示调用的命令、脚本输出、系统反馈、文件读写操作。每一行都有时间戳,可回溯复盘。
3. 运行指标与控制
- 顶部看板:累计耗时、预估费用、Token 消耗一目了然。
- 运行控制:
- 中断(黄色):暂停执行,你可以观察当前状态、审查已产出的文件,决定是否继续。
- 结束(红色):强制终止所有活动,Agent 已完成的部分文件会保留在工作目录中。
随时介入,不必等到最后
执行过程中你可以随时查看 Agent 生成的代码和文件变更。发现方向偏离?直接在对话框输入修正指令,Agent 会即时调整策略继续执行——不需要终止重来。
文件实时预览
任务执行过程中产生的任何文件变更(新建、修改、生成报表等),都可以点击工作区中的文件即时预览,无需等待整个任务结束。