OmniAgent 文档

启动智能体

一句话启动 Agent,自动拆解任务并持续执行直至完成;支持自然语言交互与实时文件管理

指令下发与交互

点击主界面中央的绿色按钮后,您将进入智能体交互窗口。这是您向 Agent 下达指令、开启自动化任务的起点。

智能体输入界面

1. 快速开始与样例提示

  • 样例提示:界面上方提供预设的提示词卡片(如“请告诉我也当前在哪个工作目录...”),初学者可点击直接体验。
  • 快速唤醒:您可以直接点击这些样例,快速了解 Agent 的基本能力和当前环境状态。

2. 核心输入区域

  • 智能输入框:支持自然语言描述复杂任务。
  • 多行支持:输入框左下角标注“支持多行输入”。对于较长的需求,建议先写入文件,再通过 @文件路径 的方式在框内引用。
  • 字数统计:右下角实时显示当前输入的字符数,方便掌控指令长度。

3. 功能工具栏(底部)

  • 技能/专业技能:点击可查看或手动指定本次任务需调用的原子化工具。
  • 重新开始:点击循环图标可清空当前上下文,重新开始全新的对话任务。
  • 语音输入:支持通过麦克风图标进行语音指令录入,解放双手。
  • 发送按钮:点击右下角紫色图标(或使用 Enter)正式启动 Agent 任务。

运行监控与结果反馈

任务启动后,OmniAgent 会切换至执行监控视图,为您提供透明、实时的任务进度反馈。

Agent 执行过程与结果展示

界面由以下四个核心区域组成:

1. 顶部任务看板

任务运行期间与结束后,顶部会实时展示关键指标,帮助您评估任务效率与成本:

  • 任务状态:左上角显示「Agent 任务」及当前状态标签(如:任务已完成)。
  • 实时统计
    • 计时器:显示任务总耗时(如 00:00:46)。
    • 费用统计:基于模型消耗实时计算的费用(如 ¥ 0.7803)。
    • Tokens:显示详细的输入与输出 Token 统计(如 117.8k / 1.8k)。
    • 轮次:记录 Agent 与模型交互的对话轮数(如 1 轮)。
  • 面板控制:提供 「工作目录」(一键打开本地文件夹)与 「目录文件」(控制右侧文件树面板的显示或隐藏)快捷按钮。

2. 左侧执行日志

这里是 Agent 的“思考轨迹”,按时间线记录每一个动作,过程完全透明可追溯:

  • AI 思考:标注为「AI 助手 - 思考」,展示 Agent 拆解任务的具体逻辑。
  • 工具调用:标注为「执行命令 (Bash)」,显示 AI 自动生成的脚本内容及运行指令。
  • 执行结果:反馈命令执行后的真实输出(如 ls 结果、脚本运行日志等)。
  • 阶段确认:Agent 在完成关键步骤后(如“脚本运行成功”)会主动向用户反馈。

3. 右侧文件浏览器

该面板实时同步当前工作目录的文件结构,反映 Agent 对文件系统的真实操作:

  • 目录树视图:清晰展示 Agent 新建的文件夹(如 images_by_date)及按日期归档后的文件结构。
  • 同步刷新:文件系统的任何变动都会即时映射在目录树中。

4. 中央预览与底部控制

  • 文件预览:在右侧点击任何文件,中间区域将即时显示文件内容。未选中时提示「请点击要预览的文件」。
  • 持续交互:任务完成后,您可以在底部输入框继续追加新指令,或点击红色的 「退出」 按钮安全返回主界面。

在任务执行过程中,您可以随时查看 Agent 生成的代码细节。若发现逻辑偏离预期,可直接下达修正指令或点击退出重新开始。

On this page