启动智能体
一句话启动 Agent,自动拆解任务并持续执行直至完成;支持自然语言交互与实时文件管理
指令下发与交互
点击主界面中央的绿色按钮后,您将进入智能体交互窗口。这是您向 Agent 下达指令、开启自动化任务的起点。

1. 快速开始与样例提示
- 样例提示:界面上方提供预设的提示词卡片(如“请告诉我也当前在哪个工作目录...”),初学者可点击直接体验。
- 快速唤醒:您可以直接点击这些样例,快速了解 Agent 的基本能力和当前环境状态。
2. 核心输入区域
- 智能输入框:支持自然语言描述复杂任务。
- 多行支持:输入框左下角标注“支持多行输入”。对于较长的需求,建议先写入文件,再通过
@文件路径的方式在框内引用。 - 字数统计:右下角实时显示当前输入的字符数,方便掌控指令长度。
3. 功能工具栏(底部)
- 技能/专业技能:点击可查看或手动指定本次任务需调用的原子化工具。
- 重新开始:点击循环图标可清空当前上下文,重新开始全新的对话任务。
- 语音输入:支持通过麦克风图标进行语音指令录入,解放双手。
- 发送按钮:点击右下角紫色图标(或使用
Enter)正式启动 Agent 任务。
运行监控与结果反馈
任务启动后,OmniAgent 会切换至执行监控视图,为您提供透明、实时的任务进度反馈。

界面由以下四个核心区域组成:
1. 顶部任务看板
任务运行期间与结束后,顶部会实时展示关键指标,帮助您评估任务效率与成本:
- 任务状态:左上角显示「Agent 任务」及当前状态标签(如:任务已完成)。
- 实时统计:
- 计时器:显示任务总耗时(如
00:00:46)。 - 费用统计:基于模型消耗实时计算的费用(如
¥ 0.7803)。 - Tokens:显示详细的输入与输出 Token 统计(如
117.8k / 1.8k)。 - 轮次:记录 Agent 与模型交互的对话轮数(如
1 轮)。
- 计时器:显示任务总耗时(如
- 面板控制:提供 「工作目录」(一键打开本地文件夹)与 「目录文件」(控制右侧文件树面板的显示或隐藏)快捷按钮。
2. 左侧执行日志
这里是 Agent 的“思考轨迹”,按时间线记录每一个动作,过程完全透明可追溯:
- AI 思考:标注为「AI 助手 - 思考」,展示 Agent 拆解任务的具体逻辑。
- 工具调用:标注为「执行命令 (Bash)」,显示 AI 自动生成的脚本内容及运行指令。
- 执行结果:反馈命令执行后的真实输出(如
ls结果、脚本运行日志等)。 - 阶段确认:Agent 在完成关键步骤后(如“脚本运行成功”)会主动向用户反馈。
3. 右侧文件浏览器
该面板实时同步当前工作目录的文件结构,反映 Agent 对文件系统的真实操作:
- 目录树视图:清晰展示 Agent 新建的文件夹(如
images_by_date)及按日期归档后的文件结构。 - 同步刷新:文件系统的任何变动都会即时映射在目录树中。
4. 中央预览与底部控制
- 文件预览:在右侧点击任何文件,中间区域将即时显示文件内容。未选中时提示「请点击要预览的文件」。
- 持续交互:任务完成后,您可以在底部输入框继续追加新指令,或点击红色的 「退出」 按钮安全返回主界面。
在任务执行过程中,您可以随时查看 Agent 生成的代码细节。若发现逻辑偏离预期,可直接下达修正指令或点击退出重新开始。