Monkeys 使用 MCP 产品介绍开发文档

产品介绍

为什么选择 Monkeys?产品开发哲学 Monkeys 核心概念关键技术概念产品数据装配手册 Monkeys 架构模块架构

工具声明式语法工具列表预置工具（大语言模型）预置工具（多模态模型）预置工具（数据处理）预置工具（私有数据搜索）预置工具（文件处理）预置工具（自动化）预置工具（模型训练）预置工具（模型测评）使用自定义工具开发自定义工具

开发文档

工具

预置工具（模型测评）

模型和工作流评测能力

模型测评

评测能力用于比较模型或工作流行为。当前生态中，评测界面位于 Studio，相关 API 位于 monkeys-server。

典型用途

比较 prompt、模型或工作流版本。
检查生成输出和执行日志。
在发布工作流变更前跟踪质量。
支持已启用的领域评测页面。

评测数据应作为应用生命周期的一部分，而不是部署后的补充步骤。

预置工具（模型训练）

模型训练服务和后台执行

使用自定义工具

将已有 API 导入为 Monkeys 工具

本页目录

模型测评典型用途