by muratcankoylan
手动评估 LLM 输出速度慢且在不同评审者之间存在不一致。本技能提供生产级别的自动化评估技术,使用 LLM 作为评审员。包括直接评分规则、成对比较(带位置偏差缓解)以及置信度校准。
1. 打开 Claude 聊天界面
2. 点击下方 "📋 复制" 按钮
3. 粘贴到 Claude 聊天框中并发送
4. 输入 "使用 advanced-evaluation 技能" 开始使用
=== advanced-evaluation 技能 === 作者: muratcankoylan 描述: 手动评估 LLM 输出速度慢且在不同评审者之间存在不一致。本技能提供生产级别的自动化评估技术,使用 LLM 作为评审员。包括直接评分规则、成对比较(带位置偏差缓解)以及置信度校准。 使用方法: 1. 调用技能: "使用 advanced-evaluation 技能" 2. 提供相关信息: 根据技能要求提供必要参数 3. 查看结果: 技能会返回处理结果 示例: "使用 advanced-evaluation 技能,帮我分析一下这段代码"
这种方法适用于所有 Claude 用户,不需要安装额外工具。
data
safe
View Count
0
Download Count
0
Favorite Count
0
Quality Score
77