📊

advanced-evaluation

by muratcankoylan

🥉77

青铜

手动评估 LLM 输出速度慢且在不同评审者之间存在不一致。本技能提供生产级别的自动化评估技术，使用 LLM 作为评审员。包括直接评分规则、成对比较（带位置偏差缓解）以及置信度校准。

支持:

ClaudeCodexCode(CC)

安装到 Claude

1. 打开 Claude 聊天界面

2. 点击下方 "📋 复制" 按钮

3. 粘贴到 Claude 聊天框中并发送

4. 输入 "使用 advanced-evaluation 技能" 开始使用

=== advanced-evaluation 技能 ===
作者: muratcankoylan
描述: 手动评估 LLM 输出速度慢且在不同评审者之间存在不一致。本技能提供生产级别的自动化评估技术，使用 LLM 作为评审员。包括直接评分规则、成对比较（带位置偏差缓解）以及置信度校准。

使用方法:
1. 调用技能: "使用 advanced-evaluation 技能"
2. 提供相关信息: 根据技能要求提供必要参数
3. 查看结果: 技能会返回处理结果

示例:
"使用 advanced-evaluation 技能，帮我分析一下这段代码"

这种方法适用于所有 Claude 用户，不需要安装额外工具。

Risk Level

safe

Stats

View Count

Download Count

Favorite Count

Quality Score

Links

View on Github

advanced-evaluation

安装到 Claude

Category

Risk Level

Stats

Links