📊

advanced-evaluation

by ChakshuGautam

🥉77

青铜

由于系统性偏差，构建可靠的LLM评估系统具有挑战性。本技能提供可直接用于生产的模式，包括直接评分、成对比较和偏差缓解，以创建可信赖的自动化评估管道。

支持:

ClaudeCodexCode(CC)

安装到 Claude

1. 打开 Claude 聊天界面

2. 点击下方 "📋 复制" 按钮

3. 粘贴到 Claude 聊天框中并发送

4. 输入 "使用 advanced-evaluation 技能" 开始使用

=== advanced-evaluation 技能 ===
作者: ChakshuGautam
描述: 由于系统性偏差，构建可靠的LLM评估系统具有挑战性。本技能提供可直接用于生产的模式，包括直接评分、成对比较和偏差缓解，以创建可信赖的自动化评估管道。

使用方法:
1. 调用技能: "使用 advanced-evaluation 技能"
2. 提供相关信息: 根据技能要求提供必要参数
3. 查看结果: 技能会返回处理结果

示例:
"使用 advanced-evaluation 技能，帮我分析一下这段代码"

这种方法适用于所有 Claude 用户，不需要安装额外工具。

Risk Level

safe

Stats

View Count

Download Count

Favorite Count

Quality Score

Links

View on Github

advanced-evaluation

安装到 Claude

Category

Risk Level

Stats

Links