通常データ分析・統計

推論AI回答評価用プロンプト

AI回答評価のための総合プロンプト

AIによる回答の質を多角的に評価し、総合的なスコアを算出する

このプロンプトは、AIが生成した回答を10の評価軸に基づいて評価するための手順を示しています。それぞれの評価軸には重みが設定されており、評価点を基に100点満点での総合スコアを計算します。評価軸には正確性、合理性、完全性、推論の深度、一貫性、分かりやすさ、説明可能性、倫理性、創造性、適切性が含まれます。各評価の理由も記述し、最終的な評価コメントと改善点を含めます。

プロンプト本文

推論AI回答評価用プロンプト
以下の手順で、AIの回答を評価してください。

回答を熟読し、どのような内容なのか理解する。
以下の 10 項目それぞれについて、0～10 点の範囲で評価する（10 が最高点）。
点数を付ける際には、各評価軸の定義と重要度を考慮する。
各評価項目ごとの簡単な理由・コメントも記述する。
最終的に「各項目の評価点 × （付与する重み / 10）」の合計を算出し、100 点満点換算の総合スコアを出す。
たとえば、「正確性（Accuracy）」は重み 25 点相当なので、個別評価点を “(評価点) × (25/10)” で加算します。

10 の評価軸
正確性 (Accuracy) [重み：25点 / 100点]
事実関係や計算が正確か、事実誤認がないか
妥当性・合理性 (Validity / Logical Soundness) [重み：15点 / 100点]
推論過程に論理的な矛盾がなく、結論が合理的に導かれているか
完全性 (Completeness) [重み：10点 / 100点]
回答に必要な情報が十分に網羅されているか、抜け漏れが少ないか
推論の深度 (Depth of Reasoning) [重み：15点 / 100点]
問題の本質に踏み込み、十分な思考・分析がなされているか
一貫性 (Consistency) [重み：10点 / 100点]
回答全体で主張や内容に食い違い・矛盾がないか
分かりやすさ (Clarity) [重み：10点 / 100点]
説明や表現が明確で、読者が理解しやすいか
説明可能性 (Explainability) [重み：5点 / 100点]
なぜその結論に至ったか、根拠がわかりやすく示されているか
倫理性・公正性 (Ethical / Fairness) [重み：5点 / 100点]
差別的・攻撃的内容が含まれていないか、公序良俗に反しないか
創造性 (Creativity) [重み：3点 / 100点]
斬新な切り口や独創的なアイデアが含まれているか
適切性・関連性 (Relevance / Appropriateness) [重み：2点 / 100点]
ユーザの文脈や質問に合った回答を提供しているか
実際に点数を付ける際のフォーマット例
以下のフォーマットに沿って評価結果を記述してください。

【評価結果】

1. 正確性 (Accuracy) / 0～10：
   - 評価理由：

2. 妥当性・合理性 (Validity / Logical Soundness) / 0～10：
   - 評価理由：

3. 完全性 (Completeness) / 0～10：
   - 評価理由：

4. 推論の深度 (Depth of Reasoning) / 0～10：
   - 評価理由：

5. 一貫性 (Consistency) / 0～10：
   - 評価理由：

6. 分かりやすさ (Clarity) / 0～10：
   - 評価理由：

7. 説明可能性 (Explainability) / 0～10：
   - 評価理由：

8. 倫理性・公正性 (Ethical / Fairness) / 0～10：
   - 評価理由：

9. 創造性 (Creativity) / 0～10：
   - 評価理由：

10. 適切性・関連性 (Relevance / Appropriateness) / 0～10：
    - 評価理由：

【各項目の点数合計・加重計算】
- (1) 正確性： 評価点 × (25/10)
- (2) 妥当性・合理性： 評価点 × (15/10)
- (3) 完全性： 評価点 × (10/10)
- (4) 推論の深度： 評価点 × (15/10)
- (5) 一貫性： 評価点 × (10/10)
- (6) 分かりやすさ： 評価点 × (10/10)
- (7) 説明可能性： 評価点 × (5/10)
- (8) 倫理性・公正性： 評価点 × (5/10)
- (9) 創造性： 評価点 × (3/10)
- (10) 適切性・関連性： 評価点 × (2/10)

【総合スコア (100点満点換算)】：
（上記計算の合計値）

【総評】
- 総合的な評価コメント
- 改善点など

推論AI回答評価用プロンプト
以下の手順で、AIの回答を評価してください。

回答を熟読し、どのような内容なのか理解する。
以下の 10 項目それぞれについて、0～10 点の範囲で評価する（10 が最高点）。
点数を付ける際には、各評価軸の定義と重要度を考慮する。
各評価項目ごとの簡単な理由・コメントも記述する。
最終的に「各項目の評価点 × （付与する重み / 10）」の合計を算出し、100 点満点換算の総合スコアを出す。
たとえば、「正確性（Accuracy）」は重み 25 点相当なので、個別評価点を “(評価点) × (25/10)” で加算します。

10 の評価軸
正確性 (Accuracy) [重み：25点 / 100点]
事実関係や計算が正確か、事実誤認がないか
妥当性・合理性 (Validity / Logical Soundness) [重み：15点 / 100点]
推論過程に論理的な矛盾がなく、結論が合理的に導かれているか
完全性 (Completeness) [重み：10点 / 100点]
回答に必要な情報が十分に網羅されているか、抜け漏れが少ないか
推論の深度 (Depth of Reasoning) [重み：15点 / 100点]
問題の本質に踏み込み、十分な思考・分析がなされているか
一貫性 (Consistency) [重み：10点 / 100点]
回答全体で主張や内容に食い違い・矛盾がないか
分かりやすさ (Clarity) [重み：10点 / 100点]
説明や表現が明確で、読者が理解しやすいか
説明可能性 (Explainability) [重み：5点 / 100点]
なぜその結論に至ったか、根拠がわかりやすく示されているか
倫理性・公正性 (Ethical / Fairness) [重み：5点 / 100点]
差別的・攻撃的内容が含まれていないか、公序良俗に反しないか
創造性 (Creativity) [重み：3点 / 100点]
斬新な切り口や独創的なアイデアが含まれているか
適切性・関連性 (Relevance / Appropriateness) [重み：2点 / 100点]
ユーザの文脈や質問に合った回答を提供しているか
実際に点数を付ける際のフォーマット例
以下のフォーマットに沿って評価結果を記述してください。

【評価結果】

1. 正確性 (Accuracy) / 0～10：
- 評価理由：

2. 妥当性・合理性 (Validity / Logical Soundness) / 0～10：
- 評価理由：

3. 完全性 (Completeness) / 0～10：
- 評価理由：

4. 推論の深度 (Depth of Reasoning) / 0～10：
- 評価理由：

5. 一貫性 (Consistency) / 0～10：
- 評価理由：

6. 分かりやすさ (Clarity) / 0～10：
- 評価理由：

7. 説明可能性 (Explainability) / 0～10：
- 評価理由：

8. 倫理性・公正性 (Ethical / Fairness) / 0～10：
- 評価理由：

9. 創造性 (Creativity) / 0～10：
- 評価理由：

10. 適切性・関連性 (Relevance / Appropriateness) / 0～10：
- 評価理由：

【各項目の点数合計・加重計算】
- (1) 正確性：評価点 × (25/10)
- (2) 妥当性・合理性：評価点 × (15/10)
- (3) 完全性：評価点 × (10/10)
- (4) 推論の深度：評価点 × (15/10)
- (5) 一貫性：評価点 × (10/10)
- (6) 分かりやすさ：評価点 × (10/10)
- (7) 説明可能性：評価点 × (5/10)
- (8) 倫理性・公正性：評価点 × (5/10)
- (9) 創造性：評価点 × (3/10)
- (10) 適切性・関連性：評価点 × (2/10)

【総合スコア (100点満点換算)】：
（上記計算の合計値）

【総評】
- 総合的な評価コメント
- 改善点など

入力項目はありません

「プロンプトを生成」ボタンを押してください