RAG 精度評価
RAG の回答品質を評価するためのツールです。 質問を入力して、RAG回答・基準回答(Ground Truth)・モデル回答を比較できます。
評価する質問を入力
評価結果(サンプル)
RAG回答
社内RAGのデータは毎日午前3時に自動クロールされ、
新しい埋め込みの生成後に検索インデックスへ反映されます。
Ground Truth
データは毎日午前3時に自動更新されます。
モデル単体回答
データ更新は定期的に行われますが、頻度は設定によって異なります。
類似度スコア
0.92
Embedding Cosine SimilarityROUGE-L
0.78
テキスト構造一致度BLEU
0.66
語彙一致RAG改善度
+38%
モデル単体比取得チャンク(Retrieval Log)
- 類似度 0.89:「RAG更新スケジュール:毎日3時に自動クロール…」
- 類似度 0.83:「SharePointからのデータ取得は毎朝3:00に…」
- 類似度 0.78:「埋め込み生成のタイミングは…」