RAG 精度評価

RAG の回答品質を評価するためのツールです。 質問を入力して、RAG回答・基準回答(Ground Truth)・モデル回答を比較できます。

評価する質問を入力
評価結果(サンプル)
RAG回答
社内RAGのデータは毎日午前3時に自動クロールされ、 新しい埋め込みの生成後に検索インデックスへ反映されます。
Ground Truth
データは毎日午前3時に自動更新されます。
モデル単体回答
データ更新は定期的に行われますが、頻度は設定によって異なります。
類似度スコア

0.92

Embedding Cosine Similarity
ROUGE-L

0.78

テキスト構造一致度
BLEU

0.66

語彙一致
RAG改善度

+38%

モデル単体比
取得チャンク(Retrieval Log)
保存された評価履歴
日時 質問内容 RAG類似度 BLEU ROUGE 詳細
今日 10:20 データ更新頻度について 0.92 0.66 0.78 表示
昨日 16:55 RAGの検索精度とは? 0.88 0.60 0.74 表示