RAG 管理者向けガイド — アプレンディのナレッジ基盤を育てる | ヘルプセンター

RAG 管理者とは

RAG 管理者 は、アプレンディの社内ナレッジ基盤（RAG: 検索拡張生成）を育てる技術的な担い手です。

受講者が学び、カリキュラム管理者がコンテンツを作り、人事や経営陣がそれを運用する — RAG 管理者はその土台となる知識の源泉そのものを管理します。具体的には、社内ドキュメントの取り込み、クロール、チャンク化と埋め込み、検索精度の評価、問題発生時の原因追跡までを担当するロールです。

なぜ RAG 管理が重要なのか

アプレンディでは、次の 2 種類の情報源が自動的に RAG のコーパスになります。

社内で作成したレッスンの本文
カリキュラム管理者が設計した学習コンテンツは、社内で最も整理された「正典ドキュメント」です。公開されたレッスンは自動的にインデックスに取り込まれ、AI エージェントや AI 教材生成の基礎知識になります。
クイズの Q&A ペア
各コースのクイズ問題と解説は、そのまま FAQ として扱われます。受講者が業務中に「これってどういうこと？」と質問すると、対応するクイズの解説が引き出される、という使い方が可能になります。

これに加えて、SharePoint や社内ファイル共有などの外部ドキュメントソースも統合されます。 RAG 管理者の仕事は、この「カリキュラム + 外部ドキュメント」の組み合わせを、品質・鮮度・アクセス権の観点で維持することです。

管理画面の構成

RAG 管理画面には 8 つのページがあります。日々の運用はダッシュボード中心、深い調整は各詳細画面で行います。

1. ダッシュボード（/ragadmin）

パイプライン全体の健全性を一目で把握するページです。

データソース数、インデックス更新率、クロール成功率、RAG 精度スコアの KPI
過去数ヶ月のインデックス再構築の頻度推移
データソースごとの状態（正常 / 警告 / 失敗）

毎日最初にここを開き、赤いサイン（失敗・警告）があれば該当の詳細画面へ進む、というのが基本のワークフローです。

2. データソース管理（/ragadmin/sources）

どの情報源を RAG に取り込むかを設定する画面です。

内部ソース: 組織内で作成された公開済みレッスン、クイズ。自動で取り込まれ、コースが公開された時点でインデックスに反映されます。追加設定は不要ですが、取り込み状況の確認と、特定のコースを除外する設定が可能です。
外部ソース: SharePoint フォルダ、Google Drive、社内ファイル共有、Web URL など。認証設定、取り込み対象パス、対象ファイル形式（PDF / Word / HTML 等）を指定します。

3. クローラー設定（/ragadmin/crawlers）

外部ソースをどの頻度で再取り込みするかを設定します。

スケジュール（毎時 / 日次 / 週次 / 手動）
差分取り込み vs フル再取り込みの切り替え
認証トークンの管理（期限切れアラート含む）
除外ルール（特定のフォルダやファイル名パターンを取り込まない）

4. インデックス構築（/ragadmin/indexing）

取り込んだドキュメントをチャンク化し、埋め込みベクトルを生成する処理の設定です。

チャンクサイズ（段落単位 / セクション単位 / 固定トークン数）
チャンク間のオーバーラップ量
埋め込みモデルの選択
全体再構築のスケジュールと手動実行

5. ベクトル DB（/ragadmin/vectors）

生成された埋め込みが実際に格納されているベクトル DB の状態を確認します。

総ドキュメント数、総チャンク数、ストレージ使用量
内部ソース / 外部ソースの内訳
部署別・タグ別のチャンク分布

6. 精度評価・改善（/ragadmin/evaluation）

検索精度を定量的に測定し、改善の方向性を判断する画面です。

セマンティック評価スコアの推移（0.0 〜 1.0）
代表的なクエリに対するヒット結果の確認
回帰テスト（以前は正しく引けていたクエリが、今も引けるか）
スコアの低いクエリパターンの抽出

精度が落ちたときは、「新しいソースの質が悪い」「チャンクサイズが合わない」「埋め込みモデルを変えた影響」のいずれかを切り分けます。

7. 処理ログ（/ragadmin/logs）

クロール失敗、埋め込み生成エラー、インデックス書き込み失敗などを時系列で確認できます。アラート通知の出発点もこのログです。

ジョブ ID、対象ドキュメント、失敗の種類、スタックトレース
リトライ回数と最終状態
フィルタ（失敗のみ、特定のソースのみ、期間指定）

8. 設定（/ragadmin/settings）

組織全体の方針に関わる設定を行います。

使用する AI モデルの切り替え
データ保持期間
アクセス制御ポリシー（部署単位のスコープなど）
通知先（失敗時のメール / Teams / Slack）

基本的な運用サイクル

RAG 管理の本質は、接続 → 取り込み → インデックス化 → 評価 → 修正 というサイクルを、社内ドキュメントが変化し続けるのに合わせて回し続けることです。

接続: 新しいデータソースを登録する（カリキュラム側は自動）
取り込み: クローラーを走らせて最新の状態を取得
インデックス化: チャンク化と埋め込み生成
評価: 代表クエリで検索精度を確認
修正: 質の低いソースの除外、チャンク設定の調整、除外ルールの追加

完成形は存在しません。社内のドキュメントが更新されるたび、組織の業務が変わるたび、RAG の内容も変えていく必要があります。

カリキュラム管理者との連携

RAG 管理者とカリキュラム管理者は、密接に連携するロールです。レッスンとクイズが RAG ソースになるため、 良いレッスンを作ることが、直接 AI エージェントの品質向上につながります。

カリキュラム管理者は、レッスンの本文が「後から検索される可能性」を意識して書くと、 RAG 経由での引き出されやすさが上がります。
RAG 管理者は、精度評価で「引き出されていないが、本来引き出されるべきレッスン」を見つけたら、カリキュラム管理者にフィードバックします。

参考: 「AI 生成コンテンツのレビュー観点チェックリスト」は、RAG ソースとしての品質チェックにも流用できます。

アクセス制御とセキュリティ

RAG に取り込まれたコンテンツは、必ず組織単位でスコープされます。他組織のチャンクは絶対に引き出されません。

部署単位のアクセス制御も可能です。人事データに基づく、機密性の高いドキュメントは、該当部署のメンバーのみが RAG 経由で参照できる、といった運用が可能です。

公開コース（IsPublic）は組織外からも参照できる点に注意してください。機密情報を含むレッスンは公開設定を避け、社内限定のまま RAG に取り込むのが原則です。

困ったときに見るべきページ

精度が落ちた気がする → 精度評価・改善ページでスコア推移を確認。同時期のインデックス構築ログと照合。
新しいソースが反映されない → 処理ログでクロール・埋め込みのエラーを確認。
古い情報が引き出される → クローラー設定の更新頻度と、インデックス構築の再ビルド頻度を見直し。
特定部署のユーザが結果を見られない → 設定ページのアクセス制御ポリシーを確認。

解決しない場合は、サポート窓口または担当コンサルタントへお問い合わせください。

RAG 管理者向けガイド — アプレンディのナレッジ基盤を育てる