本文へスキップ
← WORKS

社内問い合わせRAGチャットボット — ハイブリッド検索基盤

社内規程・マニュアル・FAQ・Confluence等のナレッジを横断検索するRAGチャットボットを構築。ベクトル検索(Semantic)とBM25キーワード検索を Reciprocal Rank Fusion で統合し、Cross-Encoder Rerankingで回答精度92%を達成。

ROLE
AIエンジニア / テクニカルリード
TEAM
3名(AI 1名 + バックエンド 1名 + PM 1名)
PERIOD
6ヶ月
  • 問い合わせの60%(月間720件)をチャットボットが自動解決、管理部門の対応工数を大幅削減
  • 回答正確率(Top-1 正答率)92%を達成(4部門の代表質問200問で人手評価。Vector Only 76% → Hybrid + Rerank 92%)
  • 平均応答時間3.2秒(TTFT 1.1s + 生成 2.1s)で実用的なレスポンスを実現
  • ユーザー満足度 4.3 / 5.0(月次アンケート N=280)
  • 年間コスト削減効果 約1,800万円(720件/月 × 平均対応15分の人件費換算)
TECHNOLOGIES
Azure OpenAI (GPT-4o / Embeddings)Azure AI SearchLangChainCross-Encoder (multilingual)FastAPIReactPythonAzure ADLangSmith
RAGシステムアーキテクチャ — Document Ingestion Pipeline + Query Pipeline(ハイブリッド検索 → Reranking → LLM生成)※画像はイメージです
RAG Architecture: Document Ingestion + Hybrid Query Pipeline
ハイブリッド検索詳細 — Vector Search と BM25 の並列実行 → RRF統合 → Cross-Encoder Reranking※画像はイメージです
Hybrid Search: Vector + BM25 + RRF + Cross-Encoder Reranking
チャットUI — 会話履歴・ソース引用付き回答・参照ドキュメントの信頼度スコア・関連質問サジェスト※画像はイメージです
Chat Interface: ソース引用付き回答 + 信頼度スコア + フィードバック

社内の規程・マニュアル・FAQが6つのシステム(社内規程DB・業務マニュアル・FAQ・Confluence・SharePoint・Slack)に分散し、従業員が正確な情報にたどり着くまでに平均15分以上を要していた。人事・IT・総務・経理への問い合わせが月間1,200件に達し、回答する管理部門の工数が常態的に逼迫。既存の社内検索はキーワード一致のみで、表現の揺れや言い換えに対応できず、検索放棄率が35%に上っていた。

Azure AI Searchのハイブリッド検索機能を活用し、ベクトル検索(意味的類似性)とBM25キーワード検索(正確な用語一致)を並列実行、Reciprocal Rank Fusion(RRF)で統合する検索パイプラインを構築。さらに多言語対応のCross-Encoderでリランキングし、Top-5の高精度コンテキストをGPT-4oに渡して回答を生成する。

Document Ingestion Pipelineでは、6つのソースからドキュメントを取り込み、Recursive Character Splittingでチャンク化(512トークン、オーバーラップ50)。見出し・セクション境界を尊重し、部門・更新日のメタデータを付与。Azure OpenAIのEmbeddingsモデルでベクトルに変換し、デュアルインデックス(Vector + Keyword)を構築した。

日本語特有の課題として、形態素解析(MeCab / Sudachi)によるBM25のトークナイズ最適化、社内略語・固有名詞の同義語辞書によるクエリ拡張を実装。Azure AD SSO連携により、部門・ロールに応じたドキュメントのアクセス制御を検索結果に反映した。