Databricks「Instructed Retriever」発表:複雑な企業内検索で精度が70%向上
Databricksが発表した「Instructed Retriever」は、従来のRAGよりも精度を70%向上させ、AIエージェントが複雑なメタデータを活用した企業内検索を行うことを可能にします。
従来の手法よりも最大で70%高い精度を実現する新しいAI技術が登場しました。データ分析基盤大手のDatabricks(データブリックス)は、企業の複雑な指示やメタデータ処理に特化した「Instructed Retriever」を発表しました。これは、現在多くの企業が採用しているRAG(検索拡張生成)の限界を打ち破る、AIエージェント時代のための新しい検索アーキテクチャです。
Instructed Retriever が解決する従来のRAGの限界
従来のRAGは、ユーザーの質問をベクトル化し、似た文書を探し出す仕組みでした。しかし、Databricksのリサーチ・ディレクター、マイケル・ベンデルスキー氏によれば、これまでのシステムは「人間が使うこと」を前提に設計されており、自律的に動く「AIエージェント」には不十分だったといいます。例えば、「過去6ヶ月以内の、ブランドXを除いた星5のレビューを表示して」といった複雑な制約を含む質問に対し、従来のシステムはメタデータを正確に処理できず、誤った情報を引き出すことが多々ありました。
3つの新機能で高度なメタデータ推論を実現
「Instructed Retriever」は、以下の3つの主要な機能を備えています。
- クエリ分解:複雑なリクエストを複数のキーワード検索やフィルタ操作に分解し、実行計画を作成します。
- メタデータ推論:「昨年から」などの自然言語を日付フィルタへ変換するなど、文書に付随する情報を直接理解します。
- 文脈に即したリランキング:ユーザーの指示内容に基づき、単なる文章の類似度ではなく、意図に合致した文書の優先順位を上げます。
このシステムは現在、Databricks Agent Bricksの一部として「Knowledge Assistant」製品に組み込まれて提供されています。現在は独自技術として提供されていますが、ベンデルスキー氏は将来的な広範囲での公開も検討していると述べています。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
NetomiがGPT-5.2とGPT-4.1を活用し、企業向けAIエージェントを大規模に拡張する方法を公開。高度な推論と厳格なガバナンスを両立させた次世代のワークフロー管理に迫ります。
2026年、AmazonやOpenAIが推進する「AIオペレーティングシステム」がアプリ経済を根底から変えようとしています。一方、OpenAIでは研究の方向性を巡り主要メンバーが離脱するなど、開発競争は新たな局面を迎えています。
Microsoft Copilotに直接購入ができるショッピング機能が登場。会話の流れで決済まで完結する新機能の仕組みと、Eコマースに与える影響を解説します。
MiroMindが発表したMiroThinker 1.5は、300億パラメータながら1兆級のAIに匹敵する性能を誇ります。ハルシネーションを抑制する「科学者モード」を搭載し、推論コストを1/20に削減。MiroThinker 1.5 AI エージェント 性能の秘密に迫ります。