「LLM は金融分析でハルシネーションを起こすから使えない」 — この主張は、多くの場合データ層の設計に原因があります。LLM そのものではなく、LLM に渡すデータがハルシネーション可能性を持っている状態を放置していることが多いのです。
EDINET DB がハルシネーションを起こしにくい理由は、データ層に 3 つの条件を組み込んでいるからです。
- 一次ソース直結: 金融庁 EDINET の XBRL を直接構造化、二次・三次加工データを介さない
- 抽出と原典の分離: 抽出された値と原典 PDF / 表番号を必ずペアで保持、検証可能性を担保
- 根拠返却: API / MCP のレスポンスに confidence と source URL を含める
これは「データインフラ」を名乗る上での最低条件であり、SEISAKU DB / FUDOSAN DB / BOUSAI DB も同じ設計を引き継いでいます。AI 時代の金融データインフラは、信頼性こそ価値です。
詳細は EDINET DB ブログをご覧ください → LLM で金融分析するとき、データ層に求めるべき 3 つの条件