ガードレール

ガードレールブロックは、複数の検証タイプに対してコンテンツをチェックすることで、AIワークフローを検証し保護します。データ品質の確保、ハルシネーション（幻覚）の防止、個人情報の検出、フォーマット要件の強制などをワークフローに組み込む前に行います。

検証タイプ

JSON検証

コンテンツが適切にフォーマットされたJSONであることを検証します。構造化されたLLM出力を安全に解析できることを確認するのに最適です。

ユースケース:

解析前にエージェントブロックからのJSON応答を検証
APIペイロードが適切にフォーマットされていることを確認
構造化データの整合性をチェック

出力:

passed: 有効なJSONの場合は true、それ以外の場合は false
error: 検証が失敗した場合のエラーメッセージ（例：「無効なJSON：予期しないトークン...」）

正規表現検証

コンテンツが指定された正規表現パターンに一致するかどうかをチェックします。

ユースケース:

メールアドレスの検証
電話番号形式のチェック
URLやカスタム識別子の確認
特定のテキストパターンの強制

設定:

正規表現パターン: 照合する正規表現（例：メールの場合は ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$）

出力:

passed: コンテンツがパターンに一致する場合は true、それ以外の場合は false
error: 検証が失敗した場合のエラーメッセージ

幻覚検出

検索拡張生成（RAG）とLLMスコアリングを使用して、AI生成コンテンツがナレッジベースと矛盾している場合や、ナレッジベースに根拠がない場合を検出します。

仕組み:

関連するコンテキストについてナレッジベースに問い合わせる
AI出力と取得したコンテキストの両方をLLMに送信
LLMが信頼度スコア（0〜10のスケール）を割り当てる
- 0 = 完全な幻覚（まったく根拠なし）
- 10 = 完全に根拠あり（ナレッジベースで完全にサポートされている）
スコアが閾値以上（デフォルト：3）であれば検証に合格

設定:

ナレッジベース: 既存のナレッジベースから選択
モデル: スコアリング用のLLMを選択（強力な推論能力が必要 - GPT-4o、Claude 3.7 Sonnetを推奨）
APIキー: 選択したLLMプロバイダーの認証（ホスト型/OllamaまたはVLLM互換モデルの場合は自動的に非表示）
信頼度しきい値: 合格するための最小スコア（0-10、デフォルト: 3）
Top K（高度な設定）: 取得するナレッジベースのチャンク数（デフォルト: 10）

出力:

passed: 信頼度スコア ≥ しきい値の場合は true
score: 信頼度スコア（0-10）
reasoning: スコアに対するLLMの説明
error: 検証が失敗した場合のエラーメッセージ

ユースケース:

ドキュメントに対するエージェントの回答を検証
カスタマーサポートの回答が事実に基づいていることを確認
生成されたコンテンツがソース資料と一致することを確認
RAGアプリケーションの品質管理

PII検出

Microsoft Presidioを使用して個人を特定できる情報を検出します。複数の国と言語にわたる40以上のエンティティタイプをサポートしています。

仕組み:

検証するコンテンツを渡す（例：<agent1.content>）
モーダルセレクターを使用して検出するPIIタイプを選択
検出モード（検出またはマスク）を選択
コンテンツが一致するPIIエンティティをスキャン
検出結果と、オプションでマスクされたテキストを返す

設定:

検出するPIIタイプ: モーダルセレクターからグループ化されたカテゴリを選択
- 一般: 人名、メール、電話番号、クレジットカード、IPアドレスなど
- アメリカ: 社会保障番号、運転免許証、パスポートなど
- イギリス: NHS番号、国民保険番号
- スペイン: NIF、NIE、CIF
- イタリア: 納税者番号、運転免許証、VAT番号
- ポーランド: PESEL、NIP、REGON
- シンガポール: NRIC/FIN、UEN
- オーストラリア: ABN、ACN、TFN、Medicare
- インド: Aadhaar、PAN、パスポート、有権者番号
モード:
- 検出: PIIを識別するのみ（デフォルト）
- マスク: 検出されたPIIをマスク値に置き換え
言語: 検出言語（デフォルト：英語）

出力:

passed: 選択したPIIタイプが検出された場合は false
detectedEntities: タイプ、位置、信頼度を含む検出されたPIIの配列
maskedText: PIIがマスクされたコンテンツ（モード = "Mask"の場合のみ）
error: 検証が失敗した場合のエラーメッセージ

ユースケース:

機密性の高い個人情報を含むコンテンツをブロック
データのログ記録や保存前にPIIをマスク
GDPR、その他のプライバシー規制への準拠
処理前のユーザー入力のサニタイズ

設定

検証するコンテンツ

検証する入力コンテンツ。通常、以下から取得されます：

エージェントブロックの出力: <agent.content>
関数ブロックの結果: <function.output>
APIレスポンス: <api.output>
その他のブロック出力

検証タイプ

4つの検証タイプから選択：

有効なJSON: コンテンツが適切にフォーマットされたJSONかどうかを確認
正規表現マッチ: コンテンツが正規表現パターンに一致するか検証
幻覚チェック: LLMスコアリングによる知識ベースとの検証
PII検出: 個人を特定できる情報を検出し、オプションでマスク

出力

すべての検証タイプは以下を返します：

<guardrails.passed>: 検証が成功したかどうかを示すブール値
<guardrails.validationType>: 実行された検証のタイプ
<guardrails.input>: 検証された元の入力
<guardrails.error>: 検証が失敗した場合のエラーメッセージ（オプション）

タイプ別の追加出力：

幻覚チェック:

<guardrails.score>: 信頼度スコア（0-10）
<guardrails.reasoning>: LLMの説明

PII検出:

<guardrails.detectedEntities>: 検出されたPIIエンティティの配列
<guardrails.maskedText>: PIIがマスクされたコンテンツ（モード = "マスク"の場合）

ユースケース例

解析前のJSONの検証 - エージェント出力が有効なJSONであることを確認

Agent (Generate) → Guardrails (Validate) → Condition (Check passed) → Function (Parse)

幻覚の防止 - カスタマーサポートの回答を知識ベースと照合して検証

Agent (Response) → Guardrails (Check KB) → Condition (Score ≥ 3) → Send or Flag

ユーザー入力のPIIをブロック - ユーザーが提出したコンテンツをサニタイズ

Input → Guardrails (Detect PII) → Condition (No PII) → Process or Reject

ベストプラクティス

条件ブロックと連携: <guardrails.passed>を使用して検証結果に基づいてワークフローロジックを分岐
解析前のJSON検証: LLM出力を解析する前に常にJSON構造を検証
適切なPIIタイプの選択: パフォーマンス向上のため、ユースケースに関連するPIIエンティティタイプのみを選択
合理的な信頼度しきい値の設定: 幻覚検出では、精度要件に基づいてしきい値を調整（高い = より厳格）
幻覚検出には強力なモデルを使用: GPT-4oまたはClaude 3.7 Sonnetはより正確な信頼度スコアリングを提供
ログ記録用のPIIマスク: PIIを含む可能性のあるコンテンツをログに記録または保存する場合は「マスク」モードを使用
正規表現パターンのテスト: 本番環境にデプロイする前に正規表現パターンを徹底的に検証
検証失敗の監視: <guardrails.error>メッセージを追跡して一般的な検証問題を特定

ガードレールの検証はワークフローで同期的に行われます。幻覚検出については、レイテンシーが重要な場合は、より高速なモデル（GPT-4o-miniなど）を選択してください。

ガードレール

On this page