プロバイダーマニフェスト

エコシステム内の各 AI プロバイダーには、その API とのやり取り方法を完全に記述する YAML マニフェストファイル（v1/providers/<provider>.yaml）があります。

サポート対象プロバイダー

プロバイダーマニフェストは 2 つの形式で利用可能です：v1（レガシー）と v2-alpha。v2-alpha 形式は Ring 1/2/3 同心円構造（コアスケルトン → 機能マッピング → 高度な拡張）を使用します。OpenAI、Anthropic、Gemini は v1 と v2-alpha 両方の形式で利用可能です。

グローバルプロバイダー

OpenAI、Anthropic、Google Gemini、Groq、Mistral、Cohere、Perplexity、Together AI、DeepInfra、OpenRouter、Azure OpenAI、NVIDIA、Fireworks AI、Replicate、AI21 Labs、Cerebras、Lepton AI、Grok

中国リージョンプロバイダー

DeepSeek、Qwen（Alibaba）、Zhipu GLM、Doubao（ByteDance）、Baidu ERNIE、iFlytek Spark、Tencent Hunyuan、SenseNova、Tiangong、Moonshot（Kimi）、MiniMax、Baichuan、Yi（01.AI）、SiliconFlow

マニフェスト構造

エンドポイント設定

endpoint:
  base_url: 'https://api.openai.com/v1'
  chat_path: '/chat/completions'
  protocol: 'https'
  timeout_ms: 60000

認証

複数の認証タイプをサポートします：

# Bearer トークン（最も一般的）
auth:
  type: bearer
  token_env: "OPENAI_API_KEY"

# ヘッダー内の API キー
auth:
  type: api_key
  header: "x-api-key"
  token_env: "ANTHROPIC_API_KEY"

# カスタムヘッダー
auth:
  type: bearer
  token_env: "ANTHROPIC_API_KEY"
  headers:
    anthropic-version: "2023-06-01"

パラメータマッピング

標準パラメータ名をプロバイダー固有のフィールドにマッピングします：

parameter_mappings:
  temperature: 'temperature'
  max_tokens: 'max_completion_tokens' # OpenAI は異なる名前を使用
  stream: 'stream'
  tools: 'tools'
  tool_choice: 'tool_choice'
  response_format: 'response_format'

ストリーミング設定

ストリーミングレスポンスのデコードと解釈方法を宣言します：

streaming:
  decoder:
    format: 'sse' # "sse"、"ndjson"、または "anthropic_sse"
    done_signal: '[DONE]' # ストリーム終了マーカー
  event_map:
    - match: '$.choices[0].delta.content'
      emit: 'PartialContentDelta'
      extract:
        content: '$.choices[0].delta.content'
    - match: '$.choices[0].delta.tool_calls'
      emit: 'PartialToolCall'
      extract:
        tool_calls: '$.choices[0].delta.tool_calls'
    - match: '$.choices[0].finish_reason'
      emit: 'StreamEnd'
      extract:
        finish_reason: '$.choices[0].finish_reason'

エラー分類

HTTP レスポンスを標準エラー型にマッピングします：

error_classification:
  by_http_status:
    '400': 'invalid_request'
    '401': 'authentication'
    '403': 'permission'
    '404': 'not_found'
    '429': 'rate_limited'
    '500': 'server_error'
    '503': 'overloaded'
  by_error_code:
    'context_length_exceeded': 'context_length'
    'content_filter': 'content_filter'

機能

ランタイムがリクエスト前にチェックするフィーチャーフラグ：

capabilities:
  streaming: true
  tools: true
  vision: true
  audio: false
  reasoning: true
  agentic: true
  json_mode: true

ランタイムがマニフェストを使用する方法

読み込み — YAML マニフェストを読み込む（ローカル、環境変数、または GitHub）
検証 — JSON Schema で検証
コンパイル — パラメータマッピングを使用してユーザーリクエストを変換
実行 — 正しい認証/ヘッダーで HTTP リクエストを送信
デコード — ストリーミング設定を使用してレスポンスを処理
分類 — 分類ルールを使用してエラーを処理

次のステップ

モデルレジストリ — モデルの設定方法
プロバイダーへの貢献 — 新規プロバイダーの追加