Architecture

ai-lib follows a layered architecture that separates concerns and enables extensibility. This design allows for easy provider integration, reliability features, and custom transport implementations.

High-Level Architecture

┌─────────────────────────────────────────────────────────────┐
│                    Your Application                         │
└───────────────▲─────────────────────────▲───────────────────┘
                │                         │
        High-Level API             Advanced Controls
                │                         │
        AiClient / Builder   ←  Model Mgmt / Metrics / Batch / Tools
                │
        ┌────────── Unified Abstraction Layer ────────────┐
        │  Provider Adapters (Hybrid: Config + Independent)│
        └──────┬────────────┬────────────┬────────────────┘
               │            │            │
        OpenAI / Groq   Gemini / Mistral  Ollama / Regional / Others
               │
        Transport (HTTP + Streaming + Retry + Proxy + Timeout)
               │
        Common Types (Request / Messages / Content / Tools / Errors)

Module Structure

Layer	Module(s)	Responsibility
Public Facade	`AiClient`, `AiClientBuilder`, `Provider`	Entry points & configuration
Domain Types	`types::request`, `types::response`, `types::common`	Messages, roles, content enums
API Traits	`api::chat`	Chat abstractions + streaming chunk types
Provider Adapters	`provider::*`	Provider-specific implementations
Model Management	`provider::models`, `provider::configs`	Capability metadata, selection strategies
Reliability	`circuit_breaker`, `rate_limiter`, `error_handling`	Retry, fallback, circuit breaker, rate limiting
Transport	`transport::*`	HTTP execution, proxy, abstraction
Metrics	`metrics`	Extensible instrumentation
Utilities	`utils::file`	File helpers for multimodal content

Core Components

1. AiClient & Builder

The main entry point for all AI operations:

use ai_lib::{AiClient, Provider, ConnectionOptions};

// Simple usage
let client = AiClient::new(Provider::Groq)?;

// Advanced configuration
let client = AiClient::with_options(
    Provider::OpenAI,
    ConnectionOptions {
        proxy: Some("http://proxy:8080".into()),
        timeout: Some(Duration::from_secs(30)),
        ..Default::default()
    }
)?;

2. Provider Adapters

Two types of provider adapters:

Config-Driven Providers (Groq, Anthropic, etc.):

Use unified configuration system
Automatic API key detection
Consistent error handling

Independent Adapters (OpenAI, Gemini, etc.):

Custom integration logic
Provider-specific optimizations
Advanced feature support

3. Transport Layer

High-performance HTTP transport with direct client integration:

use ai_lib::transport::{HttpTransport, DynHttpTransport};

// Built-in transport with retry and proxy support
let transport = HttpTransport::new()?;

// Custom transport implementation
struct CustomTransport;
impl DynHttpTransport for CustomTransport {
    // Custom implementation
}

Performance Optimizations:

Direct reqwest::Client integration for optimal performance
Unified proxy support via AI_PROXY_URL environment variable
Efficient JSON serialization using native reqwest methods
Minimal abstraction overhead for maximum throughput

4. Reliability Features

Built-in reliability primitives:

Circuit Breaker: Automatic failure detection
Rate Limiting: Token bucket algorithm
Retry Logic: Exponential backoff with jitter
Error Classification: Retryable vs permanent errors

5. Model Management

Advanced model selection and load balancing:

use ai_lib::{ModelArray, LoadBalancingStrategy, ModelSelectionStrategy};

let array = ModelArray::new("production")
    .with_strategy(LoadBalancingStrategy::HealthBased)
    .add_endpoint(ModelEndpoint {
        name: "groq-1".into(),
        url: "https://api.groq.com".into(),
        weight: 1.0,
        healthy: true,
    });

Data Flow

Basic Chat Request

Request Creation: ChatCompletionRequest with messages and options
Provider Selection: Choose adapter based on Provider enum
Request Transformation: Convert to provider-specific format
Transport Execution: Send HTTP request with retry logic
Response Parsing: Parse provider response into unified format
Error Handling: Classify and handle errors appropriately

Streaming Request

Stream Initialization: Create streaming connection
Chunk Processing: Parse SSE chunks as they arrive
Delta Aggregation: Combine deltas into complete responses
Error Recovery: Handle stream interruptions gracefully

Function Calling

Tool Definition: Define tools with JSON schemas
Request Enhancement: Add tools to chat request
Response Analysis: Detect function call intentions
Tool Execution: Execute external functions
Result Integration: Feed results back to model

Extensibility Points

Custom Transport

Implement DynHttpTransport for custom HTTP handling:

use ai_lib::transport::DynHttpTransport;

struct CustomTransport;

#[async_trait]
impl DynHttpTransport for CustomTransport {
    async fn post(&self, url: &str, body: &[u8]) -> Result<Vec<u8>, TransportError> {
        // Custom HTTP implementation
    }
}

Custom Metrics

Implement Metrics trait for observability:

use ai_lib::metrics::{Metrics, Timer};

struct PrometheusMetrics;

#[async_trait]
impl Metrics for PrometheusMetrics {
    async fn incr_counter(&self, name: &str, value: u64) {
        // Prometheus counter implementation
    }
    
    async fn start_timer(&self, name: &str) -> Option<Box<dyn Timer + Send>> {
        // Prometheus timer implementation
    }
}

Custom Model Manager

Implement custom model selection strategies:

use ai_lib::provider::models::{ModelSelectionStrategy, ModelInfo};

struct CustomStrategy;

impl ModelSelectionStrategy for CustomStrategy {
    fn select_model(&self, models: &[ModelInfo]) -> Option<&ModelInfo> {
        // Custom selection logic
    }
}

Design Principles

Unified Interface: Same API across all providers
Progressive Complexity: Start simple, add features as needed
Extensibility: Pluggable transport, metrics, and strategies
Reliability: Built-in retry, circuit breaker, and error handling
Performance: Direct HTTP client integration, minimal abstraction overhead
Type Safety: Strong typing throughout the API

Future Enhancements

Caching Layer: Request/response caching
WebSocket Support: Native WebSocket streaming
GraphQL Interface: GraphQL API surface
Plugin System: Dynamic plugin loading
Configuration Hot-reload: Runtime configuration updates

Next Steps

Explore Provider Details for specific implementations
Learn about Reliability Features for production use
Check Advanced Examples for complex patterns