Modelos de razonamiento

Algunos modelos de IA soportan pensamiento extendido (razonamiento cadena de pensamiento), donde el modelo muestra su proceso de razonamiento antes de proporcionar la respuesta final.

Modelos compatibles

Model	Provider	Reasoning
o1, o1-mini, o3	OpenAI	Extended thinking
Claude 3.5 Sonnet	Anthropic	Extended thinking
DeepSeek R1	DeepSeek	Chain-of-thought
Gemini 2.0 Flash Thinking	Google	Thinking mode

Uso

Los modelos de razonamiento funcionan a través de la misma API. La diferencia clave es que pueden emitir eventos ThinkingDelta durante el streaming:

Rust

let mut stream = client.chat()
    .user("Solve this step by step: What is 127 * 43?")
    .stream()
    .execute_stream()
    .await?;

while let Some(event) = stream.next().await {
    match event? {
        StreamingEvent::ThinkingDelta { text, .. } => {
            // Model's reasoning process
            print!("[thinking] {text}");
        }
        StreamingEvent::ContentDelta { text, .. } => {
            // Final answer
            print!("{text}");
        }
        _ => {}
    }
}

Python

async for event in client.chat() \
    .user("Solve this step by step: What is 127 * 43?") \
    .stream():
    if event.is_thinking_delta:
        print(f"[thinking] {event.text}", end="")
    elif event.is_content_delta:
        print(event.as_content_delta.text, end="")

TypeScript

for await (const event of client
  .chat()
  .user('Solve this step by step: What is 127 * 43?')
  .stream()) {
  if (event.isThinkingDelta) {
    process.stdout.write(`[thinking] ${event.text}`);
  } else if (event.isContentDelta) {
    process.stdout.write(event.asContentDelta.text);
  }
}

Go

// Go
stream, _ := aiClient.Chat().
    User("Resuelve esto paso a paso: ¿Cuánto es 127 * 43?").
    ExecuteStream(ctx)
defer stream.Close()

for stream.Next() {
    event := stream.Event()
    if event.Type == "thinking" {
        fmt.Printf("[pensando] %s", event.Text)
    } else if event.Type == "content" {
        fmt.Print(event.Text)
    }
}

Cómo funciona

El manifiesto del proveedor declara capabilities.reasoning: true
El decodificador de streaming reconoce eventos específicos de pensamiento
El EventMapper emite ThinkingDelta para contenido de razonamiento
Los eventos ContentDelta contienen la respuesta final

El manifiesto del protocolo maneja las diferencias de formato específicas del proveedor:

OpenAI o1: Usa tokens de razonamiento internos
Anthropic Claude: Usa bloques de contenido thinking
DeepSeek R1: Usa etiquetas <think> en el contenido

Consejos

Los modelos de razonamiento generalmente producen mejores resultados para tareas complejas
Utilizan más tokens (los tokens de razonamiento se cuentan)
La temperatura puede estar restringida (algunos modelos de razonamiento la ignoran)
No todos los proveedores soportan razonamiento — verifique capabilities.reasoning