Kimi K2.7 Code Highspeed API

Kimi K2.7 Code Highspeed es el nivel más rápido del modelo de codificación de Moonshot, con contexto 256K, siempre en el razonamiento, y la entrada de imagen y vídeo.

Moonshot AIGeneracion de texto256K contextoLanzado Jun 16, 2026Endpoint propietarioNuevo

About Kimi K2.7 Code Highspeed

Kimi K2.7 Code Highspeed es el nivel más rápido del modelo de codificación de Moonshot, con contexto 256K, siempre en el razonamiento, y la entrada de imagen y vídeo.

El nivel más rápido del código Kimi K2.7. Admite entradas de texto, imagen y vídeo, llamadas de función, salida estructurada del modo JSON y búsqueda web incorporada facturada en $0.015 por llamada invocada. Pensar siempre está en y razonar fichas se facturan como fichas de salida. La temperatura y otras anulaciones de muestreo se ignoran porque el servicio modelo utiliza ajustes de muestreo fijos. La función multi-paso debe volver a reproducir el mensaje adjunto con su campo reasoning content intacto. No se admiten controles de caché explícitos, lotes y ajuste fino.

También conocido como Moonshot AI Kimi K2.7 Code Highspeed, Kimi-K2.7-Code-Highspeed, kimi-k2-7-code-highspeed

reasoningfunction callingstructured outputmultimodalagentic codingweb search

Kimi K2.7 Code Highspeed specs

ID del modelo
kimi-k2-7-code-highspeed
Proveedor
Moonshot AI
Categoría
Generacion de texto
Released
Jun 16, 2026
Ventana de contexto
256K tokens
Salida máxima
131,072 tokens
Entrada
text, image, video
Salida
text
Endpoints
POST /v1/chat/completions
POST /v1/responses
POST /v1/messages

Kimi K2.7 Code Highspeed API pricing

Live pay-as-you-go rates from the EmpirioLabs catalog. You are billed only for what you use, with no monthly minimum.

Tipo
Especificación
Tarifa
Entrada
por señalización rápida 1M
$1.90
Producto
per 1M generados fichas
$8.00
Búsqueda web
por llamada invocada
$0.015
Comparar en la página completa de precios

How to call the Kimi K2.7 Code Highspeed API

Kimi K2.7 Code Highspeed serves the OpenAI-compatible Chat Completions API. Point any OpenAI SDK at https://api.empiriolabs.ai/v1 with your EmpirioLabs API key and use the model id kimi-k2-7-code-highspeed. Get an API key from the EmpirioLabs dashboard.

cURL
curl https://api.empiriolabs.ai/v1/chat/completions \
  -H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2-7-code-highspeed",
    "messages": [
      {"role": "user", "content": "Write a haiku about the ocean."}
    ]
  }'
Python (OpenAI SDK)
from openai import OpenAI

client = OpenAI(
    base_url="https://api.empiriolabs.ai/v1",
    api_key="YOUR_EMPIRIOLABS_API_KEY",
)

response = client.chat.completions.create(
    model="kimi-k2-7-code-highspeed",
    messages=[{"role": "user", "content": "Write a haiku about the ocean."}],
)
print(response.choices[0].message.content)
Full Kimi K2.7 Code Highspeed API reference

Kimi K2.7 Code Highspeed API parameters

Request parameters supported by the Kimi K2.7 Code Highspeed API on EmpirioLabs. Defaults apply when a field is omitted.

ParámetroTipoPredeterminadoRango / valoresDescripción
max_tokensnumber163841 to 131072Maximum output tokens. Reasoning tokens count toward this limit.
stopstring--Up to 4 strings where the model will stop generating further tokens.
response_formatobject--OpenAI-compatible JSON mode or JSON schema response format.
tool_web_searchbooleanfalse-Search the web for real-time information. Adds $0.015 to the request cost for each invoked web search call.

Información útil

El nivel más rápido del código Kimi K2.7. Admite entradas de texto, imagen y vídeo con contexto 256K, llamada de funciones, salida estructurada del modo JSON y búsqueda web integrada en $0.015 por llamada invocada. Pensar siempre está en y no puede ser deshabilitado; razonar fichas se facturan como fichas de salida. La temperatura y otras anulaciones de muestreo se ignoran porque el servicio modelo utiliza ajustes de muestreo fijos. Función multi-paso llamando a través de la API debe volver a reproducir el mensaje asistente con su campo reasoning content intacto.

Kimi K2.7 Code Highspeed API: common questions

How much does the Kimi K2.7 Code Highspeed API cost?

On EmpirioLabs, Kimi K2.7 Code Highspeed is billed pay as you go: Input $1.90 por señalización rápida 1M; Producto $8.00 per 1M generados fichas; Búsqueda web $0.015 por llamada invocada. The live rate card on this page always matches what the API charges.

What is the context window of Kimi K2.7 Code Highspeed?

Kimi K2.7 Code Highspeed supports a 256K-token context window with up to 131,072 output tokens per response.

Is the Kimi K2.7 Code Highspeed API OpenAI-compatible?

Yes. Kimi K2.7 Code Highspeed serves the OpenAI-compatible Chat Completions API, so existing OpenAI SDKs work by pointing base_url at https://api.empiriolabs.ai/v1 and setting the model id to kimi-k2-7-code-highspeed.

Can I try Kimi K2.7 Code Highspeed in the browser before integrating?

Yes. The EmpirioLabs playground runs Kimi K2.7 Code Highspeed in the browser with the same parameters the API exposes, so you can test prompts before writing code.

How do I get a Kimi K2.7 Code Highspeed API key?

Create an EmpirioLabs account, then generate a key under API Keys in the dashboard. Billing is pay-as-you-go credits, so you only pay for the requests you make.

Ready to use better endpoints?

Explore our models, or contact us about business inquiries, custom deployments, or anything else.