Gemma 4 26B-A4B API

ジェムマ 4 26B A4B は、256K コンテキスト、テキスト、画像、ビデオ入力、ツール、構造化された出力を備えた Google のオープンマルチモーダルモデルです。

Googleテキスト生成256K コンテキストリリース Mar 31, 2026ネイティブ推論新着

About Gemma 4 26B-A4B

ジェムマ 4 26B A4B は、256K コンテキスト、テキスト、画像、ビデオ入力、ツール、構造化された出力を備えた Google のオープンマルチモーダルモデルです。

テキスト、画像、ビデオ入力、ストリーミング、関数ツール、構造化されたJSON出力、シード制御、および思考モードをデフォルトでサポートします。 erroring effort や think budget をバインドした思考や、直接の回答に対して enable thinking=false を使う。 モデルサービスによって報告されたとき、自動キャッシュ読み取りはキャッシュされた入力速度で請求されます。 Explicit キャッシュ コントロールはサポートされていません。

別名 Google Gemma 4 26B-A4B, Gemma-4-26B-A4B

reasoningvisionvideofunction callingstructured outputcachemultimodaljson modelogprobs

Gemma 4 26B-A4B specs

モデルID
gemma-4-26b-a4b
プロバイダー
Google
カテゴリ
テキスト生成
Released
Mar 31, 2026
コンテキスト長
256K tokens
最大出力
32,768 tokens
入力
TextImageVideo
出力
Text
エンドポイント
POST /v1/chat/completions
POST /v1/responses
POST /v1/messages
POST /v1/completions

Gemma 4 26B-A4B API pricingSave up to 83%

Live pay-as-you-go rates from the EmpirioLabs catalog. You are billed only for what you use, with no monthly minimum.

タイプ
仕様
料金
パスワード
1M プロンプトトークンあたり
$0.15$0.05
ソリューション
1M生成トークンあたり
$0.50$0.29
キャッシュの読み込み
1M キャッシュされた入力トークンあたり
$0.15$0.025
Web Search (Linkup)
per call when invoked
$0.013
料金ページ全体で比較

How to call the Gemma 4 26B-A4B API

Gemma 4 26B-A4B serves the OpenAI-compatible Chat Completions API. Point any OpenAI SDK at https://api.empiriolabs.ai/v1 with your EmpirioLabs API key and use the model id gemma-4-26b-a4b. Get an API key from the EmpirioLabs dashboard.

cURL
curl https://api.empiriolabs.ai/v1/chat/completions \
  -H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma-4-26b-a4b",
    "messages": [
      {"role": "user", "content": "Write a haiku about the ocean."}
    ]
  }'
Python (OpenAI SDK)
from openai import OpenAI

client = OpenAI(
    base_url="https://api.empiriolabs.ai/v1",
    api_key="YOUR_EMPIRIOLABS_API_KEY",
)

response = client.chat.completions.create(
    model="gemma-4-26b-a4b",
    messages=[{"role": "user", "content": "Write a haiku about the ocean."}],
)
print(response.choices[0].message.content)
Full Gemma 4 26B-A4B API reference

Gemma 4 26B-A4B API parameters

Request parameters supported by the Gemma 4 26B-A4B API on EmpirioLabs. Defaults apply when a field is omitted.

パラメータタイプデフォルト範囲 / 値説明
temperaturenumber10 to 2Sampling temperature. Lower values are more deterministic.
top_pnumber0.950 to 1Nucleus sampling probability mass.
max_tokensinteger40961 to 32768Maximum output tokens.
stopstring--One or more stop strings.
reasoning_effortenummediumnone, low, medium, high, maxReasoning effort. none disables thinking; low, medium, high, and max set bounded thinking budgets.
enable_thinkingbooleantrue-Enable the model reasoning channel before final output.
thinking_budgetinteger4096128 to 32768Maximum thinking tokens before the final answer. If max_tokens is lower, the service reserves room for the answer.
top_kinteger201 to 200Limit sampling to the top K candidate tokens when supported.
min_pnumber00 to 1Minimum probability threshold for token sampling.
presence_penaltynumber0-2 to 2Penalty for tokens that already appeared in the generated text.
frequency_penaltynumber0-2 to 2Penalty based on how often a token has already appeared.
repetition_penaltynumber10.1 to 2Penalty used by SGLang to reduce repeated text.
seedinteger-0 to 2147483647Optional random seed for reproducible sampling.
logprobsbooleanfalse-Return token log probabilities when supported.
8 more parameters in the docs

知っておくと便利

テキスト、画像、ビデオ入力、ストリーミング、関数ツール、構造化されたJSON出力、シード制御、および思考モードをデフォルトでサポートします。 erroring effort や think budget をバインドした思考や、直接の回答に対して enable thinking=false を使う。 モデルサービスによって報告されたとき、自動キャッシュ読み取りはキャッシュされた入力速度で請求されます。 Explicit キャッシュ コントロールはサポートされていません。

Gemma 4 26B-A4B API: common questions

How much does the Gemma 4 26B-A4B API cost?

On EmpirioLabs, Gemma 4 26B-A4B is billed pay as you go: パスワード $0.05 (was $0.15) 1M プロンプトトークンあたり; ソリューション $0.29 (was $0.50) 1M生成トークンあたり; キャッシュの読み込み $0.025 (was $0.15) 1M キャッシュされた入力トークンあたり. The live rate card on this page always matches what the API charges.

What is the context window of Gemma 4 26B-A4B?

Gemma 4 26B-A4B supports a 256K-token context window with up to 32,768 output tokens per response.

Is the Gemma 4 26B-A4B API OpenAI-compatible?

Yes. Gemma 4 26B-A4B serves the OpenAI-compatible Chat Completions API, so existing OpenAI SDKs work by pointing base_url at https://api.empiriolabs.ai/v1 and setting the model id to gemma-4-26b-a4b.

Can I try Gemma 4 26B-A4B in the browser before integrating?

Yes. The EmpirioLabs playground runs Gemma 4 26B-A4B in the browser with the same parameters the API exposes, so you can test prompts before writing code.

How do I get a Gemma 4 26B-A4B API key?

Create an EmpirioLabs account, then generate a key under API Keys in the dashboard. Billing is pay-as-you-go credits, so you only pay for the requests you make.

Ready to use better endpoints?

Check out our pricing or reach out if you want your own model deployed on our stack.