簡単に言うと: 両方とも グロック・イマジン ビデオ1.5 および クリング3.0ターボ 画像をEmpirioLabsで動画に変換します。最も低コストの480pimage-to-videoと最も幅広いアスペクト比の選択肢を求めるなら、Grok Imagine Video 1.5を選んでください。text-to-video、同期したネイティブオーディオ、または1080p出力が必要な場合はKling 3.0 Turboを選びましょう。
Grok Imagine Video 1.5 と Kling 3.0 Turbo を一目で比較
| スタッフ | グロック・イマジン ビデオ1.5 | クリング3.0ターボ |
|---|---|---|
| メイカー | xAI | クリングAI |
| モード | 画像からビデオへ | テキストからビデオ、画像からビデオへ |
| ネイティブ音声 | いいえ | はい |
| 決議 | 480p、720p | 720p、1080p |
| 期間 | 最大15秒まで | 3秒から15秒 |
| アスペクト比 | セブン | 16:9, 9:16, 1:1 |
| 価格は480ペンス | 入力画像あたり$0.096秒プラス$0.05 | 利用できません |
| 価格は720ペンス | 入力画像あたり$0.168秒プラス$0.05 | $0.18 / 秒 |
| 価格は1080pです | 利用できません | $0.225 / 秒 |
入力:画像のみ vs テキストまたは画像
最大の違いは各モデルが受け入れる内容です。Grok Imagine Video 1.5は単image-to-videoなので、アニメーションするには必ずソース画像が必要です。Kling 3.0 Turboはその両方をこなします。text-to-videoには単独のプロンプト、またはimage-to-videoにはプロンプトと画像を付与します。もし開始画像のない説明文からクリップを生成したいなら、Kling 3.0 Turboが最適です。
音声と解像度
Kling 3.0 Turboは同期したネイティブ音声を生成し、1080pに達します。Grok Imagine Video 1.5はソース画像からの動きに焦点を当て、480pおよび720pに対応し、7つのアスペクト比を提供しているため、正確なフレーム形状が必要な場合に役立ちます。音質や高解像度を求めるなら、Kling 3.0 Turboの方が適しています。
価格:5秒クリップの費用はいくらか
どちらのモデルも完成した動画の秒単位で請求し、使い分だけ課せます。Grok Imagine Video 1.5は、ソース画像ごとにフラットな$0.05を追加します。5秒クリップの費用は以下の通りです:
- Grok Imagine Video 1.5 480p: $0.53 (5×$0.096,プラス$0.05)
- Grok Imagine ビデオ1.5、720p: $0.89 (5×$0.168,プラス$0.05)
- 720pでのKling 3.0 Turbo: $0.90 (5回 $0.18)
- Kling 3.0 Turbo 1080p: $1.13 (5回 $0.225)
720ペンスで、両者は1セント以内の距離です。Grok Imagine Video 1.5は480pで最も安価な選択肢ですが、Kling 3.0 Turboは2つの中で唯一1080pに達し、音声も追加しています。
Grok Imagine Video 1.5の使用時期
- ソース画像があって、480pで最もコストが低いアニメーションを望むなら、
- 7つの広いアスペクト比の中から特定のアスペクト比が必要です。
- 音は必要なく、image-to-videoだけで十分です。
Kling 3.0 Turboの使用時期
- text-to-videoは、開始画像のないプロンプトから得たいものです。
- 同期したネイティブ音声が欲しいです。
- 1080pの出力が欲しいです。
どちらのモデルを呼び出すか
両者ともEmpirioLabs上で同じOpenAI互換非同期ビデオAPIを使用しています。ジョブを提出してください /v1/videos/generations モデルID(grok-imagine-video-1-5 または kling-3-0-turbo)、次に投票 /v1/jobs/{job_id} 終わるまで。Grok Imagine Video 1.5では、すべてのリクエストにソース画像が必要です。両方試してみてもいいですよ プレイグラウンド そして、完全なレートカードは プライシングページお問い合わせ.
よくある質問
テキストのみから動画を生成できるのはどれですか?
Kling 3.0 Turboはtext-to-videoモードで可能です。Grok Imagine Video 1.5は単image-to-videoで、常にソース画像が必要です。
どれが音が出るの?
Kling 3.0 Turboは同期されたネイティブオーディオを生成します。Grok Imagine Video 1.5は、元の画像のアニメーション化に焦点を当てています。
どちらが安いですか?
480pで、Grok Imagine Video 1.5は1秒あたり$0.096と1枚あたり$0.05フィーと最も安価です。720pでは両者はほぼ同じです。Grokは1秒あたり$0.168と1枚あたり$0.05倍、Klingは1秒あたり$0.18です。Kling 3.0 Turboは1080pを$0.225/秒で追加します。
それぞれが支持する解決策は何ですか?
Grok Imagine Video 1.5は480pと720pに対応しています。Kling 3.0 Turboは720pと1080pに対応しています。
コード内でどうやって切り替えればいいですか?
モデルIDを grok-imagine-video-1-5 または kling-3-0-turbo.どちらも同じsubmit-and-poll Video APIを使っているので、Grok Imagine Video 1.5にはソース画像が必要だ以外は何も変わりません。



