Veo 3.1はGoogleのトランスフォーマーベース動画生成モデルです。テキストプロンプトをデュアルエンコーダーアーキテクチャで処理し、一方が映像のシーン構成を、もう一方が音声同期を担当します。フレーム間のちらつきが抑えられ、唇の動きや環境に合わせたネイティブオーディオを実現します。
Veo 3.1の高度な機能を探索 — 映像品質の向上からネイティブオーディオの音声同期まで。
Veo 3.1は顔、手、テキストオーバーレイのディテールをより鮮明に描写します。フレーム間で一貫したキャラクターレンダリングにより、不自然さを軽減します。
一貫したアイデンティティを持つ高精度な顔の表現
フレーム内にテキストや数式を正確にレンダリング
髪、布地、反射のディテールが向上
Veo 3.1は動画と同じパスで音声を生成します。セリフは唇の動きに同期し、効果音は画面上のアクションに連動します。
口の動きに自動的に同期した音声
足音、ドア、衝撃など、アクションに連動した音声
エコー、風、群衆など、環境に合わせたアンビエントサウンド
Veo 3.1はプロンプトから映画業界のカメラ用語を直接解釈します。ドリーイン、クレーンショット、トラッキングショット、ラックフォーカス、ダッチアングルなどを指定すると、物理的に正確なカメラワークとして反映されます。複数のカメラ指示を1つのプロンプトで組み合わせることも可能です。
ドリー、クレーン、トラッキング、ステディカム、ラックフォーカス、ダッチアングル
実世界の物理法則に従ったカメラの加速・減速
「ドリーイン→パンレフト→2秒ホールド」のようなカメラ指示の連結
従来の動画生成モデルとVeo 3.1を差別化する高度な機能。
Veo 3.1の映像品質と音声同期が真価を発揮するプロフェッショナルなユースケース。

クライアント提案向けのシネマグレードなコンセプト映像。高精細な顔の表現により、プリビズ映像が初期プロダクションレンダーと遜色ないクオリティに。


ブランドに求められるハイクオリティな映像制作。Veo 3.1はコンバージョン率に直結する有料メディア向けの映像品質を実現します。
Omni Videoの標準ワークフローからVeo 3.1にアクセスできます。
Google Veo 3.1動画生成モデルの仕様や利用方法に関するよくある質問。
その他の機能もご覧ください。
Google最新モデルによる高精細AI動画。Basicプラン以上でご利用いただけます。