海外の相手と話すとき、「言い終わるのを待ってから訳が返ってくる」あの間(ま)が、会話のテンポを崩していたと感じたことはありませんか。
2026年6月9日、Googleが新しい音声翻訳モデル「Gemini 3.5 Live Translate」を公開しました。これは話し終わるのを待たず、話しながら連続して翻訳音声を流し続ける専用の音声モデルです。しかも、Google翻訳アプリには本日からグローバルに展開され、日本にいるあなたもすぐ使えます。70言語以上に対応し、日本語も含まれています。今日の発表内容を、Google公式情報をもとに整理しました。
法人向けAI研修の導入社数No.1(東京商工リサーチ調べ)の弊社デジライズが、生成AIの基礎知識から社内導入の6ステップ・定着のポイントまでを1冊にまとめた「はじめての生成AI社内導入ガイド」を無料で配布中です。
目次
Gemini 3.5 Live Translateとは何か——「話し終わるのを待たない」翻訳AI

Gemini 3.5 Live Translateは、Googleが「ライブの音声対音声(speech-to-speech)翻訳のための最新の音声モデル」と位置づける新モデルです。これまでの音声翻訳の多くは、話し終わったタイミングを区切りとして訳す「ターンベース」方式でした。一文しゃべる→止まる→訳が返る、の繰り返しです。
Gemini 3.5 Live Translateはこの前提を変えました。Googleの公式発表によると、このモデルは「話者の抑揚・ペース・ピッチを保ったまま、滑らかで自然な翻訳音声を生成する」とされています。機械的な棒読みではなく、元の話し方のニュアンスを残したまま訳してくれる、というのが大きな特徴です。
(出典:Fluid, natural voice translation with Gemini 3.5 Live Translate – Google Blog)
| 項目 | 内容 |
|---|---|
| 公開日 | 2026年6月9日 |
| 正体 | ライブ音声対音声(speech-to-speech)翻訳の専用音声モデル |
| 対応言語 | 70言語以上(自動検出) |
| 日本語 | 対応(Gemini APIドキュメントに言語コード ja を明記) |
| 提供チャネル | Google翻訳アプリ/Google Meet/Gemini API・Google AI Studio |
| モデル世代 | Gemini 3.5世代の音声特化モデル |
名前に「3.5」とある通り、5月のGoogle I/Oで登場した「Gemini 3.5」世代の一員ですが、文章を生成するモデルではなく、音声翻訳に特化した別系統のモデルだと理解しておくと混乱しません。
Gemini 3.5 Live Translateの3つの新機能——連続翻訳・70言語自動検出・SynthID透かし

① 話しながら連続翻訳する(ストリーミング音声翻訳)
最大の違いは、話し終わるのを待たずに翻訳音声を流し続ける点です。Googleはこれを「awkward pauses(気まずい間)」をなくす設計だと説明しています。会話の途中で訳が重なって聞こえてくるため、対面の同時通訳に近い感覚で会話を進められます。
技術的には、入力16kHz・出力24kHzの音声を、約100ミリ秒単位の細かいチャンク(かたまり)でやり取りしながら処理する仕組みになっています。「区切る」のではなく「流し続ける」ための設計です。
② 70言語以上を自動検出・声質も保持
対応言語は70以上で、しかもどの言語が話されているかをモデル側が自動検出します。話す前に「日本語→英語」と設定し直す手間がいりません。複数の言語が混ざった会話でも処理できるとされています。
さらに、前述のとおり話者の抑揚・ペース・ピッチを保ったまま訳すため、「誰が・どんなトーンで話しているか」が訳後の音声にも残ります。淡々とした通知音声ではなく、会話として自然に聞こえるのがポイントです。
③ 生成音声にSynthIDの透かしが入る
Googleは、このモデルが生成したすべての音声にSynthIDという電子透かしを埋め込むと明記しています。人間の耳には聞こえない形で音声出力そのものに織り込まれる透かしで、「AIが生成・翻訳した音声かどうか」を後から判別できるようにするための仕組みです。音声AIの悪用が懸念されるなか、出所をたどれるようにする安全側の設計と言えます。
Gemini 3.5 Live Translateが使える3つの場所——Google翻訳・Meet・API

Gemini 3.5 Live Translateは、用途の違う3つのチャネルで同時に提供が始まりました。
Google翻訳アプリ(全ユーザーに無料・日本も今すぐ)
もっとも身近なのがGoogle翻訳アプリです。Googleは「Android・iOSの両方で、Google翻訳アプリにグローバルに展開する」と発表しています。有料プランの条件は示されておらず、アプリを使っている全ユーザーが対象です。日本にいるあなたも、アプリを最新版に更新すればすぐ試せます。
Google Meet(Workspace向けプレビュー)
ビジネス利用で注目したいのがGoogle Meetへの統合です。Googleによると、Meetでは70言語以上に対応し、1つの会議のなかで2,000を超える言語の組み合わせでの会話を可能にするとしています。提供は今月から、一部のビジネス向けGoogle Workspace顧客向けの「プライベートプレビュー」として始まります。海外拠点や海外顧客とのオンライン会議が多い現場には、影響の大きいアップデートです。
Gemini API / Google AI Studio(開発者向けプレビュー)
開発者は、Gemini Live API と Google AI Studio を通じてパブリックプレビューとして利用できます。自社のアプリや電話システム、サポート窓口にリアルタイム翻訳を組み込みたい、といった用途を自前で実装できるということです。GoogleはAgoraやLiveKit、Fishjam、Pipecatといったリアルタイム通信基盤との連携も挙げています。
料金とモデル(開発者向け)

APIで使う場合のモデルIDと料金は、Google公式の料金ページで次のように示されています(出典:Gemini API Pricing – Google AI for Developers)。
| 項目 | 内容 |
|---|---|
| モデルID | gemini-3.5-live-translate-preview |
| 無料枠 | あり |
| 入力(有料) | 100万トークンあたり $3.50(音声で $0.0053/分) |
| 出力(有料) | 100万トークンあたり $21.00(音声で $0.0315/分) |
| 音声トークン換算 | 音声1秒あたり25トークン |
音声は「1秒=25トークン」で換算されるため、分単位で見ると比較的安価に試せる水準です。まずは無料枠とAI Studioで動きを確かめてから本番に組み込む、という進め方ができます。
Gemini 3.5 Live Translateが効く場面——会議・商談・現地対応

リアルタイムの音声翻訳が「待たない」レベルに上がると、あなたの仕事の進め方も変わってきます。具体的には、次のような場面で効いてきます。
- 海外拠点とのオンライン会議:Meetの会議中に、参加者それぞれの言語で会話が流れる。議事の往復が止まらない
- 海外顧客との商談・サポート:APIで自社の通話システムに組み込めば、オペレーターと顧客が母国語のまま話せる
- 出張・現地対応:Google翻訳アプリを開けば、その場の会話を話しながら訳せる。事前設定もいらない
ここで大事なのは、これが「翻訳担当者を置き換える」話というより、これまで言語の壁であきらめていたやり取りそのものを増やせる点です。海外展開やインバウンド対応を考えているなら、まず無料のGoogle翻訳アプリで体感してみるのが早いと思います。
まとめ——「話しながら訳す」が当たり前になる入口

Gemini 3.5 Live Translateの発表を整理すると、ポイントは3つです。
- 話し終わるのを待たず連続で訳す——同時通訳に近い体験が、専用の音声モデルで実現した
- 70言語超・日本語対応で、声のニュアンスも保つ——機械音声ではなく会話として自然に聞こえる
- Google翻訳アプリは今すぐ無料、Meetと開発者向けも提供開始——立場に応じて3つの入り口から使える
「リアルタイム翻訳はまだぎこちない」という前提が、ここで一段変わりました。まずはGoogle翻訳アプリで触ってみて、ビジネスで使うならMeetやAPIでの展開を追っていくのがよさそうです。
Gemini 3.5について知りたい方は、以下の記事もあわせてご覧ください。
Gemini 3.5 Flashとは?性能・料金・使い方を徹底解説
ここまで読んで「自社の海外対応や会議にこのAIを活かせそうだ」と感じた方へ。法人向けAI研修の導入社数No.1(東京商工リサーチ調べ)の弊社デジライズが提供する「法人リスキリング」の研修内容・支援の流れ・料金をまとめたサービス資料を無料でお送りしています。


