INTERVIEW, TOPICS, タイトル特集

2024年1月16日

タイトルアップデート第3弾リリース直前!「EXOPRIMAL」SE・ボイス制作インタビュー②

こんにちは、タンタンです! 来る2024/1/18(木)「EXOPRIMAL タイトルアップデート第3弾」のリリースを記念して、SE・ボイス制作の裏側について、全2回に渡りインタビューをお届けします!

今回はサウンドディレクターの神田さん、リードサウンドデザイナーの宇野さん、サウンドデザイナーの鉢迫さん、三上さん、渡邊さん、東海林さん、ライさん、大野さん、サウンドプログラマーの夏苅さんにSE・ボイス面でのお話を伺いました。 上段左から、神田、宇野、大野、東海林、ライ
下段左から、鉢迫、渡邊、三上、夏苅(敬称略)
(東京開発:神田、宇野、大野、ライ、東海林、渡邊、三上、夏苅)
(大阪開発:鉢迫)

大群を描き切り、混戦をデザインする

タンタン
前回は主にサウンドコンセプトとSE制作の裏側についてお聞きしました。今回は、完全新規タイトルでのサウンド構築の裏側と「EXOPRIMAL」のゲーム性とサウンドの関係について伺いたいと思います!
「EXOPRIMAL」は完全新規タイトルになりますが、SE・ボイスの観点から、作り上げていくにあたって特にこだわった点・苦労した点等はありますか?以前のBGM編でも伺いましたが、SE・ボイスについてもお聞かせください!
神田
本タイトルの「ならでは」と自身がとらえていたのはその音響表現で、 大量描画を次世代の表現として余すことなく音で描き切ること、そして混戦をデザインし描くことの二つで、タイトルが掲げる体験を成立させるには、サウンドがとても重要な役割を担っていると考えていました。
「大群描画の表現力→混戦の音響デザイン」という順番で組み立てを考えていったのですが、ゲームルールの確立までに紆余曲折あったこともあり、大量、大群へのゲーム側のアプローチは何度も変わり、「混戦の中のゲームとしての正解、ユーザーを導く符号音」の在り方も何度も何度も作り直しをしました。

開発初期はもっと多い対戦人数であったことから、メモリ、発音数などスペック上の制約を鑑みて、ゲーム上で重要なものをまず表現し、足し算でその音響を構築、コントロールしていこうとアプローチしました。しかしこれが全く良くならなくて…(笑)。
というのもあとで大群が増える、オブジェクトも増えると予測が出来たので、そんなこんなでゲーム上の重要なものに対しても、発音への配慮やメモリへの配慮、ディティールへの配慮など、サウンドデザインも音数もアプローチが消極的になりがちで、テストを経て…全然「マッシヴ&オーバー」じゃないと、仕切り直しをしました。 方向転換を図り、思いっきり細部まで描き切る、大群は鳴らしきり、それを開発の進捗とあわせて引き算でデザインし、考えていくことで、狙った大量、大仰なフィールに音響的な手ごたえを感じられるようになりました。ちょうど彫刻の木彫りのようなイメージで、太い丸太(音の塊)から、形を削りだすようなそんなイメージです。
そして次に着手したのが混戦のデザインで、混戦の中の正解、すなわちHIT音や、操作の結果をフィードバックするSEやボイスになりますが、ゲーム上は様々なことが同時で起き、対戦と協力が行きかうゲーム性から状況も目まぐるしく変わり、常時、情報の渋滞が起きているような状態でした。

開発当初から、混戦を描くのに、選択的聴取(カクテルパーティ効果=聞きたい音に耳を傾けることができる能力)という人間に元々備わっている能力をうまくゲームで再現できないかと考えていました。プレイを解析して、必要だと思う音情報に到達できるように音量バランスや発音を整理するような機能のイメージでしたが、 現在の技術では、もちろんユーザーが何を考え、何の音が欲しいかをリアルタイムで取得することはかなり困難なので、プレイの流れやプレイ傾向を学習して動的にそれをさばくイメージでした。
実際の実装は残念ながら機械学習のようなインテリジェントではなく、手作業でシチュエーション毎に我々が想定したプリセットテーブルを無数に用意することで、音響を整理しユーザーがその時その時に欲しい音に到達しやすくする施策を行ったのですが、ある種手作業にしたことで、音響の符号化といいますか、思い切りや、 ディフォルメした外連味のようなものも含めることが出来たと感じています。大量の制御が裏で動いて、自然に聞かせるようにしているので気づきにくいと思いますが、大量発音/描画の中、プレイに必要な状況がしっかり聴認出来るようになっていることに気づいて頂けたらうれしいです。

タンタン
「ならでは」の要素である大群、混戦といったゲームスタイルはそういった取り組みによって成り立っているのですね!

表情や体の動きの機微、息の演技で全てを語る

タンタン
話題を変えて、カットシーンについても伺っていきたいと思います!
個性ある新しいキャラクターが登場する「EXOPRIMAL」のカットシーンでは、フルパフォーマンスキャプチャー(実際に役者が演技をしてボディ/フェイシャルアニメーション、ボイスを収録する手法)が採用されているそうですが、こちらはどういった狙いがあったのでしょうか?
神田
カットシーンは、繰り返されるウォーゲームとウォーゲームの意味をつなぐ目的で存在し、そこではプレイヤーの皆さんはエグゾファイターとして、仲間のクルーとともに、同じ時間、場所を共有します。
インゲームのある種、非現実的でとんでもない状況の反対として地に足のついたフィジカルな表現を求め、これら登場人物達の人間模様や感情、空気感を自然にそしてリアルに表現する目的で、採用がされました。

フルパフォーマンスキャプチャーは、ボディアニメーション、フェイシャルアニメーション、ボイス とこれら3種を同時に撮影/収音する手法になりますが、 この手法の利点は、情景に必要な演技を個別バラバラに取得するのではなく、そこで行われた各人の絡み合いやカンバセーションの空気感をまるごと取得できることです。実際の人間同士の対話も、会話がオーバーラップしたり、動きや話し方、間のとり方は人それぞれです。

バトルシーンや感情をぶつけ合うシーンにそれは顕著に生きていますが、個人的には動きのあるシーンはもちろんですが、間の取得にとても有効な手法だと思っていて、「間」すなわち空気感ですが、「緊張感のある間」「安堵のある間」など、これらが克明に表現できます。 動きはなくても、表情や体の動きの機微、息の演技で、全てを語れてしまう。撮影で演じて頂いた優れた俳優さんそれぞれが持つ演技を活かしながら、素晴らしいものになったと考えています。

神田
フルパフォーマンスキャプチャーでは撮影前段の事前設計がとても重要で、撮影後も取得したタイムラインを極力触らないことがフルパフォーマンスキャプチャーの効果を活かす秘訣ですが、 ご一緒したKal-El Bogdanove監督がとても優秀な方だったのと、グラフィックデザイナー側の尽力もあり、LAで取得したタイムラインがほぼそのまま採用されています。

ボイスはアクターの動きを妨げないようにラベリアマイク(衣服やヘッドギアなどに取り付けて声を拾う小型マイク)を使用しヘッドギアにセットして収音を行ったのですが、動きの激しいシーンなどで大きなノイズが乗ってしまったもの、追加シーンなどで「息や、呻き(Effort Voice)」の演技の収録で最低限のADR(映像が出来上がった後に部分的にボイスを収録し直す事)を実施している以外は、基本的にほぼそのままを生かしていて、臨場感と迫真の演技を支えています。空気感に着目してくだされば幸いです。

▼フルパフォーマンスキャプチャーの収録風景

タンタン
キャラクターたちの自然な空気感は、フルパフォーマンスキャプチャーあってこそなのですね!

「1000体の恐竜と仲間と共に戦う」マッシヴな状況を表現する

タンタン
今までのお話から「EXOPRIMAL」ならではの苦労や工夫をした部分が多かったことが伺えます…!
他に苦労や工夫をした部分はどういったところでしょうか?
三上
ゲームで音を鳴らす際、そのゲームのスタイルに合った鳴らし方をするためだったり、そのタイトル固有の特殊な仕様や演出がある場合に、様々な音の鳴らし方の基盤となるサウンドシステムを構築する必要があるのですが、 そのサウンドシステムの構築にはかなり苦労しました。

今までの自社コンテンツに無いゲームのスタイルで、時には1000体もの恐竜が出てくるというピーキーな仕様だったので、思い描いている音を表現するために、ゲームが組み上がっていくにつれてシステム面では壁によくぶつかっていましたね。

三上
サウンドシステム構築において苦労したポイントというのは乱戦の中いかにユーザーが欲しい音をしっかり届けられるかの部分でした。 自分と敵と味方合わせて最大10人のプレイヤーでバチバチにやり合いながら、更に大量に恐竜も出てくる、ルールを進める上で重要なオブジェクトも出てくる、リヴァイアサンも沢山喋る…という感じで、 このゲームは音を発するものがとにかく多いので、それらを整理しそれぞれの聴認性を担保しつつも、マッシヴさを感じる部分、つまり存在感や迫力は出来るだけ削ぎ落とさないためのシステムが必要でした。

サウンドシステムには、発音数の制御、恐竜の群れ表現、手応えの要であるHIT音の鳴らし方、リアルタイムでの音量調整機能などが含まれますが、これらはいずれも「マッシヴ&オーバー」を表現するにあたって重要な部分なので、 納得いくところまで突き詰めたことで、「EXOPRIMAL」の独自性である「1000体の恐竜と仲間と共に戦う」といういかにもマッシヴな状況を破綻させることなく表現出来たと思います。

ゲームのスタイルとしては前例が無く、コレといった定石が無い状態だったので、別プロジェクトのサウンドメンバーにも多くの助言を頂きながら、本当に色々なことを試し、もがきながら切り開いていったという感じでした。 最終的にサウンド表現についてやりたいことを実現出来たことについて、夏苅君はもちろん、チームのアプリプログラマーや、助けて頂いた多くの方々に感謝しています。

夏苅
プログラマー目線で言うと一番苦労したのは、恐竜の群れを表現するための仕組みでした。群れの音を表現するといっても、1000体も出てくる恐竜に対して1体1体の恐竜全てから音を鳴らしてしまうと、 発音の処理負荷が高くなってしまうので、必然的に群れの音を良い感じに鳴らすためのシステムが必要になります。
最終的には、「恐竜がガヤガヤしている音」をプレイヤーの周りに配置している音源から再生することで群れの表現を行ったのですが、このシステム自体は開発の進行により変化する、 ゲームにおける群れ恐竜の在り方にあわせて、何回も作り直すことなったので、特に印象に残っています。
タンタン
なるほど…! 何気なく聞こえる群れの表現の裏には、そういった苦労があったのですね!

リヴァイアサンボイスは人工音声!?

タンタン
ここからは話題を変えて、超重要な存在であるリヴァイアサンについてお話を伺っていきたいと思います!
大量の恐竜と敵チームのエグゾスーツと同時に対峙しながらミッションをクリアしていくという、新感覚のゲーム性が魅力の一つかと思いますが、その中でリヴァイアサンの的確なナビゲーションがとても印象的でした。
そのリヴァイアサンボイスでは人工音声(AIボイス)を採用しているとの事ですが、導入までにどういった経緯があったのでしょうか?
神田
開発中のゲームデザインの変容とあわせて、リヴァイアサンのゲームでの在り方やそのキャラクター表現は変わって行ったのですが、首尾一貫変わらないものとして、ウォーゲームのホストという役割がありました。
ホストなので、ルールやウォーゲームでのお作法を説明したり、プレイヤーの目的を説明したりといったことは今と変わらずあったのですが、新規IPの本作は、これだというゲーム性の確立までに開発は紆余曲折あり、 「PvEvP」という協力と対戦が入り混じるジャンルの複雑さや、ゲームデザインから画面上の要素が多く、ゲームルールを伝えにくい、すなわち「分かりにくい」という宿命がありました。
要素の多さはこのゲームのユニークなウリであったので、ここを最大化して、体験を成立させるには…ということで開発チームが打ち出したのがホストによるゲーム進行に寄り添った実況ナビゲーションでした。
ホスト役であるリヴァイアサンがこれをやるのは理にかなっていますが、BGM編でもお伝えしたとおり、新規IPであることから定則が存在せず、多くの要素を、ルールや遊びとして成立させるためにはトライ&エラーが必要で、 従来の音声収録ベースの段取りではこのトライ&エラーのサイクルの枷になってしまう状況がありました。
ここを高速化する目的=開発チームがより自由にゲームルールの組み上げ、感触を得て良くしていくことに集中出来るように導入したというのが背景です。 また、ワークフローだけでなく、リヴァイアサンのAIというキャラクターに深みを与える施策だとも感じておりました。

本件は、マイクロソフト様がサービスする「Azure Text To Speech」を採用し、声優「髙坂 篤志」さんの協力を得て実現しましたが、当初開発は従来の音声収録ベースで進めて、その収録したボイスを機械学習の為のアセットとして転用し、 検証を経て人工音声へ切り替えていきました。(※AIボイスは、実際の声優による演技を機械学習させ、それを用いてテキストベースでの発話を実現する仕組み。)

切り替え以降のコンテンツは、すべて高坂さんの演技を学習した人工音声でテキストベースの発話で100%実現しています。…そうなんです。もう人間が喋っていないんです。
人工音声であることに気づく人はいないのではないかというレベルで、声優さんの演技を再現しています。
最大のメリットは、開発コンテンツの最初から本番の声優さんによる演技でゲームの組み上げが試せるということですね。このメリットはここ数十年の開発をみても革命的だと考えます。 抑揚や演技スタイルには現時点ではまだまだ制約がありますが、昨今のAIの発展を鑑みると今後数年でさらに向上すると思います。
我々は「収録ベースの音声」と、その音声を用いて機械学習を行った「AI音声」の二つを同じゲームの中でハイブリッドしましたが、施策してみて収録でしか得られないものへの気づきもありまして、収録作業ってある種のライブなので、そこにいろんな人が介在して表現の選択の連続で形が出来ていくんですよね。「AI vs 人間」ということがなにかと話題になりがちですが、どちらにも強みがあり、そこは未来でも変わらない、共存していくのだろうと考えています。

タンタン
なるほど…!! 人工音声と人間による演技への気づき、興味深いですね。

▼収録したボイスを加工したリヴァイアサンボイス

▼人工音声を用いて生成したボイスを加工したリヴァイアサンボイス

タンタン
ゲームをプレイする上で非常に重要な役割があったリヴァイアサンボイスですが、開発は大変だったことがお話から伺えます…!
実装について工夫した点や苦労した点などはどういったものがありましたか?
東海林
実装においてはサウンド以外のセクションとのやり取りが一番苦労しました。
ボイスの実装は基本的にサウンドだけでは完結できず、企画にセリフの相談、グラフィックデザイナーに絵との整合性の相談、プログラマーに実装の相談、 ローカライズに多言語の相談と様々なセクションと連携する必要がありました。そのため、セクションごとの担当者と話してどういったスケジュールで完成までもっていくかという所から組み立てていきました。 もちろん、他のサウンド作業でも色んなセクションと関わる機会は多いですが特にボイスは多かった印象でしたね。

工夫した点としては、ユーザーに対して分かりやすいアナウンスにするために見る説明と聞く説明の区別をするようにしました。
ゲームルールを1~10までセリフで説明してしまうとどうしてもセリフが長くなり、聞いている側も頭に入ってこなくなります。
そこで見る情報から説明する部分と聞く情報で説明する部分を企画やグラフィックデザイナーと相談して決定しバランスを取るようにしています。

また、実装面でもプログラマーと相談しつつ、1ボイスごとに優先度や発音制限を設定し、状況によっては説明を省いたり、同じような説明が繰り返されたりしないように設定しています。 ここでも様々なセクションの方と連携して進めていたので色んな人と話してお互いに理解した物を形にしていくことが大変でしたが、完成した時の達成感の共有が関係者の方と出来た時は最高でしたね!

タンタン
ゲームの根幹部分に関する所なので苦労が伺えます…!
タンタン
人工音声による音声生成・実装のフローはどういったものだったのでしょうか?
東海林
ボイス生成から実装の作業の流れとしては、下記のような形です。
ボイスセリフの考案 → 人工音声出力用テキスト作成 → プログラムで人工音声を一括データ出力 → データの確認 → データをゲームに実装

収録ベースでのボイス作業と異なる点としては、「人工音声出力用テキスト作成する所」と「プログラムで人工音声を一括でデータ出力する所」の2点になるかと思いますが、特に出力用テキストの作成はコツを掴むのに苦労しました。というのも、実際のセリフ通りのテキストを読み上げさせようとした時、漢字の読みが違ったり、発音が意図しないものになってしまったりすることがあったので、そういった場合に調整する必要があったんです。

タンタン
とても便利な反面、使いこなすためにはコツが必要だという事ですね!
東海林
そうですね。ただ製作期間が短く済み、ゲームの仕様変化に柔軟に対応しやすいという利点にはかなり助けられました。
ゲームを作る中で最終的な形になるまでにいくつか仕様の変更が起こることが「EXOPRIMAL」は多く、仕様が変わることでセリフの内容が異なってしまったり、演出尺に収まらないことがありましたが、出力するだけで済むため、短いスパンで新しいボイスデータを作ることができました。変化柔軟に対応しやすいかつ演出に合わせたセリフをすぐに作れるのは、人工音声の強みだとこのタイトルを通して実感しました。
タンタン
なるほど~! 今話題の人工音声について興味深かったです!

ミッションの進行状況をユーザーに知らせるための音

タンタン
「EXOPRIMAL」ではゲーム中に色々なことがどんどん発生するので、アナウンスの役割は非常に大切ですね!
状況を知らせるという面でリヴァイアサンのボイス以外に工夫した点はあるのでしょうか?
ライ
各ルールで登場するデータキーなどのオブジェクトは、ボイス同様アナウンスという側面にフォーカスして制作しました。これらは各ミッションの中心的な要素であり、それを目立たせることは、各ミッションの進行状況をプレイヤーに知らせる音という意味でも非常に重要でした。
その為、ミッションの進行状況をユーザーに知らせるために重要な音については、高い周波数帯域を中心に強いアタック感のある音にして聞き取りやすくしたり、 シンセサイザーを音作りに使用して埋もれない音にしたり、という点は常に意識して音を制作しています。

例えば、データキーでいうと半透明なキューブ上の機械で状況により光るという性質があります。その設定から、半透明のキューブという材質感や発光するという部分に着目し、その部分を目立たせる要素として制作しようと考えました。
その発想からゲーム中で類似する音が比較的少なく、高い周波数帯域に特徴を持つグラス系の音をベースに、レーザーやエネルギーのようなシンセサイザー音と、電気がスパークする音といった「乱戦の中でも通りやすい音」を壊れや復活などのデータキーの重要な挙動にちりばめる構成にすることで、音の聞き取りやすさを担保しています。

また、壊れ、停止、復活などミッション進行上重要となる音に関しては、リヴァイアサンボイスと同様に周りの音を下げるダッキングをかけて、データキーのSEを「情報」としてユーザーに届ける工夫をしています。ミッション登場するオブジェクトに関しては、それぞれこういった工夫を盛り込んでいますね。

こういったSEを考える際、これらのオブジェクトはどれも現代に存在しない近未来の装置なので、実際どんな音がするのか想像するのは想像力の良い訓練になりました(笑)。

タンタン
たしかにオブジェクトの音がちゃんと聞こえてくることによって、ミッションの状況やゲームの流れがとても分かり易くなっていますね!
宇野
他にゲームの流れを理解するのに重要なポイントとしては、ミッションの開始時と終了時の演出が上げられるかと思います。
ミッション開始時はミッション内容が書かれた黄色いARのプレートに触れることで戦闘フィールドが展開され、ミッション達成時にはスローモーションになったあと「ドーン!」とマッシヴな衝撃波で全ての恐竜が死滅させられます。

実はミッション達成時の「ドーン!」という衝撃波の表現が先にあって、ミッション開始の演出は後から追加されたものです。
ミッションの開始演出を作るにあたって、毎回再生されるARのプレートに触れる音はマッシヴではなくあえて「フワーン…」という柔らかめのシンセの音からスタートさせることにしました。 飛行機のシートベルト着用のサイン音や、デパートのアナウンスの前チャイムのような、ある種、事務的でニュートラルな報知音をイメージしています。

ミッションはリヴァイアサンが用意したものであり、どのような過酷な戦闘が行われようとリヴァイアサンにとってはただのデータ収集に過ぎません。 最初は事務的にミッションに参加させられ、段々激化する状況の中で無我夢中で戦い、最後に「ドーン!」と達成のカタルシスがあるという エグゾファイター達やゲームをプレイするユーザーの感情に寄り添った流れを意識しています。

ゲームにおけるミッション開始終了における静と動のメリハリをわかりやすくするとともに、ミッションを司るリヴァイアサンの丁寧な言葉と無慈悲な行動の二面性のコントラストも出ているかなと思います。

タンタン
なるほど~! ミッション終わりのあの演出が、一つのコントラストの表現としてゲーム内にメリハリを利かせる役目を果たしているのですね!

ゲームスタイルと3Dオーディオとの相性

タンタン
「EXOPRIMAL」のゲーム性に対して工夫した部分を伺ってきましたが、この点について他にトピックはありますか?
三上
本タイトルは3Dオーディオに対応していますが、このゲームスタイルだったからこそ効果は高かったように思います。
神田
「EXOPRIMAL」はインジケートされる情報や、ゲームオブジェクトの大量描画(恐竜、敵、味方、ギミック)に対してトリガーされる音数、音の種別がめちゃくちゃ多いゲームです。

これらは、従来のTVやヘッドフォンでのステレオ出力でも状況が聴認出来るよう、サウンドがデザインされており、その音響を十分に楽しんで頂けますが、本ゲームは3D空間の中、文字通り縦横無尽に恐竜の大群が押し寄せ、 混戦の中で仲間との連携や敵との駆け引きがあったりするゲームなので、これらを余すことなく表現するのに3Dオーディオは最適でした。
特に上方向の表現が加わったことで、感じて頂きたい音による圧を飽和感なく耳に届けることや、上からの音があることで、状況判断がしやすくなり、従来の水平方向のサラウンドによる音の定位とは異なった体験を届けることが出来ていると感じています。

効果を体験頂ける場所はそこかしこにあるのですが、例えば、ダウンタウンステージのAIBIUSビルの上空から降り注ぐ大量のラプトル演出や、空を飛び交うプテラノドン。 カットシーンでのリヴァイアサンの声が中空から降り注ぐような体験だったり、もちろん演出だけでなくバトル中もこれらは有効で、敵のレーザー砲が頭の上をかすめて間一髪といったことや、 巨大な敵を見上げる大きさを感じられたり、仲間の位置が正確にわかるなど、3Dならではの体験がたくさんあります。

PS5は「Tempest 3D」を利用することで、他のプラットフォームは「Windows Sonic for Headphones」や「Dolby Atmos for Headphones」などを利用することで気軽にその体験を享受できます。3Dオーディオをあまり使ってないな…というユーザー様がいましたら、ぜひONにしてその体験の違いを感じてみて頂けたら嬉しいです。「体験が変わる!」と思っていただけると思います。さらに「7.1.4chのスピーカーシステム」を組んでみると、もっとすごい体験ができますのでぜひチャレンジしてみてください!

タンタン
話題の3Dオーディオですね! ぜひタンタンもプレイしてみたいと思います!

最後に読者の皆様にメッセージを!

タンタン
これまで興味深いお話を伺ってきましたが、最後にサウンドディレクターの神田さんから読者の皆様にメッセージをお願いします!
神田
「EXOPRIMAL」では大量発音の中でも、プレイヤーがフォーカスしたい音に耳を傾けられるように、SE/ボイスと、体験を支える様々な施策/創意工夫を行っています。 ゲーム体験ではそのことに気づかないことが光栄なことなのですが…(笑)。
ふと耳を澄まして音色や制御にも注目して視聴頂けたら我々制作冥利に尽きます。

タイトルアップデート第3弾では、既にティザーでお披露目済みのネオ・トリケラトプスがとても面白いバトルになっています!またリオレウスを楽しみに待っていらっしゃる方もおられるかと思いますが、「EXOPRIMAL」では初の飛ぶ大型エネミー、ハイトチャンネルが生きるバトルになっていますのでぜひ遊んでみてください!

タンタン
タンタンもタイトルアップデート第3弾を遊んでみたいと思います! ありがとうございました~!