【レビュー】社内動画担当者のユウウツを解消! 商用可のAI合成音声の定番『VOICEPEAK(ボイスピーク)』の使用感

レビュー

「モヤモヤさまぁ~ず」(テレビ東京)などのテレビ番組や、SNS、YouTubeの実況系動画でもよく使われる合成音声のナレーション。その中で老舗の商用利用可能な定番ソフトと言えばAHS『VOICEPEAK(ボイスピーク)』。新製品『VOICEPEAK 商用可能 6ナレーターセット 女性5/男性5/男性6』も好評な同製品で、実際に会社用の動画制作をしてみました。

「これまでは自分で原稿を読んで音声を録音していた」社内動画担当者の作業量は増えるばかり

筆者は「特選街web」のお仕事だけでなく、運営元の出版社「ブティック社」の動画制作全般も担当しています。今までは制作した動画の字幕キャプションに合わせて原稿を読み、自分でナレーションも録音していました。この音声録音、簡単に思えていろいろな問題が発生します。

質の良いマイクの準備、静かな録音スペースの確保なども大切ですが、国語の音読が苦手だった筆者にとっては「台本を読んでいて何度も噛んでしまう」「素人のナレーションなので滑舌(かつぜつ)が心配」など、問題点を挙げればキリがありません。

 

また、社内チェックをしていくうちに追加の字幕修正が入ると、テキストと共に音声も撮り直すことも。すると録音日が違うと、微妙に音質が変わってしまうのです! 結果、やり直し…。動画の音声作りは、こうした作業量の多さが悩みの種でした。

 

作業は多くてもこれも楽しみながらやっていたのですが、やはりたくさんの動画を限られた時間の中で作りたいとなると無理があります。なにか解決策がないものか…。


そんな矢先、機会があって自然な声でテキストを読み上げてくれる合成音声ソフト、AHS『VOICEPEAK(ボイスピーク) 商用可能ナレーター』(ダウンロード版・税込11,980円・発売中)をメーカーよりサンプル提供いただいたので、実際の動画編集作業に取り入れ、使い勝手とサンプル音声動画を交えて紹介したいと思います。

目下の最新版は『VOICEPEAK 商用可能 ナレーター 女性5/男性5/男性6』(ダウンロード版・税込11,980円・2024年2月29日発売)。AHSはボーカロイドソフトウェアなども含め、クリエイティブ系ソフトウェア製品を数多く手がける老舗メーカーの1つだ

『VOICEPEAK(ボイスピーク)』を使ってみた【基本操作編】/テキストを入れるだけでほぼ調節なしでもスムーズに読み上げてくれる!

ソフトを起動すると、パッと見でなんとなく操作性がわかるシンプルイズベストな操作画面がまず気に入りました。難しい専門用語やボタンで埋め尽くされているということはなく、イラストアイコンや簡単な単語表示のバーが並んでいます。

 

まずは読み上げて欲しい原稿を用意します。あらかじめテキストファイルなどで作成しておくと作業がしやすいのでおすすめ。ソフトを起動したらコピー&ペーストでもいいですしメニューのインポートからも原稿を入れられます。

 

下記の動画から入れた原稿を再生してみましょう。

こちらの動画はテキストを入れただけ、なにも調節をしていない状態の音声です。(『VOICEPEAK 商用可能 6ナレーターセット』[女性2]のボイスを使用)

 

最初にこの入れただけの音声を聴いた時にはあまりのスムーズさにびっくりしました。これが機械音声!?と。それぞれの単語の発音、文と文のつなぎもなめらか、これを数年前に聞いていたら機械音声だって言われても信じなかったかもしれません。

 

ただインポートするだけでもかなり理想に近い音声で再生してくれます。しかも美しくて落ち着きがあり、安定した声で動画の内容がしっかり入ってきそうな音声です。動画のクオリティも上がります。

レビューをするにあたり、いろいろな原稿をインポートさせて再生しましたが、当たり前ですが話し言葉のようなテキストは調節があまりいらないくらいまで自然に読み上げてくれる印象です。

 

少し調節が必要かなと感じたのは数字や日にち、あまりメジャーではない単語です。筆者の扱っている動画では手芸の専門用語などが登場するのでそのあたりは、のちにご紹介する発音調節が必要になってきます。

 

次に右のツールバーで感情やスピード、ピッチを調節することができるので動画に合わせて変更します。

 

声の感情はこちらの動画で聴き比べられます。

 

発音が違いや、音引き風に読んで欲しい場合は下に表示されている「アクセント」と「イントネーション」と「長さ」を調節していきます。すらすらとあまり抑揚なく読む音声を希望している筆者はとくに「イントネーション」を少し触るくらいで済んでしまいます。

それぞれ読み方の上にある丸のバーを掴んで上下に動かし、希望のイントネーションに近づけます。

試しに調節したものをお見せします。「あの日は、キラキラと眩しく光る夏の空だった」という一文の「イントネーション」を調節した動画はこちら

こちらの動画だと「キラキラ」という単語に少し違和感を感じたのでこの部分の「イントネーション」のバーを動かします。自分でどんなイントネーションにしたいか、実際に口に出して音を出してみると自然とどんな風に調節したらよいのかがわかります。

 

調節が完了したら「メニュー」から「書き出し」をします。
保存したデータを使って動画編集ソフトで動画を作ります。

 

『VOICEPEAK(ボイスピーク)』を使ってみた【実践編】/筆者が制作した動画はこちら!

けっこう良いできだと思いませんか(自画自賛)。

これは動画を編集中の一コマ。(動画編集ソフトにもよるけれど)テキストをデータで書き出しできるものもあるので、それをそのまま『VOICEPEAK』にコピーして使うことも可能です。

 

『VOICEPEAK(ボイスピーク)』を使ってみた【ワンポイント編】/あってうれしかったのはこの機能!

テキスト内でよく出てくる単語のイントネーションに違和感があるとき、毎回同じように直さなくてはいけないのは面倒です。そんな時は「辞書」機能で単語のアクセントを登録しておくことができます。

 

また、対話形式で編集することもできます。いろいろな人物を登場させたい場合はこのように、セリフブロックを作ってブロックごとに人物を変更すると対話しているような音声を作ることができます。

 

さらに、タイムスタンプ設定もできるのでセリフとセリフのあいだ00秒あけたい、という場合も簡単に設定することができます。

 

動画に合わせたナレーターがいろいろ選べる!

同じ動画でも声色が違うと与える印象も違ってくると感じます。高めの女性の声、落ち着きのある大人の女性の声、説得力のある男性、穏やかな大人の男性の声。それぞれ動画が伝えたい印象に合った声色を選ぶのがポイントだと感じます。

 

『VOICEPEAK』は6人のボイスが使えるセットでの販売もあります。

『VOICEPEAK 商用可能 6ナレーターセット』(Windows・macOS・Linux対応・税込23,800円・ダウンロード発売/パッケージ版も有) 6人のナレーター(男性3名、女性3名)に加えて幼い「女の子」の声も収録されており、様々な声のバリエーションで読み上げが可能。ダウンロード版とパッケージ版での販売があります。

何人も人物が登場する物語風の動画など多くの声色を1本の動画内で使い分けたい方や、印象の違うナレーションをつけた動画を何本か作りたい方にも嬉しいですね。音声のサンプルは公式サイトで聞くことができますのでぜひ聴き比べてみてください。

 

また、このナレーターを使って作る動画は商用可なので、筆者のように会社のプロモーション動画や製品紹介動画などを作りたい方やYouTubeで配信したい方にはぴったりだと思います。

公式サイト

PR

【ドライブ中に純正ナビでテレビ視聴!】データシステム・テレビキットシリーズから最新車種対応のカー用品『TTV443』が登場!
長時間のドライブで同乗者に快適な時間を過ごしてもらうには、車内でテレビや動画を視聴できるエンタメ機能が欠かせない。しかし、純正のカーナビは、走行中にテレビの視聴やナビ操作ができないように機能制限がかけられているのがデフォルト……。そんな純正...

PRガジェット