みんなおっぱい

めんどくさい人生を楽に生きたい。楽に生きる知恵を記録するよ。おっぱい。

目覚ましい発展をとげてる最近の音声合成ソフトまとめ

※読み上げ用の音声合成ソフトだけで歌用は含まない。

結論

音声の質だけで単純に比べた場合

VOICEPEAK >> VOICEVOX A.I.VOICE > CoeFont > CeVIO AI

無料のVOICEVOXが健闘。無料でここまで自然なのはすごい。よほど使いたいキャラがいない限りはVOICEVOXでいいと思う。

お金をかけてもいいならVOICEPEAK。めちゃくちゃ自然で感情表現も豊かになっている。

無料

VOICEVOX

youtu.be

おそらく今もっとも使われている読み上げソフト。ヒホ氏個人開発のOSSソフトウェアであり、無料で利用できる。

つい最近、激増したずんだもん解説動画の原因はこれ。他によく使われているキャラは四国めたん、春日部つむぎ、雨晴はうなど。

無料ながら質が高く、怒ったような声やリアルなささやき声なども合成できる。

ソフトをインストールしなくてもすぐに試せるWeb版

voicevox.su-shiki.com

ライセンス・商用利用について

ソフト自体は商用利用可能としているが、キャラごとに異なる利用規約を確認しておく必要がある。(ずんだもんは商用利用可)

zunko.jp

CoeFont

自分の声からAI音声を作成できるWebサービスひろゆきの声が追加されたことで一時期、話題になった。日本語のほかに英語や中国語にも対応。

hiroyuki.coefont.cloud

無料でも使えるが登録されているほとんどの声が有料。Freeプランだと女声2人、男性2人(ひろゆき他に1人)

ぱっと聞いただけだとごく自然に合成できているように思えたが、いくつかサンプルを確認すると、合成音声特有のノイズがけっこう乗っていることが多く耳触りが悪い。無料で使いたいならVOICEVOXの方がおすすめのように思う。

ただVOICEVOXと違って落ち着いたプロのアナウンサーの声が多数あるのは利点。エンタメ動画ならVOICEVOX、案内音声とか教材で使うならCoe Fontって感じかな~。プロアナウンサーの声は無料では使えないけど。

これは無料音声である女声の「アリアル」「ミリアル」を使用している実況動画。見れば分かるがVOICEVOXのずんだもんに比べると棒読みに聞こえる。もちろん、旧来のゆっくりボイスと比べるなら十分に聞ける声。

youtu.be

基本はWebで合成、デスクトップアプリ版はまだ正式リリースされておらずベータ版。

ベータ版のDL先

ライセンス・商用利用について

Standard以上のプランでないと商用利用は不可。

ただし個人で使うなら、動画の収益化や有償配布のゲームでも商用利用と見なされない。

有料

VOICEPEAK

Synthesizer VのDreamtonics社とVOICEROIDで有名なAHS社で共同開発している合成音声ソフト。合成エンジンはDreamtonics社のSyllaflowを使用している。AHS社はVOICEROIDを多数販売していたが、音声合成エンジンをSyllaflowに乗り換えたため、後述のA.I.VOICE(VOICEROIDの後継)製品を販売していない。

とにかく音声合成だと分からないくらいすごく自然。

とくにここからの怒りとクール↓(再生位置設定済)

youtu.be

中の人が苛烈な女性キャラを演じている時はまさにこんな感じ(MGSのザ・ボスとか)なんだけどVOICEROIDだった時はこういう声を作るのは難しかった。それがさらっとできちゃうのはすごい。ささやき声もリアルでドキドキする(個人の感想です)。

ライセンス・商用利用について

動画の収益化、無償配布ゲームなどの用途では特に問題ない。ただし、ケースによっては一律すべてのキャラで許可されるわけでもなくややこしい。

www.ah-soft.com

例えば、有償配布ゲームへの使用については桜乃そらだけは応相談(他のキャラはOK)。なので使用目的に応じて購入前に利用規約を確認することをおすすめする。

A.I.VOICE

株式会社エーアイが販売している読み上げ合成音声ソフト。合成エンジンは自社開発のAITalk 5.0。AITalkはVOICEROIDに搭載されているものと同じで、名前は異なるもののVOICEROIDの後継ソフトである。

というわけでVOICEROID2とA.I.VOICEの比較動画を聞いてみた。

youtu.be

うん……???あの……正直、よくわがんにゃい。

こちらの動画では「修道女」という単語についてVOICEROID版では読めず、A.I.VOICE版がテキスト修正なしにちゃんと読み上げている。

youtu.be

A.I.VOICEではいくつか新機能があったり調整の手間が軽減されている、ということらしい。ただ、合成された音声だけで比較するとそれほど大きな違いはなく、VOICEPEAKの方が何歩も前に行っていると感じる。

ライセンス・商用利用について

個人なら動画の収益化、音楽・ゲームの無償配布などはOK。

aivoice.jp

キャラクターの使用については、サードパーティ製のキャラは各社のサイトを確認する必要がある。

CeVIO AI

www.youtube.com

CeVIO AIとは名古屋工業大学発のベンチャー企業と他数社によって進められているCeVIOプロジェクトから生まれた音声合成ソフト。読み上げ、歌どちらにも対応。

以前に販売されたCeVIOではかなり機械音声がかなりキツかったのだが、CeVIO AIになって自然な発話になり、学習元になった人の声が感じ取れるようになっている。とはいえ……VOICEPEAKに比べると……見劣り(聞劣り)してしまう。

↓無印とAIの比較。無調整でもだいぶ聞き取りやすくなっている。

www.youtube.com

ライセンス・商用利用について

CeVIOプロジェクトのキャラクター「さとうささら」「すずきつづみ」「タカハシ」のライセンスに関して、個人のクリエイターを応援するためとして動画の収益化やゲーム・音楽などの販売も認めている。

cevio.jp

ただし、用途によっては無料の利用登録が必要。サードパーティ製のボイスについては各社のサイトを参照とのこと。