みんなおっぱい

めんどくさい人生を楽に生きたい。楽に生きる知恵を記録するよ。おっぱい。

最近の英語の読み上げソフト(Text toSpeach) 動画に使えそうなサービスまとめ

一応、ぜんぶFree版使って確かめた。

概要

おおよそこんな感じ

  • ほぼWebアプリでPCアプリはない
  • Freeプランではダウンロード・商用利用不可
  • 月$20前後のBasicプランからダウンロード・商用利用可能
  • Basicプランは月2時間程度の生成時間しかない
  • 動画作成に使いたいならさらに上のProプラン(Basicに+数ドル~10ドル程度)の契約が現実的
  • メジャーな言語にはだいたい対応、多い時には100以上に対応している

Lovo.ai

lovo.ai

知らないで日本人が聞いたら合成音声だと気づかないくらいに自然。試した中では一番自然に聞こえる。

www.youtube.com

プラン・商用利用などについて

  • Free Trial

最初の️14日間だけお試しできる。ダウンロード・商用利用不可。

  • Basic $19(年払い) $25(月払い)

ダウンロード・商用利用OK。月2時間まで読み上げ可能。

  • Pro $36(年払い) $48(月払い)

LimitedOfferとしてこれより安い値段が公式サイトに表示されているが、割引されるのは月払いで最初の一ヶ月、年払いで最初の一年のみ。長期間使う場合は注意。

5時間まで生成可能。合成音声以外のAIツールも利用可能になる。

Speachify

speechify.com

Lovo.aiに比べると合成音声感があるが、十分に質は高い。20以上の言語に対応。PC用アプリはあるもののMac用しかない。

www.youtube.com

プラン・商用利用などについて

日本語の公式サイトはあるのだが、英語版を見るかログイン後に使える編集アプリからでないと価格表が見れない。しかも2つの価格表の内容は異なっている。

おそらくアプリの方が正しいと思われるのでそちらを掲載。

  • Free

ダウンロード・商用利用不可。10分まで生成可能。

  • Basic $24(年払い)$99(月払い)

ダウンロード・商用利用可能。年あたり50時間、1ヶ月あたり4時間ちょいまで生成可能。

生成可能時間がなぜ1年あたりなのかというと、年契約することが前提になっているから。月契約しようとすると1ヶ月$99と跳ね上がり、月契約をさせるつもりがない。

(他のサービスでも年契約の方が安いのはもちろんだがここまで値上がりするのはここだけだし、決済画面にいくまで月払い・年払いの比較ができないようになってるのもここだけ。他のサービスは価格表で比較できるようになってる)

  • Pro $32.08(年払い) $119(月払い)

年あたり100時間、月あたり8.3時間まで生成可能。200人以上の全種類の声が利用可能。

MURF.AI

murf.ai

youtu.be

抑揚や間の取り方は自然だが、音質はLobo.aiの方が綺麗。

音声キャラクターを選ぶ際に年齢でも検索できるのは珍しい。まだ子供の声はないものの、なぜか検索はできる。あとで追加されるフラグ?

プラン・商用利用などについて

  • Free

ダウンロード・商用利用不可。10分まで生成可能。

  • Basic 年払い$19 月払い$29

ダウンロード・商用利用OK。年あたり24時間、月2時間まで読み上げ可能。

無料の音楽素材がついてくる。

  • Pro 年払い$26 月払い$39

4時間まで生成可能。120人以上の全種類の声が利用可能。

SYNTHESIS

synthesys.io

youtu.be

聞けないわけではないが、合成音声感が強い。合成音声特有のノイズを多く感じる。

プラン・商用利用などについて

課金時に生成時間を選ぶタイプ。それぞれBasicとProに相当する内容になっている。

  • 100 min 年払い$19 月払い$23

Basicプラン相当。1時間40分まで生成可能。ただし個人ライセンスで商用利用不可。

  • 500 min 年払い$49 月払い$59

Proプラン相当。8時間20分まで生成可能。商用利用OK。

他サービスのProプランと比べるとはるかに長時間利用できるのが利点。

Natural Reader

www.naturalreaders.com

www.youtube.com

Lovo.aiの次くらいに自然でなめらかに読み上げるが、たまに合成音声っぽくなる。

他サービスがサービス利用を時間を基準にして制限しているのに対して、文字数で制限している

※英語は日本語より文字数が多くなる。思ったより生成できないこともあるため要注意。ちょっと試行錯誤していると数百文字は普通に使ってしまう。

プラン・商用利用などについて

他のサービスにあるようなFree, Basic, Proといったプラン構成ではなく、大まかに個人利用・ビジネス用と分かれている。

個人利用では家庭内などの限られた場所での利用、ビジネス向けでは商用利用や公共の場(ネット上など)での利用を想定している。

Naturalreaders - Checkout

  • Free

ダウンロード・商用利用不可。月あたり5000文字まで。

  • AI Voice Generator Yearly/Monthly Plan 年払い$49 月払い$99

1日あたり100万文字分までダウンロード可。大量に生成できすぎて本当に1日あたりなのか疑いたくなる……。一応、公式の支払いページでこうなっているのだが。

Download 1 million characters per day

30以上の言語、250種類以上の声を利用可能。

  • Small Business 年払い$24.5

20人以下の企業向けのプランで年払いしかできなくなるが、50%OFFになる。機能的には上記プランと変わらない。

Eleven Labs

elevenlabs.io

けっこう自然だけど声によって安定性にバラつきがありたまに暴発する。いきなり怒ったように読み上げたことがあった。

VOICEROIDのように安定性や明瞭さなどのパラメータがいじれるので、このパラメータをいじったりテキストを工夫して落ち着かせてなんとかした。

逆にいうと声によってキャラが違うのでそこはVOICEROIDっぽくて楽しい。ゲーム実況やASMRなどの用途や、strongやsoftなどの声質で声を検索することもできる。日本人におすすめかもしれない。

Natural Readerと同じで文字数制限があるタイプ。

プラン・商用利用などについて

プランが細かく別れており、商用利用可能なプランが最安で契約できる。

  • Free

ダウンロードOK・商用利用不可。月あたり10000文字まで。

  • Starter 月払い$5

ダウンロード・商用利用可能。月あたり3万文字まで。

  • Creater 月払い$22

Basicプラン相当。月あたり10万文字または2時間以内まで生成可能。

  • Independent Publisher 月払い$99

Proより1個上のプランに相当。月あたり50万文字または10時間以内まで生成可能。

まとめ

読み上げの品質、滑らかさで選ぶならLovo.aiやNatural Readerがおすすめ。

長時間しゃべらせる、お金を節約したいならBasicプランで最も生成時間が長いSpeachifyがおすすめ。

ちょっとしか使わない、声質にこだわりたいならEleven Labsがおすすめ。

SYNTHESISは音質ならLovo.aiの方が上だし、Basicプランの生成時間も他サービスに比べてやや短いしで、Freeプランの範囲内で良いところが見つけられなかった。