みんなおっぱい

めんどくさい人生を楽に生きたい。楽に生きる知恵を記録するよ。おっぱい。

最近、話題のAI技術を少し古めのPCでざっと試した雑感想

概要

PCはコロナ少し前に18万で購入したゲーミングデスクトップPC。3Dアクションゲームは問題なく楽しめるけど、映像設定を負荷のかかる設定にすると重くなる。

ガレリア GALLERIA GXBC706 [タワー型ゲーミングPC/インテル Core i7-8700/GTX1060 3GB/メモリ 16GB/SSD 240GB/HDD 1TB/Windows 10 Home 64ビット]

あまり期待できんけど、現状でどんくらいできるかやってみた。

Stable Diffusion

一応、最低限必要なスペックは満たしていたが、くそちっちゃい画像にしないと生成できなかった。アイコンレベル。

GPUに負荷をかけない設定にしてようやくまともに動いた。

ちまたにあふてるAI生成イラストは512×512で生成して、これをまた拡大してAIに高画質化させてるらしい。

512×512設定で数十枚生成させて良さげなの選ぶ……。今の古いPCだと時間がいくらあっても足りなくなるな……。

あと設定を軽めにして呪文の試行錯誤をするにしても、時間がかかるのでキツい。雑なプロンプトだと微妙なのしか出てこない。

最低でもグラボやCPUをアップグレードないと積極的には使えないって感じだった。

ブログのサムネ用とかだったら素直に有料素材買った方が早いと思う。失敗がないし。エロ同人で儲けてた人はやっぱ高性能PCを用意したんだろうか?

RVC

中華製のAIボイスチェンジャー。音声ファイルからモデルを作って好きな声になれる。

こっちも音声データを扱うからマシンパワーがいる。

学習回数10回でお試しモデルを作成してみたら数時間かかった。寝て起きたらできてた。

お試しレベルでも声の特徴はよく出ていたものの、ボイチェン使ったのは丸わかりなので機械っぽいざらつきなんとかしたい。

ちゃんとしたモデルを作るのにだいぶ時間がかかりそう。(デフォルト設定の学習回数30回だと、1日くらいかかるのかな……?)

労力的には簡易的なボカロ作るのと大差ないわね……。当たり前だけど。

あと、リアルタイムボイチェンしようとするとラグがきつい。

既成モデルを使って音声ファイルを変換するだけなら、今のPCでも問題なさそう。多少のボイチェン感を気にしないなら同人音声作品ぐらい作れるかなーという感じ。

全体の感想

進化したAIの恩恵にあずかろうとしたら、PCのアップグレードでもサブスク契約でもいいからある程度お金をかけて本腰入れないと微妙だなあという印象。(ChatGPTにしても有料で使える4.0と無料の3.5でだいぶ違うみたいだし。)

そういえば、時間かかるイラスト生成を見ていて、ダイヤルアップ接続でじわじわイラストが表示されていく二昔前を思い出して懐かしくなった。