作業用茜ちゃん動画を作った時の備忘録と感想

１人で喋る作業用茜ちゃん.mp3及び２人で喋る作業用琴葉姉妹.mp3はこちらからどうぞ。↓

https://drive.google.com/drive/folders/1lCK2n8ObVMWMaOPhbcuPP8DN1VaEeYvI?usp=sharing

作業用茜ちゃん動画を作ったきっかけ

→寝てる時も茜ちゃんの声を聞きたくて。（作業用とは？）

chatgptが出てきたころで、話題になってた時。ふと思いついたんです。

彼に茜ちゃんを演じてもらって、ひたすら雑談してもらってそれを音声ファイルにすればラジオのようにそれなりの話として聞きつつ、幸せな気持ちで眠りにつけるんじゃないかと。じゃあ作ってみようと。そういった動機でした。

まず初めに取り掛かったのはchatgptでの文書生成から。

１人称は「ウチ」で、関西弁を使うこと。これだけ指定して適当に話してもらいました。

初めは細々と設定を定義して試行錯誤してたんですが、なかなか全部守ってくれなくて、思った通りの文章が出てこないんですよね。

結局諦めて、最低限守ってほしい１人称のウチと関西弁で話すことだけ守ってもらって自由に話してもらうことにしました。

それでも、何度か生成してると仕様上の制限か、だんだん標準語に戻ったり、１人称無視して話すようになるんですよね。

最終的に、毎回１人称と関西弁を定義しつつ、①ひとり喋り→②標準語を話す双子の妹、アオイとのエピソードトーク→③友人のユカリさんとのエピソードトーク→①ひとり喋りと違う話題をループして質問することで、大きな違和感なく使える文章が出てくるようになりました。

それから、そこそこ良い出来の文章だけつまんで、一部の口調や呼びかける時の言い方を手直しして使いました。

(今の所自分の好きな話はジャイアンの話です。)

動画の制作に使ったソフトはYMM4。

立ち絵背景BGMはそれぞれフリーのものをお借りしました。（この立ち絵がほんと好き）

慣れない動画作成だったのでいくつか壁があったんですが、

特に字幕。これがなかなか曲者で、まず自動で挿入される字幕は改行されないんですよね。

（↑A.I.Voiceで出力したそのまま字幕を生成するとはみ出す）

それから、A.I.Voice側で音声を出力する際に、設定で「１文毎に区切ってファイルを書き出す」を選択して出力したとき、

chatgptで生成したテキストの中身に"「～～～。」"のようにかぎかっこ＋句点や"！？"があると、そこで文章が区切られて変な字幕が挿入されるんですよね。

（↑理想は"「似合うかな？」"だけど、"？"で文章が終わった判定になって"」"が入らない）

（↑そして次の文章が"」"から始まってしまう。）

字幕用のtxtファイル編集すれば良いけど全部やるの大変だしなあと思いつつ、

作業用動画だし、別にいいかな、、とも思ったけど、やっぱり気になったので、

chatgptさんに聞いてみました。

とりあえず"」"から始まる字幕の違和感がすごいのでこれから。

そうしたらまあ、なんか、すごい。なんか完璧そうなコード出てきた。。

自分のパソコンがPythonを実行できる環境ではなかったので、導入して(これもchatgptさんに質問して)実行してみると、イメージ通りに動いたんですよね。

ここにさらにフォルダ内のテキストファイルをまとめて全部やってほしいと要望すると、修正されたコードが出てきて、それを実際に実行すると、フォルダの中にある"」"から始まるテキストファイルが全部ちゃんと修正されてるんですよ。この時は本当に感動しました。

ちゃんとコメントアウトもされてるので、どういう処理が行われてるのか分からなくても何となく分かるのもすごい。

これで味を占めた自分は、それぞれ、

・テキストファイル内の"「"と、"」"の数を比べて、」が少ない場合文末に」を追記するスプリクト

→「～～～。で終わるファイルに追加して「～～～。」となるようにするため。

・字幕がはみ出す限界の４０字以上の文章があった場合、読点のタイミングで改行して１行を４０字以内にするスプリクト

をそれぞれフォルダ内全てのテキストファイルに使える形で生成してもらいました。

そしてそれを順番に実行するだけで、字幕の問題を一気に修正できました。

とはいえ、それでも４行以上の改行に対応しきれてなかったり、他にも一部完ぺきではないのですが、充分自分一人で修正できる量に抑えられました。

プログラミングもほぼほぼ触ったことない自分が一人で２時間もかからずこの一連のスプリクトを作成できたんですから、chatgptは本当にすごいと思います。

（ここまで頑張ったけど、YMM4とA.I.Voiceとか上手いこと連携させたらもっとスムーズにできたのかな？）

今回、chatgptを使って生成した文章を使って動画を作成しましたが、どうなんでしょうね。

自分としては茜ちゃんの声をただダラダラと聞いてられて幸せではありますが、

話す内容はかなり割と適当で、作りこまれている訳ではないので、設定崩壊、解釈不一致等、この動画を良しとする人は少ないんじゃないかなぁと思っております。

まぁ、その辺不評だったら非公開にして自分用だけにするつもりなので、とりあえず様子見ということで、、。そもそも再生されるかすら分からんからね。

それから、chatgpt、それなりのものをポンポンと生み出すことについては優秀ですが、クオリティについてはまだまだで、特に設定を守りながら作りこませるのは難しそうだと思いました。話を作る時は、あくまでサポートする役割として活用する方が良いんでしょうね。草案を出させて、そこからブラッシュアップして作品に昇華させるという使い方が今の所理想的なんだと思います。

今回に関しては自分はchatgptから出たものをほぼそのままお届けしているので本当に何も言えませんが。

あとはプログラム作らせるのが最強ですね。今回スプリクトを使って字幕用ファイルの手直しをあれこれしましたが、何というか、人間の話す言葉と機械が話す言葉を翻訳してくれてるような、nextlevelとも言えるような何かを感じました。とにかく便利だった。

とりあえず、あと５本ぐらいは同様の動画を、あくまで個人的な作業用として作りたいなと思っております。茜ちゃんと葵ちゃんが会話してるような様子を生成するのもいいですね。

需要があるのかないのかはさっぱり分かりませんが、今回chatgptにプログラムしてもらったファイルを置いておきます。

実行するフォルダ追記してtxtファイルからpyファイルに拡張子直して使ってみてください。

（bloggerで折りたためるコードブロック置けたら便利だったんだけどなぁ）

https://drive.google.com/drive/folders/1elk4nQMwzVg8sbiSsdcJReQw2HdepGsD?usp=sharing

このブログを検索

rrsfraccのところ

作業用茜ちゃん動画を作った時の備忘録と感想

コメント

コメントを投稿

このブログの人気の投稿

見栄えとか打鍵感とか一旦置いといて最高の静音性だけを求めたボルテコンを作った - faucetwo静音化