原音設定

前準備編 /原音設定編/お役立ちツール編

クリックすることで各項目に飛びます。

前準備編は原音設定の前準備に関してのお話、原音設定編はメインである原音設定のやり方についてのお話、お役立ちツール編は原音設定の自動推定ツールの使い方などを載せています。


*原音設定の前準備* 原音設定編はこちら お役立ちツール編はこちら

ただの前準備なのですが、以下の項目に書いてあることの実行方法がよくわからないぞ!という方はいろいろクリックしてください。小さめの画像もクリックで拡大されます。

 

用語解説:原音設定

 

UTAUを起動し、oto.iniを開く
周波数表を一括作成する


*原音設定* 前準備編はこちら お役立ちツール編はこちら

原音設定本編です。あくまで池弦なりのやり方なので、これが正解!とかではないのですが、参考にしていただければまあまあ滑らかにお歌を歌ってくれる単独音が作れるかなと思います。

oto.iniを開き、適当な音素を選択して「エディタを起動」ボタンを押すと、選択した音素の波形が表示されます。「-」で縮小表示、「+」で拡大表示がされるので適宜見やすいようにいじってもOK。池弦はまず限界まで縮小表示します。

 

左右ブランクと固定範囲の設定
用語解説:左右ブランク
用語解説:固定範囲

人によって二度手間だと感じるかもしれないのですが、まず先行発声やオーバーラップは動かさず、一通り左右ブランクと固定範囲を軽く設定していきます。

この時点では各子音によってこう設定しないと~とか気にせず大雑把でいいです。どうせ後でもう一巡して細かく設定できます。

 

左ブランク:音が始まるところに設定。

右ブランク:安定した発声が終わるところに設定。

固定範囲:子音から母音に移った少し後くらいに設定。「か」って言ってるぞ!って歌ってもらう時に分かるくらいの範囲。

 

各子音に合わせてオーバーラップ、先行発声の値を設定

例えばさ行などの子音が長い音素もありますが、どんなに子音が長くても、池弦の場合先行発声は120までに留めて左ブランクで子音をぶち切っています。120以降はなんとなくもたつく気がするので。

用語解説:オーバーラップ
用語解説:先行発声

・母音(あ、い、う、え、お、ん)

先行発声、オーバーラップは共に0。先頭にエッジなどが入っている場合は左ブランクで切り落としてます。母音結合して歌ってもらう際につなぎ目の音に違和感がある気がするので。

・「いぇ」、うぁ行、や行、わ行など

比較的子音が分かりづらいやつです。慣れてくるまではスペクトラム表示をしてみたり、歌ってもらいながら調整するのが割とおススメ。

 

用語解説:スペクトラム表示


か行、た行、ぱ行など

長い場合もあるのですが、比較的子音が短いものが多い気がします。

個人の見解なんですけど、安めのマイクやダイナミックマイクとかだと子音がワンチャン表示されなかったりするかもしれないです。スペクトラム表を睨んでも子音の位置がわからない時はなんか先行発声を10~30くらいで雑に置いといても許されると思います。

この辺はオーバーラップをマイナスの値にして前の音との間に無音部分を作る派閥(?)の方もいらっしゃるのと、池弦も以前はそうしていたのですがやめました。多分好みの範囲だと思う。

・が行、だ行、ば行、ら行など

さくっと発音してほしいのでどんだけ長かろうが先行発声を40くらいに留めて左ブランクを調整しがちです。鼻濁音に関してはもうちょい下で解説してます。

・さ行、ざ行、「ち」、「つ」、は行など

息っぽい子音が長めに入ってることが多いですが、先述した通りどんだけ長くても私は先行発声を120までに留める宗派の人なのでそれに合わせて左ブランクを調整しています。

これも安めのマイクとかだとぱっと子音が見えなかったりするかもしれませんが、先行発声を30~50くらいで雑に置いておいていいと思います。


・な行、ま行、ヴァ行など

あんまり長いともたつく気がするので、先行発声を80くらいに留めて左ブランクを調整してます。

 (備考)

・「きゃ」「ちゃ」など

小さなゃゅょが入る音素は、その前の「き」「ち」などの子音とゃゅょの境目に先行発声を置いています。要は、ゃゅょは母音で、子音はいつもの子音と同じだと思って先行発声を置いておいたらいいかなって。

 

・「くぁ」「るぁ」など

各行ウ段+ぁぃぅぇぉの音素ですね。うぁ行以外の仔細をここで書きます。

 

くぁ行、ぷぁ行

か行、ぱ行などと一緒の原音設定で大丈夫です。

 

すぁ行、ずぁ行、つぁ行、ふぁ行

息っぽい子音です。さ行などと一緒の原音設定で大丈夫です。

 

ぐぁ行、ぬぁ行、ぶぁ行、むぁ行、るぁ行

な行、ま行などと一緒の原音設定で大丈夫ですが、それらよりほんの少し先行発声を長めに設定すると違いを出せる気がします。鼻濁音もこの辺と同じ原音設定でいいかも。

 


*語尾息と語頭音素*

池弦の場合母音(あ・い・う・え・お・ん)しか語尾息と語頭音素は設定していないのですが、これに関しては拘りたい場合のみ設定したらいいもの、という印象です(?)。録音でちょっと解説したのですが池弦は母音を録音するときに語尾息も一緒に録音しています。そういった録音方法により、1つのwavに対して複数の原音設定を施したい場合は「複製」という機能を使用しています。

以下左の画像のようにoto.ini編集画面で複製したい音素を右クリックすると「複製」という項目があるのでそのまま実行し、複製した音素にはエイリアス(音の名前)として「- え(えの語頭音素)」「e R(えの語尾息)」と設定しています。説明がややこしいのですが、こうすることでUTAU上で歌わせる時も「- え」「e R」と入力した場合だけそのエイリアスに入力された原音設定が反映されるようになります。

ちなみにこのエイリアス、多音階音源などを作りたいときは多用することになると思うので頭の片隅に入れておくといいかも。


・語尾息の原音設定

録音してる場合に限るのですが、なんか調声する時にそれっぽく聴こえる魔法の音素ですね。歌詞のワンフレーズが終わる頃にふっと吐く息を再現できるようなアレです。

 

先行発声は110~120までの適宜な値、右ブランクは音が終わるところで、固定範囲は音が終わるギリギリくらいまでに設定しがちです。左ブランクは先行発声に合わせてなんかいい感じのところに雑に置いてます。

・語頭音素の原音設定

たぶん声を出す前の一瞬の口を開く微かな音から声を出すところまでの表現を拘りたい人…向け…?

先行発声は50~70までの値で発声が始まった直後、オーバーラップは0~20までのところの雑な位置に置いています。


*お役立ちツール* 前準備編はこちら 原音設定編はこちら

お役立ちツールの紹介です。

 

①パラメータの推定

UTAU上で単独音原音設定を自動でざっくりやってくれる機能です。

まず、録音して周波数表だけは作成してあるような(原音設定がされていない)音源を用意してください。原音設定の画面で、以下の左の画像の赤い線で囲んだような"何もない場所"をダブルクリックすると、「パラメータの推定を行います」と表示されます。

OKを選択すれば、以下の右の画像のように勝手に原音設定をしてくれます。もちろん自動推定なので厳密な設定はされていないことが多い(※個人の感想)のですが、左右ブランクの設定などはわりとしっかりやってくれるらしいのでそっと紹介しておきます。


②setParamの自動推定

突然別ソフトの話をしてしまうのですが、setParamというUTAU音源の原音設定に特化したソフトがあります。インストール方法などは端折りますが①よりももう少し精密な自動推定をしてくれるので簡単に紹介だけしておきます。

setParamを起動するとまず最初に原音設定したい音源のフォルダ選択画面になるので、音源を選びます。その後にoto.iniを読み込むか否かの選択画面になるので、一番右の「パラメータを自動的に生成する」を選んでください。


そのあとにどんな音源のパラメータ自動推定をするかの選択画面に移るのですが、(ここは単独音の原音設定解説ページなので)「単独発声データ」を選び、特にこだわりがなければ(池弦もここはよく分からんので)次の画面で「全wavに対して実行」を選んでください。これで自動推定が始まります。のんびり待って推定が終わったら保存してソフトを閉じるか、このままsetParamで原音設定チェックをするかはお好みでどうぞ。


③周波数表の編集

「UTAUで使っていて変な音が鳴るけど原音のwavを聞いてもなんともないぞ?」

なんて時がたまにあります。そういう時は周波数表の破綻を疑いましょう。周波数表、なんと、たまにバグります。


原音設定エディタを開いたとき、黄色の線が原音のピッチ線になるのですが、左の画像のようにこれが極端に上下していたり途切れていたりしているとUTAUで使用する際ノイズのようになって音に現れてきます。

これはUTAUにデフォルトで搭載されている「周波数表の編集(周波数表の初期化の左のボタン)」という項目で直せるほか、「freqeditor」あるいは「speedwagon」という外部配布ツールで直すことができたりします。これで直らんかったら……録りなおした方が早いかも……(小声)

「周波数表の編集」機能を使う場合は左の画像のように極端に上下していたり途切れたりしているピッチ線を直すのに周波数表の編集という項目を開いたとき、右の画像のような画面が出てきます。青い点が並ぶ中で赤くなっているところが選択している音の高さになるので、空白になっていたり極端に数値が違っていたらその前後の音の高さの中間や全く同じ音の高さの数値を入力し、書き込むボタンをクリックして更新してください。

ちなみにこの左の画像のように、平均的な音の高さとして「240~250」までの数値が書き込まれているにもかかわらず、上のキーで「400」というやたら離れた数値になっている場合も確実に周波数表がバグっているので、この場合はキーも240~250の数値を書き込んで更新しましょう。

 

最後にめちゃくちゃ簡単な紹介になりますが、speedwagonはこの作業を自動でやってくれるツール、freqeditorは数値を書き込むのではなく直接ピッチ線を描き直せるツールです。