原音設定

前準備編 /原音設定編/お役立ちツール編

クリックすることで各項目に飛びます。

前準備編は原音設定の前準備に関してのお話、原音設定編はメインである原音設定のやり方についてのお話、お役立ちツール編は原音設定の自動推定ツールの使い方などを載せています。ちなみに池弦はいつも単独音の原音設定をUTAU上でやっているので、主にUTAUでの原音設定画面の画像を用いて解説しています。

 

*原音設定について*

説明がうまくないのでこれは例なのですが、「UTAU音源を録音したぞ!よーし早速歌ってもらおう!」ということでUTAUを起動し、録音した音源を選択して、歌詞を入力してみたり、ustを借りてきたりしてそのまま再生ボタンを押し歌ってもらおうとすると、以下のサンプルのように音が途切れ途切れになって再生されます。

これが、「原音設定」という作業をすることで以下のサンプルのようにそれなりに滑らかに再生されるようになります。

基本的に、音声波形を見た時子音と母音をパッと見で区別できれば何ら怖いものはない!ので、一旦その見分け方を簡単にまとめていきましょう。



上の画像をご覧ください。※クリックすると拡大できます。

一旦細かい手順をすっ飛ばしますがこちら左が「い」、右が「き」のwavの音声波形(※真ん中にある青いやつ)をUTAU上で表示している画像になります。このそれぞれの音声波形の左端を見比べて欲しいのですが、そのままの母音である「い」と違い「き」の方は子音が入っているので、赤い縦線を分かれ目にして細い線(左)と太い線(右)が切り替わっているわけですね。この赤い縦線より左側の細い波形が子音の部分です。ちなみにこの赤い縦線ちゃんには「先行発声」という名前があります。

そして本題!その原音設定について!と言いたいところなのですが追加で3点。

 

voice①UTAUのフォルダ内に「voice」というフォルダがあります。録音の流れで※のところに前述していますが、まずここに(録音したあとなど)右の画像のように原音設定したい音源をフォルダごとまとめて入れておくと様々な面で楽です。

ここに入れておかなくても一応UTAU上で原音設定したり歌わせたりは可能なのですが、いちいち探して指定して……という手間が発生するので!

 

 

②録音特化ソフトにOREMOがあるように、原音設定特化ソフトでsetPARAMという便利ツールがあります。単独音(とCVVCもほぼそうだった気がする)に関してはUTAU上の機能だけで原音設定することができるので、単独音しか作らねぇし使わねぇぜ!!って方はマジでUTAU上の機能だけで十分なのですが、慣れてきたら多音階音源(これは後ほどしっかり解説します)とか連続音とか挑戦してみたいかも!という方は入れておいて絶対に損はないです。なんと単独音と連続音に関しては原音設定の自動推定ができます。さいつよ。この場を借りて書きますいつもお世話になっております。

多音階音源について

 

③周波数表の作成

音源選択さあ新しい単語が出ましたね、周波数表!簡単に解説すると、これがない限りUTAU音源は歌を歌いません。

まず録音したUTAU音源をvoiceフォルダに移動したあと、UTAUを起動しましょう。「プロジェクト」欄の「プロジェクトのプロパティ」からデフォルト以外の原音設定したい音源を選択してOKを押してください。 音源選択画面が閉じられ、UTAU上の左斜め上に表示されているのが先ほど選んだ音源に切り替わっているのを確認したら、「ツール」欄から「原音の設定」を選ぶことでその音源のoto.iniが開かれます。

 


oto.iniを開いたら上の画像のように「編集」欄から「複数選択」を選んで、もう一度「編集」欄を開いて新しく表示された「全部選択」をクリックしてください。次にその全部選択状態でそのまま下にある「周波数表を初期化」ボタンをクリックしてください。「選択したエントリの周波数表を再作成します」と出てくるはずなのでOKを選択し、待っていると周波数表が一括で作成されていきます。

oto.ini

 

ちなみにこの周波数表一括作成、惜しみなく他のツールを使って時短を試みたい方はSpeedWagonがおすすめです。録音機器との相性によってはうまいこと作成してくれない場合もあるにはあるのですが大体の場合はこのデフォルトの周波数表一括作成より素早くいい感じに周波数表を作成してくれます。


*原音設定* 前準備編はこちら お役立ちツール編はこちら

はい!やっと本編ですね。まず原音設定において「先行発声」などを含めた各設定項目が存在するのですが、その名前をさらっと紹介していきましょう。


この画像2つ、左が原音設定済、右がなにもしていない状態の音源のエディタ画面です。
周波数表を作成の項目でoto.iniの開き方もサラッと解説しましたね。あの画面で「エディタを起動」というボタンをクリックするとこの画像のように音声波形を確認することができます。何も弄っていない状態であれば右のようなピンクやすみれ色の部分がない状態で表示されるかと思うのですが、このピンクやすみれ色部分の範囲設定、それから左端に寄っている赤と緑の縦線の位置を決めていくのが原音設定になるわけですね。

 

それぞれ超簡単に説明すると、

①赤い縦線=「先行発声」(UTAUの楽譜上で音を始める場所)

②緑の縦線=「オーバーラップ」(前の音と重ねる範囲)

③ピンクの範囲=「固定範囲」(音を伸縮させる範囲)

という名前と役割があります。

で、④すみれ色の部分は何かというと"音を使わない部分"になります。これは「左ブランク」「右ブランク」という項目で設定できます。ちなみにsetPARAMではこの左右のブランクの表示色が変わってくるのですが名前は一緒なので落ち着きましょう(?)。


こちら原音設定済みの単独音をUTAUで使用したサンプル画像になります。「さ」が一番わかりやすいかな?「さ」の左端のピンクの線が「わ」に覆いかぶさるように伸びていますね。右の画像のような位置に先行発声とオーバーラップを設定していることにより「わ」の発音最中に「さ」の子音がヌルっと入り込んで発音される仕組みになっています。「ん」は(池弦の原音設定の場合)先行発声やオーバーラップは0の値にしているので前の音と重なる範囲が一切ありません。

単独音の原音設定は前置きの部分で少し解説した子音と母音の見分けさえできればかなり楽勝です。子音と母音の間にこの先行発声をシューーーーッ!!超!!エキサイティンッ!!!みたいな作業です(※厳密には他にも色々動かします)。

 

右ブランク手順として、まず池弦は先行発声やオーバーラップを設定する前にざっくりで全部のwavに固定範囲と左右ブランクの値を設定していきます。これをやることでまずwavにある余白の無音部分を使わないように設定できるので、前述していたサンプル音声みたいにUTAUで使用する際に音が途切れ途切れになって再生される現象を(とりあえず)なくすことができます。

 

画像のように、エディタを起動すると左上に「+」「-」「s」とボタンがあるのですが、+が横幅の拡大、-が縮小のボタンなので池弦の場合は一旦-ボタンを押しまくって限界まで縮小表示にします。で、その後にエディタ内の端にカーソルを合わせると矢印が+マークに変わるので、そこでマウスを右クリックしたまま出てくる名前が「右ブランク」あるいは「固定範囲」の場合にちょいと左右どちらかへ動かしてから指を離してみてください。すみれ色、あるいはピンク色の範囲が設定できたでしょうか?できたらそれが第一歩だ!!!すごいぞ!!

エディタから原音設定をする場合、左ブランクは固定範囲を動かしてからでないと設定できないので一旦固定範囲を設定してからもう一度左端にカーソルを合わせ右クリックすると「左ブランク」という名前が出てくるかと思います。ちなみに、左端で先行発声やオーバーラップの縦線とカーソルの位置が被る状態で右クリックするとUTAUちゃんは左ブランクや固定範囲でなくそちらの設定を優先しようとしてしまうので、なるべくその線に被らない上下どちらかの端の部分で右クリックしてみてください。

 

ブランク設定で、肝心の固定範囲と左右のブランクの位置をどこに設定するか……という話に移りましょう。前提として、環境音などが入っていない場合は画像のように声のみが音声波形として青く表示されているはずです。ので、その声の音声波形と、真ん中を通るオレンジの線に注目して設定していきます。

 

①左ブランクは声がちょうど始まる位置
②固定範囲は左端から見てオレンジの線が真ん中に向けて安定し始めた位置
③右ブランクは声が尻すぼみになったりする前の適度な太さを保った上で可能な限りの右端の位置

といった感じで池弦は一旦ざっくり設定しています。ちなみに、この真ん中のオレンジの線はピッチ線(音の高さを示している線)なのですが、この線が極端にガッタガタだったり途切れてたり真ん中にいなかったりそもそも無かったりした場合はUTAU上で使うとえらい音になったりします。周波数表を作成していない場合そもそも表示されませんが、作成した上でピッチ線の様子がおかしいことになっている場合は周波数表の作成がバグったかそもそもの原音のwavにノイズが入ってるかなどのアクシデントが起こっている可能性があるので一旦wavを開いて耳で聞くなりしてください。聞いてみてノイズが入ってるかも!とか声が途中で枯れてるかも!という場合は録りなおせばOKなのですが、wavを聞いても問題がなさそうな場合はシンプルに周波数表の作成がバグってる可能性があります。周波数表の破綻と呼ばれる現象だ!周波数表も一応修正ができるので後ほど解説します(ので一旦置いといていいです)が、これが全部の音で起こってる場合はおそらく録音機器かパソコンかに何かしらの問題があるかもなのでもう有識者に相談しつつ録音環境を見直して録音し直すなどした方が良いです。

補足しておくと、囁き気味の声で録音した場合多少ピッチ線はガタガタになりますがよほど極端なガタガタ具合でない限りは気にしなくても大丈夫です。

 

この左右ブランクが一通り設定出来たらわりと声が途切れないまま歌ってもらえるようになりますが、そのままだと子音がもったりとしてしまうので、ここからが-先行発声-の出番となります(オーバーラップも設定していくよ)。

前述した通り、先行発声はUTAU上で音が始まる部分に設定していきます。オーバーラップは先行発声の3分の1くらいの値だと耳馴染みがいいらしいです。単独音の場合は子音と母音がちょうど切り替わる場所に先行発声を置いていきましょう。といってもいきなり子音と母音を見分けるのは難しいと思うので、さらっと画像付きで解説します。

 

▽母音(あ、い、う、え、お)+「ん」

母音各子音の前にまずこの音素たちですね。池弦は語頭音素と通常音素のふたつを設定していますが、一旦通常音素の方だけ解説しましょう。先行発声とオーバーラップは0の値のまま、固定範囲と左右ブランクだけ設定しています。左ブランクは音の途中に設定して先頭部分を捨て置いています。

 

 

▽さ行、は行、「ち」「つ」など

摩擦破擦カサカサした長めの子音になるかも。一番見やすい。 池弦はあんまり長すぎる子音が好きではない(???)ので先行発声の上限を120までに留めて、オーバーラップはその3分の1の40前後の値にしています。 このカサカサした子音は摩擦音と破擦音に分類されるらしいのですが、池弦は音声学に詳しくない(し、詳しくなくても原音設定はなんとかなる)ため細かい話は端折ります。ちなみに、この下に解説している破裂音たちもそうなのですが、こういう息っぽい子音は録音環境によっては波形に現れない時があります。その時は何もない虚無空間に先行発声とオーバーラップをなんとなくで置いておいても許されるでしょう。見えないもんはしょうがねえ。君はよく頑張った。

 

 

▽か行、「た」「て」「と」、ぱ行など

破裂これも比較的子音が見やすいはず。パキっとした子音になるかカサカサ……とした子音になるかは人によりけりですが「き」は特にカサカサした子音になりやすいかも。この辺は子音が破裂音と呼ばれるやつらしいです。

 

 

 

 

▽な行、ま行など

鼻音鼻音と呼ばれるやつらしいですね。もっっったりした形の子音になりやすいので、先行発声の位置が分かりにくい時は仮置きしては都度UTAU上で歌詞を入力して再生しながら調整してみましょう。池弦は子音がもったりしすぎてしまうのが好きではないので先行発声の上限を60くらいに留めています。

 

 

▽ら行

弾音弾き音と呼(ry。これオノマトペで表現するの難しいな、独特な形してるんですよね。上記の鼻音たちと同じく子音がもったりしすぎるのが嫌なので、これに関しては先行発声の上限を30くらいに留めています。

 

 

 

 

▽「いぇ」、うぁ行、や行、わ行など

半母音正直いちばん子音が分かりづらい音素なので解説にも困るんだこれ。半母音と呼ばれるやつらしいです。鼻音と同じく都度UTAU上で歌詞入力して調節するのが一番いいと思うな。

 

 

 

 

◇特殊音素について

池弦の場合母音(あ・い・う・え・お)+「ん」の6つだけ語頭音素と語尾息を設定しているのですが、これに関しては拘りたい場合のみ設定したらいいもの、という印象です(?)。録音でちょっと解説したのですが池弦は母音を録音するときに語尾息も一緒に録音しています。そういった録音方法により、1つのwavに対して複数の原音設定を施したい場合は「複製」という機能を使用しています。

以下左の画像のようにoto.ini編集画面で複製したい音素を右クリックすると「複製」という項目があるのでそのまま実行し、複製した音素にはエイリアス(音の名前)として「- え(えの語頭音素)」「e R(えの語尾息)」と設定しています。説明がややこしいのですが、こうすることでUTAU上で歌わせる時も「- え」「e R」と入力した場合だけそのエイリアスに入力された原音設定が反映されるようになります。

※ちなみにこのエイリアス、多音階音源などを作りたいときは多用することになると思うので頭の片隅に入れておくといいかも。


▽語頭音素

語頭音素先行発声は50~70くらいの値を目安にして、ちょうど音が始まるくらいの位置にしています。オーバーラップは20~30くらいかな。

口を開く音から入れたいというかなんというか、そういう好みがある人向けの音素かも。

 

 

 

▽語尾息

語尾息池弦が大好きなやつですね。これはだいたいいつも先行発声を110~120、オーバーラップを30~40の値にしています。

母音からカサカサッ……とした息の波形に切り替わるあたりに先行発声を置いてますね。固定範囲は音が終わるギリギリまで伸ばしがちです。

 

 

 

▽喉切り母音

喉切り先行発声とオーバーラップの値は語尾息と一緒でOKということにしています。固定範囲もやっぱり音が終わるギリギリまで伸ばしがちです。

 

 

 

▽ロングトーン母音

ロングトーン先頭の音は入れずに途中から。先行発声が300、オーバーラップが100くらいにしてるのですがもうここまで来ると好みの範囲ではないですか?


*お役立ちツール* 前準備編はこちら 原音設定編はこちら

お役立ちツールの紹介です。

 

①パラメータの推定

UTAU上で単独音原音設定を自動でざっくりやってくれる機能です。

まず、録音して周波数表だけは作成してあるような(原音設定がされていない)音源を用意してください。原音設定の画面で、以下の左の画像の赤い線で囲んだような"何もない場所"をダブルクリックすると、「パラメータの推定を行います」と表示されます。

OKを選択すれば、以下の右の画像のように勝手に原音設定をしてくれます。もちろん自動推定なので厳密な設定はされていないことが多い(※個人の感想)のですが、左右ブランクの設定などはわりとしっかりやってくれるらしいのでそっと紹介しておきます。


②setParamの自動推定

突然別ソフトの話をしてしまうのですが、setPARAMというUTAU音源の原音設定に特化したソフトがあります。インストール方法などは端折りますが①よりももう少し精密な自動推定をしてくれるので簡単に紹介だけしておきます。

setParamを起動するとまず最初に原音設定したい音源のフォルダ選択画面になるので、音源を選びます。その後にoto.iniを読み込むか否かの選択画面になるので、一番右の「パラメータを自動的に生成する」を選んでください。


そのあとにどんな音源のパラメータ自動推定をするかの選択画面に移るのですが、(ここは単独音の原音設定解説ページなので)「単独発声データ」を選び、特にこだわりがなければ(池弦もここはよく分からんので)次の画面で「全wavに対して実行」を選んでください。これで自動推定が始まります。のんびり待って推定が終わったら保存してソフトを閉じるか、このままsetParamで原音設定チェックをするかはお好みでどうぞ。


③周波数表の編集

「UTAUで使っていて変な音が鳴るけど原音のwavを聞いてもなんともないぞ?」

なんて時がたまにあります。そういう時は周波数表の破綻を疑いましょう。周波数表、なんと、たまにバグります。


原音設定エディタを開いたとき、黄色の線が原音のピッチ線になるのですが、左の画像のようにこれが極端に上下していたり途切れていたりしているとUTAUで使用する際ノイズのようになって音に現れてきます。

これはUTAUにデフォルトで搭載されている「周波数表の編集(周波数表の初期化の左のボタン)」という項目で直せるほか、「frqeditor」あるいは「SpeedWagon」という外部配布ツールで直すことができたりします。これで直らんかったら……録りなおした方が早いかも……(小声)

「周波数表の編集」機能を使う場合は左の画像のように極端に上下していたり途切れたりしているピッチ線を直すのに周波数表の編集という項目を開いたとき、右の画像のような画面が出てきます。青い点が並ぶ中で赤くなっているところが選択している音の高さになるので、空白になっていたり極端に数値が違っていたらその前後の音の高さの中間や全く同じ音の高さの数値を入力し、書き込むボタンをクリックして更新してください。

ちなみにこの左の画像のように、平均的な音の高さとして「240~250」までの数値が書き込まれているにもかかわらず、上のキーで「400」というやたら離れた数値になっている場合も確実に周波数表がバグっているので、この場合はキーも240~250の数値を書き込んで更新しましょう。

 

最後にめちゃくちゃ簡単な紹介になりますが、SpeedWagonはこの作業を自動でやってくれるツール、freqeditorは数値を書き込むのではなく直接ピッチ線を描き直せるツールです。