カテゴリー: ソフト制作

  • 俺の、俺の、俺の話を聞け!

     

     

    5秒だけでもいいーーー

     

    すいません、5秒もありません。1秒だったかしら。音が出ますのでご注意を。

    話というより声ですね。

    まあ、正確に言えば「俺の声」ではないわけですが。

    俺の声「あ」をFFT掛けて、それとフォルマント的発想を加味して正弦波で再構成したものがこれです。できるだけ簡単化するために詳細は無視してますけど。いやかなり大雑把。の割には俺の声と似ている気がしてます。ちなみに絵は・・一目瞭然ですが左が実際の声、右が合成音声です。

    ただちょっと音が硬いかな?気持ち奇数倍音落としたほうがいいかしら、とか思ってます。

    とりあえずここまでやるのにいろいろと音声関係のページを見ましたけど、結構役に立たないもんです。

    一般的に音声解析で使うフォルマントは2つか3つみたいです。見た限りすべてのページでそうなってます。

    でも、これは機械で認識する上での手段としての話であって、音声合成目的だと足りない気がしました。それだけだと僕の耳ではかなり認識しづらいんです。

    「あ」の音は700Hzあたりと1k~1.2kあたりにフォルマントがある資料がほとんどで、モノによってあとは3kあたりにもあったりしますが、これだけだとちょっと「あ」とは聞きづらいんですよ、僕。

    これに3.7k、6k、9.6k(9.6はなくても認識はできるけど、ないと今一すっきりしないので;)も足してやったらちゃんと「あ」に聞こえました。

    たぶん人間はそこまで単純な周波数分けで音聞いてないと思いましたよ、たいていの研究ほどは。

    まあそんなに複雑なことしてないんですけど。僕も。

    とはいえ一応フォルマントをきちんと意識して作ってるので、ちゃんと音階変えても「あ」に聞こえますよw

    ・・聞こえるか聞こえないかというレベルの話まあ当然で、声の個性の意味からしても高次倍音特性は必要なので、今やらなくても後でやるところだったんですけどね;;;

    データの調整は必要として、さし当たって問題と言えるのはフォルマントの形ですか。現在つりがね型(いわゆる標準偏差の曲線w)関数でやってますけど、実波形は左右不均衡にみえます。もしかするとフォルマント自体はこれで良いものの、共振波形に対しても倍音があるがゆえ右側が左側より大きい形になっている可能性もあります。ちょっとそのあたりは研究が足りてませんね。ま、いろいろ調べてみましょう。

    ・・てかこの声紋見る限り、俺の声9.6k見えるほど出てないな;;そして6kは強すぎですな;

    フォルマント全体に強すぎかな。「あ」に聞こえないのが怖いという一番陥りやすいパターンですな、これ。別に歌だったらきちんと聞こえない可能性たかいくらいなのにw

    まあこれから調整です。

  • これで簡単に報道規制がかけられます!

     

    すごいや、サム?

    ハーハッハ驚くのは早い、まずボタンを押してみるんだ!いいかい? トミー? このボタンを押すだけでいわゆる報道規制音、すなわち1kHzが簡単に鳴るんだぜ?これさえあればあのろくでなしのスティーブがとんでもないことを喋っちまってもボタンを押すだけで放送に乗らなくなる。簡単に言論統制もできるってもんさ?どうだい?

     

    ・・・本当にほしい人がいたらあげてもいいですけど(爆 

    まあ誰も面白いと思わないネタはほおって置いて、もっと誰も面白くないネタを書くことにします(ぇ

    ちょっとしたテストのために音声再生をやってみましたが、意外に問題多いんですね。他に仕事しながらではありますが、二日も無駄に使ってしまいました。

    まずどのAPIを使うかからして、問題で・・・

    XACTが一番今後はつかえそうなんですが、これがファイル読み込んで再生するしかできなかったり。最終的な成果物はこれでもできそうな気がしているんですが、実験段階だとちょっと使いにくいんです。

     

    ・・リアルタイム性は必要ないし、他のソフトの親和性からするとWaveoutでやろうかと思いましたが面倒くさくて挫折(水爆。

    最初C#とWaveOutとか致命的に大変な方法をやろうとして、面倒だからC++に移行してヤッパリ挫折、みたいな;;;

    あんたにはがっかりだ。俺です、どうもすいません。

    将来がないので、ManagedDirectSoundは考えたくなかったし、どうせ楽音目的だからVSTi作っちゃえばいいじゃん・・と思ってちょっとやって、なんとなく挫折(ぇ

    まあ、VSTiとしてつかえる音楽ツールにはなりにくいもんで、どうせだったら単独で使う上で便利なツールのほうがよくねえ?と思ったのが挫折の主な理由なんですけどね。

     

    ・・結局他のソフトとの同時使用でもDirectSoundで問題ないだろうと判断して、かつ面倒くさくないManagedDirectSoundに落ち着くわけです。将来性?まあ簡単にできるならいいんじゃね?どうせラッパークラス作るわけだし。・・がこれはこれでトラップだったり。まともな文献MSのサイトにもねえよwwww(将来性ないからやる気もないのね>M$;

    いろんなサイト参考にして動くもの作りましたとさ。結局どこもそのまんま、ってわけには行かず、ちょっとづつ参考にしてできたのがこのソフト。・・・これだけでは単にボタンを押すと1秒間1kが出るだけなので誰もほしくないでしょうw

    所詮研究のためのテスト用ソフトなんでw

     

    いやね、どっかの歌ソフトよりもっとまともな歌が歌えるソフトつくれねえかと思いましてw

     

    ま、あれが受けた理由って、変だからでしょうけどねww

     

    まともな歌が歌えたらもっと売れなかったと思いますwww

     

     

    かといってまともな歌が歌えるソフトもありそうで意外に少ない(ない?)のでニーズがないわけではないかなーと。そういう言い訳の元に、「面白そうだからやるだけじゃーーーーい」という本音が漏れまくり。

    おそらくできたとして、最初に歌うのは俺そっくりな声に決まってます。誰がほしがるんだ。まあちゃんとできたら声データをかわいこちゃんから戴くつもりでいます。アテはあるし。