はぅ君プロジェクト > 管理人近況 > 未分類 > 音素インテグレーター 【考】
この記事は、旧システム用に書かれたものです。
本システムでは正常に表示されない可能性があります。ご了承ください。
風邪がやっと治りました。長かった…。
色、は光だから、それを解析して、RGBという3つの要素を取り出してなんとかマッピングしたことで、色を我々は自由に表現できるようになったわけです。
で、声は、波だから、それを解析して、何らかの要素に分類してマッピングできれば、いい感じになるんじゃないかなーという考察。
音声の音素表(発音表みたいな)を言語学者は持っているだろうから、まずは、それに伴った音声の波形を集めて平均化(もしくは分類)。
その後声色をパラメータ化して、全ての音声は理論上生成可能な状態にする。
最後に、言語解析機構を整えて、文章の抑揚の処理をできるようにすれば、Vocaloidみたいな感じで、Talkloidが作れないかなぁー。
もともとは、水銀燈ジェネレーターでも作ったら面白いのでは、と思って考えてはじめてみたのだけど、もし実現できたら、結構いい感じになりそう。
生成された音声情報に、圧縮されたすかしを埋め込んでおけば、セキュリティは保持されるはず。
あとは、音声を劣化させない最低限の回線を(物理的な波に変換する直前のデジタル部分で、すかしセキュリティを認証すればいいので、スピーカーはどんなに悪くてもかまわない)確保できれば、電話などの音声通信手段も詐欺されることなく使えますね。
一般的には、多分抑揚つける部分で困難してると思うので、何かいい指標を作れないものなのかなぁ…。
で、3Dアニメーション作成ツールとして、Animaloidができれば、理論上は1人で映画が作れることになる…はずなんだ(・-・)
個人の想像力が簡単に表現できるような時代になってきたのはいいこと。
大事なのは、今あるものでどれだけがんばれるか、の方なのかなぁ。
私もいつかは何かやってみたいところ。多分、この"いつか"が大事なんだなぁ…。
コメント無し
2013年もよろしくお願いいたします!
合計 | 228095 |
12/12 | 20 |
12/11 | 99 |
12/10 | 80 |
12/09 | 93 |
12/08 | 78 |
12/07 | 93 |
12/06 | 98 |
1,721,981 | 秒 |
478 | 時間 |
19 | 日 |
5.4603 | % |