人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2013-01-01から1年間の記事一覧

2013年のまとめ

2013年の目標(2013/1/1)の続き。2013年のまとめ。 (1) 音声認識と音声合成の深耕 近年、実用化されて話題になっている音声認識や音声合成の分野を調査した。最近だとDeep Learningを使った方法がホットみたいだけれど、ベースとなる隠れマルコフモデル(HM…

L-systemで植物を描く

L-system入門(2013/11/26)の続き。前回は、L-systemで有名なフラクタルを描きましたが、今回は植物を描いてみます。植物を描くためには前回導入した記号に加えて次の2つの記号を新たに導入します。 [ : 亀の状態(位置と向き)をスタックにプッシュ ] : 亀…

L-system入門

今回は、植物の成長をモデル化したLindenmayer system、略してL-systemの実験をしてみます。ライフゲームと同じく非常に単純な規則から複雑な形状が発生する複雑系の興味深い例です。 L-system L-systemは、初期文字列と書き換え規則から構成されます。たと…

Complexity Explorer

ガイドツアー 複雑系の世界: サンタフェ研究所講義ノートから作者: メラニー ミッチェル,高橋 洋出版社/メーカー: 紀伊國屋書店発売日: 2011/11/25メディア: 単行本購入: 4人 クリック: 23回この商品を含むブログ (15件) を見るこの本はComplexity Explorer…

Open JTalkでメイちゃんにしゃべってもらう

Open JTalkで音声合成(2013/9/21)の続き。引き続き、音声合成ネタです。Open JTalkにはデフォルトで前回の男性の声しかついていません。何となくちょっとガッカリ(笑)してたんですが、MMDAgentという別のプロジェクトにメイちゃんという女性の声がついて…

Open JTalkで音声合成

前回は、音声認識エンジンJulius(2013/7/6)を試してみましたが、今回は、オープンソースで開発されている音声合成エンジンのOpen JTalkで遊んでみました。こちらも日本の大学が中心になって開発しているようです。そのわりにページが全部英語で敷居の高さ…

Juliusで連続音声認識

大語彙連続音声認識エンジンJuliusで遊んでみました。動作環境はMac OS X Mountain Lionです。 準備 コンパイラはXcodeでインストールしたgcc(2013/1/13)を使用しました。また、Macで動かす場合はPortAudioというライブラリも必要みたいなので、macportsで…

SPTKの使い方 (10) ボコーダーで遊ぼう

SPTKの使い方 (9)(2013/3/2)の続き。今回は、分析合成音のパラメータを変えることで、高い声、低い声、かすれ声、ロボット声、子供声、深い声などいろんな音声に変換してみます。この実験はSPTKのマニュアルの8章を参考にしています。 オリジナルの音声 今…

SPTKの使い方 (9) メル一般化ケプストラム分析合成

SPTKの使い方 (8)(2013/2/16)の続き。今まで紹介したメルケプストラム分析(2013/1/19)やLPC分析(2013/2/16)を一般化したメル一般化ケプストラム(Mel-Generalized Cepstrum: MGC)分析の実験をしてみます。似たような名前のパラメータがたくさんあって…

SPTKの使い方 (8) LPC・PARCOR・LSP分析合成

SPTKの使い方 (7)(2013/1/19)の続き。前回は、メルケプストラムというスペクトルパラメータを用いたメルケプストラム分析合成の実験をしました。今回は、別のスペクトルパラメータであるLPC、PARCOR、LSPを用いた分析合成を実験してみます。PARCORとLSPは…

メルケプストラム次数

SPTKの使い方 (7) メルケプストラム分析合成(2013/1/19)の続き。メルケプストラム次数を変えたときにスペクトル包絡と分析合成音がどのように変化するか実験してみました。前回書いた mcep.py というスクリプトを使います。SPTKのmcepコマンドのメルケプス…

SPTKの使い方 (7) メルケプストラム分析合成

SPTKの使い方 (6)(2012/8/5)の続き。今回は、SPTK(2012/7/1)を使って音声合成の実験をしてみました。ここで言う音声合成は、テキストを音声に変換するTTS(Text-to-Speech)ではなく、分析合成と呼ばれるものです。分析合成では、人間の音声からパラメー…

MacにHTKをインストール

音声認識・音声合成の実験をするために隠れマルコフモデルのライブラリである Hidden Markov Toolkit (HTK) をMac OS X Mountain Lionに導入した。いろいろコンパイルエラーが出てインストールに苦労したのでまとめておく。 コンパイラ macportsのgccではな…

ライフゲームの世界

ニコニコ動画の複雑系コミュニティの発起人のはむくんがライフゲームの世界というとても面白い動画を投稿されています。Twitterでは何度かツイートしてたけど完結したのでブログでも紹介させていただきます。 ライフゲームの世界1 John Horton Conwayが提案…

2013年の目標

今年の目標!今年はわりと具体的。 (1) 音声認識と音声合成の深耕 眼の実装(2009/9/28)の続き。今度は、耳と口を実装する技術ってことで音声認識と音声合成の勉強を始める。どちらも隠れマルコフモデルがベースなのでPRMLの残りの章も復習しないと(2010/8…