人工知能に関する断創録

人工知能、認知科学、心理学、ロボティクス、生物学などに興味を持っています。このブログでは人工知能のさまざまな分野について調査したことをまとめています。最近は、機械学習、Deep Learning、Keras、PyTorchに関する記事が多いです。



音声信号処理

ハイパスフィルタ

Pythonで音声信号処理(2011/05/14)ローパスフィルタ(2011/10/28)の続き。今回は、ハイパスフィルタを実験します。逆フーリエ変換の式が違うだけでほとんどローパスフィルタと同じなんだけどね。ハイパスフィルタは、ローパスフィルタの逆でエッジ周波数f…

ローパスフィルタ

Pythonで音声信号処理(2011/05/14)FIRフィルタ(2011/10/23)の続きです。今回は、FIRフィルタの代表例であるローパスフィルタ(LPF)を実装していきます。フィルタの設計には、Z変換という技術が必要になります。元の空間では難しい問題をZ変換で別の空間…

FIRフィルタ

Pythonで音声信号処理(2011/05/14)今回からしばらくディジタルフィルタの実験をいろいろやろうと思います。ディジタルフィルタは、 乗算器 加算器 遅延器 の3つの要素の組み合わせによって構成されます。この組み合わせ方によって、 FIR(Finite Impulse R…

ディストーション

Pythonで音声信号処理(2011/05/14)今回は、ディストーション(distortion)というサウンドエフェクトを試してみます。ディストーションは、音を極端に増幅し、わざとクリッピングを発生させることで、歪んだ(ひずんだ)音色を作る技術とのこと。普通の音…

サウンドスペクトログラムに画像を埋め込む

Pythonで音声信号処理(2011/05/14)今回は、スペクトログラムを使って遊んでみました。サウンドスペクトログラムって何って人はこちらへ。Pythonでサウンドスペクトログラム(2011/10/1)。なんとスペクトログラムに任意の画像を埋め込んだ音声が作れるとの…

Pythonでサウンドスペクトログラム

Pythonで音声信号処理(2011/05/14)今回は、さまざまな音声のスペクトログラム(spectrogram)を求めてみたいと思います。科学捜査班が声紋分析で使っているやつですね。こういうの。名前がスペクトログラムってくらいなのでフーリエ変換で求めるスペクトル…

短時間フーリエ変換

Pythonで音声信号処理(2011/05/14)今回は、短時間フーリエ変換(Short-Time Fourier Transform: STFT)を実装してみます。音声信号スペクトルの時間変化を解析する手法です。ある一定の長さの信号サンプルを切り出し、それに窓関数をかけてからフーリエ変…

ディレイとリバーブ

Pythonで音声信号処理(2011/05/14)今回は、サウンドエフェクトのアルゴリズムであるディレイとリバーブを試してみます。私は、PCで音楽を聴くとき、いつもコンサートホールのサウンドエフェクトをかけて聴いていますがそれと同じ効果を自分で実装してみた…

高速フーリエ変換(FFT)

Pythonで音声信号処理(2011/05/14)今回は、高速フーリエ変換(FFT)を試してみます。FFTとはFinal Fantasy Tactics Fast Fourier Transformの略でその名の通り、前回の離散フーリエ変換(DFT)を大幅に高速化したしたアルゴリズムです。一般にフーリエ変換…

離散フーリエ変換

Pythonで音声信号処理(2011/05/14)今回は、信号処理の肝とも言える離散フーリエ変換(Discrete Fourier Transform: DFT)を試してみようと思います。ときどき感動するアルゴリズムに出会うけれど、フーリエ変換はその一つです。最初に考え出したフーリエさ…

正弦波の合成

Pythonで音声信号処理(2011/05/14)今までは、既存の音声ファイルを再生したり、波形を見たりしてきましたが、今回は、音の波の基本となる正弦波や正弦波を合成して作れる三角波、矩形波、ノコギリ波などを自前で作って音を鳴らしてみたいと思います。正弦…

波形を見る

Pythonで音声信号処理(2011/05/14) サイン波 次は音の波をプロットして目に見えるようにしてみます。グラフの描画にはPythonのmatplotlibを使います。WAVEファイルには音をディジタル化(標本化 + 量子化)したデータがそのまま含まれているのでそれを読み…

WAVEファイルの再生

Pythonで音声信号処理(2011/05/14)まずは基本ということでWAVEファイルを再生してみます。Pythonにはwaveモジュールが用意されていてWAVEファイルの読み書き、情報の抽出はできます。しかし、waveモジュールだけでは音を再生できないのでpyaudioという別の…

Pythonで音声信号処理

今年の目標(2011/1/1)の1つに音声認識技術の深耕というのを立ててます。いきなり音声認識をやるのは知識不足でかなり大変だということが分かったので、まずは音声のいろんな性質や信号処理の技術を一つ一つ試しながら習得していくことにしました。音声信号…

last.fm

言語情報処理ポータルのコラム記事読んでいてlast.fmという面白いアプリケーションを知った。このアプリケーションはいわゆるインターネットラジオというやつで楽曲がフリーで聴ける。このラジオの特徴は選曲のパーソナライゼーションが可能なこと。流れる曲…