LibSVM のバックアップ(No.2) - 音声メモ

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
LibSVM へ行く。
- 1 (2013-05-30 (木) 12:17:35)
- 2 (2013-05-30 (木) 12:26:31)
- 3 (2013-11-03 (日) 23:21:08)
- 4 (2013-11-07 (木) 16:20:22)
- 5 (2013-11-08 (金) 17:08:31)
- 6 (2013-11-13 (水) 17:39:05)
- 7 (2013-11-23 (土) 16:56:35)
- 8 (2014-06-12 (木) 17:20:34)

LibSVM †

LibSVMとは †

SVM（Support Vector Machine) ツールの一つ
学習が早い
幾つかの種類のカーネル関数を選べる

簡単な使い方 †

学習データを用意する（場合によっては評価データも）
- 書式:
```
クラスID 1:値 2:値 3:値 4:値 ...
```
- 例
```
+1 1:0.97 2:1.4 3:1 4:2 5:1.3
-1 1:-1.2 2:0.1 3:0.1 4:-2 5:1.1 
```
  - クラスIDが判定させたいブール値．基本的には2値だが，LibSVMは多値分類もできる．その際はIDを増やすだけでOK．
  - クラスID以降に素性値を入力していく
  - SVMを活かすも殺すも素性次第!

svm-scaleで各素性値をスケーリングする
- 学習データと評価データが同じ場合の例（Cross Validation を使う際も含む）
```
$ ./svm-scale data.train > data.scale
```
- 学習データと評価データが違う場合の例
```
$ ./svm-scale -s data.minmax data.train > data.train.scale
$ ./svm-scale -r data.minmax data.measure > data.measure.scale
```
  （学習データと評価データのスケールを同じにするため，学習データの最大値と最小値をファイルに保存することで評価データの方にも同じスケーリングを施している）

svm-trainで学習する
- モデルファイルの作成
```
$ ./svm-train data.train.scale
```
  - これでdata.train.scale.modelという名前のモデルファイルができる
- 10-Fold Cross Validationを行う
  - 学習データの量が少ないとき，評価データを用意していないとき等に行う評価方法
  - 学習データを10個に分割して，1個を評価データ，残りの9個を学習データとして評価する
  - これを分割数（10回）行い，その平均を結果とする
```
$ ./svm-train -v 10 data.train.scale
```

svm-predictで評価する
- 評価データを用意しているときは，Cross Validationを行う必要はない
- 作成したモデルファイルを利用し実際に予測を行う
```
$ ./svm-predict data.measure.scale data.train.scale.model > result.txt
```
  - result.txt に書きだされた結果が実際に予測された結果となる

実際に音声の判別に使ってみる

テーマ: 「工事中」 †