LibSVM

LibSVMとは

  • SVM(Support Vector Machine) ツールの一つ
  • 学習が早い
  • 幾つかの種類のカーネル関数を選べる

簡単な使い方

  • 学習データを用意する(場合によっては評価データも)
    • 書式:
      クラスID 1:値 2:値 3:値 4:値 ...
    • +1 1:0.97 2:1.4 3:1 4:2 5:1.3
      -1 1:-1.2 2:0.1 3:0.1 4:-2 5:1.1 
      • クラスIDが判定させたいブール値.基本的には2値だが,LibSVMは多値分類もできる.その際はIDを増やすだけでOK.
      • クラスID以降に素性値を入力していく
      • SVMを活かすも殺すも素性次第!
  • svm-scaleで各素性値をスケーリングする
    • 学習データと評価データが同じ場合の例(Cross Validation を使う際も含む)
      $ ./svm-scale data.train > data.scale
    • 学習データと評価データが違う場合の例
      $ ./svm-scale -s data.minmax data.train > data.train.scale
      $ ./svm-scale -r data.minmax data.measure > data.measure.scale
      (学習データと評価データのスケールを同じにするため,学習データの最大値と最小値をファイルに保存することで評価データの方にも同じスケーリングを施している)
  • svm-trainで学習する
    • モデルファイルの作成
      $ ./svm-train data.train.scale
      • これでdata.train.scale.modelという名前のモデルファイルができる
    • 10-Fold Cross Validationを行う
      • 学習データの量が少ないとき,評価データを用意していないとき等に行う評価方法
      • 学習データを10個に分割して,1個を評価データ,残りの9個を学習データとして評価する
      • これを分割数(10回)行い,その平均を結果とする
        crossvalidation.png
        $ ./svm-train -v 10 data.train.scale
  • svm-predictで評価する
    • 評価データを用意しているときは,Cross Validationを行う必要はない
    • 作成したモデルファイルを利用し実際に予測を行う
      $ ./svm-predict data.measure.scale data.train.scale.model > result.txt
      • result.txt に書きだされた結果が実際に予測された結果となる
  • 実際に音声の判別に使ってみる

テーマ: 「工事中」

トップ   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS