使えるRecog

Recogとは

  • Juliusのプラグインとして動作させた時に,専用のコールバック関数から引き出せる巨大な構造体.
  • この中にJuliusが出力する主要なデータ(音声認識結果,入力音声,設定状況など)が格納されている.
  • Recogを使いこなせれば活用の幅がぐっと広がる.

Recogの欠点

  • あまりに巨大な構造体ゆえ,どこに何のデータが入っているかがわかりづらい.
  • 詳しいドキュメントも公式を除けばあまりない.

Recogの使い方

  • Juliusのコールバック関数内では引数から使える(あらかじめ関数を登録しておくこと)
  • プラグインの場合,int startup(void *data)を定義し,関数内で引数をRecog型にキャストすることでも使える
  • Recogのポインタが一度わかってしまえば,Recog型のグローバルポインタ等を経由してあらゆるところからRecogを参照できる

使えるRecogメモ

  • recog 構造体(ルート)
    • SP16 *speech
      • short型(16bit)の入力音声データ
      • adin_postprocess() からも同様のデータを取得できる.この関数内では直接音声データを書き換えて音声認識を行うことが可能
      • サンプル数はint speechlen (recog->speechlen) でOK
    • adin 構造体(recog->adin)

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2013-12-09 (月) 15:47:10 (2549d)