[音声処理][iOS][Objective-C][ライブラリ]OpenEars 1.6で音声認識を行う

フリーのiOS向け音声認識／音声合成ライブラリ『OpenEars』について半年ほど前に記事を書いたのですが、

フリーの iOS 向け音声認識／音声合成ライブラリ『OpenEars』の使い方 - Over&Out その後

このときのバージョンは1.3.6でしたが、2014年1月現在の最新バージョンは1.64となっています。

で、もうAPIも結構変わっていて、上記記事のコードだと動かない（ビルドエラーになる）部分も多いので、改めて実装手順を書いておきます。

ちなみに音声合成は今回は省きます。iOS7でAVSpeechSynthesizerも追加されたし、もういいかなと。。

1. フレームワーク・リソースをプロジェクトに追加

とりあえず英語の認識だけでよければ、

OpenEars.framework
AcousticModelEnglish.bundle

の２つをプロジェクトに追加します。

2. ヘッダをインポート

#import <OpenEars/LanguageModelGenerator.h>
#import <OpenEars/PocketsphinxController.h>
#import <OpenEars/AcousticModel.h>

3. 言語モデル生成

プロパティを定義しておき、

@property (strong, nonatomic) NSString *amPath;
@property (strong, nonatomic) NSString *lmPath;
@property (strong, nonatomic) NSString *dicPath;

LanguageModelGeneratorで言語モデルを生成し、プロパティに格納しておきます。

NSArray *words = @[
                   @"SUNDAY",
                   @"MONDAY",
                   @"TUESDAY",
                   @"WEDNESDAY",
                   @"THURSDAY",
                   @"FRIDAY",
                   @"SATURDAY",
                   @"QUIDNUNC",
                   @"CHANGE MODEL",
                   ];
self.amPath = [AcousticModel pathToModel:@"AcousticModelEnglish"];
LanguageModelGenerator *generator = [[LanguageModelGenerator alloc] init];
NSError *error = [generator generateLanguageModelFromArray:words
                                            withFilesNamed:@"OpenEarsDynamicGrammar"
                                    forAcousticModelAtPath:self.amPath];

if (error.code != noErr) {
    
    NSLog(@"Error: %@",[error localizedDescription]);
}
else {
    
    NSDictionary *languageGeneratorResults = [error userInfo];
    
    self.lmPath = [languageGeneratorResults objectForKey:@"LMPath"];
    self.dicPath = [languageGeneratorResults objectForKey:@"DictionaryPath"];
}

4. 各種オブジェクト初期化／プロトコル実装

ここは旧バージョンと変わってないので省略します。

フリーの iOS 向け音声認識／音声合成ライブラリ『OpenEars』の使い方 - Over&Out その後

上記記事の3, 4を参考にしてください。

5. 認識スタート

[self.pocketsphinxController startListeningWithLanguageModelAtPath:self.lmPath
                                                  dictionaryAtPath:self.dicPath
                                               acousticModelAtPath:self.amPath
                                               languageModelIsJSGF:NO];

こんな感じです。

変更箇所を見ると、全体的に音響モデルを取り替えやすくするようにAPIを変更したのかなーと感じました。

[音声処理][iOS][Objective-C][ライブラリ]OpenEars 1.6で音声認識を行う

1. フレームワーク・リソースをプロジェクトに追加

2. ヘッダをインポート

3. 言語モデル生成

4. 各種オブジェクト初期化／プロトコル実装

5. 認識スタート

Trending Articles

RealLifeCam (RLC) - Mini and Tim, Buki, Brianna - Terrace

伊東　瑛進

ゴールデン・スランバー　ザ・ビートルズ　歌詞　和訳

井上貴博アナウンサー彼女や結婚の噂は？実家や親が話題？人気は？

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

FlaR_ver1.06.zip (FlaR_ver1.06.zip)

2015年3月20日号　豊川信用金庫（3月1日付）

部落探訪(318)静岡県沼津市戸田沢海

三越伊勢丹

元AKB48・倉持明日香の胸の谷間がスゴすぎる！スタイル抜群の写真が話題に

自宅警備員2　-灰原家の血族-　攻略

☆西荻南で６棟燃える大火事、男性が死亡

モーツァルトディヴェルティメント変ホ長調 K.563 の名盤

池田連合会（木村會/神戸山口組）

[転載]宮崎県日向市暴力団で検索

【ディズニーランドパリ】日本にないオススメアトラクション13選【ウォルトディズニースタジオ】

【ビデオ】カワサキ、マン島で最高速度記録を更新した「Ninja H2R」の特集映像を公開！

荒川シルバー大学（令和4年度受講生募集）／荒川区

イベントID:0 のイベントログについて

[1080p]回復術士のやり直し 11 完全《回復》ver.