日本語の複雑さは、単語分割、情報検索、音声技術、固有表現認識、機械翻訳等の領域において、自然言語処理アプリ開発に大きな課題をもたらします。包括的なデータベース、特に固有名詞の不足は問題をより複雑にします。
各データベースの概要、使用分野、サンプル等は下記リンクよりご確認ください。
NLP用単言語一般語彙データベース
重要な日本語語彙のIPA音声・音韻表記
重要な日本語語彙12.6万項目の異表記
すべての屈折形、格変化形、活用形を収録