アラビア語の複雑さは、単語分割、情報検索、固有表現抽出、機械翻訳等の分野で、自然言語処理アプリ開発に大きな難題を突き付けます。
包括的なデータベース(特に固有名詞)と標準的な表記を網羅するデータベースの不足は大きな課題となっています。CJKIはNLPアプリの精度と信頼性を高めるため、多様なアラビア語データベースの開発を続けてきました。
各データベースの概要、使用分野、サンプル等は下記リンクよりご確認ください。
重要なアラビア語語彙の音韻表記
すべての屈折形、格変化形、活用形を収録
アラビア語の規則的と不規則な複数形を幅広く網羅
一般用語、固有名詞、専門用語