日本語語彙データベース

約29万項目を収録

自然言語処理アプリ向けに最適化

文法情報と音韻情報を提供

概要

日本語語彙データベース(JLD: Japanese Lexical Database)は、詳細な文法属性を提供する包括的な単言語語彙データベースです。収録する一般語彙は自由形と拘束形を含め約29万項目に上り、日本語におけるあらゆる屈折、派生、形態素を認識するために必要な多数の接辞、助詞、助動詞、活用形を網羅します。自然言語処理ソフトに組み込むことで、語彙辞書に載ってない屈折・活用・派生で出来た語句の認識を容易にします。

JLDは経験豊富な日本語編集チームと言語学者が10年をかけて編纂したデータベースで、日本語の自然言語処理と情報処理分野に大きく貢献しています。

主な特徴

音韻情報

平仮名とローマ字表記等

文法情報

品詞等を収録

形態素情報

派生接辞と活用形等

日本語語彙データベース

JapaneseKanaPOSSubConj.Type
買いあおるかいあおるV5R
買い煽るかいあおるV5Rt
買煽るかいあおるV5R
改悪かいあくVNt
買いあげかいあげNC
買い上げかいあげNC
買上かいあげNC
買上げかいあげNC
買いあげるかいあげるV1
買い上げるかいあげるV1St
買い上げるかいあげるV2
買上げるかいあげるV1
買いあさるかいあさるV5R
買い漁るかいあさるV5Rt
買い漁るかいあさるV4
買漁るかいあさるV5R
貝合かいあわせNC
貝合せかいあわせNC
貝合わせかいあわせNC
介意かいいVNt
会意かいいNC
解頤かいいNC
怪異かいいAN2
怪異かいいNC
魁偉かいいAN0
魁偉かいいAN2
海尉かいいNC
痒いかいいAJ
海域かいいきNC
海域礁かいいきしょうNC
海域制御かいいきせいぎょNC
海域利用かいいきりようNC
魁偉さかいいさNC
買い急ぐかいいそぐV5Gt
飼い犬かいいぬNC
飼犬かいいぬNC
飼い犬に手を噛まれるかいいぬにてをかまれるV1
飼犬に手を噛まれるかいいぬにてをかまれるEJ
買いいれるかいいれるV1
買い入れるかいいれるV1St
買い入れるかいいれるV2
買入れるかいいれるV1
会員かいいんNC
拐引かいいんVNt
改印かいいんVNi
海員かいいんNC
開院かいいんVNr
誨淫かいいんNC
会員会社かいいんがいしゃNC
海員組合かいいんくみあいNC
会員券かいいんけんNC
会員権かいいんけんNC
会員権商法かいいんけんしょうほうNC
会員証かいいんしょうNC
会員数かいいんすうNC
会員制かいいんせいNC
会員組織かいいんそしきNC
海芋かいうNC
買いうけるかいうけるV1
買い受けるかいうけるV1St
買い受けるかいうけるV2
買受けるかいうけるV1
買い埋めるかいうめるV1
買埋めるかいうめるV1
海運かいうんNC
開運かいうんNC
海運局かいうんきょくNC
海運業かいうんぎょうNC
海運同盟かいうんどうめいNC
カイエかいえNC
快泳かいえいNC
開映かいえいVN
改易かいえきVNt
快演かいえんVN
海塩かいえんNC
海淵かいえんNC
開園かいえんVNr
開宴かいえんVN
開演かいえんVNi
海王星かいおうせいNC
貝覆かいおおいNC
貝覆いかいおおいNC
買い置きかいおきVN
買置かいおきVN
買置きかいおきVN
壊屋かいおくNC
買い置くかいおくV5K
買置くかいおくV5K
飼い桶かいおけNC
飼桶かいおけNC
買いオペかいおぺNC
買オペかいおぺNC
買いオペレーションかいおぺれーしょんNC
買オペレーションかいおぺれーしょんNC
介音かいおんNC
快音かいおんNC
怪音かいおんNC
海温かいおんNC
開音かいおんNC
開音節かいおんせつNC
会歌かいかNC
怪火かいかNC
開化かいかVNi
開架かいかVN
開花かいかVNi
階下かいかNC
諧和かいかVNi
怪々かいかいAN0
怪怪かいかいAN0
恢々かいかいAN1
恢恢かいかいAN1
恢恢かいかいAN2
開会かいかいVNr
開会式かいかいしきNC
買いかえすかいかえすV5S
買い返すかいかえすV5St
買い返すかいかえすV4
買返すかいかえすV5S
買い換えるかいかえるV1
買い替えるかいかえるV1
買換えるかいかえるV1
買替えるかいかえるV1
買替るかいかえるV1
開花期かいかきNC
改革かいかくVNt
海角かいかくNC
買い掛けかいかけNC
買掛かいかけNC
買掛けかいかけNC
買い掛け金かいかけきんNC
買掛け金かいかけきんNC
買掛金かいかけきんNC
開花前線かいかぜんせんNC
買い方かいかたNC
買方かいかたNC
快活かいかつAN0
快活かいかつAN2
快豁かいかつAN0
快豁かいかつAN2
快闊かいかつAN0
快闊かいかつAN2
開豁かいかつAN0
開豁かいかつAN2
快活さかいかつさNC
開化どんぶりかいかどんぶりNC
開化丼かいかどんぶりNC
買いかぶりかいかぶりVN
買い被りかいかぶりVN
買被かいかぶりVN
買被りかいかぶりVN
買いかぶるかいかぶるV5R
買い被るかいかぶるV5Rt
買い被るかいかぶるV4
買被るかいかぶるV5R
開花ホルモンかいかほるもんNC
買い為替かいかわせNC
買為替かいかわせNC
会館かいかんNC
会舘かいかんNC
快感かいかんNC
快漢かいかんNC
怪漢かいかんNC
海関かいかんNC
開巻かいかんVN
開館かいかんVNr

使用分野

JLDは世界有数のIT企業で使用され、日本語形態素分析を含む多様な分野の自然言語処理アプリ開発に有用です。

単語分割と単語識別

入力システム

情報検索

形態素解析

品詞付け

参考文献

情報検索と形態素解析に於いてJLDを最大限に活用するためには、日本語異表記データベース(JOD)と組み合わせて使うことをお勧めします。JODについては下記論文をご覧ください。

知的日本語検索の諸課題

高度な情報検索技術が扱うべき言語学的重要課題

日本語の形態素情報

派生接辞と結合属性について説明

JLD関連データベース

CLD

中国語語彙データベース

NLP用単言語一般語彙データベース

KLD

韓国語語彙データベース

NLP用単言語一般語彙データベース

JWL

日本語単語データベース

一般語彙、固有名詞、専門用語