Japanese Full-Form Lexicon
Simplifies morphological analysis
Instantly identifies inflected forms
Comprehensive coverage, especially verbs
Overview
CJKI provides a Japanese Full-Form Lexicon (JFULEX) that covers roughly 120 million entries, including canonical forms, inflected forms, and compound words. This lexicon is being used by major IT companies like Amazon and Google to enhance their search technology.
The Japanese language is agglutinative; that is, it forms words by putting together basic elements called morphemes to form countless inflected forms, compound words, and affixed words. For example, the compound 造船所 zōsenjo ‘shipyard’ consists of the free word 造船 ‘shipbuilding’ (造 ‘make; build’ + 船 ‘ship’) followed by the suffix 所 ‘place’.
Japanese also has many derived words, (morpheme + grammatical suffix) such as combining 黒 kuro ‘black’ with the suffix い i to form the adjective 黒い kuroi ‘black’. Derivation should not be confused with inflection, which consists of adding word endings to indicate grammatical functions such as tense. For example, the last syllable of the verb 帰る kaeru ‘to return’ is inflected to yield 帰れ kaere, the imperative. Japanese verbs have thousands of inflected forms.
If proper nouns, technical terms and verb-following expressions (such as なければならない nakerebanaranai) are included, the the total can exceed 120 million.
tazuneru(たずねる) POS=V1
Tense | Stem | Kana | Kanji | Inflected | Roman |
---|---|---|---|---|---|
Past | たずね | S + ました | - | たずねました | TAZUNEmashita |
Past | たずね | S + て い ました | S + て 居 ました | たずねて いました | TAZUNEte imashita |
Past | たずね | S + て おり ました | S + て 居り ました | たずねて おりました | TAZUNEte orimashita |
Past | たずね | S + やした | - | たずねやした | TAZUNEyashita |
Past | たずね | S + て い やした | S + て 居 やした | たずねて いやした | TAZUNEte iyashita |
Past | たずね | S + て おり やした | S + て 居り やした | たずねて おりやした | TAZUNEte oriyashita |
Past -tara I | たずね | S + ましたら | - | たずねましたら | TAZUNEmashitara |
Past -tara I | たずね | お + S + して おり ましたら | 御 + S + 為て 居り ましたら | おたずねして おりましたら | oTAZUNE shite orimashitara |
Past -tara I | たずね | S + やしたら | - | たずねやしたら | TAZUNEyashitara |
Past -tara I | たずね | お + S + して おり やしたら | 御 + S + 為て 居り やしたら | おたずねして おりやしたら | oTAZUNE shite oriyashitara |
Past -tara II | たずね | S + ましたらば | - | たずねましたらば | TAZUNEmashitaraba |
Past -tara II | たずね | お + S + して おり ましたらば | 御 + S + 為て 居り ましたらば | おたずね して おりましたらば | oTAZUNE shite orimashitaraba |
Past -tara II | たずね | S + やしたらば | - | たずねやしたらば | TAZUNEyashitaraba |
Past -tara II | たずね | お + S + して おり やしたらば | 御 + S + 為て 居り やしたらば | おたずね して おりやしたらば | oTAZUNE shite oriyashitaraba |
Past causative | たずね | S + させ ました | - | たずねさせました | TAZUNEsasemashita |
Past causative | たずね | S + させ やした | - | たずねさせやした | TAZUNEsaseyashita |
Past causative honorific | たずね | S + させ られ ました | - | たずねさせられました | TAZUNEsaseraremashita |
Past causative honorific | たずね | S + させ られ て い ました | S + させ られ て 居 ました | たずねさせられて いました | TAZUNEsaserarete imashita |
Past causative honorific | たずね | S + させ られ やした | - | たずねさせられやした | TAZUNEsaserareyashita |
Past causative honorific | たずね | S + させ られ て い やした | S + させ られ て 居 やした | たずねさせられて いやした | TAZUNEsaserarete iyashita |
Past causative passive | たずね | S + させ られ ました | - | たずねさせられました | TAZUNEsaseraremashita |
Practical Applications
CJKI’s full-form lexicons can bring the following benefits to various NLP applications:
Machine translation
Greatly enhanced translation quality
Named-entity recognition (NER)
Dramatically improved
Morphological analysis
Significantly simplified algorithms
Information retrieval applications
Support for query processing
Pedagogical applications
Automatic conjugation systems
Part-of-speech (POS) analysis and tagging
Automatic conjugation systems
JFULEX Related Resources
Arabic Full-Form Lexicon
Includes all inflected, declined, and conjugated forms
Spanish Full-Form Lexicon
Includes all inflected, declined, and conjugated forms
Comprehensive Japanese Wordlist
General vocabulary, proper nouns and technical terms