中国人名異表記データベース
760万項目を収録
主なローマ字表記すべてを含む
頻度と性別等の情報
概要
中国語人名と異表記は数百万件と規模が巨大で、その特定は計算言語学で大きな課題となっています。
CJKIの包括的な中国語人名データベースは、中国語の基本人名(姓と名別々)160万項目とそのローマ字異表記約760万項目からなり、固有表現認識と自然言語処理アプリの品質向上に貢献します。
中国人名異表記データベース(CNV: Chinese Personal Name Variants)は、中国人の姓・名を多くの標準的なローマ字表記で収録するデータベースで、タイプ、頻度、性別等の多様な付加情報を提供します。ピンイン、ウェード式、イェール式、台湾で使う通用ピンイン等多くの中国人名の主なローマ字表記と、現在はあまり使わない表記も含む異表記を幅広く網羅したデータベースで、方言表記(広東語、客家語、福建語等)も提供します。
* タブで画面を切り替えることができます。
中国人名異表記
方言異表記
Type | Chinese | Pinyin | Tongyong | Yale | Wade-Giles | Variants | English |
---|---|---|---|---|---|---|---|
G | 百欣 | bǎi xīn | Baisin | Baisyin | Paihsin | Paisin | Baixin |
S | 白 | bái | Bai | Bai | Pai | Bai | |
G | 北强 | běi qiáng | Beiciang | Beichyang | Peich’iang | Peits’iêng, Peichiang, Peitsiêng | Beiqiang |
G | 炳章 | bǐng zhāng | Bingjhang | Bingjang | Pingchang | Bingzhang | |
G | 宝程 | bǎo chéng | Baocheng | Baucheng | Paoch’eng | Paocheng | Baocheng |
G | 爱华 | ài huá | Aihua | Aihwa | Aihua | Ngaihua | Aihua |
G | 伯芝 | bó zhī | Bojhih | Bwojr | Pochih | Bozhi | |
G | 长流 | cháng liú | Changliou | Changlyou | Ch’angliu | Changliu | |
G | 邦达 | bāng dá | Bangda | Bangda | Pangta | Bangda | |
S | 曹 | cáo | Cao | Tsau | Ts’ao | Cao |
Category | Variants | Type |
---|---|---|
LANGUAGE | 业经 | Simplified Chinese |
業經 | Traditional Chinese | |
業経 | Japanese | |
예징 | Hanja reading | |
業經 | Korean Hanja | |
Yejing | MOE (Korean Ministry of Education Romanization) | |
Yejing | NRS (New Romanization System) | |
Yejing | KLS (Korean Language Society Romanization) | |
Yecing | ISO DPRK (Used in North Korea) | |
Yejing | ISO ROK (Used in South Korea) |
使用分野
CNVは、名前とそのローマ字異表記の特定・処理・標準化を含む、次のような幅広い分野のソフトウェア開発に有用です。