简介
处理Unicode字符数据库(UCD)的模块,UCD为所有Unicode字符定义字符属性。
UCD是Unicode字符数据库(Unicode Character DataBase)的缩写。
UCD由一些描述Unicode字符属性和内部关系的纯文本或html文件组成。
UCD中的文本文件大都是适合于程序分析的Unicode相关数据。其中的html文件解释了数据库的组织,数据的格式和含义。
定义函数
1 | >>> import unicodedata |
unicodedata.lookup(name)
1 | lookup(name, /) |
1 | >>> unicodedata.lookup('LEFT CURLY BRACKET') |
unicodedata.name(chr, default=None)
1 | name(chr, default=None, /) |
1 | >>> unicodedata.name('}') |
unicodedata.decimal(chr, default=None)
1 | decimal(chr, default=None, /) |
1 | >>> unicodedata.decimal('8') |
unicodedata.digit(chr, default=None)
1 | digit(chr, default=None, /) |
1 | >>> unicodedata.digit('8') |
unicodedata.numeric(chr, default=None)
1 | numeric(chr, default=None, /) |
1 | >>> unicodedata.numeric('5') |
unicodedata.category(chr)
1 | category(chr, /) |
unicodedata.bidirectional(chr)
1 | bidirectional(chr, /) |
unicodedata.combining(chr)
1 | combining(chr, /) |
unicodedata.decomposition(chr)
1 | decomposition(chr, /) |
unicodedata.east_asian_width(chr)
1 | east_asian_width(chr, /) |
unicodedata.mirrored(chr)
1 | mirrored(chr, /) |
unicodedata.normalize(form, unistr)
normalize(form, unistr, /)
Return the normal form 'form' for the Unicode string unistr.
Valid values for form are 'NFC', 'NFKC', 'NFD', and 'NFKD'.
unicodedata.unidata_version
unicodedata.ucnhash_CAPI
unicodedata.ucd_3_2_0
1 | DATA |
Reference
https://docs.python.org/zh-cn/3/library/unicodedata.html#module-unicodedata