懒人资源论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2443|回复: 0

GBK 在 unicode 编码中,字符的收录分布情况

[复制链接]

42

主题

0

回帖

653

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
653
发表于 2020-11-8 22:32:20 | 显示全部楼层 |阅读模式
1:所有的 GBK 字符在 unicode 都有收录(都在 unicode 的 UCS-2 编码范围,也就是2字节的unicode能表示)
2:大多数汉字都在 unicode 编码范围的 中日韩统一汉字 中(0x4E00-0x9FA5)
3:下表列出GBK在 unicode 中的分布详情(不列出 中日韩统一汉字)


Unicode字符集
起始编码
结束编码
GBK字符数量
列出此字符集中包含的GBK字符
中日韩统一汉字
0x4E00
0x9FFF
20902

用户自定义区
0xE000
0xF8FF
1372

部件扩展
0xE400
0xE5E8
489

PUA增补
0xE600
0xE6CF
208

框线绘制符号
0x2500
0x257F
112
═║╒╓╔╕╖╗╘╙╚╛╜╝╞╟╠╡╢╣╤╥╦╧╨╩╪╫╬╭╮╯╰╱╲╳─━│┃┄┅┆┇┈┉┊┋┌┍┎┏┐┑┒┓└┕┖┗┘┙┚┛├┝┞┟┠┡┢┣┤┥┦┧┨┩┪┫┬┭┮┯┰┱┲┳┴┵┶┷┸┹┺┻┼┽┾┿╀╁╂╃╄╅╆╇╈╉╊╋
半角片假名、谚文、拉丁字母
0xFF00
0xFFEF
100
~$¢£!"#¥%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|} ̄¬¦
片假名
0x30A0
0x30FF
89
ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶーヽヾ
平假名
0x3040
0x309F
87
ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん゛゜ゝゞ
PUA(GBK)部件
0xE815
0xE86F
80

西里尔字符
0x0400
0x04FF
66
АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя
带圈字母和数字
0x2460
0x24FF
50
⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇①②③④⑤⑥⑦⑧⑨⑩
希腊文字中的科普特字符
0x0370
0x03FF
48
ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψω
汉语注音字母
0x3100
0x312F
37
ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒㄓㄔㄕㄖㄗㄘㄙㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄤㄥㄦㄧㄨㄩ
数学运算符
0x2200
0x22FF
37
∶∧∨∑∏∪∩∈∷√⊥∥∠⊙∫∮≡≌≈∽∝≠≮≯≤≥∞∵∴∕∟∣≒≦≧⊿⊕
中日韩标点符号
0x3000
0x303F
34
、。〃々〔〕〈〉《》「」『』〖〗【】〓〒〝〞〡〢〣〤〥〦〧〨〩〆〇
CJK Compatibility Forms
0xFE30
0xFE4F
27
︵︶︹︺︿﹀︽︾﹁﹂﹃﹄︻︼︷︸︱︳︴︰﹉﹊﹋﹌﹍﹎﹏
小形式变体字符
0xFE50
0xFE6F
25
﹐﹑﹒﹔﹕﹖﹗﹙﹚﹛﹜﹝﹞﹟﹠﹡﹢﹣﹤﹥﹦﹨﹩﹪﹫
数字形式字符
0x2150
0x218F
22
ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ
中日韩相容汉字
0xF900
0xFAFF
21
郎凉秊裏隣兀嗀﨎﨏﨑﨓﨔礼﨟蘒﨡﨣﨤﨧﨨﨩
增补拉丁字符集 1
0x0080
0x00FF
20
·¨±×÷°¤§áàéèíìóòúùüê
方形组块图符
0x2580
0x259F
18
▁▂▃▄▅▆▇█▉▊▋▌▍▎▏▓▔▕
通用标点符号
0x2000
0x206F
16
—‖…‘’“”′″‰※–―‥‵‐
几何图形
0x25A0
0x25FF
15
○●◎◇◆□■△▲▼▽◢◣◤◥
带圈中日韩相容表音文字字母和月份符号
0x3200
0x32FF
12
㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩㊣㈱
中日韩相容符号
0x3300
0x33FF
11
㎎㎏㎜㎝㎞㎡㏄㏎㏑㏒㏕
箭头符号
0x2190
0x21FF
8
→←↑↓↖↗↘↙
拉丁字符扩展集 A
0x0100
0x017F
8
āēěīōūńň
拉丁字符扩展集 B
0x0180
0x024F
8
ǎǐǒǔǖǘǚǜ
字母类符号
0x2100
0x214F
5
℃№℅℉℡
间隔修饰符
0x02B0
0x02FF
5
ˉˇˊˋ˙
综合符号
0x2600
0x26FF
5
♂♀☆★☉
国际音标扩展集
0x0250
0x02AF
2
ɑɡ
综合技术符号
0x2300
0x23FF
1


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|懒人资源论坛

GMT+8, 2024-11-21 18:02 , Processed in 0.058780 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表