问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

...GB18030大字符集的,笔画和拼音都可以,谢谢。

发布网友 发布时间:2024-10-08 19:04

我来回答

1个回答

热心网友 时间:2024-10-11 19:48

“从GB2313-标准字符集、GBK-大字符集到GB18030-超大字符集 ”。

多字节字符集(MBCS)是相对单字节字符集(SBCS)来说的,在单字节字符集里,一个字节表示一个字符,对于英文和大多数欧洲语言来说这就够用了。但对于中日韩以及阿拉伯文字来说就不够了,比如在汉字GB2312标准里,英文字符用1个字节,汉字用2个字节;而另外一些语言可能是变长的,一个字可能是1个、2个、3个字节来表示。不管是单字节字符集还是多字节字符集,都是各个国家自己制定的(后来美国国家标准化委员会进行了标准化,所以也可以把单字节集和多字节字符集的总合简称ANSI字符集)。大家可以想到,日本在制定日语编码标准的时候,他不会考虑是否会跟汉语冲突,当然制定汉语编码标准的时候也不会考虑是否跟韩语或阿拉伯文冲突,所以不同语言的多字节编码是冲突的,也就是说如果给你一个字符串,你根本不知道怎么处理它,因为你不知道它是那种语言的哪种编码,只能猜!(猜错了就是大家时不时看到的显示乱码)

而Wide-Character即UNICODE是将全世界的所有文字统一编码,在UTF-16中每个字都是2字节,不管是英文还是中文、日文、阿拉伯文,都一样,而且一个码一个字,在那种语言平台上都对应相同的字。

为什么说UNICODE通常占用更多空间?举例来说,对于字符串“中国ABC”,总共5个字符用UTF-16编码需要5*2=10个字节。而如果用我们的GB2312(多字节字符集),则需要区分汉字和英文,前两个汉字用2*2=4个自己,后面3个字符用3*1=3个字节。所以总共需要4+3=7个字节。所以说用UNICODE编码通常比用多字节编码要用多一点的内存,极端情况就是用UNICODE编码全英文字符串,那就是2倍的空间。

但是为什么说UNICODE编码处理速度快呢?以刚才的“中国ABC”为例,如果用MBCS虽然省了3个字节,但是用起来可就麻烦了。对程序来说,它看到就是一个7个字节的数据,如果现在需要取出串里的第4个字符即'B',怎么写代码?你怎么知道第4个字符在什么位置?它是一个字节还是两个字节?办法就是根据汉字编码的规律,比如第一个字节总是大于0x80,然后从头至尾开始数:第一个字节大于0x80所以这是个汉字,占用2个字节,指针加2,字符计数加1;第三个字节大于0x80所以这也是个汉字,占用2个字节,指针加2,字符计数加1;第五个字节小于0x80所以是个英文,占用1个字节...........还好,我们的例子只有5个字符,如果是一个很大的文本文件呢?是不是效率极低?而用UNICODE编码则很简单,反正一个字符2个字节(UTF-16),所以你要第4个字符,就是第8个字节开始的双字节。直接就可以定位当然速度快了。

但是UNICODE的好处不仅仅如此,它至少还有以下好处:

1. 你不用担心在不同语言的平台上你的字符串会显示成乱码,只要它支持UNICODE,你的字符串在哪显示都一样。你的汉字UNICODE串在英文平台上也一样显示成汉字。如果用多字节编码,恐怕只能显示成乱码,因为它不知道你是哪个语言的(IE有一些猜测的方法)。

2. 你的代码不容易出错。对UTF-16来说,一个字符2个字节,你的软件卖到哪个国家都对。而要是用多字节编码,你不得不使用与当前语言相关的编码特点,比如你觉得第一个字节大于0x80就是一个汉字,那换个语言平台你保准不对。即便你使用各种手段,整的你头发都掉光,一千个一万个小心,你还是会出错。因为你的开发环境和运行环境不一样,你没有办法在那么多环境组合里进行调试和测试!你也没那么多语言知识!

3. 使用多字节编码,有些问题会非常难处理。比如在一个编辑器里,用户用鼠标选择了一段文字,为了避免出现选择“半个汉字”的怪事,你就不好办。自动换行的时候,也要避免把一个汉字分成两半。这还是汉字编码呢,有些文字更惨,三个字节在一起是一个字,把它们分开就变成另外两个意思完全不同的字。想象一下,如果因为你的编辑器自动换行了,本来意思是“我爱你”,结果显示成“我恨死你”是什么结果吧!

补充一点:UNICODE存储通常需要更多空间的缺点(通常是英文和欧洲文字的用户抱怨这个)也是可以解决的,通常的做法就是压缩存储。即存储或者通过网络传输的时候的经过简单压缩,用的时候再解压缩。

×另外提供给你一个下载地址
海峰五笔·超大字符集·标准通用版·V8.0

☆ 全面支持GB18030国家标准大字符集,能打出GBK(在Windows 95 / 97 /98 / ME中)和CJK+CJK扩展A+CJK扩展B(在Windows NT / 2000 / XP / 2003中)大字符集内的所有简、繁体汉字。其中五笔86版已支持UNICODE国际通用超大字符集,在Windows XP / 2003中能打出CJK + CJK扩展A + CJK扩展B中的所有七万多汉字。感谢王源深兄在其《山顶洞五笔》中所做的宝贵工作——没有他的前期劳动成果和经验,这个版本的面世可能还要等待很久。在这个意义上可以说,8.0版是山顶洞五笔和海峰五笔合并升级的结果.
下载地址http://culchina.net/sunwb/
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
胜达这款车百公里油耗多少? 胜达节能油加盟办厂可靠吗是不是骗子 河南洛阳胜达就是骗子,我把钱交了也不来人了,他们一个老总说了爱咋办... 胜达油是个骗局吗 胜达节能油是什么? 叩解度关于叩解的论述 湿重跟湿重有关的打浆磨片 戴尔XPS M1330-950重要参数 如果到别的单位去面试的话 如果人家问起为什么会选择这家公司而离开另外... 学生会被两个部门同时面试怎么办 ...两级索引物理结构所支持的最大文件为___GB? 460300是什么基金 汽车教练证怎么考 如何考取汽车教练员证? 005197是什么基金 ...的,然后插到手机耳机孔里就是没声音啊! 手机也显示有耳机模式... 手机查上耳机没有显示耳机模式,插上之前是外音之后还是外音,是在手机... 莫迪亚诺简介 可以带隐形眼镜午休吗,一个小时 小孩子长高的最有效方法是什么? 佩戴隐形眼镜是不是有时间限制?多久? 暗铺街作者介绍 三星2015wps怎么打开 ...用狙击枪用什么样的鼠标和键盘好一些 游戏耳机需要什么样的 沈阳... 女生长高小技巧 女生长高小技巧有哪些 帕特里克·莫迪亚诺家庭背景 中午睡觉的时候带着隐形眼镜没事吧,就一个小时 刚出生的小猫怎么除跳蚤 在word中怎么使我所写文章的目录与其所对应的内容进行链接? 刚出生的猫身上有跳蚤怎么办 怎样在Word文档中提取目录? ...5.44GB,我想提高一点,各位大虾可要帮帮我啊 ...FAT32一个是FAT 这两个都代表什么意思 啊??? 右耳突然刺痛怎么回事 ...不好的食品配料的名称,有什么坏处,能不能告诉我,我只知道像棕榈油... 晶锐4s店告诉我如果加装倒车影像会出现跳屏的问题,我该咋办 晶锐(车享版)加装倒车影像 我要去意大利,须要办什么样的护照 请高手分析下云天化什么时候买入好 云化和上港权证,行权利润是怎么计算的? 华为手机不用拨号也能接打电话,好多人还不知道,真是太炫酷了! 来电话不用看手机就知道是谁,只需打开华为手机这个开关,很实用 电脑上如何使用跳舞毯 打开华为手机这个开关,用语音就能控制接听或拒接来电,太实用了 华为手机打开这个开关,再也不怕别人偷看手机,保护隐私太安全了 华为手机打开这个开关,保护隐私太安全了,再也不怕别人偷看手机 台式电子秤什么牌子比较好 switch日服怎么用paypal支付购买 一部在几年前多个国家合作的动作电影叫什么名字?有好几个人他们很烈害... 苹果2代平板电脑与笔记本电脑可否连接 ...电脑要安装苹果的什么驱动程序,平板电脑才能与笔记本电脑连接?