LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1102|回复: 7

关于汉字编码方式和字体的几个问题

[复制链接]
发表于 2006-6-5 15:34:59 | 显示全部楼层 |阅读模式
不知道该不该在这发,就先发了,不对请斑竹转,谢谢。
1、目前支持ExtA、ExtB的字体有哪几个?其中有点阵或Hinting信息的有哪几个?
Simsun好像只有GBK,Simsun18030只支持到ExtA,而且好像不带点阵(貌似,是吗?),Vista中的新Simsun和Mingliu好像要扩展到ExtB区,那个带不带点阵或Hinting?Redhat找中易买的那套呢?方正超大字符集宋体支持到ExtB吗?
2、uming目前支持到哪里?
3、香港政府提供的《香港增補字符集》參考字型中包括点阵吗?其字形遵循于什么地方的标准?为什么看到有的地方说其收字不及DFSonfSd.ttf (華康香港參考宋體)全?http://www.chinesecj.com/forum/viewthread.php?tid=113
4、Sourceforge上那个支援 CJK Ext A 和 Ext B 的越南字型 HAN NOM http://sourceforge.net/projects/vietunicode/是把ExtA和ExtB区的字分别放在两个文件里吗?如果是这样,那么指定字体的时候应当如何才能两个里面的字都抓的到呢?
5、为何在http://www.microsoft.com/globald ... ns/015/default.mspx
里面MS说GB18030——This is larger than any other code page Windows supports, including Unicode。
在这里http://www.microsoft.com/globald ... ns/018/default.mspx 又说GB18030 contains exactlythe same characters as Unicode 3.2. This includes Latin, Greek, Arabic, Hebrew, Thai characters etc. It also includes CJK Extensions A and B.
GB18030要是多些,都是多了什么?

在文泉驿上画了很久的字体,还是有很多事不懂,请大家指点,谢谢。
发表于 2006-6-5 20:39:48 | 显示全部楼层
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-6-6 21:36:40 | 显示全部楼层
惭愧 这篇很久以前就看到了 竟然没有认真读
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-6-6 21:51:37 | 显示全部楼层
虽然如此 那里面的GB18030 收字范围貌似还是没说清楚,是因为GB18030 里面多收一些我国少数民族文字——因为MS 说GB18030 conformance includes requirements to support some previously unsupported languages, for example Tibetan, Mongolian, Yi, and Uyghur. 还是因为GB18030 是four byte characters ,其Code Page才会比Unicode还大?
还有就是PKUCN 上头那文章说GB18030字符集GB18030字符集,包含GBK字符集、CJK Ext-A 全部6582箇漢字,共計27533箇漢字。这不对吧?!“It is very large – with room for 1.6 million characters.”Unicode 里面加上EXtA/B 也只收七万多汉字呢?GB18030 怎么样也包括了ExtB区吧?

P.S. 从文章中看貌似MS 对GB18030 支持得很不情愿啊。似乎纯粹是因为“It is now illegal to sell products in China that do not conform to the standard. ”才用打Patch 的办法部分支持的。
回复 支持 反对

使用道具 举报

发表于 2006-6-7 12:01:50 | 显示全部楼层
是指gb18030-2000吧,它对应unicode 3.0,而Ext B是unicode 3.1引入的。

simsun18030.ttc只包括CJK Ext A。
回复 支持 反对

使用道具 举报

发表于 2006-6-7 12:08:17 | 显示全部楼层
gb18030与其说是字符集,不如说是编码方式,和utf-8类似。所以不太好说gb18030里面有多少汉字,就像不好说utf-8编码了多少汉字。

gb18030制定的时候unicode的版本是3.0,所以当时的宣传大多说它编码了2万多汉字,这个说法就流传下来了。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-6-7 21:38:00 | 显示全部楼层
是这样啊,那么我是不是可以理解为GB18030像UTF-8、UTF-16那样,是一种具体实现Unicode的编码方式呢?

另外就是,昨天我仔细看了一下那个越南的Han Nom,发现它的小字形几乎与与Simsun如出一辙。这不会造成法律问题么?

谢谢各位的指教
回复 支持 反对

使用道具 举报

发表于 2006-6-8 12:52:20 | 显示全部楼层
GB18030
的编码与Unicode的非BMP区有一种算法关系的。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表