LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1074|回复: 5

请教,如何判别文本文件是什么编码类型?

[复制链接]
发表于 2004-9-23 10:25:15 | 显示全部楼层 |阅读模式
如何判别文本文件是什么编码类型?

想要分辨文件到底是UTF8还是GB2312编码的。

C语言,Linux环境

谢谢!
发表于 2004-9-23 10:47:28 | 显示全部楼层
基本没戏吧,linux下面utf8没有BOM,差不多就没法区分了
发表于 2004-9-23 11:10:13 | 显示全部楼层
 楼主| 发表于 2004-9-24 18:33:43 | 显示全部楼层
谢谢,基础太差,不太明白。

看了 http://www.unicode.org/faq/utf_bom.html#37
几个问题:
1、BOM具体是什么作用呢?是用来指明编码方式么?
2、GB2312有BOM么?怎么判断是GB2312?

谢谢,可否给出一些链接,想赶紧补充一下基础知识。
发表于 2004-9-24 18:52:41 | 显示全部楼层
呵呵,用google搜吧,具体的俺也不清楚
发表于 2004-9-24 19:23:10 | 显示全部楼层
mozilla里有一套代碼是用作自動檢測編碼的...我記得有個大蝦已經把那套代碼提取了出?..能編譯成一個庫.是C++的..
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表