LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1605|回复: 6

请问如何才能判断一个字符串是否是UTF-8编码的呢?

[复制链接]
发表于 2005-3-9 14:32:32 | 显示全部楼层 |阅读模式
工作中遇到可能是GB码,也可能是UTF-8编码的串,均包含汉字,格式间的相互转化容易实现,但如何判断原始串的编码格式呢?  libiconv中好像也没有这样的函数啊。

谢谢啦!!!
发表于 2005-3-9 15:13:01 | 显示全部楼层
如果要从分析原始串的内容来判断,这个好像比较难,尤其是文字比较少的时候。

你的具体应用中能不能通过原始串的来源来判断,而不是从分析原始串内容来判断?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2005-3-9 16:09:46 | 显示全部楼层
通过分析来源我也想过,但不可行。 要是各种编码都有一个标识的头和尾就好了。
回复 支持 反对

使用道具 举报

发表于 2005-3-9 17:14:22 | 显示全部楼层
他们是不是都有个自的编码范围?
回复 支持 反对

使用道具 举报

发表于 2005-3-9 18:32:39 | 显示全部楼层
能不能像现在的浏览器一样,将选择的权利留给用户?
回复 支持 反对

使用道具 举报

发表于 2005-3-9 21:51:43 | 显示全部楼层
是不是可以参照glib的g_utf8_unicode的实现?
我没看过,只是猜测
回复 支持 反对

使用道具 举报

发表于 2005-3-10 09:56:06 | 显示全部楼层
http://www.linuxforum.net/forum/ ... mp;o=all&fpart=

这个可以参考一下。
如果保证只可能有utf8或者gb两种编码,那用这个方法基本就解决了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表