|

楼主 |
发表于 2007-12-11 07:53:13
|
显示全部楼层
Post by ocean390;1793804
其实楼主的正则表达式虽然可能因为疏忽把[^>]写成了[^<],但还是可以匹配的,sed有一个很大的问题就是,sed的执行会和locale相关。比如说如果文件的编码是gbk的,而locale是utf-8,这时候你所有关于正则表达式的知识都是不起作用的。根据我的经验用sed处理有中文字符处理的文件,最好把locale设置成LC_ALL=C,进行处理,或者你能保证文件的编码和locale是一致的情况下。
完全正确。文件的编码是GBK的,我将它转换成utf-8后,搞定了。
多谢楼上各位
另外能否解释一下 LC_ALL=C |
|