PHP iconv()字符编码转换的问题
发布时间:2016-04-19, 14:44:48 分类:PHP | 编辑 off 网址 | 辅助
正文 752字数 110,776阅读
在php函数库有一个函数:iconv(),iconv函数库能够完成各种字符集间的转换,是php编程中不可缺少的基础函数库。最近在做一个小偷程序,需要用到iconv函数把抓取来过的utf-8编码的页面转成gb2312, 发现只有用iconv函数把抓取过来的数据一转码数据就会无缘无故的少一些。 让我郁闷了好一会儿,去网上一查资料才知道这是iconv函数的一个bug。iconv在转换字符"—"到gb2312时会出错。
下面慢慢看一下这个函数的用法。
最简单的应用,把gb2312置换成utf-8:
$text=iconv("GB2312","UTF-8",$text);
在用$text=iconv("UTF-8","GB2312",$text)过程中,如果遇到一些特别字符时,如:"—",英文名中的"."等等字符,转换就断掉了。这些字符后的文字都没法继续转换了。
针对这的问题,可以用如下代码实现:
$text=iconv("UTF-8","GBK",$text);
你没有看错,就这么简单,不使用gb2312,而写成GBK,就可以了。
还有一种方法,第二个参数,加上//IGNORE,忽略错误,如下:
iconv("UTF-8","GB2312//IGNORE",$data);
没有具体比较这两种方法,感觉第一种(GBK代替gb2312)方法更好。
原文 http://www.nowamagic.net/librarys/veda/detail/834
Run code
Cut to clipboard
(支付宝)给作者钱财以资鼓励 (微信)→
暂无评论 »