PHP5.4以上版本htmlspecialchars()输出空的解决办法
从旧版升级到php5.4,恐怕最麻烦的就是htmlspecialchars这个问题了!当然,htmlentities也会受影响,不过,对于中文站来说一般用htmlspecialchars比较常见,htmlentities非常少用到。
可能老外认为网页普遍应该是utf-8编码的,于是苦了那些用GB2312,GBK编码的中文站……!
0 1 |
$str = "mrdede.com的php版本是5.2.10"; echo htmlspecialchars($str); |
gbk字符集下输出为空…utf-8下,输出正常。
为什么呢,原因在于5.4.0对这个函数的变化:
5.4.0 The default value for the encoding parameter was changed to UTF-8.
原因是什么呢?
0 1 |
string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] ) Defines encoding used in conversion. If omitted, the default value for this argument is ISO-8859-1 in versions of PHP prior to 5.4.0, and UTF-8 from PHP 5.4.0 onwards. |
原来是ISO-8859-1,5.4后默认变成utf-8!然后中文使用这个函数就输出为空白了。
国内一堆开源程序在5.4下都会有这样的问题,DISCUZ官方也建议用户不要升级到5.4
解决方案:
1.苦逼的修改所有用到htmlspecialchars地方的程序
1.1 其第二个$flags参数,默认是ENT_COMPAT,因此改成
0 |
htmlspecialchars($str,ENT_COMPAT,'GB2312'); |
为什么不是GBK?因为没有GBK这个参数,如果强行使用GBK,则报错给你看:
0 |
Warning: htmlspecialchars(): charset `gbk' not supported, assuming utf-8 |
为了能使用GBK,则改成:
0 |
htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1'); |
1.2.一样是改程序,但可以省略一个参数。
可以在网页头部加
0 |
ini_set('default_charset','gbk'); |
然后改成:
0 |
htmlspecialchars($str,ENT_COMPAT,''); |
文档中有写:An empty string activates detection from script encoding (Zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. Not recommended.
大概意思就是:传入空字符串则使用default_charset的编码
1.3.封装一个函数吧…本来htmlspecialchars这个单词一直不好记。
0 1 2 |
function htmlout($str) { return htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1'); } |
然后去批量替换。
2.直接修改源码,重编译!这也是目前我在线上做的方案。
修改ext/standard/html.c
0 1 2 |
/* Default is now UTF-8 */ if (charset_hint == NULL) return cs_utf_8; |
大概在372行
把cs_utf_8改成 cs_8859_1
0 1 2 |
/* Default is now UTF-8 */ if (charset_hint == NULL) return cs_8859_1; |
编译后,原程序就不用做任何调整了。