PHP 5.4.3 環境中測試了一個在 PHP 5.2 環境下運行正常的程序,卻發現本應正常提交一個中文字符串到數據庫的代碼卻提交了一個空字符串,經過排查,該字符串在經 htmlspecialchars 函數轉義之前正常,而在轉義之后卻變成了空字符串。調用例子如下:
$str = '中文字符串';
$str_converted = htmlspecialchars($str);
echo $str_converted; 遂查看PHP手冊,獲知 htmlspecialchars 函數原型如下:
string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] ) 更新日志里面又有提到:
5.4.0 The default value for the encoding parameter was changed to UTF-8.
5.4.0 The constants ENT_SUBSTITUTE, ENT_DISALLOWED, ENT_HTML401, ENT_XML1, ENT_XHTML and ENT_HTML5 were added. PHP 從 5.4.0 版本開始第三個參數字符串編碼的默認值改成了 UTF-8,而我這段代碼中的中文編碼正好是 GB2312 編碼的,跟現在的默認參數不一致,于是更改調用參數如下:
$str = '中文字符串';
# 為了與舊環境兼容,這里第二個參數沒有組合使用 PHP 5.4 新加入的 ENT_HTML401 常量
$str_converted = htmlspecialchars($str, ENT_COMPAT ,'GB2312');
echo $str_converted; 這樣,“中文字符串”就可以正常顯示了。為了使 PHP 5.4 之前環境中編寫的代碼能夠向前兼容,建議調用 htmlspecialchars 函數的的時候都提供字符串編碼參數。
發表評論