PHP 特殊字符转换

htmlspecialchars() 函数把一些预定义的字符转换为 HTML 实体。

预定义的字符是:

  • & (和号) 成为 &
  • " (双引号) 成为 "
  • ' (单引号) 成为 '
  • < (小于) 成为 &lt;
  • > (大于) 成为 &gt;

语法htmlspecialchars(string,quotestyle,character-set)参数描述string必需。规定要转换的字符串。quotestyle

可选。规定如何编码单引号和双引号。

  • ENT_COMPAT - 默认。仅编码双引号。
  • ENT_QUOTES - 编码双引号和单引号。
  • ENT_NOQUOTES - 不编码任何引号。

character-set

可选。字符串值,规定要使用的字符集。

  • ISO-8859-1 - 默认。西欧。
  • ISO-8859-15 - 西欧(增加 Euro 符号以及法语、芬兰语字母)。
  • UTF-8 - ASCII 兼容多字节 8 比特 Unicode
  • cp866 - DOS 专用 Cyrillic 字符集
  • cp1251 - Windows 专用 Cyrillic 字符集
  • cp1252 - Windows 专用西欧字符集
  • KOI8-R - 俄语
  • GB2312 - 简体中文,国家标准字符集
  • BIG5 - 繁体中文
  • BIG5-HKSCS - Big5 香港扩展
  • Shift_JIS - 日语
  • EUC-JP - 日语

提示和注释

提示:无法被识别的字符集将被忽略,并由 ISO-8859-1 代替。

例子<html><body><?php$str = "John & 'Adams'";echo htmlspecialchars($str, ENT_COMPAT);echo "<br />";echo htmlspecialchars($str, ENT_QUOTES);echo "<br />";echo htmlspecialchars($str, ENT_NOQUOTES);?></body></html>

浏览器输出:

John & 'Adams'John & 'Adams'John & 'Adams'

如果在浏览器中查看源代码,会看到这些 HTML:

<html><body>John &amp; 'Adams'<br />John &amp; &#039;Adams&#039;<br />John &amp; 'Adams'</body></html>
htmlspecialchars_decode()
函数把一些预定义的 HTML 实体转换为字符。

会被解码的 HTML 实体是:

 

&amp;

 

成为 &(和号)

 

&quot;

 

成为 " (双引号)

 

'

 

成为 ' (单引号)

 

&lt;

 

成为 < (小于)

 

&gt;

 

成为 > (大于)

 

 

htmlspecialchars_decode(string,quotestyle)参数描述string必需。规定要解码的字符串。quotestyle可选。规定如何解码单引号和双引号。ENT_COMPAT - 默认。仅解码双引号。ENT_QUOTES - 解码双引号和单引号。ENT_NOQUOTES - 不解码任何引号。

 

<?php   $str = "John &   amp;   &   #039;   Adams&   #039;   ";   echo htmlspecialchars_decode($str);   echo "<br />";   echo htmlspecialchars_decode($str, ENT_QUOTES);   echo "<br />";   echo htmlspecialchars_decode($str, ENT_NOQUOTES);   ?>浏览器输出:

 

John &   'Adams' John &   'Adams' John &   'Adams'如果在浏览器中查看源代码,会看到这些 HTML:

 

<html> <body> John &   &   #039;   Adams&   #039;   <br /> John &   'Adams'<br /> John &   &   #039;   Adams&   #039;   </body> </html>

htmlspecialchars_decode() 函数把一些预定义的 HTML 实体转换为字符。

 

会被解码的 HTML 实体是:

 

&amp;

 

成为 &(和号)

 

&quot;

 

成为 " (双引号)

 

'

 

成为 ' (单引号)

 

&lt;

 

成为 < (小于)

 

&gt;

 

成为 > (大于)

 

 

htmlspecialchars_decode(string,quotestyle)参数描述string必需。规定要解码的字符串。quotestyle可选。规定如何解码单引号和双引号。ENT_COMPAT - 默认。仅解码双引号。ENT_QUOTES - 解码双引号和单引号。ENT_NOQUOTES - 不解码任何引号。

 

<?php   $str = "John &   amp;   &   #039;   Adams&   #039;   ";   echo htmlspecialchars_decode($str);   echo "<br />";   echo htmlspecialchars_decode($str, ENT_QUOTES);   echo "<br />";   echo htmlspecialchars_decode($str, ENT_NOQUOTES);   ?>

浏览器输出:

 

 

John &   'Adams' John &   'Adams' John &   'Adams'

如果在浏览器中查看源代码,会看到这些 HTML:

 

 

再附加:PHP对表单提交特殊字符的过滤和处理
函数名  释义  介绍
htmlspecialchars 将与、单双引号、大于和小于号化成HTML格式 &转成&amp;
"转成&quot;
' 转成&#039;
<转成&lt;
>转成&gt;
htmlentities() 所有字符都转成HTML格式 除上面htmlspecialchars字符外,还包括双字节字符显示成编码等。

addslashes 单双引号、反斜线及NULL加上反斜线转义 被改的字符包括单引号 (')、双引号 (")、反斜线 backslash (\) 以及空字符NULL。
stripslashes 去掉反斜线字符 去掉字符串中的反斜线字符。若是连续二个反斜线,则去掉一个,留下一个。若只有一个反斜线,就直接去掉。

quotemeta 加入引用符号 将字符串中含有 . \\ + * ? [ ^ ] ( $ ) 等字符的前面加入反斜线 "\" 符号。
nl2br() 将换行字符转成<br>
strip_tags 去掉HTML及PHP标记 去掉字符串中任何 HTML标记和PHP标记,包括标记封堵之间的内容。注意如果字符串HTML及PHP标签存在错误,也会返回错误。
mysql_real_escape_string 转义SQL字符串中的特殊字符 转义 \x00  \n  \r  空格  \  '  " \x1a,针对多字节字符处理很有效。mysql_real_escape_string会判断字符集,mysql_escape_string则不用考虑

点赞

发表回复

电子邮件地址不会被公开。必填项已用 * 标注