如何防止 PHP 中的 SQL 注入?
P粉022723606
2023-08-23 12:44:04
<p>如果用户输入未经修改就插入到 SQL 查询中,则应用程序很容易受到 SQL 注入的攻击,如下例所示:</p>
<pre class="lang-php prettyprint-override"><code>$unsafe_variable = $_POST['user_input'];
mysql_query("INSERT INTO `table` (`column`) VALUES ('$unsafe_variable')");
</code></pre>
<p>这是因为用户可以输入类似<code>value')的内容; DROP TABLE table;--</code>,查询变为:</p>
<pre class="brush:php;toolbar:false;">INSERT INTO `table` (`column`) VALUES('value'); DROP TABLE table;--')</pre>
<p>可以采取什么措施来防止这种情况发生?</p>
要使用参数化查询,您需要使用 Mysqli 或 PDO。要使用 mysqli 重写您的示例,我们需要如下内容。
您需要阅读的关键函数是
mysqli::prepare
.此外,正如其他人所建议的,您可能会发现使用诸如 PDO.
请注意,您询问的案例相当简单,更复杂的案例可能需要更复杂的方法。特别是:
mysql_real_escape_string
不包含所需的转义。在这种情况下,您最好通过白名单传递用户的输入,以确保只允许“安全”值通过。无论您使用哪种数据库,避免 SQL 注入攻击的正确方法都是将数据与 SQL 分离,这样数据仍然是数据,并且 >永远不会被 SQL 解析器解释为命令。可以使用格式正确的数据部分创建 SQL 语句,但如果您完全不了解详细信息,则应始终使用准备好的语句和参数化查询。是与任何参数分开发送到数据库服务器并由数据库服务器解析的 SQL 语句。这样攻击者就不可能注入恶意SQL。
您基本上有两种选择来实现此目的:
使用PDO(用于任何支持的数据库驱动程序):
使用MySQLi(用于MySQL):
从 PHP 8.2+ 开始,我们可以使用 execute_query() 在一个方法中准备、绑定参数并执行 SQL 语句:
最高可达 PHP8.1:
如果您要连接到 MySQL 以外的数据库,则可以参考特定于驱动程序的第二个选项(例如,
pg_prepare()
和pg_execute() 对于 PostgreSQL)。 PDO 是通用选项。
正确设置连接
PDO
请注意,当使用PDO访问MySQL数据库时,真正的准备好的语句默认情况下不使用。要解决此问题,您必须禁用准备语句的模拟。使用 PDO 创建连接的示例是:
在上面的示例中,错误模式并不是绝对必要的,但建议添加它。这样,PDO 将通过抛出
PDOException
的方式通知您所有 MySQL 错误。但是,强制是第一行
setAttribute()
行,它告诉 PDO 禁用模拟准备好的语句并使用真实准备好的语句声明。这可以确保语句和值在发送到 MySQL 服务器之前不会被 PHP 解析(让可能的攻击者没有机会注入恶意 SQL)。虽然您可以在构造函数的选项中设置
字符集
,但请务必注意,“较旧”版本的 PHP(5.3.6 之前)默默地忽略了 DSN 中的字符集参数。Mysqli
对于 mysqli,我们必须遵循相同的例程:
说明
您传递给
prepare
的SQL语句由数据库服务器解析和编译。通过指定参数(?
或命名参数,如上例中的:name
),您可以告诉数据库引擎您要过滤的位置。然后,当您调用execute
时,准备好的语句将与您指定的参数值结合起来。这里重要的是参数值与编译后的语句结合在一起,而不是 SQL 字符串。 SQL 注入的工作原理是在脚本创建要发送到数据库的 SQL 时欺骗脚本包含恶意字符串。因此,通过将实际的 SQL 与参数分开发送,您可以限制最终出现意外情况的风险。
您在使用准备好的语句时发送的任何参数都将被视为字符串(尽管数据库引擎可能会进行一些优化,因此参数当然也可能最终被视为数字)。在上面的示例中,如果
$name
变量包含'Sarah'; DELETE FROMEmployees
结果只是搜索字符串"'Sarah'; DELETE FROMEmployees"
,并且最终不会得到 一个空表。使用准备好的语句的另一个好处是,如果您在同一个会话中多次执行相同的语句,它只会被解析和编译一次,从而提高速度。
哦,既然您询问了如何进行插入,这里有一个示例(使用 PDO):
准备好的语句可以用于动态查询吗?
虽然您仍然可以对查询参数使用准备好的语句,但动态查询本身的结构无法参数化,并且某些查询功能也无法参数化。
对于这些特定场景,最好的办法是使用白名单过滤器来限制可能的值。