开发懵逼了！误用一个双引号，生产数据全变0！-双引号错误用法

最近经常碰到开发误删除误更新数据，这不，他们又给我找了个麻烦，我们来看下整个过程，把我坑得够惨。

图片来自 Pexels

过程

由于开发需要在生产环节中修复数据，需要执行 120 条 SQL 语句，需要将数据进行更新。

于是开发连上了生产数据库，首先执行了第一条 SQL：

update tablename set source_name = "bj1062-北京市朝阳区常营北辰福第"   
 
where source_name =     "-北京市朝阳区常营北辰福第"

我们仔细看了下，这个 SQL，的确没有什么问题，where 条件也是正常的，大意就是将这个地址的前面加字符串 bj1062，是真的没有错误么?

是的，没有错误。开发执行完成后，结果的确是符合预期。

然后开发执行了剩下的 SQL，都是和上面的 SQL 一样，将地址进行更新。

执行完成后，开发懵逼了，发现 source_name 都变成了 0，开发赶紧给我打电话说：

Harvey，我执行了 update，where 条件都是对的，set 的值也是对的，但是 set 后的字段全部都变成了 0，你赶紧帮我看看，看看能不能恢复数据。

我赶紧登上服务器，查看了这段时间的 binlog，发现了大量的 update tablename set source_name=0 的语句，利用 binlog2sql 进行了解析。

项目地址：

binlog2sql https://github.com/danfengcao/binlog2sql

赶紧和开发确定了操作的时间点，生成 flashback 的 SQL，进行了数据恢复，同时保留现场证据。

然后对开发执行的 SQL 进行了 check，发现了几条很诡异的 SQL：

这几条 SQL 的引号位置跑到了 where 字段名字后面，简化后的 SQL 变成了：

update tbl_name set str_col="xxx" = "yyy"

那么这个 SQL 在 MySQL 他是如何进行语义转化的呢?

可能是下面这样的么?

update tbl_name set (str_col="xxx" )= "yyy"

这样就语法错误了，那么只会是下面这样的形式：

update tbl_name set str_col=("xxx" = "yyy")

而

select "xxx" = "yyy"

的值是 0，所以：

update tbl_name set str_col="xxx" = "yyy"

等价于：

update tbl_name set str_col=0

所以就导致了 source_name 字段全部更新成了 0。

我们再研究下 select 形式这种语句会怎么样。

mysql [localhost] {msandbox} (test) > select id,str_col from tbl_name where str_col="xxx" = "yyy"; 
+----+---------+ 
| id | str_col | 
+----+---------+ 
|  1 | aaa     | 
|  2 | aaa     | 
|  3 | aaa     | 
|  4 | aaa     | 
+----+---------+

我们发现，这个 SQL 将 str_col='aaa' 的记录也查找出来了，为什么呢?

mysql [localhost] {msandbox} (test) > warnings 
Show warnings enabled. 
mysql [localhost] {msandbox} (test) > explain extended select id,str_col from tbl_name where str_col="xxx" = "yyy"\G 
*************************** 1. row *************************** 
           id: 1 
  select_type: SIMPLE 
        table: tbl_name 
         type: index 
possible_keys: NULL 
          key: idx_str 
      key_len: 33 
          ref: NULL 
         rows: 4 
     filtered: 100.00 
        Extra: Using where; Using index 
1 row in set, 1 warning (0.00 sec) 
 
Note (Code 1003): /* select#1 */ select `test`.`tbl_name`.`id` AS `id`,`test`.`tbl_name`.`str_col` AS `str_col` from `test`.`tbl_name` where ((`test`.`tbl_name`.`str_col` = 'xxx') = 'yyy')

这里他把 where 条件转化成了：

((`test`.`tbl_name`.`str_col` = 'xxx') = 'yyy')

这个条件的首先判断 str_col 和 'xxx' 是否相等，如果相等，那么里面括号的值为 1，如果不相等，就是 0。

然后 0 或者 1 再和和 'yyy' 进行判断，由于等号一边是 int，另外一边是字符串，两边都转化为 float 进行比较。

可以看我之前的一篇文章 MySQL 中隐式转换导致的查询结果错误案例分析：

http://www.fordba.com/mysql-type-convert-analysis.html

'yyy' 转化为浮点型为 0，0 和 0 比较恒等于 1。

mysql [localhost] {msandbox} (test) > select 'yyy'+0.0; 
+-----------+ 
| 'yyy'+0.0 | 
+-----------+ 
|         0 | 
+-----------+ 
 
1 row in set, 1 warning (0.00 sec) 
 
mysql [localhost] {msandbox} (test) > select 0=0; 
+-----+ 
| 0=0 | 
+-----+ 
|   1 | 
+-----+ 
1 row in set (0.00 sec)

这样导致结果恒成立，也就是 select 语句等价于以下 SQL：

select id,str_col from tbl_name where 1=1;

将查询出所有的记录。

小结

在写 SQL 的过程中，一定要小心引号的位置是否正确，有时候引号位置错误，SQL 依然是正常的，但是却会导致执行结果全部错误。在执行前必须在测试环境执行测试，结合 IDE 的语法高亮发现相应的问题。

作者：Harvey

编辑：陶家龙

出处：www.fordba.com/mysql-double-quotation-marks-accident.html