需求

更新表的某个字段,DBA要求一条SQL语句不能超过5000行,且必须主键更新(行锁),且更新完后需要sleep 3秒;
以前处理这种数据的时候,都是用excel,但是excel处理大量数据的时候可能就会崩溃。。。而且对于某些特定行的处理不是很方便(其实是我菜,不会excel),为了更好的处理数据,

脚本

查阅shell资料,憋出了如下awk脚本,命名为awk_data.awk文件,

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。
BEGIN{
    printf "update table set is_ok=1 where table_id in (\n"
}

{
    if(NR%100 == 0)
        printf $1");\n select sleep(3);\n update table set is_ok=1 where table_id in (\n"
    else
        printf $1",\n"
}

END{
    printf ");"
}

终端中输入

awk -f awk_data.awk data > temp

得到如下结果

update table set is_ok=1 where table_id in (
    1,
    2,
    ......
    100);
     select sleep(3);
    ......
    ......
    199999,);

bug

可以看到,最后一行多出了一个逗号,会导致SQL语法错误。其实解决办法有多种。

fix bug

第一种就是判断行号是否是最后一行,如果是最后一行,无需加逗号输出。这种办法很笨,因为AWK不是很好获取最后一行。换一种思路,我们可以将上一行的逗号放到下一行开头输出,这样我们只要判断第一行行首,无需加逗号就行了
第二种就是手动删除最后的逗号,让语法正确,我是不是很机智。。。
第三种是在最后END的代码块里一行加一个不存在的主键ID,即

END{
    printf "-1);"
}
扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄