昨天,在脉脉“我来爆个料”话题下,有人爆出「字节跳动一实习生删除公司 GB 以下所有机器学习模型」。
一时间话题引起无数程序员围观。
lite模型指的是轻量级的模型,全称TensorFlow Lite,是一种用于移动端设备深度学习的模型。例如分类,分割的相关模型都很小,很多非常有用的模型都属于轻量模型。
舆论中,有人为实习生的「去留」担忧:
也有人为该同学抱不平:
还有吃瓜群众言,「在字节删字节,在头条上头条。」
那么言归正传,这个应该有谁来负责?事情的严重性又是几何呢?
影响到底大不大?
该楼主评论表示,管理的给子目录加了保护,但是实习生直接删除的是hdfs,还加了 skip trash(删除默认到trash,相当于windows的彻底删除)。
不过有人表示,模型都是离线数据,对线上影响不大。
还有人认为,「说明轻量模型确实没前途了,大规模预训练模型卷起来。」
据传闻,还有传言删了以后,连事故处理群都加了三百多个人。更有员工为了修复加班到3点!
不过,吃瓜群众最关心的莫过于「责任问题」。毕竟,一个实习生能够删除模型,ta的权限何来的呢?
有人爆料称:该实习生实际上不是「手滑」,更不是「手抖」,而是多方问过才下次操作的……
更多的人认为:这锅80%应该判给管理者!
还有人结合近期「字节大小周加班问题」调侃了一下:
权责问题引来讨伐声
问题引发了网友对权责问题的讨论。
据知乎,事故的原因是实习生清理HDFS上的目录,发现一个目录最近更新时间是3月份,就以为这个不用了,多方求证之后得到了这个目录已经没用的结果(绝了),然后删掉了……
直到一个小时后有人发现模型上线不了……
在很多大公司,模型跑完后会放到Hadoop。
但实际上,权限管理目录是个大学问,需要一套大流程。
有人提议,这种情况后续权限控制,或者把skip trash弄掉,或者尽可能把权限拆分到各自的模型上。
总之大部分网友认为,一个实习生不应该承担太多的责任!
其实类似事情还有较为狗血的——2019年AI删库,程序员背锅!
2019年,美国版大众点评Yelp训练了一个用来消除 bug 的神经网络,万万没想到,该网络删除一切,从根本上彻底了实现“bug-free”.
最后,可怜的工程师背了锅。
不小心删库是一种怎样的体验?
据说,程序员一生会删三次库。
在话题「不小心删库是一种怎样的体验?」下,很多人都发表了当年的经历。
比如这位答者:实习的时候删过测试库……
再比如:那感觉天塌下来一样!
还有网友表示:「一辈子难忘!」
多年前(2001年),那还是unix字符界面,半夜我例行维护,我删过一个包含二十万本图书的库…………十分钟后我确认我出错后,我开始冒汗,胃部像是被猛打了一拳开始痉挛,疼的我都坐不住。
好一会我去过道抽了两根烟,才回忆起前天做了全系统备份,丢的数据不多!
当然,恶意删库的现象也不在少数。
2020 年 2 月微盟员工恶意破坏公司数据,让微盟的市值一天之内蒸发了超 10 亿元。不久前,链家网一名员工恶意删除了公司 9TB 数据,造成公司财务系统服务器应用程序出现故障无法登录。不过,这种严重的恶性事件,都让他们受到了法律的审判。
不过,如果此次字节lite模型删除真的没影响线上,某种程度上,这还及时暴露了问题,甚至可能避免了以后更大的错误。