字节跳动实习生攻击大模型训练

Sun 20 October 2024

字节跳动大模型训练被实习生攻击,涉事者已被辞退

10月18日,多个微信群流传一则消息:"某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。"

界面新闻从知情人士处获悉,该头部大厂为字节跳动。此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。

界面新闻向字节跳动求方面证此事,截至目前,官方未进行回应。

传闻显示,该田姓实习生利用了HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且AML团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。

界面新闻从知情人士处了解到,字节跳动内部已经调查明确此事为田姓实习生所为。目前,该实习生已被辞退,字节跳动同时把此事同步给大模型行业联盟和该实习生所在的给学校。但这名实习生被辞退后到处"辟谣"甩锅,称是其他人所为。

但该实习生攻击的并不是豆包大模型,而是商业化技术团队的模型训练任务,影响了该技术团队的一些业务进展,但整体对公司造成的损失并没有传闻中的超过千万美元那么大。

一位技术安全专家告诉界面新闻,HF漏洞产生肯定是单一性集中训练,此事暴露了字节跳动技术训练存在安全管理问题。公司既没做权限隔离,也没有做好共用代码的审计。正常情况下,每次大的代码变动必须做审计,无论谁做操作都有痕迹记录,一个人想动代码是不可能的。

上述技术安全专家表示,目前行业通用的做法是做三级隔离导向性部署,每一级只有镜像,每次先扫描。调用按次算、必须密钥。每一级完成后,才能进入下一级,而上一级自动删除,进行分级训练。

据字节跳动今日头条官方账号消息,字节跳动10月19日发布关于"实习生破坏大模型训练"的事实澄清:

近期有媒体称"字节跳动大模型训练被实习生攻击",经公司内部核实,确有商业化技术团队实习生发生严重违纪行为,该实习生已被辞退。但相关报道也存在部分夸大及失实信息,特说明如下:

一、涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。

二、网传"涉及8000多卡、损失上千万美元"严重夸大。

三、经核实,涉事人一直在商业化技术团队实习,并没有AI Lab实习经历。其社交媒体个人简介及部分媒体报道有误。

该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校,交由校方处理。

来源:界面新闻

据南都记者获悉,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院,判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。

据南都记者了解,2024年10月,有媒体称"字节大模型训练任务被实习生攻击",并有网传信息称"涉及8000多卡、损失上千万美元"。后字节跳动通过官方账号发布事实澄清,称确有实习生发生严重违纪,涉事实习生已于2024年8月被公司辞退。

字节跳动:关于"实习生破坏大模型训练"的事实澄清

近期有媒体称"字节跳动大模型训练被实习生攻击",经公司内部核实,确有商业化技术团队实习生发生严重违纪行为,该实习生已被辞退。但相关报道也存在部分夸大及失实信息,特说明如下:

一、涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。

二、网传"涉及8000多卡、损失上千万美元"严重夸大。

三、经核实,涉事人一直在商业化技术团队实习,并没有AI Lab实习经历。其社交媒体个人简介及部分媒体报道有误。

该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校,交由校方处理。

上述澄清公告还指出,此次涉事行为恶意干扰的是,字节跳动商业化技术团队某研究项目的模型训练任务,并不影响公司的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。至于"涉及8000多卡、损失上千万美元"的传闻,则属严重夸大。

11月5日,字节跳动内部发布的年内第四份《企业纪律与职业道德委员会通报》进一步披露了这起事件的相关细节。通报指出,2024年6月至7月,集团商业产品与技术部门前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。公司已与其解除实习协议,同步阳光诚信联盟及企业反舞弊联盟,并同步至其就读学校处理。

公开信息显示,田某某本科毕业于北京航空航天大学软件学院,研究生就读于北京大学,研究兴趣为深度学习的优化与算法。自2019年起,他在商汤和字节跳动实习研究,具体包括超参数优化、强化学习算法、自监督的新型算法。

为何选择在此时发起诉讼?

据字节跳动内部人士介绍,由于田某某为在读博士,公司将其辞退后首先交由校方处理。但在事件处理期间,田某某多次对外否认,称攻击模型训练任务的不是自己,而是别的实习生。考虑到田某某完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉,以表明公司严肃态度、杜绝类似事件再次发生。

如何看待这一索赔金额?上海大邦律师事务所高级合伙人游云庭告诉南都记者,索赔金额的高低,关键在于其是否合理。如果字节跳动能够提供证据,证明对方故意篡改代码导致相应损失,那么即使索赔800万,也不能视为过高。

他认为,"索赔金额可能只是覆盖了直接损失,例如浪费的算力和电力成本;而间接损失,如因人工智能训练未达预期而错失的业务机会、人力成本的浪费等,可能并未包含在内。"

据游云庭分析,如果田某某是作为在校学生去实习,他与字节跳动之间的法律关系可能是劳务关系或者非劳动关系的其他民事关系。在这种情况下,如果田某某故意破坏了人工智能的训练过程,这可能构成对劳务合同或实习合同的违约。

游云庭还提到,如果此事确实造成巨大损失,田某某涉嫌毁坏财物罪或者破坏生产经营罪,那么作为被害人的字节跳动可以追究实习员工刑事责任。

来源:南方都市报,采写:南都记者李玲 黄莉玲 杨柳

相关文章

::: {#commentsbox} []{.underline}

  1. ::: {#comment-250462} ::: {#div-comment-250462 .comment-body} ::: {.comment-author .vcard} ::: {style="float:right"} 1 :::

    [GoodBoyboy]{#cmt250462}   [说道:]{.says} :::

    ::: {.comment-meta .commentmetadata} :::

    安全问题已经习以为常了[]{#AjaxCommentEnd250462} ::: {.reply} [2024/10/20 11:27:40]{.comment-meta .commentmetadata style="float:left"} []{#note250462}支持([0]{#sdig250462}) 反对([0]{#sdown250462}) 回复 ::: :::

::: {.sidebar-box .clearfix}

网站分类

::: {.sidebar-box .clearfix}

热文排行

::: {.sidebar-box .clearfix}

站点统计

  • 文章总数:7485
  • 评论总数:199452
  • 浏览总数:71465589
  • 当前主题:SimplePro :::

Category: m2