實習生攻擊字節(jié)跳動大模型訓(xùn)練:揭秘背后四大真相
字節(jié)跳動的模型訓(xùn)練遭到實習生攻擊一事引發(fā)了網(wǎng)友的廣泛關(guān)注,相關(guān)話題迅速登上了熱搜榜。
據(jù)“大廠青年”爆料,內(nèi)部員工透露,雖然確實發(fā)生了破壞模型訓(xùn)練的事件,但其中也夾雜了一些夸大的傳聞。
據(jù)了解,這起事件發(fā)生在六月底。一名來自知名高校的博士生田某某在字節(jié)跳動商業(yè)化技術(shù)團隊實習,由于對資源分配不滿,他使用惡意代碼破壞了團隊的模型訓(xùn)練任務(wù)。
需要澄清的是,受影響的并不是字節(jié)跳動的大模型,而是商業(yè)化技術(shù)團隊負責的廣告部門的模型訓(xùn)練任務(wù)。
關(guān)于損失上千萬美元的傳聞則被認為過于夸張。
此外,“實習生被送進去”的說法不屬實,實際處理方式是辭退,并將情況通報給行業(yè)聯(lián)盟和學校。
消息曝光后,這名涉事實習生試圖在社交平臺上辟謠,將責任推卸給他人,但很快被接近字節(jié)跳動的人士否認。
據(jù)知情人士在GitHub上的描述,“你(指田某)在長達兩個月的時間里對集群代碼進行了惡意攻擊,對公司近30位員工造成了巨大傷害,讓同事們幾乎一個季度的工作付諸東流。所有記錄和審查都證明這是無可辯駁的事實!”
據(jù)悉,田某某利用Huggingface(HF)平臺的漏洞,在公司的共享模型中植入了破壞性代碼,導(dǎo)致模型訓(xùn)練效果波動不定,無法達到預(yù)期成果。
一位前字節(jié)跳動技術(shù)員工表示,“字節(jié)AI Lab給予實習生與正式員工相似的權(quán)限,這為此次事件埋下了隱患。”他對事件帶來的負面影響表示擔憂,并預(yù)測“這件事之后,公司肯定會大幅收緊實習生權(quán)限”。