員工竊取前東家算法,還拿到 PyTorch 開源?Facebook 被 MIT 教授起訴

雷鋒網AI源創評論訊,就在上週,一家由麻省理工學院(MIT)兩位教授設立的創業公司,將 Facebook 告上了法庭,指控 Facebook 侵犯了他們的商業機密,還將其核心算法放在 GitHub 開源了,而開源的恰恰是深度學習框架 PyTorch 的一個關鍵庫。

同時被告的還有這家名為神經魔法公司(NeuralMagic, Inc. )的前員工亞歷山大·茲拉特斯基(Aleksandar Zlateski),如今他是 Facebook人工智能研究院的研究科學家。茲拉特斯基被指控違反了保密和競業禁止協議。

员工窃取前东家算法,还拿到 PyTorch 开源?Facebook 被 MIT 教授起诉

【 雷鋒網注:圖片來源:Pixabay所有者:Gerd Altmann 】

2020 年 3 月 4 日,美國麻省地區法院公佈了編號為”第 20-10444 號民事訴訟“的起訴書,原告神經魔法公司敘述了詳細過程。[1]

员工窃取前东家算法,还拿到 PyTorch 开源?Facebook 被 MIT 教授起诉

神經魔法公司創辦於 2017 年,創始人為 MIT 電氣工程與計算機科學系教授尼爾·沙維特(Nir Shavit)[2] 和 MIT 計算機科學與人工智能實驗室的研究科學家亞歷克斯·馬特維耶夫(Alex Matveev)[3] 。

他們的核心技術之一,是包含在編譯器中的一套算法,這些算法具有很大潛力,它允許複雜的數學函數在 CPU 上就能高效運行,不需要使用 GPU 這樣的專門硬件;還允許研究科學家使用比通常大得多的數據集,可以用在醫療保健、癌症篩查、電子商務等方面,讓人工智能應用降低花費和硬件成本,更加普及。

亞歷山大·茲拉特斯基早先是 MIT 的博士後,作為第一個正式員工加入了神經魔法。2018 年 3 月,他成為技術總監,基本年薪為 16.5 萬美元加期權。在擔任技術總監期間,茲拉特斯基有權限獲得公司所有的商業機密、專有信息和商業計劃,關鍵是他能夠接觸到同時也協助編寫了編譯器核心算法的源代碼。

2019 年 7 月,茲拉特斯基離開神經魔法,加入 Facebook,並表示不會涉及到此前參與的編譯器工作。神經魔法也選擇信任他,因為有相關的保密協議,同時預期的工作內容也並不涉及編譯器相關工作。

結果證明這種信任是錯誤的。不到 6 個月後,2019 年 12 月,Facebook 向世界宣佈並開源了一個編譯器,可以通過調查揭示,這其中包括了和神經魔法相同的專有算法。Facebook 甚至還在發行公告裡向茲拉特斯基表示感謝:“團隊認可並高度讚賞茲拉特斯基對稀疏內核和統一代碼緩存的貢獻。”

神經魔法究竟做了什麼

尼爾·沙維特教授在 MIT 已經任教 30 多年,主要興趣是設計,實現和推理多處理器算法的技術,尤其是多核機器的併發數據結構以及控制其行為的計算模型的數學基礎。

2016 年,沙維特教授開始了新的挑戰,開發人工智能系統來重建大腦中神經組織的連通性,被稱為“提取大腦的連接圖”。

當他和馬特維耶夫教授一起在 MIT 實驗室進行測試時,在大量神經生物學數據的基礎上,他們發現,使用正確的算法,可以僅使用標準計算機在這些大型神經生物學數據集上運行神經網絡,而不需要專門的硬件,而且能夠實現非凡的速度。這促成了神經魔法公司的誕生,兩位教授準備將他們的願景變成現實並推向市場。

這意味著數據科學家可以通過 CPU 運行神經網絡和推理引擎,而不是用 GPU 或 TPU 這樣的專用芯片,大大降低了機器學習項目的硬件成本。另外,CPU 還可以訪問更多的內存,不像專用硬件有內存的限制。神經魔法的技術,使得僅僅用軟件和算法,就可以代替高成本的 AI 硬件。

而投資商也看到了這一技術的前景,公司進行了兩輪融資,從 Comcast、NEA 等投資人那裡累計籌集了 2000 萬美元的風險投資。

官司之爭

據起訴書稱,2019 年 11 月,Facebook 在 Github 上披露了神經魔法的算法。一個月後,在西雅圖的 TVM AI 開發者大會上,Facebook 公佈算法開源,可以支持神經網絡在 CPU 上高效運行。

一直到 2020 年 1 月,一個 LinkedIn 帖子才提醒到馬特維耶夫教授,Facebook 已經盜用了神經魔法的算法。Facebook 把它開源的編譯器稱為“Sparse GEMM JIT”,在相關部分實現了神經魔法的算法。

Github 的修改歷史也表明,它的最早發佈者是 Facebook FBGEMM 軟件包的負責人 Jongsoo Park,茲拉特斯基則被列為第一個代碼審查人 [4]。而 FBGEMM( Facebook GEneral Matrix Multiplication,矩陣乘法)正是 PyTorch 框架的卷積庫。[5]

员工窃取前东家算法,还拿到 PyTorch 开源?Facebook 被 MIT 教授起诉

2020 年 1 月 22 日,神經魔法書面要求 Facebook 刪除 Github 有侵權的部分,而 Facebook拒絕接受。

神經魔法公司表示,茲拉特斯基違反了他在加入神經魔法時簽署的保密協議,他和 Facebook忽略了從 Github 消除信息的請求。它要求獲得三倍的實際損害賠償,以及律師費和禁止進一步使用其商業秘密的禁令。

神經魔法還在起訴書裡稱,目前只能看到 Github 開源部分的內容,而茲拉特斯基可能還會向 Facebook 披露更多信息,在內部或未來的開源版本中使用,這些持續的披露會進一步損害神經魔法公司的市場和業務機會。

影響

對於 Facebook 而言,PyTorch 是其最受歡迎的深度學習框架。此次陷入訴訟,會對其未來造成多大影響還未可知。

2019 年 6 月,Facebook 就曾經涉及另外一場訴訟,普林斯頓大學的計算機科學家從一款名為 Planner 5D 的軟件裡,抓取了超過 45000 個文件,用它們來訓練人工智能算法。這些信息組成了被稱為 SUNCG 的數據集。

因為 Facebook 資助了普林斯頓大學的合作,SUNCG 數據集被用到了 Facebook 的虛擬現實公司 Oculus,並作為數據集資源辦了一次數據競賽。結果 Planner 5D 公司將 Facebook 和普林斯頓大學都告上了法庭。最後該數據集也被撤掉。

员工窃取前东家算法,还拿到 PyTorch 开源?Facebook 被 MIT 教授起诉

【 雷鋒網注:圖片來源:Pixabay所有者:Gerd Altmann 】

這其中體現了開源、AI 和學術所涉及到的複雜法律和倫理問題。開源的思維方式很常見,特別是在科學家和開發人員中間,也可以加快科學進步,但是需要這個算法和數據鏈條上的每個人都同意才行。

對於 Planner 5D 公司而言,它認為其對所創建的模型和場景擁有唯一所有權,這個所有權能夠保證商業上的成功。對於神經魔法公司也是一樣,本來 Facebook 是其專有算法的一個潛在大客戶,結果因為員工被挖角跳槽,不僅賠了算法,還被開源了公之於世。

對於剛創業的商業公司而言,這可能是災難性的事件,獨有的算法或者數據都是 AI 時代的關鍵核心;而對於 Facebook 而言,雖然並沒有變成私有,而是開源了算法或數據,但畢竟涉及知識產權的源頭以及和法律的衝突。

在機器學習的社區裡,大家討論熱烈,眾說紛紜。

reddit 機器學習論壇的網友 TSM 認為,這個不涉及專利和版權,涉及的只是算法作為一種商業秘密的共享。商業秘密應該受到保護,它可以阻止大公司挖角小公司的員工以竊取商業秘密,比如豐田曾花很多時間聘請福特公司的一名高級員工,瞭解他們如何完成一些特殊的製造過程。

網友程序辣椒認為,目前至少有 20 家初創公司在做類似非 GPU 芯片上進行稀釋計算的事情,只擁有算法對於公司而言不是一個好基礎,除非有特殊的實現方法,沒有人能夠複製,否則投資價值不大。

網友 hitaho 則說,我會把代碼 fork 一份,先下載下來再說。

引用出處:

[1] https://www.docketalarm.com/cases/Massachusetts_District_Court/1--20-cv-10444/Neural_Magic_Inc._v._Facebook_Inc._et_al/1/

[2] https://people.csail.mit.edu/shanir/

[3] https://people.csail.mit.edu/amatveev/

[4] https://github.com/zlateski

[5] https://github.com/pytorch/FBGEMM

雷鋒網雷鋒網雷鋒網


分享到:


相關文章: