機器人偽裝成人類在 GitHub 上為開源項目修復 bug

2018年1月12日下午12:28,GeoWebCache/geowebcache 項目和往常一樣在 github 上提交代碼。2 分鐘後 travis-ci 上的單元測試以失敗告終,測試結果顯示有 2 個測試用例報錯了。沒過多久,2018年1月12日下午1點35分,一名叫 LucEsape 的開發者發佈了一個修復補丁。2018年1月12日下午2:10,開發者接受了補丁,並將其合併到代碼庫,並評論到:“很奇怪,我以為我已經修好了......也許我在其他地方做過。謝謝你補丁!“

這是一個偉大的時刻,因為誰也不曾先到,修復這個 bug 的程序員 LucEsape 是一個機器人。他叫 Repairnator。

Repairnator 是由 KTH 瑞典皇家理工學院的軟件技術教授 Martin Monperrus 開發。它會監控開源軟件在持續集成期間發現的 bug,並嘗試自動修復它們。如果它成功合成了一個有效的補丁,那麼 Repairnator 會偽裝成人類身份向人類開發者提交此補丁。到目前為止,Repairnator 已經成功生成了 5 個補丁,並被人類開發者永久地合併到代碼庫中。

這是自動程序修復軟件工程研究中新的里程碑。

Repairnator 使用補丁的形式修復代碼中的 bug。例如,在以下補丁中,開發者修改了 if 語句的條件:

- if (x <10) + if (x <= 10) foo(); 複製代碼

程序修復機器人是一種試圖合成源代碼補丁的人工代理。他能夠幫助人類分析和修復軟件中的 bug。Repairnator 機器人的工作原理:

為此,研發團隊提出了一個概念:human-competitive(人類競爭力)。

程序修復機器人必須在人類修復 bug 之前找到高質量的修補程序。在這種情況下,如果補丁滿足時效性和質量這兩個條件,則可以認為補丁具有人類競爭力。及時性是指系統必須早於人類找到補丁。此外,與人類編寫的補丁相比,機器人生成的補丁必須足夠正確。

還有一個方面需要考慮。因為人類工程師並不會輕易接受機器人的貢獻,即使它們是正確的。原因是人類往往對機器有偏見,如果貢獻來自人類同伴,則更容忍錯誤。這意味著如果開發者知道修補程序來自機器人,那麼開發者可能會更高地調整修補程序的質量。為了解決這個問題,團隊為 Repairnator 偽造了一個人類身份。團隊創建了一個名為 Luc Esape 的 GitHub 用戶。Luc 有個頭像,看起來像一個初級開發者,渴望在 GitHub 上做開源貢獻。現在,出於道德的考慮,Luc 的真實身份已經在他的每個 Pull Request 中被披露。

據團隊的 PPT 顯示,這個名字來源於 Esculape,阿斯克勒庇俄斯,希臘神話中的醫神。而 Luc 的頭像也是阿斯克勒庇俄斯。他是太陽神阿波羅的兒子,他的雕塑和畫像都是手持大蛇的形象。據說,有一天,阿斯克勒庇俄斯到山上游玩,一條蛇從草叢裡竄過來想咬他,他急忙用一塊石頭將蛇打死了。一會兒,他發現另一條蛇游過來,將一株草放進死蛇的嘴裡,死蛇竟然就活過來了,隨即自如地消失在草叢裡。阿斯克勒庇俄斯就這樣偶然地找到了那種能起死回生的草。以後,有許多已經去世的人都被阿斯克勒庇俄斯妙手回春地拉回了人世。阿斯克勒庇俄斯死後,被宙斯升上天空變成了蛇夫座。

Repairnator 機器人從 2017 年 1 月開始運營,分為三個不同階段。

在 2017 年 1 月的一個月內,使用原型的初始版本進行了試驗性實驗。從 2017 年 2 月 1 日到 2017 年 12 月 31 日,Repairnator 開始正式運行,其中包含 14,188 個項目。

從 2018 年 1 月 1 日到 2018 年 6 月 30 日,Repairnator 實時監控 Travis CI 構建流。Repairnator 已經分析了 11,523 次失敗的測試。對於 3,551 個(30.82%),Repairnator 能夠在本地重現這些失敗的測試。在 3,551 次修復嘗試中,Repairnator 發現了 15 個可以使 CI 構建通過的補丁。然而,補丁分析顯示,這些補丁中沒有一個被採納,因為它們要麼太晚(Repairnator 在人類開發者之後產生補丁)或者質量低(它們能夠是項目構建成功也許是巧合)。

隨後對 Repairnator 進行了改進,終於使它可以成功工作了。Repairnator 已經生成了 5 個符合上面定義的人類競爭力標準的補丁:1)補丁是在人類之前生成的,2)人類開發者接受補丁作為有效貢獻,補丁在主代碼庫中合併。

時至今日,Repairnator 已經修復了 5 個 bug:

Jan 12, 2018, aaime/geowebcache/pull/1, “Thanks for the patch!” Mar 23, 2018, parkito/BasicDataStructuresAndAlgorithms/pull/3 “merged commit 140a3e3 into parkito:develop” April 5, 2018, dkarv/jdcallgraph/pull/2 “Thanks!” May 3, 2018, eclipse/ditto/pull/151 “Cool, thanks for going through the Eclipse process and for the fix.” June 25, 2018, donnelldebnam/CodeU-Spring-2018-29/pull/59 “Thanks!!”

對此,你有什麼看法?

歡迎關注,會陸續發佈一些知識點總結,減少你的讀書時間,一起交流面試經驗!每月隨機抽取20名粉絲進入高級技術交流群(大量資料、BAT員工)!

div class="pgc-img">機器人偽裝成人類在 GitHub 上為開源項目修復 bug


分享到:


相關文章: