開源與 AI 引領技術新格局,詳解百度投資開源中國的底層邏輯

日前,百度一筆投資引發整個行業的關注。根據媒體報道,百度戰略投資中文開源技術社區開源中國。

百度作為一家人工智能平臺型公司,過去幾年在 AI、自動駕駛等領域為整個開源社區做出了重要貢獻。公開資料顯示,百度開源的飛槳是中國唯一功能完備、開源開放的深度學習平臺,Apollo自動駕駛開放平臺則是全球首個自動駕駛開源項目,BAETYL 也是中國首個開源的邊緣計算框架。

另一方面,開源中國是目前國內最大、最活躍的中文開源社區,一直致力於推動國內開源技術的應用和發展,擁有近 400 萬開發者。

一邊是業界領先的 AI 巨頭,一邊是開源社區的佼佼者,百度的這筆投資也具備了多重意義。

開源與 AI 引領技術新格局,詳解百度投資開源中國的底層邏輯

從行業視角去看,近幾年在機器學習、深度學習等技術趨勢加持下,開源與 AI 正在左右軟件行業的未來,百度的一系列 AI 開源產品也將通過開源中國的平臺更好賦能開發者。

而在國家技術安全層面,這筆投資對於推動發展中國獨立自主可控的開源技術意義重大,特別是在國際大環境不確定以及 AI 競爭加劇的當下,依託百度在 AI 領域的開源技術和產品,有助於建設中國開發者的開源社區,減少對國外開源社區的依賴。

那麼,透過這筆投資,如何更好理解開源、AI 之於軟件行業的關係?以及中國開源社區、AI 開源之於中國軟件乃至中國科技行業發展的影響?

接下來,我們來一一探索其中的邏輯。

開源如何影響軟件行業

自上世紀 90 年代末以來,開源軟件已經有了二十多年的歷史,這二十多年裡,科技行業從互聯網時代大踏步地來到移動互聯網以及 AI 時代,在這個過程裡,開源軟件逐漸成為科技行業發展的重要推動力。

一方面,大量開源產品基於底層技術基礎設施開發,比如開源數據庫 MySQL,極大推動了早期互聯網企業的發展。與此同時,包括紅帽在內的開源軟件公司,通過開源與商業軟件的正向循環,構建了一套全新的商業模式。


開源與 AI 引領技術新格局,詳解百度投資開源中國的底層邏輯

另一方面,2008 年 Github 成立。Github 的價值並不是簡單提供一個 Git 工具或代碼託管平臺,而是以開源代碼的形式構建了一個開源社區,進一步將開源文化散播到世界的各個角落。越來越多的開發者、企業開始將自己的代碼開源到 Github,在開源協議的規範下,接受全世界開發者的「檢驗」,同時也在全世界開發者的不斷優化、迭代中,實現更好的軟件性能。

也正是在這樣的背景下,僅在 2018 年,IBM 斥資 340 億美元收購紅帽,微軟 75 億美元收購 Github。與百度戰略投資開源中國一樣,這些巨頭們看中的,正是開源軟件、開源社區在軟件開發中的重要意義。

如果說開源悄然改變了軟件開發的方式,那麼機器學習、深度學習的流行,則將從根本上重塑軟件開發的流程。

當 AI 平臺也開源

2016 年 9 月,隨著百度開源深度學習平臺 PaddlePaddle(中文官方名稱為「飛槳」,以下簡稱為「飛槳」),中美兩大深度學習開源平臺飛槳與 TensorFlow 成為全球 AI 開發的重要平臺。


開源與 AI 引領技術新格局,詳解百度投資開源中國的底層邏輯

AI 開發與傳統軟件開發有著本質不同。首先,即便是採購了昂貴的計算基礎設施(比如 GPU 集群),AI 開發還需要構建數據、算法模型選擇、測試部署等流程,這也將大量中小企業以及個人開發者排除在外。

而開源的 AI 平臺恰恰解決了這個難題。以百度開源的飛槳為例,它是集核心框架、工具組件和服務平臺為一體的端到端開源深度學習平臺,這意味著,即便是個人開發者,都可以利用飛槳提供的平臺和能力,快速訓練、部署自己的深度學習模型,這種「站在巨人肩膀」的創新儼然成為 AI 時代軟件開發的潮流。

其次,AI 領域的發展非常快,基於開源的形式,這些 AI 平臺上的算法模型迭代與業務需求「你追我趕」,AI 平臺也在不斷進化。

飛槳就在 2019 年迎來一系列重要升級。比如在 AI 開發的核心框架上,可以同時向用戶提供動態圖和靜態圖,這滿足了不同階段的用戶需求,動態圖側重AI 訓練效果實時調試,靜態圖則加速 AI 業務快速部署。

再比如模型訓練上,目前飛槳為用戶提供100+精選經過真實業務場景驗證的、應用效果最佳的官方算法模型,涵蓋視覺、NLP、語音和推薦等AI核心技術領域。

而在今年 11 月的「WAVE SUMMIT+」2019深度學習開發者秋季峰會上,百度將包括 ERNIE 語義理解、PaddleDetection 目標檢測等四大端到端開發套件的開源,飛槳進一步降低了深度學習與 AI 開發的門檻,極大提升了易用性,滿足不同行業、不同階段開發者和企業的 AI 開發需求。

從開源軟件到開源 AI 平臺,開源不僅改變了軟件業態的模樣,還在定義全球科技產業的格局。

開源與 AI 如何推動中國技術的自主創新

即將過去的 2019 年對於中國科技產業而言可謂五味雜陳,面對潛在的「斷供」、「停止支持」風險,中國企業也需要真正自主可控的技術,而開源與 AI 成為推動中國技術自主創新進而實現軟件領域突圍的「雙引擎」。

其一,過去幾年,包括百度、阿里、騰訊在內的中國科技巨頭積極擁抱開源,在不同的開源社區發佈自己的開源項目,鼓勵國內外的開發者共同參與其中。

這些開源項目脫胎於中國互聯網的產品需求,對於中國開發者更友好,以區塊鏈技術為例,超過80%的區塊鏈技術平臺是使用國外開源技術(如Fabric、以太坊)的產品或者衍生產品。2019年5月,百度首次對外發布區塊鏈品牌——Xuper,並宣佈底層區塊鏈技術XuperChain 正式開源,與開發者共享科技創新成果,告別技術上的「拿來主義」和核心技術依賴別國帶來的風險。

其二,根據技術社區 Infoq 此前的一份報告,中國科技巨頭在積極開源的同時,還需要提供更多有技術前瞻性以及行業領導性的項目,這其中,百度飛槳、自動駕駛平臺 Apollo 多少有點「獨樹一幟」。

正如前文所言,飛槳是中國唯一的功能完備、開源開放的深度學習平臺,而Apollo 則是百度提供給全球自動駕駛領域的開源方案。

開源與 AI 引領技術新格局,詳解百度投資開源中國的底層邏輯

自 2017 年亮相以來,Apollo 已經更新有了三次大版本的更新,伴隨快速迭代的系統版本,Apollo 生態也從無到有、從一到多,快速成長為世界級的自動駕駛開放平臺,公開資料顯示,僅截至去年7月,Apollo 平臺已經開放了 22W+ 行代碼,其託管在 GitHub 上的開放代碼數量在一年之內增長了 6 倍,而根據 InfoQ 的統計,Apollo 的代碼貢獻者數量也相當可觀。

其三,作為中國的軟件開發者,在這個開源的 AI 時代,一方面可以充分利用國內科技巨頭們的開源項目——在飛槳上訓練 AI 模型、利用 BAETYL 部署邊緣計算項目或者將 Apollo 納入自動駕駛項目裡——另一方面,通過像開源中國這樣的中國開源社區,不斷反饋、迭代、貢獻源代碼,形成中國特色的開源生態。

值得注意的是,此次戰略投資開源中國,百度除了把飛槳入駐到開源中國代碼託管平臺 Gitee外,其它百度系優秀開源產品也將陸續入駐,為開發者提供更多開發工具和技術服務,為開發者構建更多創新應用提供支持。

寫在最後:中國 AI 開源黃金時代的序幕

如果從美國貝爾實驗室發明晶體管算起,由晶體管引領的計算革命已經走過了 70 餘年,中國軟件行業在這 70 餘年一直處在追趕者的位置,計算機時代如此、互聯網時代亦是如此。

從移動互聯網開始,中國軟件開始有了一系列應用模式的創新,但這些創新的底層技術架構,依然受限於別人的開源產品。

到了 AI 時代,不管是深度學習一站式開發還是自動駕駛研發,抑或是基於 5G 的邊緣計算創新以及區塊鏈的商業創新,百度過去幾年為中國軟件開發者們提供了一系列業界領先、自主可控的底層技術平臺,使得中國開發者從一開始就站在了新技術的起跑線,依靠中國自研的技術與全球開發者們同場競技。

更重要的是,這些平臺都以開源的形式向開發者賦能,與開發者們共同成長,推動中國開源技術生態的快速發展。這也正是百度投資開源中國的要義所在,而在 AI、5G 全球競爭加劇的大背景下,或也將成為中國開源生態黃金時代的序幕。(完)


分享到:


相關文章: