爲什麼這麼多數據科學家離職?

沒錯,我是一名數據科學家,曾經在英國網絡點餐外賣平臺Deliveroo工作;沒錯,你也沒看錯標題。沒錯,真相總得有人說出來。

為什麼這麼多數據科學家離職?

數據科學是本世紀最理想的工作,這個領域擁有大量高端人才,他們熱衷於解決複雜的問題,這樣的報道已經連篇累牘。

但事實是,根據英國《金融時報》的報道,數據科學家通常“每週花一兩個小時尋找新工作”。

這篇報道還指出,根據程序設計專業問答網站Stack Overflow針對6.4萬名開發人員的調查,數據科學家在尋找新工作的開發人員名單上名列前茅。

那麼,為什麼這麼多數據科學家在尋找新的工作?

從我的角度來看,數據科學家對他們的工作不滿意有四個主要原因。

一、期望與現實不符

關於大數據,每個人都在談論它,但沒有人真正知道如何去做,每個人都認為其他人都在做,所以每個人都聲稱他們在做——丹·艾瑞里(Dan Ariely)

艾瑞里的描述很貼切。我認識的許多初級數據科學家(包括我自己)都想進入數據科學領域,因為這個行業總是用最牛的新機器學習算法去解決複雜問題,而且這些算法對企業產生了巨大影響。這樣的一個情景讓讓我們覺得我們正在做的工作比以往做過的任何事情都重要。然而,情況往往並非如此。

在我看來,期望與現實不符是許多數據科學家離開的最終原因。

每個公司都不一樣,所以我不能代表所有公司,但是許多公司招募了基礎不相當的數據科學家來從事人工智能研究,這導致了人工智能中的冷啟動現象。加之這些公司在僱傭年輕人之前並未擁有資深的數據專家,因此公司與員工都會彼此產生失望和不愉快。

數據科學家往往被要求上手直接編寫智能機器學習算法,但實際上不應該這樣做,因為他們的第一項工作是整理數據基礎,創建分析報告。但公司管理層不這樣想,他們只想要一張可以在董事會上展示的圖表。 因此他們認為沒有很快看到數據科學家的價值,而這也使得數據科學家不開心。

羅伯特·張(Robert Chang)在他的博客中引用了一句非常有見地的話,他給初級數據科學家提供了建議:

重要的是要評估我們的願望與我們所在公司的關鍵路徑有多一致。我們應該尋找關鍵路徑與自己最一致的項目、團隊和公司。

這突出了僱主和數據科學家之間的雙向關係。如果公司不在正確的路徑,或者發展目標與數據科學家 不一致,那麼數據科學家的跳槽只是時間問題。

數據科學家失望的另一個原因與我對學術界失望的原因相似。我們總自信地認為能夠對整個世界產生巨大影響,不僅僅是公司內部。實際上,如果公司的核心業務不是機器學習(我以前的僱主是一家媒體出版公司),那麼你所做的數據研究很可能只會帶來少量的增量收益。

二、政治至高無上

如果你真的認為精通機器學習算法會讓你成為最有價值的數據科學家,那麼請參看第一點 。

事實是,你需要業內的權威人士對你有一個良好的評價。這可能意味著你必須經常做一些臨時性的工作,比如在適當的時間從數據庫中獲取數字給適當的人,以及從事簡單的項目。在我之前的公司,我不得不做很多,儘管令人沮喪,但這是工作中不可或缺的一部分。

三、所有數據有關的事情都來找你

從前面的觀點來看,公司中有影響力的人往往不明白“數據科學家”是什麼意思。這意味著你將是分析專家,也是報告專家,當然,你還必須是數據庫專家。

不只是非技術高管會對你的技能做出太多假想。技術領域的其他同事也會認為你理所應當知道所有與數據相關的事情,包括如何處理Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A / B測試、NLP等。(如果你看到上面有所有這些的招聘廣告,保持清醒。這意味著一家公司不知道他們的數據策略是什麼。)

但這並不止於此。因為你知道所有這些,並且顯然你可以訪問所有的數據,所以你應該會得到所有問題的答案。

試圖告訴每個人你真正知道和控制的事情可能很難。作為一名缺乏行業經驗的初級數據科學家,你會擔心人們會對你不太重視,這可能是一個相當困難的情況。

四、在一個孤立的團隊中工作

當我們看到成功的數據產品時,我們經常會看到經過專業設計的具有智能功能的用戶界面, 重要的是,它能輸出有用的信息,這就是價值所在。現在,如果一個數據科學家只花時間學習如何編寫和執行機器學習算法,那麼他們只能是團隊中的一小部分,這意味著獨立工作的數據科學團隊將難以凸顯價值!

儘管如此,許多公司仍然有數據科學團隊提出他們自己的項目並編寫代碼來嘗試解決問題。在某些情況下,這就足夠了。例如,如果所需要的只是每季度製作一次靜態電子表格,那麼它可以提供一些價值。但如果目標是優化定製網站產品並提供智能建議,這將涉及許多不同的技能,只有真正的數據科學獨角獸才能解決這個問題。

因此,如果一個獨立的數據科學團隊接手這個項目,很可能會失敗,或者需要很長時間。組織孤立的團隊在大型企業中從事協作項目並不容易。

要成為一名卓有成效的數據科學家,僅僅在Kaggle競賽中表現出色並完成一些在線課程是不夠的,還取決於你對公司的商業運作路徑的理解。在尋找數據科學工作時,找到一家關鍵路徑與你一致的公司很重要。即使如此,你可能仍然需要重新調整你的期望。(Jonny Brooks-Bartlett)


分享到:


相關文章: