如何打破自我提升的泡沫

【編者按】SharpestMinds聯合創始人Jeremie Harris分享了申請數據科學家職位的經驗。

如何打破自我提升的泡沫

我仍然記得我兄弟決定賣出他的比特幣的時刻。那是2017年,當時我們在星巴克。我們碰到了一個發傳單的中年婦女。傳單開頭用黑體印著“比特幣:通向提前退休的道路”。

當時我挺好奇的,就問了她對加密貨幣市場的看法,結果發現她對比特幣以外的其他加密貨幣幾乎一無所知。以太坊?“從來沒聽說過。”萊特幣?“那是廉價版的比特幣,是吧?”

從經驗上說,如果毫無頭緒的中年婦女都在當地的星巴克向你宣傳最新的技術趨勢,你大概正接近不實宣傳的高峰,或者“泡沫”。

當然這算不上什麼新發現。每個人都同意,投資的時候如果你做的和其他所有人都一樣,那你不太可能得到多少回報。很奇怪的一點是,人們沒能在投資自身上應用同一推理。

假設你想要應聘數據科學家職位。如果你做的全是標準的“我想要成為一位數據科學家”事情,那麼這就意味著你不應該期望得到夢想的工作。目前市場已經充斥了初級水平的人員,因此,處於中位數水平的新手數據科學家不太可能得到太多認同。所以,你如果想要避免中位數的結果,為什麼要做中位數的事?

問題在於,大多數人開始他們的數據科學之旅時不是這麼想的。我在SharpestMinds工作的時候和數百名新手數據科學家聊過,其中大約80%的人告訴我的都差不多:

  1. 首先,他們學一些基礎(Python + sklearn + Pandas,也許還學點別的,比如SQL)
  2. 接著,他們參加了千篇一律的MOOC課程
  3. 他們讀了一些工作描述,擔心不符合條件
  4. 也許去參加另一門MOOC,也許開始申請工作
  5. 沒有收到任何迴音(或者,最好的情況下,參加了一些面試,全搞砸了)
  6. 變得很沮喪,考慮是不是去讀個碩士,或者再申請一些工作
  7. 到了抉擇的時刻了:該不該重複第2-7步直到發生了不同的事情?

如果這符合你的情況,那麼很可能你也處在一個自我提升的泡沫中:你正在做所有其他人都在做的事,但期望得到不同的結果。你需要做一件事:停下來

如果你期望超出平均水平的結果,那麼你不能做平均水平的事情。但是,想要避免平均水平的事,你需要知道什麼是平均水平的事。

這裡是一些例子:如果你需要參加一個MOOC課程學習一些基礎,那很好。但不要陷入MOOC螺旋:MOOC,從定義上來說,基本上都是為平均水平的人設計的。所以你並不會因為上了多門MOOC就成為一個突出的人。類似地,如果你的GitHub上有4到5個Jupyter notebook,內容都是乏味的sklearn/Pandas/seaborn/Keras技術棧,不要再做一個新的了

總的規則是:如果有一件事看起來是明顯的下一步,因為所有其他人都這麼做,這是一件很好的不去做的事。相反,你需要找到其他人不做的事,並且儘快去做。

那是些什麼樣的事情?根據我的經歷,我想到5件:

  1. 復現論文。 如果你是深度學習愛好者,這一點尤其重要。人們不做這事,因為這比獲取一個數據集,然後使用簡單的人工神經網絡或XGBoost進行千篇一律的分類要難。在arXiv上找一篇和你的領域相關的最有趣的論文(最近的論文最理想),閱讀它,理解它。接著,復現它,可能是在一個新的數據集上覆現。寫篇博客總結這次復現。
  2. 不要呆在舒適區。 如果你開始一個新項目,最好學習一些新框架/庫/工具。如果你正創建第6個Jupyter notebook,開頭是df = pd.read_csv(filename),結尾是f1 = f1_score(y_true, y_pred),是時候改變你的策略了。
  3. 學習枯燥的東西。 其他人不做這事,因為沒人喜歡枯燥的東西。但是,學習正確的Git流程,如何使用Docker,如何使用Flask搭建一個應用,如何部署模型至AWS或Google Cloud,這些都是公司很盼望申請人具備的技能,但大多數申請人低估了這些技能的重要性。
  4. 做頭疼的事情。 1) 爭取在當地的數據科學聚會上講篇論文。或者,最起碼,參加當地的數據科學聚會。2) 給LinkedIn上的人發冷消息。試著首先提供一些價值(“我剛發現了你網站上的一個筆誤”)。不要直接向他們請求一份工作。你的請求越具體越好(“我希望你能給我的博客文章一點反饋”)。你正試圖建立關係,拓展你的網絡,那需要耐心。3) 參加會議和組織。4) 創辦一個學習小組。
  5. 做看起來瘋狂的事情。
    每個人都用UCI倉庫,或者使用某個股票數據集(沒勁)來創建他們的項目。別這麼做。學習如何使用一個網頁抓取庫,或者某個被低估的API創建自己的定製數據集。數據很難獲取,公司常常需要依靠工程師收集數據。你的目標是成為那種痴迷數據科學的瘋子,如果工作需要,會自己創建該死的數據集。

這些策略都是一種在僱主每天面對的噪聲中突出自己的方法。它們都不是銀彈,但它們是在數據科學工作市場上得到更多認同,成為更能幹的數據科學家的萬無一失的方法。

最後,記住,培養自己的技能是對自身的投資。那意味著適用於投資的經濟學原則同樣適用於此:如果你想要突出的結果,那麼你需要做突出的事情。

如果你對如何優化自己的機器學習或數據科學軌跡存有疑問,我很樂意和你聊聊。在Twitter上給我(jeremiecharris)發DM :)

原文 To get hired as a data scientist, don’t follow the herd https://towardsdatascience.com/the-economics-of-getting-hired-as-a-data-scientist-e3882933b43c

感謝原作者Jeremie Harris授權論智編譯


分享到:


相關文章: