12.06 六個開源數據科學項目

2019-12-06 16:11:48 人工智能遇見磐創

簡介

我最近參加了一個開放數據科學家職位的面試。正如你所能想象的，有來自各種背景的候選人——軟件工程、學習和開發、金融、市場營銷等等。

讓我印象深刻的是，這些人已經完成了一系列令人驚歎的項目。他們本身在數據科學方面並沒有太多的行業經驗，但是他們對學習新概念的熱情和好奇心驅使他們去了以前從未涉足過的領域。

一個共同的特點，開源數據科學項目。在過去的幾年裡，我一直認可開源數據項目的價值。相信我，招聘人員和招聘經理都很欣賞你在接手一個以前沒見過的項目時所付出的努力。

該項目可以來自你當前工作的領域，也可以來自你想要學習的領域。

在這裡，我在本文中展示了六個這樣的開源數據科學項目。。你將發現從計算機視覺到自然語言處理(NLP)等各種項目。

開源計算機視覺項目

對計算機視覺專家的需求每年都在穩步增長。它已經確立了自己作為行業領先領域的地位(這對於任何緊跟最新行業趨勢的人來說都是不足為奇的)。作為一名數據科學專業人士，有很多事情要做，有很多東西要學。

這裡有三個有用的開源計算機視覺項目，你會喜歡的。

NVIDIA的Few-Shot vid2vid

https://github.com/NVlabs/few-shot-vid2vid

去年我偶然發現了視頻到視頻(vid2vid)合成的概念，並被它的有效性所震撼。vid2vid本質上是將一個語義輸入視頻轉換為一個超真實的輸出視頻。從那時起，這個想法已經有了很大的進展。

但是目前這些vid2vid模型有兩個主要的限制:

他們需要大量的訓練數據
這些模型很難推廣到訓練數據之外

英偉達viv2vid框架做了有效的進步。我們可以用它來“生成人體運動姿勢,從邊緣圖合成人物,或者把語義標籤地圖變成實景照片視頻。

這個GitHub庫是一個PyTorch實現，它很少使用vid2vid。你可以在這裡查看完整的研究論文(它也在NeurIPS 2019上發表):https://arxiv.org/abs/1910.12713

這是一段由開發者分享的視頻，展示了幾次拍攝的視頻:https://youtu.be/8AZBuyEuDqc

輕量的面部檢測器

https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB

這是一個超輕版本的人臉檢測模型，一個非常有用的計算機視覺應用。

該面部檢測模型的大小僅為1MB！我讀了幾次後才相信。

該模型是基於libfacedetection架構的邊緣計算設備的輕量級面部檢測模型。該模型有兩個版本：

Version-slim (slightly faster simplification)
Version-RFB (with the modified RFB module, higher precision)

Gaussian YOLOv3：一種精確、快速的自動駕駛目標探測器

https://github.com/jwchoi384/Gaussian_YOLOv3

我是自動駕駛汽車的超級粉絲。但是由於各種原因(建築、公共政策、社區的接受度等)，進展緩慢。因此，看到任何框架或算法為這些自動駕駛汽車帶來更美好的未來，總是令人振奮的。

目標檢測算法是這些自動駕駛車輛的核心——我相信你已經知道了。而高精度、快速的推理速度是保證安全的關鍵。這些都已經存在了好幾年了，那麼這個項目有什麼不同之處呢?

Gaussian YOLOv3架構提高了系統的檢測精度，支持實時操作(一個關鍵方面)。與傳統的YOLOv3相比，Gaussian YOLOv3分別將KITTI和Berkeley deep drive (BDD)數據集的平均精度(mAP)提高了3.09和3.5。

其他開源數據科學項目

這篇文章不僅僅侷限於計算機視覺!正如我在引言中提到的，我的目標是覆蓋數據科學的所有方面。因此，這裡有三個項目，從自然語言處理(NLP)到數據可視化!

Google的T5：Text-to-Text Transfer Transformer

https://github.com/google-research/text-to-text-transfer-transformer

谷歌怎麼可能每次都被排除在“最新突破”名單之外呢?他們在機器學習、深度學習和強化學習研究上投入了大量資金，他們的研究結果反映了這一點。我很高興他們不時地開放他們的項目，我們有很多東西可以向他們學習

T5是Text-to-Text Transfer Transformer的簡稱，它是由遷移學習的概念驅動的。在這個最新的NLP項目中，T5背後的開發人員引入了一個統一的框架，將每個語言問題轉換為文本到文本的格式。

該框架在總結、問題回答、文本分類等任務的各種基準測試上取得了最新的結果。在這個GitHub存儲庫中，他們已經開源了數據集、預先訓練的模型和T5背後的代碼。

正如谷歌的人所說，“T5可以作為未來模型開發的庫，它提供了有用的模塊來向量和微調(參數量巨大)文本到文本混合任務的模型。”

歷史上最大的中國知識圖譜

https://github.com/ownthink/KnowledgeGraphData

最近我讀了很多關於圖的文章。它們是如何工作的，一個圖的不同組成部分是什麼，知識如何在圖中流動，這個概念如何應用到數據科學中，等等。我相信你們現在正在問這些問題。

圖論的某些分支可以應用於數據科學，如知識樹和知識圖。

從這個意義上說，這個項目是一個龐然大物。它是歷史上最大的中文知識地圖，超過1.4億個節點！數據集以（實體，屬性，值），（實體，關係，實體）的形式組織。數據為.csv格式。這是一個出色的開源項目，可以展示你的圖方面的技能。

RoughViz – JavaScript中的出色數據可視化庫

https://github.com/jwilber/roughViz

我是數據可視化的忠實擁護者 -這不是秘密。因此，我總是抓住機會在這些文章中加入一個數據可視化庫或項目。

RoughViz就是這樣一個JavaScript庫，用於生成手繪草圖或可視化。它基於D3v5、roughjs和handy。

你可以使用以下命令在你的計算機上安裝roughViz：

npm install rough-viz

這個GitHub存儲庫包含關於如何使用roughViz的詳細示例和代碼。以下是你可以生成的不同圖表:

條形圖
水平欄
圓環圖
折線圖
餅狀圖
散點圖

結尾

我很喜歡整理這篇文章。在這個過程中，我遇到了一些非常有趣的數據科學項目、庫和框架。這實際上是一種很好的方式來跟上這個領域的最新發展。

分享到:

閱讀更多 人工智能遇見磐創 的文章

關鍵字: 開源無人駕駛機器學習

90後單身女青年的月工資分配情況

朝九晚五薪水少，八小時外“開源”有方

陝西西安曲江新區管委會招聘公告

西安曲江新區，是陝西省、西安市確立的以文化產業和旅遊產業為主導的城市發展新區，在“文化立區、旅遊興區”的發展理念下，不斷在“標誌性、國際範、科技風、地方味”上下功夫，形成了“文化+旅遊+產業”的發展模式和文旅高品質融合的發展道路。

內蒙古自治區體育局面向退役運動員招聘教練員16人簡章

內蒙古自治區體育局面向退役運動員招聘教練員簡章。經自治區人社廳批准，內蒙古自治區體育局直屬事業單位與應聘人員簽訂聘用合同。

2020年甘肅白銀市白銀區鄉鎮衛生院招聘10人公告

白銀市白銀區2020年鄉鎮衛生院公開招聘緊缺專業人才公告　　白銀區各鄉鎮衛生院因工作需要面向社會公開招聘工作人員。現將有關事項公告如下：　　一、招聘計劃　　本次招聘醫療衛生類專業技術人員10名，具體招聘崗位及條件見附表1。

甘肅慶陽招聘政府專職消防員18名公告

根據慶陽市人民政府《關於印發慶陽市招聘合同制政府專職消防員實施意見》文件要求，決定在全縣範圍內公開招聘合同制政府專職消防員18名。

甘肅省武威市教師招聘97人公告

根據武威市教育事業發展需要，按照事業單位公開招聘有關規定，決定採取面試考核方式面向全國引進教育類人才，現將有關事項公告如下:

數據深扒：這輩子在哪些行業打工有可能年薪百萬？

近兩年很流行的FIRE運動，就倡導

這款全能圖片處理工具箱，內置將近100個圖片處理工具，非常實用

在介紹軟件之前，我想問各位一個小問題：各位平時用什麼圖片處理軟件來修圖呢？PS、美圖秀秀？還是ACDSee之類的圖片處理軟件？今天要為大家介紹的這款軟件名為電腦圖像工具箱，它是一款功能非常豐富且強大的處理處理軟件。

人社部最新發布！2020年就業新方向，這16個新職業要火

近日，中國就業培訓技術指導中心發佈《關於擬發佈新職業信息公示的通告》，經人社部同意，現場擬發佈包括人工智能訓練師、網約配送員、健康照護師等16個新職業，並明確賦予了這些職業具體的定義和主要工作任務。

文字辦公—如何在Word中內置一頁PPT

PPT與Word在操作上還是有挺大區別，在PPT中能夠繪製框圖並且多批量處理要素，一鍵框選內容，很多小夥伴習慣於使用PPT轉而使用Word就不太習慣，其實只要一個小操作就能讓Word也實現上述功能。

文字辦公—如何修改Word 的文本樣式

接下來小編跟大家講解如何修改Word

文字辦公—如何讓Word只粘貼網頁中的文字而自動去除圖形和版式

我們在網頁中看到不錯的內容或者查找資料時瀏覽到對報告有意義的內容時，會複製網頁內容至word文檔內，但如果不想整篇網頁內容都複製到文檔內，只需要文字內容時應當怎麼操作呢，今天小編就為大家演示一遍具體的步驟。

PPT演示技巧—PPT怎麼錄屏

在需要錄屏時我們第一時間想到的可能是下載軟件去錄製，但很多人不知道的是其實在PPT中就有錄屏這個功能，也省去了我們使用錄屏軟件的麻煩，接下來小編就帶大家操作一遍吧。

招聘通知（全國）丨貴州省農村信用社招聘347人公告

公示項目:2020年貴州省農村信用社招聘347人公告。輻射範圍:貴州省。

5月7日·張家口要聞快報：有編制！張家口一地招聘公告！這些地方有了移動5G網絡

為進一步提高涿鹿縣高中階段學校教師隊伍層次規格，以適應新高考改革，培養更多的優秀畢業生，確保涿鹿教育事業可持續發展。張家口:這些地方已經覆蓋移動5G網絡。

工作中出現錯誤後，不應該著眼於這2點

工作中一旦出現錯誤，考慮如何補救才是真正重要的，不應該著眼在以下2點：一

妙招！Word和Execl“聯姻”實現數據高效處理！

你是不是想到的是在Excel中將數據處理好後再粘貼到word中，這種方法在某些時候是不可取的，比如表格中時間可能隨時需要更新，我們不可能，更新一次就去複製粘貼一次，這樣會影響我們的工作效率。

重要提醒：本週六要上班！2020年還有這些假

剛過完假期的你是不是意猶未盡？今天上班第一天小編有以下幾點友情提醒小夥伴們要仔細看01

沿海大型高新科技企業南充設廠，大量招人，月薪最高15000元，免費宿舍…

點擊觀看視頻，一起走進

5月7日廣東最新事業單位招聘公告

05-06[中山]2020年中山市農業農村局招聘事業單位高層次人才公告05-06[中山]2020年中山市黃圃鎮招聘編外人員公告05-06[湛江市]2020年湛江市坡頭區財政局招聘編外人員公告05-06[深圳]2020年5月深圳市寶安區發展研究中心選聘常設崗位人員公告05-06[江

5月7日湖北最新事業單位招聘公告

05-07[湖北]2020年黃石市住房和城鄉建設局招聘專業人才公告05-07[湖北]2020年十堰市竹溪縣招聘高中階段學校教師公告05-07[湖北]2020年咸寧市政府投資項目建設管理局招聘工程專業技術人員公告05-07[湖北]2020年黃石大冶市政府總值班室選聘事業單位人員公告

5月7日河北最新事業單位招聘公告

05-07[河北]2020年石家莊辛集市事業單位選聘公告04-30[河北]2020年邯鄲市國資委選聘碩士研究生公告04-30[河北]2020年河北峰峰礦區高層次人才引進公告04-29[河北]2020年邯鄲市住房公積金管理中心引進博碩人才公告04-29[河北]2020年邯鄲市水利局

5月7日山東最新事業單位招聘公告

05-072020年棗莊臺兒莊區招聘鎮街事業編制人員到村擔任黨組織書記公告05-062020年東營廣饒縣“英才進廣饒”招聘簡章05-062020年淄博周村區行政審批服務局招聘工作人員公告05-062020年煙臺萊州市考核評價中心招聘萊州市“鄉呼縣應”話務員公告05-062020年

未籤書面勞動合同用人單位必須支付二倍工資？

可是，現實中有一些用人單位明明沒有與勞動者簽訂書面勞動合同，也未向勞動者支付二倍工資，卻贏了官司，這是為什麼?

【西青宣傳】校招衝刺季！高校畢業生雲招聘首場直播 1000+個崗位在線等你

天津衛視《天津新聞》:西青區認真貫徹落實文明條例

風水學！洞悉常人無法察覺的不確定性

生活在如今這個時代，肯定會有不少人感慨，不管你是江湖老鳥，還是職場小白，猜不透的“海底針老闆心”幾乎每家公司都是同款的。

工作幹好恰恰是你不能升職的原因

S是私企公司的技術骨幹，在公司7年裡，他每天兢兢業業，加班加點也都是司空見慣，總算熬成了部門裡資格最老的一個員工。

會計做賬中最常見的5項支出不需要發票就可以稅前扣除

估計還有很多會計不知道，會計做賬中最常見的5項支出不需要發票就可以稅前扣除！關於這方面的內容今天一次給大家總結清楚了，以後不要弄錯了。支出一工資薪金支出提醒：企業平時支付職工的工資不需要發票。

「轉發擴散」長春市招聘296名公益性崗位人員

為貫徹落實長春市“保基本就業、保基本民生”工作要求，現面向社會公開招聘296名公益性崗位人員，以加強街道、社區基層公共服務平臺力量，提升就業服務和民生服務能力。

招聘巨頭裁員，但更可怕的是招聘行業的亂象

近期有消息稱，這家招聘巨頭已經陷入了裁員風波，先後關閉了石家莊、烏魯木齊、蘭州、廈門等11座城市辦事處，裁員上百人。

代理記賬流程揭祕，學會了你也可以去記賬

代理記賬可以節約成本，提高效率。是很多小微企業財務工作的選擇。因為巨大的市場需求，所以很多財務人員選擇了代理記賬工作。代理記賬工作流程簡單，易於上手，而且如果客戶資源豐富的話，收益也是頗豐。小編曾經有過一段代理記賬公司工作的經歷，下面就來為大家揭秘下代理記賬的流程。

電腦快捷鍵彙總

Excel表格中Ctrl+字母快捷鍵彙總1、Ctrl

如何去掉word文檔行尾的換行符

在我們日常的文檔編輯當中，有時候會遇到只要一換行下面就會出現一個小箭頭，看著特別不美觀，下面我來分享一下如去掉這個換行標識，和大家共同學習一下。　　1、首先單左上角“開始”　　2、在打開的對話框裡。

甘肅省民政廳直屬事業單位公開招聘工作人員11人

怎麼在Word文檔中插入頁碼

在我們日常的文檔編輯中，由其是在需要打印當中，都希望在文檔中看是頁碼。下面來分享二個在文檔當中加入頁碼的小未能，來和大家共同學習一下。

今天，蔡甸區人社局組織 400＋崗位送到百姓家門口

5月6日上午，蔡甸區“戰疫情

單位裡高手的說話方式（看懂閱歷漲10年）

高手說話，可能簡單幾句，就能讓對話者茅塞頓開。在單位裡，高手說話，沒有華麗的詞語，卻能讓與之溝通的人如沐春風。那麼，高手說話的功夫是如何煉成的呢？說話溝通，首先要擺正心態，有正確的心態為基礎，說話的方向就不會跑偏。

什麼時候是跳槽的最佳時機？怎樣跳更有利於你身家升值？

“領導太難伺候了，我怎麼努力他就是不滿意”，“這裡的人際關係太複雜了，老子不幹了”，“這裡的工資太低了，事情又多，我還是換一家高工資的公司吧”，如果你是因為這些原因跳槽，那你就大錯特錯了。一.

用控件查詢生日信息

問題情境掌握職工的生日信息，及時送出生日祝福，是每位HR必備的技能。

【法律知識】員工離職的22個法律要點

1、經濟補償是國家要求用人單位承擔的一種社會責任，即用人單位解除或者終止勞動合同時，應當支付給勞動者一定的經濟補助，以幫助勞動者在失業階段維持基本生活，不至於生活水平急劇下降。正是由於這種社會責任是國家強加給用人單位的義務，因而，何種情況下用人單位應當擔責，需要由法律的明確規定。

終於，我還是去領了失業金

“我爸已經去領失業金了，我覺得我也快了。微博上，90後女孩默默已經辦妥了失業金領取手續，但對結果並不滿意，因為她累計繳了15個月社保，卻只能領到1個月失業金，1960元。

試用期沒提成！成交130萬訂單一分不給，半個月後老闆蒙了

現如今的大多數公司都有試用期的規定，公司通過這種方式來考察員工是否是公司想要的人才，但是我們都知道，試用期內的工資都比較低，有的公司甚至規定在試用期內只有底薪，沒有提成。這讓很多員工感到不公平，同樣是為企業帶來業績為什麼自己得不到提成？

同樣工作30年，為什麼有人養老金能領6000元，有的人只能領1500？

經常會有朋友這樣問鏡仔，為什麼同樣工作了30年，有的人退休後每個月養老金能領到6000元，自己卻只能領取1500元？影響退休後養老金數額多少的原因有很多種，那麼今天鏡仔就來詳細說一下，到底為什麼造成了養老金這樣的差異性。

招聘啦！長春市公益性崗位人員招人啦

為貫徹落實我市“保基本就業、保基本民生”工作要求，現面向社會公開招聘296名公益性崗位人員，以加強街道（鄉、鎮）、社區基層公共服務平臺力量，提升就業服務和民生服務能力。

回老家被問工資，我說2000，非要給我找月薪3000的，我說日入兩千

我弟弟辭去公職去外地發展，開了一家公司，一年百把萬收入總是有的，但是每次回家都是開個榮威350，而且是乞丐版，同村里人對他都是一臉同情，說辭職辭虧了，只有我知道，他這樣做一方面怕別人生嫉妒，另一方面也是怕招惹是非。

為“偷懶”做的Excel進項增值稅管理系統，升級版更好用！財務收

進項增值稅管理升級版——系統自帶公式，基礎數據錄入之後，會自動生成數據報表，數據也能備份，避免我們誤刪之後找不到。

勞動者履職過程中給用人單位造成損失承擔賠償責任的裁判規則

勞動者在履行職務過程中可能因為各種原因直接或者間接造成用人單位損失，在何種情形下，勞動者需要賠償用人單位的損失，又如何賠償?

懂得規劃自己的人，少吃10年苦！

在生活中，很多職場人混跡職場，處理職業問題貌似都是盲人摸象，毫無章法的，從而處於很被動的位置。這是因為我們大多數人出了大學校門，就一路裸奔邁進了職場，沒有人教我們怎麼規劃自己的發展，沒有人教我們怎麼去應對職場人際，更沒有人傳授我們工作技巧，所以我們對未來基本沒有什麼規劃，導致我們

作者可自主選擇免費或付費閱文：一個月內推新版合同

東方網記者包永婷5月6日報道:今天下午，在閱文集團新管理團隊與多位作家參加的首場作家懇談會上，閱文新任CEO程武表示，著作人身權屬於作家獨有，閱文絕不會通過任何方式分享或獲取著作權，將在1個月內推出新版合同。

學會這個方法，表格想怎麼合併都不愁！

把表裝入Power

哪些行業薪資最高？脫貧就要入對行！

上市公司對很多人都感覺高大上，在上市公司工作是不是年薪很高呢?如果想要更快更好的脫貧，那就應該選擇金融、地產、科技行業，儘可能擺脫傳統行業，當然要進入這些高科技行業，打鐵要自身硬，力爭在大學就要進入這些專業的985院校就妥妥了。