乾貨|別以為語言學家就整天咬文嚼字,其實他們代碼也很 6

干货|别以为语言学家就整天咬文嚼字,其实他们代码也很 6

在科技公司工作的語言學家們每天到底都做些什麼?

AI科技評論按:統計 NLP 已取得巨大成果,但其極度依賴統計手段,相比之下深入的語言學思考少很多。當今研究遇到瓶頸,許多 NLP 的研究者都在引入一些語言學的知識來幫助他們提取更多的訓練特徵,提供更靠譜的思維角度。同時也有很多語言學家開始供職於科技公司,計算心理語言學家 Tal Linzen 近日就對語言學家在科技公司的具體職責進行了調查,並寫了一篇統計博客。AI 科技評論對博客內容編譯如下。

干货|别以为语言学家就整天咬文嚼字,其实他们代码也很 6

我告訴我的朋友們現在有很多語言學家供職於科技公司,他們聽完很好奇這些語言學家在公司的具體職責是什麼。我知道一些工作內容但並不全面,所以我通過 twitter 蒐集了一些信息。鑑於 twitter 界面不便於瀏覽,我把回覆整理了一下放在這篇博客裡,其中最突出的回覆當屬 Wabbott_Lane 的那句「供職於科技企業的語言學家簡直就是職場標杆」。我從這些回覆裡獲取了不少信息,感謝回覆的各位。

●匿名用戶:我與一幫語言分析學家一起工作,他們的日常任務是項目設計與管理,做實驗,標註釋,做錯誤分析,增加音素、音位的數量和狀態規範,最後就是編寫和測試有限狀態語法。

●erikavaris:在我從事數據科學和機器學習之前,我寫過很多的關鍵詞布爾運算算法。(PS:如果你真的知道人們如何使用語言的話那你就可以使用關鍵詞過濾器幹很多事情)

●lousylinguist:我曾為不同的老闆創建語言複雜度標準,分析句法分析器的輸出結果,開發和應用語義標註方案,創造 NLP 訓練數據,審核自動隱喻工具,構建 NLP 解決方案。

●zehavoc:我的同事負責獲取語言搜索資源,併為搜索引擎精準搜索提供技術支持,當很寬泛的搜索詞也能搜到他們公司時,會大大增加公司花費(seo 吧,這是)。

●plmtznr:數據科學。

●atakanince:幹很多事:本體論,智能問答,標註釋,為搜索引擎設計語言架構,如果你還會機器學習,那就有更多的有趣的項目。

●AbsP:我是一名語言學家,也是一名用戶體驗研究者。我使用類似於人種學研究的方法,即可用性測試比如讓用戶做書寫熟練度測試,期間詢問和觀察他們。一些涉及內容策略和信息架構的工作中也會用心理映射和卡片排序法(該方法也應用於語義分類)。我還做過一些涉及到自然語言處理和計算機語言學的工作。我目前就想到這麼多。

●poptimality:我是一名計算語言學家,我工作的重心是上下文無關文法,但與語言有關的工作還有很多,你可以在求職信息中數數種類:https://careers.google.com/jobs#t=sq&q=j&li=20&l=false&jlo=en-US&j=linguist,我在前一家從事語音合成的相關工作,開發並實現了韻律一致化標準,我還寫了大量的SQL代碼

●rleegoldman:我目前在研究上下文無關文法,設計人類計算任務和 UI,為語義標註創建本體和分類,有時候,我會和其他的語言學家一起撰寫提案並爭辯相關內容。有時候我會去評估自然語言理解系統的輸出,但絕大多數時候我在做一些數據處理與管理的工作

●aoinifh:很多人都沒法如實說(因為保密政策)

●aftonSteps:我是一家研究公司的統計程序員,我日常從事一些數據科學相關的工作,比如分析研究結果,運行統計模型,寫數據應用程序,自動化報告。

●franckbrl:我不太確定這裡的「語言學家」是什麼意思。如果你是指希望語言學家學會寫正則表達式,或者熟練使用某工具,那麼他其實已經不是語言學家了,因為他研究的很明顯不是語言的本質及其運行模式。

●AndresKarjus:我所認識的翻譯和定位方向的語言學家們一本有這些職責:如果你懂人類語言學,那麼就要去評估機器翻譯的輸出,如果你還懂編程語言,那麼就要去調整 SMT 引擎。

●Wabbott_Lane:我為 NLP 任務準備數據集,訓練信息提取模型,優化自然語言理解的模型,學習人類語言技術的最新研究,每天學習新的東西。做科技領域的語言學家是我的夢想職業!

●name_inspector:我編寫註釋指南,也同時為機器學習項目標註數據。

●lefft:在文本數據搜索工具上實現「相似詞」功能。

以上就是 AI 科技評論整理的 Tal Linzen 博客的全部內容。

干货|别以为语言学家就整天咬文嚼字,其实他们代码也很 6

CCF - GAIR 2018 將於

6 月 29 日 至 7 月 1 日

在深圳舉行。

三天議程及強大陣容已經陸續出爐。

6 月 8 日,

AI 科技評論啟動了

CCF-GAIR 2018 的免費門票申請通道,

並計劃從中篩選 20 位學生,

承包「國內往返機票+四晚住宿」

AI 科技評論讀者專屬福利。

福利發出後,

表單如海水一樣湧入後臺系統,

截至 6 月 14 日晚 24 點,

第一批申請表單已經截止申請,

同事們最近也都在加班加點審核表單。

在此,

AI 科技評論由衷感謝

同學們對 CCF-GAIR 大會的關注!

從眾多申請之中,

AI 科技評論甄選了 12 名學生,

他們將成為第一批獲得

價值 3999 元 CCF-GAIR 2018 大會門票

「國內往返機票+四晚住宿」福利的同學!

AI 科技評論將第一批獲獎學生名單

及所屬院校公佈如下(共 12 位):

新加坡南洋理工大學 張徵豪

斯坦福大學 孫林

清華大學 孔濤

賓夕法尼亞大學 王倪劍橋

北京航空航天大學 黃雷

澳大利亞國立大學 劉瀚陽

中國科學院 王昌淼

香港科技大學 李正

上海交通大學 徐衍鈺

華中科技大學 李柏依

香港理工大學 曹自強

香港中文大學 楊巍

在此向以上同學表示祝賀,

運營小姐姐將很快聯繫你們喲~

並備註姓名及院校。

但是!

我們的福利申請並沒有結束!

從 6 月 15 日 0 時開始,

AI 科技評論將開啟第二批福利申請通道,

將繼續篩選 8 名同學贈送價值 3999 元 CCF-GAIR 2018 大會門票

及「國內往返機票+四晚住宿」福利!

本福利申請截至 6 月 21 日晚 24 點,

預計將於 6 月 22 日公佈獲獎名單。

填寫個人信息申請!

與此同時,

暫時沒有入選第一批名單的同學們也不需要灰心,

我們也會在所有提交申請的同學中,

篩選部分學生

陸續進行一對一聯繫,

贈送價值 3999 元的 CCF-GAIR 大會門票。

(此門票包含三天午餐喲!)

贈票申請通道截止日期為

6 月 26 日晚 24:00

6 月 29 日至 7 月 1 日,深圳見!

贈票申請須知

➤ 截止日期:6 月 26 日晚 24:00

➤ 活動解釋權歸雷鋒網 AI 科技評論所有


分享到:


相關文章: