06.21 重要通知！2018 iFLYTEK AI 開發者大賽方言賽初賽正式開啟！

AI研究所

2018-06-21 09:57:41

2018 iFLYTEK AI 開發者大賽分賽題“方言種類識別AI挑戰賽”初賽從今天起正式開始！同時，其提交作品通道也將全面開啟！

提交作品時間：6月20日—7月19日

報名截止時間：7月10日

此次大賽面向全球開發者首次開放中文方言語音數據集，利用開放的方言語音數據集進行模型訓練，優化方言種類的識別效果。

賽題詳情

方言種類識別 AI 挑戰賽任務為漢語方言語言種類識別，即根據給定語音，判斷該語音屬於哪個方言。科大訊飛全球首次開放覆蓋中國六大方言區，總時長約 60 小時的 10 種漢語方言語音數據集，供參加競賽的科研單位以及開發者免費使用。

方言識別 AI 挑戰賽結果評價指標為分類正確率：即分類正確的語音條數/所有語音條數。訓練集合與開發集合供參加競賽的科研單位以及開發者調試系統使用，測試集合不開放，最終排名以參賽者提交的系統在線上測試集合上的結果為準，分類正確率越高排名越靠前。

基線系統介紹

官方提供一個基於神經網絡的端到端方言識別系統。該系統採用LSTM（Long Short-Term Memory，LSTM）模型，並以CE（cross entropy，CE）準則優化模型。

其中語音特徵採用40維的FB（Filter Bank，FB）特徵，並對特徵進行整句均值規整處理；LSTM是隱層節點為128的1層單向結構，再連接全連接層後進行softmax，並做幀級輸出值的平均，用於預測方言的類別標籤，此處用於預測方言的個數為6。

在測試時，待測語音經過LSTM模型後會得到維度等於方言個數（6）的得分向量，維度最高值對應的方言即為判定的方言種類。

評測方式

本次比賽的測試集是不公開的，因此需要參賽者提交自己的評測系統（不提供訓練所需的計算平臺，模型由參賽者自行訓練完成），具體操作方式如下：

a)初賽提交系統時，請提交參賽者名稱、第一作者、參賽系統（提交方式見下面詳述）

b)複賽提交系統時，需要額外提交一份參賽系統的論文或者說明書（最好能夠附帶提供源代碼），詳細介紹系統的構成、訓練方法和對應的參數

c)如無特殊情況，每天上午11點在官方網頁上公佈各個參賽者在測試集上的分類正確率並對結果進行排序（每個參賽單位的結果以最新提交的為準）

評測系統

1.評測系統目錄結構

/dataset…………………………測試數據目錄，評測代碼必須遍歷此目錄下所有音頻文件（後綴名為pcm）進行測試

/inference………………………評測代碼及資源目錄，系統運行的當前路徑

/result……………………………評測代碼中要創建此目錄，並請將評測結果以result.txt命名，存放在此目錄，文件格式見《result.txt》

2.本地開發調試

a. 訓練——參賽者下載訓練集和開發集，自行訓練

可參考基線系統的LSTM模型方案，使用開源深度學習框架進行模型訓練，也可以採用其他技術方案。完成模型訓練後再進行本地評測調試。

b. 本地評測調試——使用開源深度學習訓練框架(推薦)

請從公開鏡像倉庫下載對應版本的深度學習鏡像CPU版本，編寫本地程序進行評測。以pytorch工具為例：

I.下載鏡像，docker pull floydhub/pytorch:0.4.0-py2.29

II.下載開發集，並存放到 /dataset目錄，將評測代碼inference.sh及評測所需資源複製到 /inference目錄

III.運行鏡像，docker run –it –v /dataset:/dataset –v /inference:/inference –v /result:/result floydhub/pytorch:0.4.0-py2.29 /inference/inference.sh

IV.查看輸出結果(result\\result.txt文件)，並檢查該輸出結果的正確性

其他框架與此類似

c. 使用非開源深度學習訓練框架

首先，要將使用的深度學習訓練框架製作成docker鏡像，上傳至公開鏡像倉庫（推薦使用國內穩定鏡像倉庫服務，如UCloud）

d. 製作詳情可參考docker官方文檔，具體操作如下：

I.在hub.docker.com註冊賬號，並創建倉庫

II.本地執行docker tag your_demo your_account/your_demo:latest

III.本地執行docker push account/your_demo:latest，等待命令執行成功後，即可在hub.docker.com網頁上，看到新提交的鏡像信息。

鏡像提交完成後，參考使用開源深度學習訓練框架中的步驟，進行本地開發和調試，具體的為：

IV. 下載上傳的鏡像，docker pull yourtoolname

V.下載開發集到 /dataset目錄，將評測代碼inference.sh及評測所需資源複製到 /inference目錄

VI.運行鏡像，docker run –it –v /dataset:/dataset –v /inference:/inference –v /result:/result yourtoolname /inference/inference.sh

VII.查看輸出結果，並檢查該輸出結果的正確性。

3.提交評測系統

a. 將/inference目錄打包成tar文件，tar –cvf inference.tar inference/

b. 在比賽官網中評測系統提交頁面進行上傳

4.線上驗證及評測

a. 配置系統所需的鏡像倉庫地址，鏡像入口及驗證參數(/dataset目錄由系統自動將開發集掛載到鏡像內)

b. 點擊“提交”，等待評測結果，確保提交的測試程序能夠遍歷運行環境下/dataset目錄內所有pcm文件

c. 如評測報錯或效果異常，請排查/inference目錄結構、鏡像等配置信息

5.溫馨提示：

各位選手提交的評測系統，需要遍歷dataset目錄下所有測試文件，並按規定格式輸出包含所有測試文件分類結果的result.txt文件，比賽系統會自動根據result.txt中的分類結果計算正確率，並作為比賽成績。

6. 關於docker的使用說明？

docker的使用說明（點擊查看詳情）

PS：有疑問的小夥伴，歡迎添加小助手微信或者直接在留言區留言。小助手看到後一定會及時為您解答哦~

您也可以直接添加開發者大賽小助手的微信

◆您將獲得的參賽權益：

1.參加初賽並提交有效作品：

· 團隊與作品參賽證明

2.入圍複賽

· 團隊與作品晉級複賽證書

· 大賽紀念勳章及定製禮包

· 1024開發者節全場通票

3.入圍決賽

· 團隊與作品晉級決賽證書

· 大賽決賽戰隊紀念勳章

· 科大訊飛明星產品套裝

· 訊飛創孵基地綠色入駐通道

4.決賽勝出

· 總計￥100萬元現金

· 大賽獲獎證書與獎盃

· AI全鏈創業扶持

· 1024科技晚宴席位

· 綠色就業通道&訊飛Offer

大家切記要在報名截止時間之前在官網上完成所有報名流程！

報名戳我：官方唯一報名通道！

房建和市政基礎設施工程開復工率85.06%

網貸逾期日記04.06

每日一題｜04.06 黑棋的巨龍還有救嗎？

尋東問西-06

賽題詳情

基線系統介紹

評測方式

評測系統

相關文章:

房建和市政基礎設施工程開復工率85.06%

網貸逾期日記04.06

每日一題｜04.06 黑棋的巨龍還有救嗎？

尋東問西-06

老紫砂壺賞評！06

06-世上的生活02

每日體彩福彩開獎公告01-06

「群面case」06

磚卡10.87，金卡5.06，大家看看自己的紅包是不是都一樣

福建各地推廣禁毒微信排行榜（08.06

每日一圖｜2018.06.29

ScalersTalk成長會第191周運行報告（2018.06.18-06.24）

「百人百天」第8周成績匯報

每日一圖｜2018.06.27

金融版QQ將上線，好友可達10萬「天下早報-第2018.06.23期-精選」

「百人百天」第七周成績匯報

波場TRON進展週報2018.06.09-2018.06.15

06.18 2018-06-18全國豬價（端午瞬間變臉了）

2018-06-17全國豬價（平平漲漲趨勢明顯）

周口天氣2018.06.16

2018-06-16全國豬價（破6地區增多）

2018-06-13全國豬價（大部分地區開始漲起）

「百人百天」第六周成績匯報

波場TRON進展週報2018.06.02-2018.06.08

2018-06-12全國豬價（真的開始漲漲漲）

每日精選資訊（2018.06.12）

06.12 每日精選資訊（2018.06.12）

周口天氣2018.06.11

日本米其林餐廳空位信息（2018.06.08）

06.11 十二星座一週運勢「06.11-06.17」

2018-06-11全國豬價（開始漲起了）

周口天氣2018.06.10

2018-06-10全國豬價（南方率先漲起）

2018-06-08全國豬價（平穩漲著是必須要）

06.07 龍巔十年，感恩有你！

2018-06-07全國豬價（逐漸走起）

2018-06-06全國豬價（平穩回升啦）

2018-06-06·快報

06.05 每日一圖｜2018.06.04

06.05 每日一圖｜2018.06.03

2018-06-05全國豬價（還是有希望的）

06.05 第一航運物流網運價（2018-06-05）

06.07版本（槍劍士之隱祕往事、十週年慶典倒計時）

「十年老照片」06 不再讓你孤單

06 把對方看在眼裡，放在心裡

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

出海奮鬥是有膽識後浪的更優選項

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

為珠峰“量身高”，為啥要人上去？

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

後疫情時代的五個營銷啟示

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

秦山核電應急行動水平優化項目招標公告

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

縣域社區團購，在平臺發展上有哪些優勢？

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

衡水：守護一湖碧水打造生態之城

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度