源和目標語句不再獨立，聯合表示更能提升機器翻譯性能

2020-02-16 10:07:32 AI科技評論

作者 | 李炎洋

目前，神經機器翻譯模型主要基於編碼器-解碼器框架，其中編碼器把源語句編碼成一個連續表示，解碼器把這個連續表示解碼成目標語。

Figure 1編碼器-解碼器框架

可以看到，編碼器-解碼器框架的一個明顯缺陷在於它把源語句跟目標語句分開進行處理，因此不能直接建模源語句跟目標語句之間的關係。比如，編碼器只把源語句作為輸入，而解碼器只把目標語句作為輸入。最近提出的注意力機制通過橋接編碼器跟解碼器可以部分解決這個問題。

Figure 2注意力機制

當翻譯“intensive“這個詞的時候，注意力機制計算這個目標詞與每個源語詞之間的關係，從而直接建模了源語句與目標語句之間的關係。但是我們也可以看到，注意力機制只計算了一個目標詞與源語句之間的關係，它並不能捕捉整個目標句與源語句之間的關係，而這種句子級的聯繫是我們希望翻譯模型能夠建模的，它能在作出下一步決策的時候更好的考慮源語與目標語句子的關係。

聯合表示

解決這個問題的一個自然想法就是使用大小為的表示而不是（編碼器）或（解碼器）這麼大的表示，其中是源語句子長度，是目標語句子長度。這也是我們使用的“聯合表示“（Joint Representation）。

Figure 3聯合表示

這樣一個表示為當前輸入的源語句子和目標語句子裡任意一個源語詞和目標語詞的組合都賦予了一個單獨的表示。通過關聯兩個句子裡任意兩個詞，聯合表示可以建模句子與句子之間的關係。

Reformer-base

那麼如何構建一個基於聯合表示的注意力翻譯模型呢？它主要分為三部分：

1）如何構造一個基於聯合表示的輸入（詞嵌入）？

2）如何在聯合表示上做注意力的操作？

3）如何從聯合表示中預測目標語句子？

詞嵌入

直接構造一個基於聯合表示的詞嵌入矩陣會產生一個大小為的參數矩陣，其中是源語詞表大小，是目標語詞表大小。這樣一個矩陣包含非常多的參數。而我們知道，在沒有上下文的情況下，一個源語詞在語義上幾乎獨立於一個隨機採樣出來的目標語詞。因此，我們使用詞的表示的組合作為詞的組合的表示：

類似的，基於聯合表示的位置表示也可以用相同的思想計算得到。

Figure 4基於聯合表示的詞嵌入

當計算(我,I)這個詞的組合的表示，我們可以通過把“我“和”I“這兩個詞各自的表示相加得到。

可分離注意力

直接在聯合表示上做注意力是非常耗時的。可以看到，標準的注意力機制在聯合表示上的複雜度高達，儘管它有著僅使用層即可訪問到任意位置的表示這樣的優勢。

Figure 5標準的注意力機制

相應的，我們提出可分離注意力（Separable Attention）。它由兩部分組成：目標註意力（Target Attention）和源注意力（Source Attention）。

Figure 6可分離注意力（訓練）

其中，目標註意力只沿著聯合表示的目標語維度進行注意力操作，而源注意力只沿著源語維度進行注意力操作：

其中。這樣，對於目標註意力而言，它的複雜度只有，而源注意力的複雜度只有。因此，可分離注意力整體的複雜度，而它只需要層的操作即可訪問到任意位置的表示。

Figure 7可分離注意力（解碼）

解碼的時候，因為同一層的表示的計算是相互獨立的，因此，在計算第時刻的輸出的時候，目標註意力只需要關注前個詞，而源注意力只需要關注當前第時刻輸入裡的目標語詞。

降維

給定一個聯合表示，如何從中預測目標語句子？我們知道聯合表示的大小為，而一般翻譯模型的解碼器預測使用的表示大小為，其中每一個元素對應著預測出來的目標語句子的每一個詞。

那麼自然的想法就是通過降維操作把大小的聯合表示變成大小再進行預測。這裡壓縮聯合表示的源語維度所使用的降維（Reduction）模塊的結構本質上是一個基於特徵的注意力，也就是它操作的粒度是單個特徵而不是單個詞。它工作的方式類似於源注意力，除了它使用一個可學習的權重作為query而不是當前產生的輸入：

其中是詞嵌入的大小。

整體架構

有了詞嵌入，可分離注意力和降維，基於聯合表示的一個注意力模型實例Reformer-base的整體結構如下：首先通過詞嵌入構建聯合表示輸入，然後使用由注意力機制組成的層來進行多次變換，得到的聯合表示輸出的源語維度會通過降維操作被壓縮掉，最後從被壓縮過的聯合表示中預測目標語句子。

Figure 8 Reformer-base

其中，模型使用的層由四個子層構成：目標註意力，前饋神經網絡，源注意力和另一個前饋神經網絡。需要注意的是，注意力操作後緊跟著Dropout1d，而前饋神經網絡後緊跟著Dropout2d。

對於目標註意力，它的Dropout1d會沿著源語維度對特徵（神經元）進行掩蓋，而源注意力的Dropout1d則沿著目標語維度對特徵進行掩蓋。前饋神經網絡的Dropout2d會同時沿著源語和目標語維度對特徵進行掩蓋。這樣做的原因在於其中源語/目標語維度的特徵會在另外一個維度上存在重複。

如圖9所示，在做目標註意力的時候，關於源語詞的特徵會沿著目標語的維度重複，因此在使用Dropout掩蓋源語詞特徵的時候，我們需要沿著目標語維度同時掩蓋所有可能的的重複特徵，否則被丟棄的特徵可以在其他時刻的表示中被重新獲取到，使得Dropout鼓勵特徵獨立的目標失效。

Figure 9特徵重複（目標註意力）

Reformer-fast

權衡效率和有效性

從表1可以看到，對比標準的注意力，可分離注意力擁有著能以路徑長度（層數）訪問任意位置的表示的優勢，但是可分離注意力自身的複雜度要比標準注意力高。

Table 1各操作的複雜度和路徑長度

通過觀察Reformer-base，我們可以發現它有兩個問題導致它需要堆疊大量的高複雜度的可分離注意力才能獲得優異的性能：

1）重複計算：Reformer-base在解碼的每一時刻都需要從詞嵌入開始計算，因此當模型需要一些抽象的信息，特別是源語的信息的時候，它都需要重新進行計算；

2）計算分配：在解碼每一時刻，輸入的源語詞的數目是遠多於輸入的目標語詞的數目，因此它天然的就需要更多關於源語端的操作。

PreNet

為了解決這個問題，我們在Reformer-base的基礎上引入了PreNet這個模塊，得到了我們的Reformer-fast模型。這個模型首先把輸入的源語端的詞嵌入送到PreNet，然後PreNet的輸出當成原始的源語端的詞嵌入的替代送到Reformer-base裡面進行後續的處理。PreNet的結構類似標準的的Transformer編碼器。

Figure 10 Reformer-fast

PreNet的引入成功減少了可分離注意力的數目，並且它本身的複雜度非常低，因此提高了模型整體的效率。然而，PreNet損害了Reformer-base的理論有效性。相比於Reformer-base可以以路徑長度訪問任意源語詞，Reformer-fast只能以路徑長度訪問任意源語詞，其中是PreNet的深度。

模型調優

在實際應用當中，我們通常需要在大數據集上使用更大的模型。但是使用網格搜索在大數據集上尋找合適的大模型配置是非常耗時的，而在Transformer當中常用的技巧如增大詞嵌入大小或者是更寬的前饋網絡對Reformer並不好用。

為了解決這個問題，我們把這樣一個超參數調優過程看作是在當前網絡配置的寬度和深度基礎上對它們進行梯度下降，以取得最優的校驗集性能，同時使用的參數量不超過規定：

其中是調整超參數（寬度、深度）使用的步長，是校驗集性能，是模型的參數量，是手工設定的參數量限制。從這樣的角度出發，優化的目標可以看作是在固定參數量下尋找能取得最好的校驗集性能的模型配置。

為了計算梯度下降中使用的梯度，我們使用了梯度的定義來進行估計。其中關於深度的梯度計算如下：

其中是手工設定的一個小數。類似的我們可以得到關於寬度的梯度。整個調優過程如下：首先估計梯度，然後根據手工設定的參數量限制，計算得到最佳的步長，從而得到最佳的模型配置。

實驗

我們在IWSLT15 (Vi-En), IWSLT14 (De-En, En-De) 和NIST12 (Zh-En)四個數據集上進行驗證，如表2所示：

Table 2實驗結果

可以看到，Reformer-base/fast在所有測試集上都比標準的Transformer基線表現要好，並且這兩個模型的性能相近，但是Reformer-fast要比Reformer-base要快。需要注意的是，Reformer-base在Vi-En這個任務上要比基線差一些，這可能是因為Reformer-base在設計上要求源語句子和目標語句子長度相近，而Vi句子通常比它對應的En翻譯要長很多。

Table 3消融實驗

在表3的消融實驗中可以看到，Dropout1/2d可以提升模型的泛化能力，而PreNet則可以提升模型的效率。

Table 3消融實驗

更進一步地，如果我們僅僅為Reformer-fast增加兩層以及50%的前饋網絡寬度，它就可以超過Transformer-big，同時參數量只有一半。

Figure 11長度統計

圖11的左圖告訴我們，Reformer模型比Transformer更加傾向於生成長的翻譯。而圖11的右圖告訴我們，Reformer模型對比基線的優勢會在長句子翻譯上更加明顯。

Figure 12準確率統計

圖12告訴我們，無論是從目標語詞的位置或者是詞頻的角度，Reformer模型的準確率都要比標準的Transformer基線要高不少。

Figure 13注意力分佈例子

最後，圖13的例子展示了在輸入不同的源語詞或者目標語詞的情況下，可分離注意力對同一的輸入產生的分佈是不同的。這說明了聯合分佈的必要性。

結論

我們提出了兩種基於聯合分佈的注意力模型的實現。這兩個模型在不同數據集或配置上均取得比基線優異的性能。目前基於聯合分佈的模型設計仍然非常原始，我們期望將來有更多的工作來改善它們。

AAAI 2020 報道：

新型冠狀病毒疫情下，AAAI2020 還去開會嗎？

美國拒絕入境，AAAI2020現場參會告吹，論文如何分享？

AAAI 最佳論文公佈

AAAI 2020正式開幕，37%錄用論文來自中國，連續三年制霸榜首

一文全覽，知識圖譜@AAAI 2020

Hinton AAAI2020 演講全文：這次終於把膠囊網絡做對了

AAAI 2020 論文集：AAAI 2020 論文解讀會 @ 望京（附PPT下載）

AAAI 2020上的NLP有哪些研究風向？

微軟 6 篇精選 AAAI 2020 論文

京東數科 6 篇精選AAAI 2020 論文

AAAI 2020 論文解讀系列：

01. [中科院自動化所] 通過識別和翻譯交互打造更優的語音翻譯模型

02. [中科院自動化所] 全新視角，探究「目標檢測」與「實例分割」的互惠關係

03. [北理工] 新角度看雙線性池化，冗餘、突發性問題本質源於哪裡？

04. [復旦大學] 利用場景圖針對圖像序列進行故事生成

05. [騰訊 AI Lab] 2100場王者榮耀，1v1勝率99.8%，騰訊絕悟 AI 技術解讀

06. [復旦大學] 多任務學習，如何設計一個更好的參數共享機制？

07. [清華大學] 話到嘴邊卻忘了？這個模型能幫你 | 多通道反向詞典模型

08. [北航等] DualVD：一種視覺對話新框架

09. [清華大學] 藉助BabelNet構建多語言義原知識庫

10. [微軟亞研] 溝壑易填：端到端語音翻譯中預訓練和微調的銜接方法

11. [微軟亞研] 時間可以是二維的嗎？基於二維時間圖的視頻內容片段檢測

12. [清華大學] 用於少次關係學習的神經網絡雪球機制

13. [中科院自動化所] 通過解糾纏模型探測語義和語法的大腦表徵機制

14. [中科院自動化所] 多模態基準指導的生成式多模態自動文摘

15. [南京大學] 利用多頭注意力機制生成多樣性翻譯

16. [UCSB 王威廉組] 零樣本學習，來擴充知識圖譜（視頻解讀）

17. [上海交大] 基於圖像查詢的視頻檢索，代碼已開源！

18. [奧盧大學] 基於 NAS 的 GCN 網絡設計（視頻解讀）

19. [中科大] 智能教育系統中的神經認知診斷，從數據中學習交互函數

20. [北京大學] 圖卷積中的多階段自監督學習算法

21. [清華大學] 全新模型，對話生成更流暢、更具個性化（視頻解讀，附PPT）

22. [華南理工] 面向文本識別的去耦注意力網絡

23. [自動化所] 基於對抗視覺特徵殘差的零樣本學習方法

24. [計算所] 引入評估模塊，提升機器翻譯流暢度和忠實度（已開源）

25. [北大&上交大] 姿態輔助下的多相機協作實現主動目標追蹤

26. [快手] 重新審視圖像美學評估 & 尋找精彩片段聚焦點

27. [計算所&微信AI] 改進訓練目標，提升非自迴歸模型翻譯質量（已開源）

28. [中科院&雲從科技]：雙視圖分類，利用多個弱標籤提高分類性能

29. [中山大學] 基於樹狀結構策略的漸進強化學習

30. [東北大學] 基於聯合表示的神經機器翻譯（視頻解讀）

31. [計算所]引入評估模塊，提升機器翻譯流暢度和忠實度（視頻解讀）

32. [清華大學]用於少次關係學習的神經網絡雪球機制（視頻解讀）

33. [計算所]非自迴歸機器翻譯，基於n元組的訓練目標（視頻解讀）

34. [清華大學] 司法考試數據集（視頻解讀，附下載鏈接）

35. [自動化所] 弱監督語義分割（視頻解讀）

36. [自動化所] 稀疏二值神經網絡，不需要任何技巧，取得SOTA精度（視頻解讀）

37. [華科&阿里] 從邊界到文本—一種任意形狀文本的檢測方法

38. [上交大&雲從科技] DCMN+ 模型：破解「閱讀理解」難題，獲全球領先成績

39. [自動化所&微信AI] 雙通道多步推理模型，更好解決視覺對話生成問題

40. [ETH Zurich] 反向R？削弱顯著特徵為細粒度分類帶來提升

41. [中科大] RiskOracle: 一種時空細粒度交通事故預測方法

45. [商湯] 新弱監督目標檢測框架

46. [第四範式] 優化NAS算法，速度提高10倍！

47. [牛津大學] 利用注意力機制，實現最優相機定位（視頻解讀）

48. [天津大學] DIoU和CIoU：IoU在目標檢測中的正確打開方式

49. [寧夏大學] 面向大規模無標註視頻的人臉對齊方法

50. [商湯] KPNet，追求輕量化的人臉檢測器（視頻解讀）

分享到:

閱讀更多 AI科技評論 的文章

關鍵字: 機器翻譯人工智能片段

shell-case語句

shell-if語句

shell條件判斷

Truncate用法詳解

C#入門之變量類型

JavaScript If...Else 語句

SELECT COUNT 語句，你真的瞭解它嗎？

JavaScript 語句

Oracle 分區表的 FOR 語句，你這樣用過嗎？

02.19 機器學習筆記04：機器翻譯；注意力機制與Seq2seq；Transformer

select * from user 這條 SQL 語句，背後藏著哪些不可告人的祕密

C++學習大綱：異常處理機制示例及講解

優化OR條件

01.15 一些 MySQL DBA 實用 SQL 語句

01.02 select * from user 這條 SQL 語句，藏著哪些不可告人的祕密？

mybatis-plus/mybatis 自定義 sql 語句、動態 sql

12.27 mybatis-plus/mybatis 自定義 sql 語句、動態 sql

解鎖新姿勢：探討複雜的 if-else 語句“優雅處理”的思路

C#判斷語句詳解(if、if-else、switch-case、三目/元運算符)

C++｜函數指針做參數，讓函數更一般化（選擇排序：升序或降序）

ORACLE多表關聯UPDATE 語句

自然語言到 SQL 語句，微軟只用六個子任務，結果超越人類水平

golang for 語句的特點和 range子句的關係

火熱公測！華為雲 DAS 支持一鍵診斷劣質 SQL 語句

VBA語法02：VBA語句之select判斷語句使用

VBA語法01：VBA當中的IF語句單一條件判斷和多條件判斷的使用

《碼出高效》——MYSQL資料庫SQL 語句

09.11 你試過不用if擼代碼嗎？

hibernate的三種檢索策略——今天比較下它們的優缺點

一文讀懂 with……as 語句

一些滲透和手工注入技巧

SQL GROUP BY 語句，送給正在迷茫的你

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"