DeepMind開源2款基於JAX庫，針對神經網絡和強化學習，易用性更強技术頭條網

DeepMind開源2款基於JAX庫，針對神經網絡和強化學習，易用性更強

2020-02-21 12:36:18 量子位

十三發自凹非寺
量子位報道 | 公眾號 QbitAI

DeepMind今日發佈了Haiku和RLax兩個庫，都是基於JAX。

JAX由谷歌提出，是TensorFlow的簡化庫。結合了針對線性代數的編譯器XLA，和自動區分本地 Python 和 Numpy 代碼的庫Autograd，在高性能的機器學習研究中使用。

而此次發佈的兩個庫，分別針對神經網絡和強化學習，大幅簡化了JAX的使用。

Haiku是基於JAX的神經網絡庫，允許用戶使用熟悉的面向對象程序設計模型，可完全訪問 JAX 的純函數變換。

RLax是JAX頂層的庫，它提供了用於實現增強學習代理的有用構件。

有意思的是，Reddit網友驚奇的發現Haiku這個庫的名字，竟然不以“ax”結尾。

當然，也有網友對這兩個庫表示了肯定：

毫無疑問，對JAX起到了推動作用。

那麼，我們就來看下Haiku和RLex的廬山真面目吧。

Haiku

Haiku是JAX的神經網絡庫，它允許用戶使用熟悉的面向對象編程模型，同時允許完全訪問JAX的純函數轉換。

它提供了兩個核心工具：模塊抽象hk.Module，和一個簡單的函數轉換hk.transform。

hk.Module是Python對象，包含對其自身參數、其他模塊和對用戶輸入應用函數方法的引用。

hk.transform允許完全訪問JAX的純函數轉換。

其實，在JAX中有許多神經網絡庫，那麼Haiku有什麼特別之處呢？有5點。

1、Haiku已經由DeepMind的研究人員進行了大規模測試

DeepMind相對容易地在Haiku和JAX中複製了許多實驗。其中包括圖像和語言處理的大規模結果、生成模型和強化學習。

2、Haiku是一個庫，而不是一個框架

它的設計是為了簡化一些具體的事情，包括管理模型參數和其他模型狀態。可以與其他庫一起編寫，並與JAX的其他部分一起工作。

3、Haiku並不是另起爐灶

它建立在Sonnet的編程模型和API之上，Sonnet是DeepMind幾乎普遍採用的神經網絡庫。它保留了Sonnet用於狀態管理的基於模塊的編程模型，同時保留了對JAX函數轉換的訪問。

4、過渡到Haiku是比較容易的

通過精心的設計，從TensorFlow和Sonnet，過渡到JAX和Haiku是比較容易的。除了新的函數(如hk.transform)，Haiku的目的是Sonnet 2的API。

5、Haiku簡化了JAX

它提供了一個處理隨機數的簡單模型。在轉換後的函數中，hk.next_rng_key()返回一個唯一的rng鍵。

那麼，該如何安裝Haiku呢？

Haiku是用純Python編寫的，但是通過JAX依賴於c++代碼。

首先，按照下方鏈接中的說明，安裝帶有相關加速器支持的JAX。https://github.com/google/jax#installation

然後，只需要一句簡單的pip命令就可以完成安裝。

<code>$ pip install git+https://github.com/deepmind/haiku/<code>

接下來，是一個神經網絡和損失函數的例子。

<code>import haiku as hkimport jax.numpy as jnpdef softmax_cross_entropy(logits, labels):  one_hot = hk.one_hot(labels, logits.shape[-1])  return -jnp.sum(jax.nn.log_softmax(logits) * one_hot, axis=-1)def loss_fn(images, labels):  model = hk.Sequential([      hk.Linear(1000),      jax.nn.relu,      hk.Linear(100),      jax.nn.relu,      hk.Linear(10),  ])  logits = model(images)  return jnp.mean(softmax_cross_entropy(logits, labels))loss_obj = hk.transform(loss_fn)/<code>

RLax

RLax是JAX頂層的庫，它提供了用於實現增強學習代理的有用構件。

它所提供的操作和函數不是完整的算法，而是強化學習特定數學操作的實現。

RLax的安裝也非常簡單，一個pip命令就可以搞定。

<code>pip install git+git://github.com/deepmind/rlax.git/<code>

使用JAX的jax.jit函數，所有的RLax代碼可以不同的硬件上編譯。

RLax需要注意的是它的命名規則。

許多函數在連續的時間步長中考慮策略、操作、獎勵和值，以便計算它們的輸出。在這種情況下，後綴_t和tm1通常是為了說明每個輸入是在哪個步驟上生成的，例如：

q_tm1：轉換的源狀態中的操作值。a_tm1：在源狀態下選擇的操作。r_t：在目標狀態下收集的結果獎勵。q_t：目標狀態下的操作值。

Haiku和RLax都已在GitHub上開源，有興趣的讀者可從“傳送門”的鏈接訪問。

傳送門

Haiku：https://github.com/deepmind/haiku

RLax：https://github.com/deepmind/rlax

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們，第一時間獲知前沿科技動態

分享到:

閱讀更多 量子位 的文章

關鍵字: 人工智能 Haiku 設計

DeepMind開源2款基於JAX庫，針對神經網絡和強化學習，易用性更強

Haiku

RLax

傳送門

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

小米手機在你心中的第一印象是什麼？

肖戰太難！汪海林批粉後改新歌詞諷刺，回應何炅熱搜又招滿屏謾罵，如何評價？

如何客觀評價斯蒂芬·庫裡的防守水平？

為什麼最近肖戰被黑的那麼慘？

網傳何炅邀請肖戰錄製《嚮往的生活》消息引發爭議。肖戰發文回應，你怎麼看？

DNF100級傳說防具與超界孰強孰弱，你會選擇哪個？

今天是我的生日，我沒有任何朋友。陌生人，可以給我一句祝福嗎？

家裡老人控制慾太強，怎麼辦？

29號碎片皮膚更新，兩款特效皮膚免費分，特工魅影不可錯過，你有何看法？

營養土可以種長壽花嗎？如何種植？

大家對怕老婆這個事是什麼看法？

我有高血壓，現血壓正常，往下躺和睡起來時頭髮暈，是什麼原因？

如果你孩子的老師是同性戀，你會要求學校辭退老師嗎？

睡眠質量與高血壓有什麼關係？

如果宿舍太吵，用什麼辦法可以提高學習效率（為了考研)？

怎麼能讓老師不管我？

交易性金融資產持有期間的財務處理，你們瞭解多少？

印度尼西亞號稱千島之國，且島嶼分散，它是怎麼維護國家一統的？

未來5年內會有大牛市嗎？

戰國時期的鬼谷先生有哪些異人之處，縱橫百家，古今流傳？

有什麼帶明字的詩句？

你希不希望周揚青爆更多猛料？

疫情期間的學生如何進行管理？

蘇州的朋友們是怎麼看待許可馨和許可馨現象的？

昨天我們鎮一個老師，確定是無症狀感染者，很糾結五一假期回不回家，怎麼選？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？