2018-05-26 21:34:45 百度AI

所有 PaddlePaddle 的應用者們：

我們很高興地宣佈，

PaddlePaddle Fluid 可以支持在卷積神經網絡上進行 float 16模式的低精度預測了！

同時在 NVIDIA 最新的支持 Tensor core 的 GPU 提供的 float 16加速運算支持下，float 16模式的預測在不損失準確率的情況下，實現了很大的加速效果（跟float 32比較）！

為什麼可以非常開心的慶祝起來？

這就需要從 float 講起。通常的深度學習預測（inference）的參數，輸入輸出和運算都是用的4個字節的 float（也叫 float 32）浮點數表示。 Float 指的是浮點數，由 IEEE 指定規則，這種結構是一種科學計數法，用符號、指數和尾數來表示，底數定位2。float 包括1個符號位、8個指數位和23個尾數位。

如果改成用2個字節的 float 16浮點數來表示，可以節約內存佔用、耗電量和運算時間。PaddlePaddleFluid 完成了在卷積神經網絡（CNN)上進行 float16inference 的支持。跟 float 32模式的預測比較，在準確率一致的前提下，float 16模式的預測在 GPU 上更快，更省電，更節省內存佔用。

這就好比在吃食物時，同樣熱量的棉花糖和軟糖，顯然後者的食用速度是快於前者的，這樣也可以儘快消化。