01.30 書籍推薦——一本老書,吳軍老師《數學之美》

1


這幾天春節,因為疫情和拜年,所以文章停更了四天。但是這四天裡我並沒有偷懶,我利用間歇的時間讀了一本久仰大名但是一直沒有時間閱讀的書。它就是吳軍老師的著作——《數學之美》。


書籍推薦——一本老書,吳軍老師《數學之美》


之前早在我還在上大學的時候,就聽線性代數的老師給我們推薦過這本書。但是當時並沒有什麼印象,也沒有讀書的習慣,所以當年並沒有讀這本書。以我現在的眼光來看,當時如果讀了,也未必能夠讀懂。後來一次偶然的機會,在“得到”APP當中聽過吳軍老師的一些講座,給了我很多啟發。


後來默默百度了吳軍老師的簡歷,發現他曾經當過Google的高級資深研究員,並且還擔任過騰訊副總裁,是一個不折不扣的業內神犇。因此,我這次是抱著朝聖的心態來閱讀的。


讀完之後,果然不負期望,感受非常多,收穫滿滿,因此今天特地單獨開篇文章介紹本書。


首先,我先說對我感觸最大的一點。其實並不是書中講的數學或者是機器學習模型,也不是某個神人科學家的事蹟,而是吳軍老師

對待教育的觀點


2


在自然語言處理領域,有一個非常牛的開創人,名叫賈里尼克。他是猶太人,生於二戰之前,由於全家受到二戰的影響舉家移民到了美國。他們剛到了美國的時候非常貧困,以至於他不過十幾歲大,還需要進工廠打工彌補家用。所以他大部分時間不能花在學習上,和其他同學相比,他的課業落下了一大半。


在他成長的路上,他的志向也幾次發生變化。一開始的時候,他想要學醫當一名醫生。但是由於醫學院學費過於高昂,才轉而去的麻省理工的電機工程。雖然發生了這麼多波折,但是有一點沒有變,他一直想要通過自己的努力走向成功


介紹賈里尼克的故事,並不是想給大家灌雞湯或者是強調努力的重要性。而是想要說明吳軍老師的一個觀點,就是對於一個人來說,

小學和初中其實並不需要花那麼多時間讀書,因為這個階段的知識總量就那麼多,早點不學晚點也來得及補上。


並且更重要的一點是,隨著一個人年齡的增長,他的學習能力也在不斷的提升。一個在初中階段需要花費500個小時的課程,到了大學可能只需要100個小時。因此早期勤奮積累下的優勢其實非常有限,經常會發生在小學和初中成績平平的學生到了高中和大學迅速起飛逆襲的故事。


更重要的是,學習是一個終生的事情,不是到了大學或者某個階段就結束。所以對於一個十幾歲的孩子來說,更重要的是培養他們的性格、素養,以及找到屬於自己的志向。也就是古人常說的早立志


書籍推薦——一本老書,吳軍老師《數學之美》


這個年代天才少年並不罕見,像是前段時間寫出《冰雪奇緣》物理引擎的胡淵明,還有在ACM界鼎鼎大名的陳立傑和樓天城,無一不是早在少年時期就立志在編程領域有所建樹。只有遠大的志向才能引導出源源不斷的努力,拿我個人而言,我目前的兩大志向,一個是做好TechFlow,另一個是成為算法領域一流的技術專家。明確了這兩點之後,我個人的意志以及專注都比之前提升了非常多。


3


在我讀這本書之前,我覺得業內的書籍易懂門檻低的往往淺薄,乾貨會比較少,而內容深刻的往往晦澀,容易勸退對於新手體驗不好。想要在市面上找一本既好懂又內容深刻乾貨十足的書非常困難,但是這本書非常難得的同時做到了這兩點。


這本書雖然叫做《數學之美》,聽起來勸退能力很強,但是實際上並不是一本數學領域的書籍,其實也很難說它到底屬於哪個領域,因為本書涉及的內容實在是有點多。既講了很多信息學家的生平軼事,研究路途上的經歷和一些人生哲學,又涉獵信息論、密碼學、統計學、自然語言處理、搜索引擎等等許多領域。可能也正因此,想必很難找出一個詞來能夠統領這一切,所以稱為《數學之美》也不為過。


本書的切入點很簡單,就是統計學在自然語言處理的應用。實際上就是我們之前在介紹樸素貝葉斯模型的時候用到的假設,假設每個單詞只和前面的少數幾個單詞有關,並且明確了模型的目標就是使得整個句子或者是文本出現的概率儘量大。現在來看這兩點當然不起眼,但是在當時算得上是劃時代的非常新穎的做法了。正是由於引入了統計學的知識,所以自然語言處理方面得到了非常巨大的提升和進展。


書籍推薦——一本老書,吳軍老師《數學之美》


之後,順著這條線,書裡引入了信息論當中關於信息熵的闡述和理念。之後,從信息論的角度來講解中文分詞算法、搜索引擎以及拼音輸入法等算法,非常精彩,也非常深刻。而且在講解具體技術的過程當中,還穿插很多名人的故事和背後的道理以及作者的一些評論。打個不一定確切的比方,如果把算法或者搜索領域比較是武俠小說當中的一個門派,那麼這本書可以算得上是祖師爺寫的

入門心法了。


4


既然是入門心法,其實並不會涉及很多技術的具體細節,吳軍老師在這本書裡講的正是他對這搜索對這個行業理解的一個精華濃縮。也就是說,這本書不是讓我們學習某個技術的,而是讓我們用來更好學習技術的。


我個人覺得這本書最好的閱讀方式應該至少閱讀三遍,第一遍在你還沒有入門的時候讀,讀完你可能什麼算法和技術都沒有學到,但是一定會對機器學習、搜索、統計、模型這些概念有一個最基本的認識。


能夠知道,目前行業內的算法工程師究竟是幹什麼的,面臨和解決的問題大概是哪些,之前最基礎的解決方法是什麼

。如果你理解能力強一些,還能大概讀到當你面臨一個全新的問題的時候應該怎麼做。如果你還能被勾起一些學習的興趣,那就完美了。但是顯然,紙上讀來終覺淺,讀完這一遍之後,你還是你,從技術上看,也許你什麼都沒學到,但你至少可以將它當做是入門指南,順著書上的順序一點一點地深入學習每一個技術細節。


書籍推薦——一本老書,吳軍老師《數學之美》


第二遍是在你學習的過程當中,不論是什麼模型或者是算法,都會經歷一個從不明白到明白的過程。在這個過程當中最大的問題其實是很多時候我們並不知道我們理解到什麼地步了,最常見的就是我們以為我們已經明白了,但其實還差一些,所以面試的時候才經常被秒殺。所以在學習的過程中,應該再讀一遍本書,看看吳軍老師是如何站在更高的視角上理解這個問題的。既可以杜絕驕傲自滿,又可以起到指導前進的作用。


最後一遍是在我們學完書中所提到的所有技術細節之後,再回過來溫故知新、查漏補缺。我覺得一定還會有新的收穫。


如果你想要會踏入互聯網,無論你做不做技術,我都建議你抽出一點時間來閱讀本書。如果你真的可以按照我說的方法去讀三遍本書的話,我覺得你一定會獲得遠超想象的回報。這本書的可讀性很強,如果覺得有讀不懂的地方,可以跳過,

章節之間關聯性並不強,跳過部分內容不會影響之後的閱讀。


今天的內容就到這裡,如果覺得有所收穫,請順手點個關注或者轉發吧,你們的支持是我最大的動力。


分享到:


相關文章: