機器學習+數據可視化，老中醫逆襲的祕密武器！

2018-06-12 12:09:51 DataHunter

『姐是老中醫，專治吹牛逼』——著名歌唱家花粥

前言

中國古籍，汗牛充棟，源遠流長，即使皓首窮經，人一生能博覽的書籍也是少之又少，能深入參悟的就更是稀有。

好在現在是AI時代，通過機器學習可以快速大量處理包括文本在內的各種數字文檔，藉助AI，我們也可以提高對於知識處理和提煉的效率。

本文將以橫跨明清兩代的醫學家陳士鐸的畢生心血《醫學全書》為例，用AI研習經典，用人工創作智慧。

勵志照亮人生，程序猿改變世界。

背景介紹

陳士鐸，字敬之，號遠公，別號朱華子，又號蓮公，自號大雅堂主人，浙江山陰（今浙江紹興）人。約生於明朝天啟年間，卒於清朝康熙年間。據嘉慶八年《山陰縣誌》記載：“陳士鐸，邑諸生，治病多奇中，醫藥不受人謝，年八十餘卒。“

書籍介紹

陳士鐸是清代初期的著名醫學家，一生的著述非常多。

《醫學全書》總共3.7M，漢字約120萬字，全部文言文。一個勤奮的讀者，每天閱讀2000字，需要600多天完成第一輪學習。

至於歸納整理，就需要更久的時間。所以說，學醫需謹慎。

框架選型

中文處理文本，第一步分詞，第二步向量化。

1、分詞

分詞我選用了開源項目結巴分詞：https://github.com/fxsjy/jieba

自從github嫁給ms，總感覺心裡很失落，懷念啊我們的青春啊。

同時，考慮到結巴分詞對文言文醫學的不熟悉，需要手動設置用戶自定義詞，示例如下：

2、向量化

因為這次的主要目的是尋找詞語關係，所以選擇了word2vec作為工具庫。

word2vec也叫word embeddings，中文名“詞向量”，作用就是將自然語言中的字詞轉為計算機可以理解的稠密向量（Dense Vector）。

word2vec模型其實就是簡單化的神經網絡。

word2vec不僅可以在百萬數量級的詞典和上億的數據集上進行高效地訓練，還可以得到訓練結果——詞向量（word embedding），可以很好地度量詞與詞之間的相似性。

word2vec常見應用：

用 Word2vec 尋找相似詞

根據上下文預測某個詞語出現概率

數據處理

良好的數據是機器學習模型的食材。

經過結巴分詞之後的segment還需要手工過濾掉標點符號和很多奇怪的詞語，這些詞語如果不去掉，在後面的向量相似度上會帶來很多困擾。

訓練模型

訓練模型輸出相似度

這裡以六經為例，目的是看看與這幾條經脈最親密的是哪些東西。

老中醫順手普及：

少陰：分足少陰腎經和手少陰心經，對應心、腎。

太陰：分足太陰脾經和手太陰肺經，對應脾、肺。

厥陰：分足厥陰肝經和手厥陰心包經，對應肝、心包。

少陽：分足少陽膽經和手少陽三焦經，對應膽、三焦。

太陽：分足太陽膀胱經和手太陽小腸經，對應膀胱、小腸。

陽明：分足陽明胃經和手陽明大腸經，對應胃、大腸。

以上對應的五臟（心肝腎肺脾）和六腑（膽，心包，膀胱，小腸，大腸，三焦）並非西醫意義上的器官。

數據樣本

以上美觀大方的數據表格由DataHunter數據可視化軟件生成。

可視化

為了直觀和顏值，我們採用DataHunter最新的1.8版數據可視化軟件來呈現數據。

新版新增了包括熱力圖、箱線圖、關係圖、樹狀圖、玫瑰圖、桑基圖、儀表盤、象形圖，正好可以用來展示多維度量的數據。

結論

少陽經與其他經脈的聯繫最多，古人稱“少陽為樞”，很多病症只需『和解少陽』便可四兩撥千斤，達到早治療早輕鬆的效果。

與虛火關係緊密的是陽明，即胃經，這個在臨床上也有很多驗證效果，瀉胃火可以治療包括牙齦腫痛、便秘、口腔潰瘍等各種現代上火症狀。

與腎虛關係緊密的分別是少陰（心腎）經和太陰（脾肺）經，腎很好理解，脾肺在這裡出現則發人深思，所謂土生金、金生水，造化之妙。

厥陰與痙病（四肢抽搐、角弓反張）密切相關，這個有經驗的老中醫一看就洞悉於心：肝木主風，痙病這些症狀正與風症吻合。

有興趣的朋友，還可以拓爾思之，比如查一下與『人參』關係緊密的老鐵是那幾位？答案不揭曉了，有心者自得知。

現代科技也可以讓古老的典籍重新煥發青春！

分享到:

閱讀更多 DataHunter 的文章

關鍵字: 汗牛充棟中醫人工智能

線上呈現全民參與——“假期雲考古”引燃空前觀看潮

截至5月6日上午10點，“中國文博”＃全國十大考古新發現＃話題的閱讀量7555.3萬、今日頭條＃發現考古＃閱讀量5737.5萬、央視新聞＃雲考古看寶藏＃3214.5萬及＃雲考古4000多年前古都遺址＃602.3萬、微博“陝視新聞”＃2019年度全國十大考古新發現＃3560.5萬、

宮廷技藝，定製雙瓏原著專屬府門之儀

鏨刻，是中國一門古老的手藝，是在較強延展性的金屬上，用鐵質鏨頭，刻畫出圖案。從曾經出土的青銅器和金銀器可以判斷，鏨刻已經延綿了數千年的歷史。孟德仁先生是北京宮廷造辦處傳統金屬鍛鏨技藝第三代傳人，自20歲入行，到花甲古稀，他用50年的時光守護著"國家非物質文化遺產銅鏨工藝"。

陽光的湖泊與夜雨的憂傷

不去聽朋友說詩人的身份經歷並不是拒絕瞭解詩人，實則是沿襲我的習慣:寫讀詩心得時，只從看到、讀到的詩出發，在其詩作中發現詩，在其詩中來品讀人。

精品連環畫《哪吒鬧海》

如果覺得不錯，點屏幕右上角的"…"分享到朋友圈

精品連環畫《雙城記》2

接續：補：如果覺得不錯，點屏幕右上角的"…"分享到朋友圈

第四屆中國書法蘭亭獎“終身成就獎”——尉天池等3人

第四屆中國書法蘭亭獎“終身成就獎”《論書卷氣》一文獲全國首屆書法蘭亭獎理論獎，曾被中國書協學術委員會聘為第一屆學術委員。

精品連環畫《雙城記》

如果覺得不錯，點屏幕右上角的"…"分享到朋友圈

我國最神祕的姓氏，百家姓沒有記載，他們的祖先在斯里蘭卡

中國有很多姓氏，我們通常能接觸到的姓氏有幾百個。根據2018年數百個姓氏的統計，“王”姓位居榜首，“李”姓緊隨其後，“張”姓居第三，而我們經常看到的其他姓氏也不少。但是，這個姓氏在古代是我們祖先傳下來的。姓氏不能改。更改姓氏是對我們祖先的不尊重。不過，姓氏後面的字是可以改變的。

詩詞｜立夏：綠樹陰濃夏日長，樓臺倒影入池塘

綠樹陰濃夏日長，樓臺倒影入池塘。水精簾動微風起，滿架薔薇一院香。“入池塘”著一入字，用得亦是極好。夏日午時，晴空驕陽，池水清澈見底，映在池塘中的樓臺倒影，也那樣清晰。

精品連環畫《五朵金花》

連環畫在線看連環畫在線看

中國南方最重男輕女的地區，女孩不入祠堂，名字不入族譜！

人們總是以為，重男輕女的思想，以北方為重，尤其是河南、山西、山東等地，大底是因為這些地方受傳統文化和傳統風俗習慣的影響更深，總認為只有兒子才能傳宗接代，讓整個家族人丁興旺，也只有兒子才能夠夠光宗耀祖，光耀門楣。

Hi視頻丨漁民人人能作畫小漁村變“畫村”

在榮成石島的港灣街道除了“百年花村”之外，還有一個風景美如畫，妙筆又生花的“畫村”——牧雲庵。步入牧雲庵村，宛如走進了一個五彩繽紛的美術新天地，一幢幢新瓦房的牆壁上繪製著巨幅壁畫，家家戶戶的映壁上都用圖畫裝點一新，絢麗多姿，光彩奪目。

七律：山居(二一七)

鄉村祖宅靠河邊，明月清風不要錢。晚上悠閒常把酒，早間沒空擼遊船。牛羊滿地超三百，雞鴨成群過十千。環境優良山水秀，逍遙自在比神仙。

七律《腹有詩書氣自華》

心無貪念魂魄定，腹有詩書氣自華。腹有詩書氣自華【華:六麻，二十二禡】

滿江紅《讀史感懷》

千萬裡，獨騎單行，過關斬將;功業累累何豈數，凌雲壯志蔑豪強。驚濤駭浪【浪:第二部，第二部】

金觀察｜淮陽平糧臺城址：“以中為尊”，開中國城建規劃先河

在中國，從城市到鄉村，大家看到的房屋建築幾乎都是方方正正、坐北朝南、左右對稱。走進該城址考古發掘現場可以清晰地看到，整座古城是方方正正的格局，正中間有一條道路貫穿南北，城內佈局以這條南北中軸路相隔、規劃嚴整。

有故事的自貢

聞鍾記郵有故事的自貢。知道自貢這個城市，源自一種井，叫自流井，不用開鑿就能出滷水，是千年不斷地井鹽文化。

《白鹿原》蕩婦田小娥之死，作者寫到恍惚，醒來說了十二字很扎心

藍田縣檔案館有一件鎮館之寶，那就是民國藍田縣誌，因為編者牛兆濂是關學的最後一位繼承人，所以藍田縣誌別稱牛志，蜚聲海內外。

各省萬氏字派表

良常一，江西省1，江西南昌，輩分是橫學文家正德齊忠立怡本

一樣的愛書情懷

萬氏家族和甘鵬雲的交往之二

仁者愛人也

“仁”，是華夏民族的一個重要道德範疇。《尚書•商書•太甲下》記載：“民罔常懷，懷於有仁。”意思是說，唯有仁德才是民心所歸，人心所向。“仁”，是孔子心目中的道德極致，也是儒家思想的核心理念。孔子從不同角度對“仁”進行闡釋，把“仁”發揚為一種至高人生境界。

七律•初夏梅熟寄知己

江南入夏熟青梅，濺齒猶酸手上杯。星眸彈玉碎琴臺。曾經對面相無語，況復天涯互度猜。許我焚香烹濁酒，殷勤青鳥寄蓬萊。

「愙齋書法」王羲之《孝女曹娥碑》最好的拓本

王羲之深受其孝行所動，因此為她也寫了碑文，此時的他年邁體弱多病，此碑絹本手跡在遼寧博物館收藏，雖然自己身體狀況不好，但是筆法還是剛勁有力，字體帶有隸書之意，字體寬平，無華麗而古樸自然，用筆大多是不藏鋒，字與字之間錯落有致，整體排列工整勻稱。

七言：《鄉愁》

花開花落總因風，情少情多何必爭。月下相思無夢夜，他鄉最是恨蛙鳴。

「愙齋書法」鋼筆書法作品欣賞：歐陽詢《九成宮碑》

硬筆臨歐陽詢《九成宮碑》

「愙齋書法」明初宋濂楷書欣賞

宋濂，初名壽，字景濂。元末明初著名政治家、文學家、史學家、思想家，與高啟、劉基並稱為“明初詩文三大家”，又與章溢、劉基、葉琛並稱為“浙東四先生”。宋濂楷書《和馮子振韻》

詩一樣的李冶：心遠浮雲知不還，心雲並在有無間

今晚住家小區完全籠罩在今年立夏以來的第一場暴雨中，我聽著狂風雨打雨滴落聲，閒著無事，又端起了被自己遺忘多日的《唐詩評選》，順手一翻，居然是她這樣的一所首詩，詩人名李冶，廿五年之前讀過唐詩的些許記憶，只記得她是位女詩人。

《好嘴楊巴》：個性獨特的奇人奇事，妙趣橫生的文化小說

今天要講的書是馮驥才的《好嘴楊巴》。《好嘴楊巴》是一本短篇小說合集，分俗世奇人和怪事奇談兩個部分。總結:《好嘴楊巴》是一本短篇小說合集，從奇入手。

《好嘴楊巴》：馮驥才經典文學裡的俗世奇人奇事

「愙齋書法」手抄經典第221期——陳繼儒《小窗幽記》

一軒明月，花影參差，席地便宜小酌;入山採藥，臨水捕魚，綠樹陰中鳥道;掃石彈琴，捲簾看鶴，白雲深處人家。—

艙籬.醉飲.風騷.潮歌.相思

艙籬文/章子建湖為杯盞水為酒，舟溢風中幾孤愁。又是今霄共此時，奈何艙籬鎖自由？醉飲文/章子建醉飲當歌誰人聽風訴聲曳扣窗欞。琴絕音婉今霄月，光陰如夢又匆匆。風騷文/章子建風騷易往詩仙事，璀璨星辰和北斗。欲問古今誰長在，李白東坡難聚頭.

七絕·秦始皇禮讚

君不見

在志怪和志人之間來回切換，魏晉筆記體小說為何會誕生？

前言中國小說有兩個大的系統，一個是文言文小說，一個是白話文小說。魏晉南北朝時期，白話文還沒有出現，只有文言文小說，這個時候的文言文小說被我們稱為筆記體小說。為什麼取這個名字？

詩歌《夜隨想》作者：樑增亮

夜

坐山吵窯-連環畫出版社2011 水天宏繪

坐山吵窯-連環畫出版社2011

河南話，到底是土還是雅？

原創

撕下那些偽精英、偽貴族們的畫皮

在上海的一次座談會上，有個中年學者，他的發言大家都聽不懂，因為他是反覆地在講兩個歷史人物，一個叫子先，一個叫西泰，大家都不知道他在講什麼。

最早的杭州西湖全景畫作——南宋.宮廷畫家李嵩《西湖圖》精賞

李嵩

72歲餘秋雨給湖畔大學30名企業家的箴言

餘秋雨和湖畔大學的學生聊儒釋道，面向30名頂尖企業家談“孔子、老子、佛祖能教給我們什麼”。比如我認識在美國生活的一對夫妻，丈夫是中國人，他們的裂痕首先是每個清明節丈夫都要回來祭祖，我們在座的人一定知道原因何在，他們家有兄弟姐妹，趁這個機會聚一聚，這牽扯到中國的精神價值。

柳永詞中的反叛精神，主要體現在哪些方面？

說起柳永，大家最為熟悉的便是那首高中語文課本中的《雨霖鈴》。便縱有千種風情，更與何人說?這首詞文辭雅麗，韻味悠長，朗朗上口，飽含悽美之情，筆者大愛。

對聯題李煜

做主則春花覺少，為侯而秋月猶多，意氣兩參差，惜銅雀東風，吹皺簾波飛宿雨；填詞而玉砌方華，治國則雕欄不在，襟懷多婉約，付金陵桂棹，研勻江水盪寒笙。

「分享」叔本華：獨立思考的人，是自己精神領域的君主

論獨立思考哪怕是再大的圖書館，如果它藏書豐富但卻雜亂無章，其實際用處就反不如那些規模雖小卻條理井然的圖書館。同樣，如果一個人擁有大量的知識，卻未經過自己頭腦的獨立思考而加以吸收，那麼這些學識就遠不如那些雖所知不多但卻經過認真思考的知識有價值。

魯迅到底說過這些話麼？

我們經常在網上能看到“魯迅說過xx”等等，但事實上魯迅也許沒說過那些話。然而魯迅先生也確實說過很多經典的話。我不是很仔細的整理了一些，所以也有可能裡邊有一句半句的不是出自魯迅先生筆下。

「薦書」《追憶那些年的絕代芳華》：她們給那個年代添上了一抹亮麗的色彩

《追憶那些年的絕代芳華》作者介紹黃紫彤:本名黃鴻涯，墨香學堂聯合創始人，中國傳統文化藝術傳播者，女學研究教育踐行者。曾在中央人民廣播電臺《廣播歌選》編輯部，全國婦聯心繫系列活動組委會宣傳部任職。

宋拓東漢《西嶽華山廟碑冊》

《西嶽華山廟碑》冊，拓本38頁，剪條裝裱，每頁3行，行6字。縱22

寫歐體入十二屆國展

作品散見於

從奴隸到伊尹

寫歷史文章非常煎熬，過程枯燥不說，還看不到希望，我是全憑一腔熱血支撐著。因為白天要上班，晚上回家又很晚，只能抽出很少的時間構思文章，故進度超級慢。本來計劃著一週至少更新一篇，現在倒好，10天出不了一篇。蒼天哪，怎樣才能提高寫作效率啊。寫歷史文章還有一個難點，處理史料的問題。

讀《平凡的世界》讓人淚流而下

路遙先生所著的《平凡的世界》這部文學作品，帶給我的閱讀體驗很深，讓我連續看了幾遍都不覺累，每次重讀都會有新的收穫。

當詞人的審美情感比較平和，所選擇的情感符號相對來說也比較溫馨

當詞人的審美情感比較平和時，所選擇的情感符號相對來說也比較溫馨。蘇軾就此詞曾雲:“後主既為樊若水所賣，舉國與人，故當慟哭於九廟之外，謝其民而後行，顧乃揮淚宮娥，聽教坊離曲。

三國裡一位雄主，竟然被認為是嶽不群似的人物，會是誰呢？

文