瑋瑜主辦 2018 年8月18-19日(週末兩天)北京
當前的大數據時代對生物醫學領域產生了巨大的影響,成為生物醫學領域的最新驅動力。數據分析及數據挖掘在生物醫學領域的應用具有重要的意義。但是,常用的數據挖掘軟件,如微軟公司的SQLServer, SPSS公司和SAS公司的數據挖掘產品較為昂貴,算法更新較慢,不適合個人和小型科研團隊使用。而R軟件是一款國際通用的免費軟件,其功能十分強大,且運算結果可靠。目前,在國際上非常流行。
本課程將以案例形式詳細講解如何應用R軟件完成數據挖掘分析,涉及的數據挖掘方法均為當前較為熱門的分析算法:包括決策樹和隨機森林分類器的構建、指標和樣本的聚類與分類、各種熱圖的繪製、變量之間的關聯規則、貝葉斯互作網絡的構建及腫瘤基因組數據的分析等等。特別的,課程還將分享生物數據與臨床數據的整合分析思路及如何應用數據挖掘方法發表SCI論文的經驗。
課程安排:
第一天上午:8:30---11:30
一:什麼是數據挖掘
1. 數據挖掘的概念
2. 臨床科研中的數據挖掘思路
3. 如何應用數據挖掘方法提升論文級別
4. R軟件實操
1)R軟件的下載和安裝
2)R軟件的基本運算(向量運算、矩陣計算)
3)R軟件的基本統計分析操作(t檢驗,卡方檢驗,線性迴歸,logistic迴歸)
4)統計分析批處理的R軟件實現
第一天下午:1:30---5:00
二:數據挖掘方法:分類與聚類
1. 分類
1)分類的概念
2)分類的性能與評估
3)決策樹與隨機森林分類器的構建及R軟件實現
4)交叉驗證的R軟件實現
5)決策樹與隨機森林結果的可視化
6)主成分分析
7)應用主成分分析繪製分類圖
2. 聚類
1)聚類的概念及常用聚類方法(K均值聚類與系統聚類)
2)K均值聚類與系統聚類的R軟件實現
3)K均值聚類與系統聚類的可視化
4)雙向聚類熱圖的繪製
第二天上午:8:30---11:30
三:數據挖掘方法:關聯規則與貝葉斯網絡
1. 關聯規則
1)關聯規則的概念及常用關聯規則分析方法(Apriori算法)
2)關聯規則分析的R軟件實現
3)關聯規則的可視化
2. 貝葉斯網絡
1)貝葉斯網絡的概念及構建
2)基因與環境互作的貝葉斯網絡構建及R軟件實現
3. 腫瘤基因組數據挖掘的R軟件包CancerSubtypes
1. 數據導入及數據預處理(數據正態化,數據的缺失值填補)
2. 聚類熱圖的繪製
3. 提取差異表達基因
4. 繪製火山圖
5. 應用非負矩陣分解聚類法進行腫瘤亞型分析(腫瘤亞型比較,繪製亞型聚類熱圖和Silhouette圖)
第二天下午:1:30---5:00
四:數據挖掘案例討論與分享
1. 案例:應用決策樹獲得影響結局的決策準則及應用隨機森林算法預測樣本分類並提取結局的重要風險因素----------決策樹和隨機森林方法發表SCI論文經驗分享
2. 案例:應用分類與聚類進行全基因組突眼症的DNA甲基化數據分析--------分類與聚類發表SCI論文的經驗分享
3. 案例:應用關聯規則探討自免疫疾病的相關性-------------關聯規則發表SCI論文經驗分享
4. 案例:應用貝葉斯網絡探討COPD基因與環境的互作-----------貝葉斯網絡發表SCI論文經驗分享
5. 生物數據與臨床數據的整合分析思路
6. 對如何回答reviewer問題的一點建議
課程講師
首都醫科大學副教授,碩士生導師,擅長統計研究設計、各類型數據統計分析、生物醫學大數據挖掘及生物信息學分析等。主持和參與多項國家級、省部級和局級科研課題。
主辦單位:
瑋瑜科研平臺(上海瑋瑜生物科技有限公司)
承辦單位 :
上海瑋瑜生物科技有限公司
時間地點:
2018年8月18-19日 17日報到 北京橡樹林酒店
住宿酒店:
北京寶林軒國際大酒店
標準間380元/間 合住190元/間
註冊費用:
3000元/人。授課期間發放紙質邀請函(蓋章)和發票。按交費先後順序確定座位號。會務期間提供午餐,晚餐自理。
付款方式:
A:銀行轉賬
賬戶名稱:上海瑋瑜生物科技有限公司
賬戶號:97340154740007035
開 戶 行:上海浦東發展銀行大華支行
B:支付寶轉賬
支付寶戶名:上海瑋瑜生物科技有限公司
C:現場刷卡或現金:支持公務卡
說明:匯款時寫上您的姓名,如果朋友代付一定要註明您本人的名字,便於好查詢。
疑問諮詢:
聯繫人:謝老師 13611825136
報名郵箱:[email protected]
報名方式(在線報名)
1、郵件報名:將您的手機姓名和參加班級發送到[email protected]並編輯參會二字發信息到13611825136.
2、在線報名:您可以掃描下面二維碼在線報名
閱讀更多 中國醫學博士聯絡站 的文章