玮瑜主办 2018 年8月18-19日(周末两天)北京
当前的大数据时代对生物医学领域产生了巨大的影响,成为生物医学领域的最新驱动力。数据分析及数据挖掘在生物医学领域的应用具有重要的意义。但是,常用的数据挖掘软件,如微软公司的SQLServer, SPSS公司和SAS公司的数据挖掘产品较为昂贵,算法更新较慢,不适合个人和小型科研团队使用。而R软件是一款国际通用的免费软件,其功能十分强大,且运算结果可靠。目前,在国际上非常流行。
本课程将以案例形式详细讲解如何应用R软件完成数据挖掘分析,涉及的数据挖掘方法均为当前较为热门的分析算法:包括决策树和随机森林分类器的构建、指标和样本的聚类与分类、各种热图的绘制、变量之间的关联规则、贝叶斯互作网络的构建及肿瘤基因组数据的分析等等。特别的,课程还将分享生物数据与临床数据的整合分析思路及如何应用数据挖掘方法发表SCI论文的经验。
课程安排:
第一天上午:8:30---11:30
一:什么是数据挖掘
1. 数据挖掘的概念
2. 临床科研中的数据挖掘思路
3. 如何应用数据挖掘方法提升论文级别
4. R软件实操
1)R软件的下载和安装
2)R软件的基本运算(向量运算、矩阵计算)
3)R软件的基本统计分析操作(t检验,卡方检验,线性回归,logistic回归)
4)统计分析批处理的R软件实现
第一天下午:1:30---5:00
二:数据挖掘方法:分类与聚类
1. 分类
1)分类的概念
2)分类的性能与评估
3)决策树与随机森林分类器的构建及R软件实现
4)交叉验证的R软件实现
5)决策树与随机森林结果的可视化
6)主成分分析
7)应用主成分分析绘制分类图
2. 聚类
1)聚类的概念及常用聚类方法(K均值聚类与系统聚类)
2)K均值聚类与系统聚类的R软件实现
3)K均值聚类与系统聚类的可视化
4)双向聚类热图的绘制
第二天上午:8:30---11:30
三:数据挖掘方法:关联规则与贝叶斯网络
1. 关联规则
1)关联规则的概念及常用关联规则分析方法(Apriori算法)
2)关联规则分析的R软件实现
3)关联规则的可视化
2. 贝叶斯网络
1)贝叶斯网络的概念及构建
2)基因与环境互作的贝叶斯网络构建及R软件实现
3. 肿瘤基因组数据挖掘的R软件包CancerSubtypes
1. 数据导入及数据预处理(数据正态化,数据的缺失值填补)
2. 聚类热图的绘制
3. 提取差异表达基因
4. 绘制火山图
5. 应用非负矩阵分解聚类法进行肿瘤亚型分析(肿瘤亚型比较,绘制亚型聚类热图和Silhouette图)
第二天下午:1:30---5:00
四:数据挖掘案例讨论与分享
1. 案例:应用决策树获得影响结局的决策准则及应用随机森林算法预测样本分类并提取结局的重要风险因素----------决策树和随机森林方法发表SCI论文经验分享
2. 案例:应用分类与聚类进行全基因组突眼症的DNA甲基化数据分析--------分类与聚类发表SCI论文的经验分享
3. 案例:应用关联规则探讨自免疫疾病的相关性-------------关联规则发表SCI论文经验分享
4. 案例:应用贝叶斯网络探讨COPD基因与环境的互作-----------贝叶斯网络发表SCI论文经验分享
5. 生物数据与临床数据的整合分析思路
6. 对如何回答reviewer问题的一点建议
课程讲师
首都医科大学副教授,硕士生导师,擅长统计研究设计、各类型数据统计分析、生物医学大数据挖掘及生物信息学分析等。主持和参与多项国家级、省部级和局级科研课题。
主办单位:
玮瑜科研平台(上海玮瑜生物科技有限公司)
承办单位 :
上海玮瑜生物科技有限公司
时间地点:
2018年8月18-19日 17日报到 北京橡树林酒店
住宿酒店:
北京宝林轩国际大酒店
标准间380元/间 合住190元/间
注册费用:
3000元/人。授课期间发放纸质邀请函(盖章)和发票。按交费先后顺序确定座位号。会务期间提供午餐,晚餐自理。
付款方式:
A:银行转账
账户名称:上海玮瑜生物科技有限公司
账户号:97340154740007035
开 户 行:上海浦东发展银行大华支行
B:支付宝转账
支付宝户名:上海玮瑜生物科技有限公司
C:现场刷卡或现金:支持公务卡
说明:汇款时写上您的姓名,如果朋友代付一定要注明您本人的名字,便于好查询。
疑问咨询:
联系人:谢老师 13611825136
报名邮箱:[email protected]
报名方式(在线报名)
1、邮件报名:将您的手机姓名和参加班级发送到[email protected]并编辑参会二字发信息到13611825136.
2、在线报名:您可以扫描下面二维码在线报名
閱讀更多 中國醫學博士聯絡站 的文章