统计学中高引用的15篇论文

一、写这篇博文的初衷

1.写这篇博文的初衷是看到很多网上罗列的统计学的高引用论文有些不靠谱,所以想动手自己去罗列一下,希望能靠谱一些

2.这篇博文中列出的只是我自己了解并根据谷歌学术查到的高引用论文的数据,是否是真实的高引用论文数据这个可能还是有一些差距。比如贝叶斯统计这一块的高引用论文就没有罗列。主要是我自己对贝叶斯统计这一块的内容不是很熟

3.我此处列出的数据是截止到2020-04-07基于谷歌学术搜索得到的数据,统计的年均引用次数是截止年份2019年计算出的

4.初步看了一下统计学中引用比较高的论文首发基本上是统计学的四大天王级别的期刊(Biometrika、JASA、JRSSSB和The annals of statistics)

5.统计学中的高引用论文中提出的方法目前基本上在实践中被广泛应用,比如GBDT、GLMNET、BOX-COX变换、COX回归模型等等

6.可能有些人已经发现统计学中高引用的论文,很多方法在机器学习中也是非常常用的,比如adbooting、GBDT、GLMNET等。这从一个侧面反映出统计学和机器学的广泛联系和相互交融

7.文中表述有错误的地方欢迎各位读者在评论区留言说明,谢谢!


统计学中高引用的15篇论文


二、统计学高引用论文按年份罗列

1.Nonparametric estimation from incomplete observations(引用次数57681,年均引用946次/年)

核心内容:这篇文章主要是提出了生存分析数据分布的估计方法提卡普兰-迈耶估计(Kaplan–Meier)的统计量

作者:EL Kaplan, P Meier

期刊:Journal of the American statistical association

发表年份:1958


2.An analysis of transformations(引用次数15635 ,年均引用284次/年)

核心内容:提出了BOX-COX变换

作者:GEP Box, DR Cox

期刊:Journal of the Royal Statistical Society : Series B

发表年份:1964


3.Regression models and life‐tables(引用次数51516 ,年均引用1096/年)

核心内容:提出了生存分析的Cox回归模型(比例风险模型)

期刊:Journal of the Royal Statistical Society : Series B

发表年份:1972


4.Cross‐validatory choice and assessment of statistical predictions(引用次数8798 ,年均引用215/年)

核心内容:提出了我们目前常用的模型评估机制Cross‐validation

期刊:Journal of the Royal Statistical Society : Series B

发表年份:1974


5.Maximum Likelihood from Incomplete Data Via the EM Algorithm(引用次数60123 ,年均引用1432/年)

核心内容:提出了EM算法

作者:A. P. Dempster N. M. Laird D. B. Rubin

期刊:Journal of the Royal Statistical Society : Series B

发表年份:1977


6.Estimating the dimension of a model(引用次数41570 ,年均引用1014/年)

核心内容:提出了模型选择和模型定阶的标准BIC准则

期刊:The annals of statistics

发表年份:1978


7.Bootstrap Methods: Another Look at the Jackknife(引用次数19153 ,年均引用479/年)

核心内容:提出了bootstrap方法

期刊:The annals of statistics

发表年份:1979


8.Longitudinal data analysis using generalized linear models (引用次数17347 ,年均引用526/年)

核心内容:提出了处理纵向数据的广义估计方程方法

作者:KY Liang, SL Zeger

期刊:Biometrika

发表年份:1986


9.Controlling the false discovery rate: a practical and powerful approach to multiple testing(引用次数63236 ,年均引用2635/年)

核心内容:提出了多重假设检验错误率控制的方法

作者:Y Benjamini, Y Hochberg

期刊:Journal of the Royal Statistical Society : Series B

发表年份:1995


10.Regression shrinkage and selection via the lasso(引用次数

32896 ,年均引用1430/年)

核心内容:提出了lasso回归方法

期刊:Journal of the Royal Statistical Society : Series B

发表年份:1996


11.Additive logistic regression: a statistical view of boosting (引用次数6917 ,年均引用364/年)

核心内容:从统计的观点解释了boosting,并给出了我们目前常用adboosting算法

作者:Jerome Friedman, Trevor Hastie, and Robert Tibshirani

期刊:The Annals of Statistics

发表年份

:2000


12.Greedy Function Approximation: A Gradient Boosting Machine(引用次数9620 ,年均引用534/年)

核心内容:提出了GBDT算法,是现在XGBOOST、LIGHTGBM、CATGBM算法的基础

作者:Jerome H. Friedman

期刊:The Annals of Statistics

发表年份:2001


13.Least angle regression(引用次数9160 ,年均引用611/年)

核心内容

:提出了最小角回归算法,系统解决了线性回归模型基于L1正则化系数解路径的求法

作者:B Efron, T Hastie, I Johnstone

期刊:The Annals of Statistics

发表年份:2004


14.Regularization and variable selection via the elastic net(引用次数11048 ,年均引用789/年)

核心内容:首次提出了弹性网回归(基于L1和L2混合的正则化方法),并给出了近似解法

作者:H Zou, T Hastie

期刊:Journal of the royal statistical society: series B

发表年份:2005


15.Regularization paths for generalized linear models via coordinate descent(引用次数7988,年均引用888/年)

核心内容:给出了广义线性模型和COX风险模型基于弹性网回归的算法(坐标交替梯度回归算法),并发布了应用非常广泛的GLMNET软件包(R版)

作者:J Friedman, T Hastie, R Tibshirani

期刊:Journal of statistical software

发表年份:2010


分享到:


相關文章: