首页 理论教育 《基于方法对带自回归线性模型的收缩选择方法》简介

《基于方法对带自回归线性模型的收缩选择方法》简介

时间:2022-02-22 理论教育 版权反馈
【摘要】:北京大学王汉生、香港大学李国栋、美国加州大学戴维斯分校蔡知令的《基于LASSO方法对带自回归线性模型的收缩选择方法》,发表在Journal of the Royal Statistical Society Series B—Statistical Methodology 2007年第1期,获统计学一等奖。经典的自回归模型为该框架中的一个特例。《基于LASSO方法对带自回归线性模型的收缩选择方法》一文是对这种算法的进一步完善。
《基于方法对带自回归线性模型的收缩选择方法》简介_中国高校人文社会科学研究通鉴(2001—2010)下册

北京大学王汉生、香港大学李国栋、美国加州大学戴维斯分校蔡知令的《基于LASSO方法对带自回归线性模型的收缩选择方法》,发表在Journal of the Royal Statistical Society Series B—Statistical Methodology 2007年第1期,获统计学一等奖。

一、篇章结构和基本观点

此文考虑到经济管理实践的应用背景,将研究重点放在具有自回归残差项(Auto Regressive Error)的线性回归方程(Regression Model)上。在回顾一种非常重要的现代变量选择方法——LASSO(Least Absolute Shrinkage and Selection Operator)的基础上,将其推广到带自回归残差项的线性模型(Regression with Auto Regressive Error)中,进而使得该方法的应用范围更大。文章还对传统LASSO方法的调节系数加以改良,使得新的方法(即LASSO*)具备选择相合性。文章通过大量的数据试验证明改良后的LASSO*方法在参数估计精度以及模型选择精度等诸多方面表现优秀。

此文共分七节,第一节主要对相关文献进行了回顾和讨论。第二节基于已有的LASSO方法,将其推广到带自回归残差项的线性模型中,进而得到一个改进了LASSO的估计方法。第三节主要对第二节中两种LASSO估计方法(一为传统方法在REGAR模型下的推广,一为具备自适应特性的改良,即LASSO*)的理论性质予以讨论。第四节针对由于REGAR模型的对数似然函数(Log Likelihood)不是凸函数(Convex Function)所引起的优化(Optimization)问题,提出了分步迭代法(Iterative Process),即将回归模型参数(Regression Coefficient)和自回归模型参数(Auto Regression Coefficient)分开交替优化的方法。第五节首先通过大量的随机模拟试验证明LASSO方法,特别是改良后的LASSO*方法在参数估计精度以及模型选择精度等诸多方面表现优秀;之后,通过一个关于电力需求的实际数据,证明如果回归分析中忽略了残差项中的自回归特征,那么所产生的参数估计就有可能非常不合理;相反,REGAR模型就可以有效地纠正此估计偏差。所以使用基于REGAR模型的LASSO*方法,可以更有效地帮助我们了解哪些经济或者天气变量对电力需求影响重大等问题。第六节简要总结了本文的主要内容及贡献,并指出本文所发展的LASSO*方法还可以很容易地拓展到其他的回归模型。第七节对文中所涉及的定理及结论进行了严格的证明。

二、主要创新和学术价值

1.将传统LASSO方法的应用范围延展到REGAR模型的框架下。经典的自回归模型为该框架中的一个特例。

2.提出一种具有自适应特征的LASSO*方法,改进后的方法具有变量选择一致性,从而大大提高了估计的精度。

3.在数值计算方面,创造性地提出了分步迭代法,并证明了该算法在具有相和初始估计的情况下的全局最优性质。

三、学术影响和社会效益

此篇论文具有重要的理论意义和现实意义。从理论上,它给出了如何对带自回归残差项的线性回归方程作变量选择的基本理论框架以及可实现的高效数值计算方法。从现实意义上,对我国相关的经济管理实证研究帮助甚大。以本文为核心,本文作者相继发表了一系列与变量选择相关的论文,这些论文发表在Journal of the American Statistical Association,Biometrika,Journal of Business&Economics Statistics等一系列国际顶级统计学或者国际知名经济学杂志中。基于这一系列文章的贡献,从2008年起,此文作者成为国际顶级统计学杂志The Annals of Statistics在中国大陆唯一的编委,同年,还应邀成为SCI索引的杂志Computational Statistics and Data Analysis在中国大陆仅有的三名编委之一。

【注释】

[1]LASSO(Tibshirani,1996)方法是一种压缩估计。它通过构造一个罚函数得到一个较为精练的模型,它压缩一些系数,同时设定一些系数为零,因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。《基于LASSO方法对带自回归线性模型的收缩选择方法》一文是对这种算法的进一步完善。
LASSO是一个专有名词,一般情况下在中文标题中最好保留原词不翻译,就如有的文章专门对某个外文哲学词汇的概念进行研究,这些词本身就含义丰富,如果勉强翻译的话,反而容易造成偏颇或引起误解。LASSO如果一定要译的话,按字面可译为“最小绝对收缩和选择算子”,但建议最好不译,因为它作为一个专业词汇,在目前所有的统计学文章中都是保留了LASSO的英文原文而不翻译,这已经算是一种行业共识。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈