首页 理论教育 阻尼最小二乘法

阻尼最小二乘法

时间:2022-02-12 理论教育 版权反馈
【摘要】:阻尼最小二乘法是目前一种最成熟、使用最广泛的光学自动设计约定方法。阻尼最小二乘法求解线性方程组首先要构建表征各种像差F与结构参数x关系的评价函数,当改变结构参数使各种像差趋近目标值时,评价函数便趋近于极小值,评价函数在一定程度上表示了系统的成像质量。这种求超定方程组最小二乘解的方法称为最小二乘法,它在工程技术问题上经常采用。这就是光学自动设计中所称的阻尼最小二乘法。

15.1.2 阻尼最小二乘法

阻尼最小二乘法(DLS)是目前一种最成熟、使用最广泛的光学自动设计约定方法。国内外很多著名的光学自动设计软件中都采用或包含了阻尼最小二乘法方法。从数学原理上说,阻尼最小二乘法是一个平方和形式的评价函数(Merit Function)的最优化问题。

阻尼最小二乘法求解线性方程组首先要构建表征各种像差F与结构参数x关系的评价函数,当改变结构参数使各种像差趋近目标值时,评价函数便趋近于极小值,评价函数在一定程度上表示了系统的成像质量。评价函数的构成应满足能正确地反映系统的成像质量和便于计算两个条件,前者可使计算结果符合像质评价标准的要求,后者可使评价函数有比较快的收敛速度。像差自动平衡是同时对多种像差进行多因素校正,有了评价函数给计算机提供单一的评价标准,便于计算机判断,所以评价函数是像差自动平衡的基础。

1)评价函数

首先定义一个函数组φ(x)=(φ1(x),φ2(x),…,φM(x))T,如下

img1641

称为“像差剩余量”,写成矩阵形式为

φ=(AΔx-ΔF)               (15.4)

实际光学系统中各种像差参数的物理意义可能各不相同,数量值上差别也很大。像差校正时,并不是希望各种像差在数值上趋于相等,而希望它们之间在数值上达到合理的匹配。为使像差以最佳校正状态为校正目标,常以像差剩余量加权平方和作为评价函数:

Φ(x)=(μ1φ12+(μ2φ22+…+(μMφM2=img1642(μiφi2    (15.5)

式中,μ1,μ2,…,μM称为权因子(Weight)。

为讨论问题和程序设计处理方便,对方程组式(15.3)和式(15.4)进行如下变换。首先对应i行都乘以系数μi,然后将μiFi记为Fi、μiaij记为aij、μiφi记为φi,分别称为规化像差、规化系数和规化像差剩余量,式(15.3)和式(15.4)经处理之后的表示形式将与原来形式相同,而式(15.5)评价函数变为规化像差剩余量平方和形式:

img1643

再由式(15.4)可得

Φ(x)=(AΔx-ΔF)(AΔx-ΔF)T            (15.7)

2)最小二乘解法

由式(15.7)所构建的评价函数可知看出,能使Φ(x)=0的解,就是像差线性方程(15.3)的准确解。但是当要求校正的像差数M大于结构可变参量数N时,像差线性方程组为超定方程组,它的解实际上是不在的。光学设计中,像差校正实际上也只是尽量使各种像差趋近目标值,因此可改为求式(15.7)使Φ(x)为极小值的解,作为像差线性方程(15.3)的近似解,称为像差线性方程的最小二乘解。这是因为评价函数Φ(x)越趋近于极小值,系统成像质量越接近设计要求。

根据多元函数的极限理论,Φ(x)取极小值的必要条件是它的一阶偏导数等于零,即

▽Φ(x)=0                  (15.8)

运用矩阵求导规则求得Φ(x)的一阶偏导数为▽Φ(x)=2(ATAΔx-ATΔF)。由式(15.8)可得最小二乘法的法方程组

ATAΔx=ATΔF            (15.9)

上式为一个具有N个变量N个方程式的方程组。当矩阵ATA为非奇异矩阵时,其逆矩阵(ATA)-1存在,式(15.9)法方程组的解为

Δx=(ATA)-1ATΔF          (15.10)

上式即为评价函数取极小值的解,即像差线性方程的最小二乘解。这种求超定方程组最小二乘解的方法称为最小二乘法,它在工程技术问题上经常采用。

3)阻尼最小二乘法

光学设计中,由于像差和结构之间的非线性关系,在比较复杂的光学系统中作为自变量的结构参数很多,很有可能在若干自变量之间出现近似相关现象。这就使矩阵ATA的行列式值接近于零,逆矩阵(ATA)-1接近奇异,按最小二乘法求出的解Δx很大,远超出近似线性区域,用它对系统进行修改,往往不能保证评价函数Φ(x)的下降。为了使最小二乘法能有效地应用,对解向量Δx应加以限制,使得在远离极小点时线性逼近依然有效于是就提出了对步长Δx进行阻尼的方法,经过这样改进的最小二乘法,称阻尼最小二乘法。

为此,在原定义的评价函数Φ(x)中,加入一个对解向量Δx应加以限制项,构建新的评价函数如下:

img1644

式中:P——拉格朗日函数系数,又称为阻尼因子,它的作用是限制解的范围;

   r——N维解向量Δx的约束球半径。

L(x)称为拉格朗日函数。当对新的评价函数L(x)作最优化处理时,被减小的不仅是像差,而且还有步长Δx本身。Δx被减小的程度由常数P大小决定。所以式(15.11)的意义是将最小二乘法的概念同时用于像差ΔF和步长Δx,使像差的平方和与步长的平方和同时取得极小值。

用同样的方法,再求L(x)取极小值时的解,有

▽L(x)=▽Φ(x)+2PΔx=2ATAΔx-ATΔF+PΔx)=0

或者改写为

(ATA+PI)Δx=ATΔF            (15.12)

上式为阻尼最小二乘法的法方程组,其中,I为单位矩阵,由上式可得解Δx为

Δx=(ATA+PI)-1ATΔF          (15.13)

式(15.3)中逆矩阵(ATA+PI)-1永远存在。在像差方程组确定后,即A和ΔF确定后,给定一个P值就可以求出一个解向量Δx。P值越大Δx的模越小,像差和结构参数之间越接近线性,越有可能使Φ(x)的下降。但是Δx的模越小,系统改变不大,Φ(x)下降幅度越小,系统收敛速度较慢。因此必须优选一个P值,使Φ(x)达到最大的下降。当求出使Φ(x)最大下降的Δx后,用它们分别对系统结构参数进行修改,构建成新系统,然后把这个新系统作为新的原始系统,重新建立像差线性方程组,重复上述过程,直到评价函数Φ(x)不再下降为止。这就是光学自动设计中所称的阻尼最小二乘法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈