首页 百科知识 极值与条件极值

极值与条件极值

时间:2022-08-23 百科知识 版权反馈
【摘要】:函数的极值和条件极值是函数性态的一个重要方面。在本节中,我们首先对函数极值的判定作一些回顾性叙述,然后重点讲解条件极值和拉格朗日乘数法。在实际运用时,人们往往按第2段的方法求得了条件极值侯选点P0后,直接依据问题的实际意义如极值一定存在,极值侯选点的唯一性等判定P0即为所求的条件极值点。f在约束条件之下的条件极值即是F的无条件极值。

§6.5 极值与条件极值

函数的极值和条件极值是函数性态的一个重要方面。在实际应用中更是占有重要的地位。在本节中,我们首先对函数极值的判定作一些回顾性叙述,然后重点讲解条件极值和拉格朗日乘数法。

一、一元函数极值

为了方便,恒设函数f在x0的某领域U(x0;δ)内一阶可导,在x=x0处二阶可导。

1.极值必要条件

定理1 (费马)函数在x0处取得极值的必要条件是f′(x0)=0。

或说成:在可导的假设之下,极值点必是稳定点。

2.极值充分条件

定理2 若f′(x0)=0,f″(x0)≠0,则x0为f的极值点。具体地,

  当f″(x0)>0时,f在x0处取得极小值;

  当f″(x0)<0时,f在x0处取得极大值。

为了推广和形式统一的需要,我们将上述极值第二充分条件的关键语句f″(x0)>0或f″(x0)<0用二阶微分的形式表示之。

定理2′ 设x0为f的稳定点,则

  当alt时,x0为f的极小值点;

  当alt时,x0为f的极大值点。

事实上,d2f=f″(x)dx,故二阶导数和二阶微分同号。

二、二元函数极值

设二元函数f(x,y)在P0(x0,y0)的某领域内有二阶连续偏导数。

1.极值必要条件

定理3 f(x,y)在P0(x0,y0)处取得极值的必要条件是:

f′x(P0)=f′y(P0)=0。

满足上式的P0仍称为f的稳定点。

和一元函数相同的是:在可偏导的前提下,极值点一定是稳定点。

这样,极值点的搜索范围将大为缩小。

2.极值充分条件

定理4 设f(x,y)在P0的邻域内有二阶连续偏导数,且P0为f的稳定点,引入A=f″xx(P0),B=f″xy(P0),C=f″yy(P0),Δ*=AC-B2,则

Δ*<0时,P0不是极值点;

Δ*>0时,P0是极值点:当A>0时为极小,A<0时为极大。

注 该定理及其证明在§3.6中有介绍。

下面我们将二元函数极值的充分条件用二阶微分的形式来表达,并设法寻求其和一元函数极值充分条件相一致的表达方式。

在§6.2节,已经讲过了全微分及其不变性。接下来我们介绍高阶微分。

三、高阶微分

设二元函数z=f(u,v)n阶连续可偏导,其一阶微分

alt

二阶微分alt

一般地,n阶微分

alt

注意:上式中dun-k=(du)n-k,dvk=(dv)k是约定的记法。

现在问,二阶微分有没有形式不变性呢?

设u,v是中间变量,而x,y是自变量。u=φ(x,y),v=φ(x,y)

z=f(u,v)=f(φ(x,y),ψ(x,y))是(x,y)的函数。

由一阶微分的形式不变性

alt

alt

将(4)式和(2)式作一个比较,就发现u、v作为中间变量时,z的二阶微分中多出了两项alt

而d2u,d2v分别代表u=φ(x,y),v=ψ(x,y)的二阶微分,此时公式(2)仍适用。如

alt

而当u,v作为自变量时,du=Δu,dv=Δv,d2u=d(du)=0,d2v=d(dv)=0。

所以,二阶微分不再具有形式不变性。

四、微分形式的极值充分条件

应用二阶微分的形式,我们可以将定理4改写成:

定理4′ 设f(x,y)在P0的邻域内有二阶连续偏导数,且f′x(P0)=f′y(P0)=0。则

   alt时,P0必为f的极小值点;

事实上,由于dx=Δx,dy=Δy,f(x,y)在P0处的二阶微分是

alt

当Δ*=AC-B2>0时,alt一定保号且和A同号。

为使读者更好地理解二阶微分和极值的关系,我们以微分形式的语句给出定理4′的证明。

证明 z=f(x,y)在P0(x0,y0)处对应于Δx,Δy的全增量

Δz=f(x0+Δx,y0+Δy)-f(x0,y0);又dx=Δx,dy=Δy。

一阶微分dz=f′x(P0)Δx+f′y(P0)Δy

二阶微分d2z=f″xx(P0)(Δx)2+2f″xy(P0)ΔxΔy+f″yy(P0)(Δy)2

由多元Taylor公式(参见§3.6之定理1),有

alt

而当P0(x0,y0)是f(x,y)的稳定点时,dz=0,

于是

alt

若d2z保号,则当ρ充分小时,Δz必和d2z同号。

而二次齐次式A(Δx)2+2BΔxΔy+C(Δy)2的判别式为

Δ=4(B2-AC)

当Δ<0即Δ*=AC-B2>0时,d2z保号。

  A>0时,d2z>0,在P0的某领域内,Δz>0,得P0为极小值点;

  A<0时,d2z<0,在P0的某领域内,Δz<0,得P0为极大值点。

当Δ>0即Δ*<0时,d2z变号,从而Δz在P0的近旁也要变号,P0不是极值点。

当Δ=0时,存在无限多组(Δx,Δy)使得d2z=0。

此时,Δz的符号取决于误差项o(ρ2),故无法判定P0是否极值点。需要更高阶的微分性质才可能判定。

对一元函数来说,类似的结果可参见§3.6之例10。

比较定理2′、定理4′不难发现,在微分语句之下,一元函数和二元函数极值的充分条件就实现了形式上的统一。

五、条件极值、拉格朗日乘数法

1.条件极值问题的一般形式

在条件 alt

的限制下,求目标函数z=f(x1,x2,…,xn)的极值。

为通俗易懂,我们选取n=4,m=2情形为代表,记号上稍作变动。

求四元函数f(x,y,u,v)在两个约束条件

alt

之下的条件极值。

2.条件极值必要条件·拉格朗日乘数法

拉格朗日函数为

L(x,y,u,v,α,β)=f(x,y,u,v)+αφ(x,y,u,v)+βψ(x,y,u,v)=f+αφ+βψ

其中α,β被称作是拉格朗日乘数。

令L′x=L′y=L′u=L′v=L′α=L′β=0。

解得作为六元函数的L的稳定点M0(x0,y0,u0,v0,α0,β0),而P0(x0,y0,u0,v0)则是f(x,y,u,v)的条件极值侯选点。

简洁而稍逊严谨地讲,f(x,y,u,v)的条件极值点一定是其拉格朗日函数L(x,y,u,v,α,β)的稳定点。

仔细地加以甄别,P0(x0,y0,u0,v0)和M0(x0,y0,u0,v0,α0,β0)的维度是不一样的,在条件极值的求解过程中,拉格朗日乘数α、β的确定也是非常重要的一环!

3.条件极值充分条件

在实际运用时,人们往往按第2段的方法求得了条件极值侯选点P0后,直接依据问题的实际意义如极值一定存在,极值侯选点的唯一性等判定P0即为所求的条件极值点。理论上的严密性比较疏忽。结合前述二阶微分和极值的关系,本段我们重点论述二阶微分和条件极值的关系,建立如下条件极值的充分条件。仍回到一般形式,拉格朗日函数为

alt

解方程组(共n+m个方程)

alt(1≤i≤n),以及φk(x1,x2,…,xn)=0(1≤k≤m)

得出一组特定的拉格朗日乘数alt,以及f的条件极值稳定点alt

现仍记 alt

L作为普通n元函数的二阶微分

alt

而自变量的微分即为自变量的增量。

dxi=Δxi(1≤i≤n)

但当x1,x2,…,xn受到条件组φk(x1,x2,…,xn)=0的约束时,dxi(1≤i≤n)之间也将受限于方程:

alt

有了上述准备工作,我们可将条件极值的充分条件简述为:

定理5 设目标函数为f,拉格朗日函数为L,P0为f的条件极值侯选点,则

  alt时,P0是f的条件极小值点;

  alt时,P0是f的条件极大值点。

  d2L如(8)式所示,而dxi(1≤i≤n)则受到方程组(9)的限制。

证明 仍以n=4,m=2情形为例。

设从约束条件(7)中确定了唯一的一组函数u=u(x,y),v=v(x,y)代入拉格朗日函数中,所得函数记为F(x,y):

alt

利用一阶微分的形式不变性

dF=dL=Lxdx+Lydy+Ludu+Lvdv

二阶微分

d2F=d2L=dLx·dx+dLy·dy+dLu·du+dLv·dv+Lud2u+Lvd2v

因为在P0处,Lu=Lv=0

所以alt

等式右端是视x,y,u,v为独立变量时,L的二阶全微分。f在约束条件(7)之下的条件极值即是F的无条件极值。依定理4′,只需判定d2F的符号。从上面推导可知,d2F即d2L,但dx,dy,du,dv必须受dφ=dψ=0,即

alt

的限制。

这样,从定理4′立得定理5。

下面我们举一些条件极值及其应用(如证明不等式等)的例子。

例1 求f=x+y+z+t在限制条件xyzt=c4下的极值。(x,y,z,t>0)

alt

(二) alt

在M0(c,c,c,c)处,L的二阶微分

alt

将xyzt=c4两边微分:dx+dy+dz+dt=0(在M0(c,c,c,c)处)。

亦即dz=-(dx+dy+dz),代入(△)式:

alt

因此函数f在点(c,c,c,c)达到极小值,极小值为4c。

注 也可由几何意义判定M0为极小值点,或代数判定无极大值,或降维考虑:x+y在xy=c2之下的条件极值。

证一 令alt

证二 令alt原条件化为x′+y′+z′=r′。

alt (问题的变换转化)

即在约束条件x′+y′+z′=r′之下,求alt的最小值。

再转化为求g(x′,y′,z′)=x′y′z′的条件极大值。

令L(x′,y′,z′,λ)=x′y′z′+λ(x′+y′+z′-r′)。

或从约束条件解出z′=r′-x′-y′

x′y′z′=x′y′(r′-x′-y′),化为显函数的极值问题解得。

(或利用算术-几何平均不等式亦可)

现有不等式:alt

立得 alt

此为调和-几何平均不等式。

现以二阶微分来验证M0(3r,3r,3r)为极小值点。

在点M0

alt

从而M0点为条件极小值点,且是唯一的极小值点,易判定其为最小值点。

注 此处约束条件alt的微分没有用到。

若用转换以后g(x′,y′,z′)=x′y′z′在x′+y′+z′=c之下的极值。仍记

alt

但因为x+y+z=c, 所以dx+dy+dz=0。dz=-(dx+dy)

alt

从而P0为函数g的条件极大值点。

解一 转化为求u2=x2+y2+z2的条件极值。

令L(x,y,z)=x2+y2+z2+λ[(x-y)2-z2-1]

从L′z=0知(λ-1)z=0,得λ=1或z=0

λ=1舍去(方程组L′x=L′y=L′z无解)。

alt

所以z=0,代入其他式子得驻点alt,相应的乘数alt

alt

所以alt

P1,P2为极小值点,极小值为alt

解二 以z2=(x-y)2-1代入u2=x2+y2+z2中得

v=x2+y2+(x-y)2-1

alt解点为(0,0),但此时z无解。

于是极值应当在边界上取得。

曲面∑:(x-y)2-z2=1定义于xy平面的区域D:|x-y|≥1之上。

即z2=(x-y)2-1或写为alt

D的边界alt:|x-y|=1,代入曲面方程知z=0。

例4 若x,y,z为满足x2+y2+z2=8的正数,证明:

alt

证 令F(x,y,z)=x3+y3+z3

转化为求F(x,y,z)在条件x2+y2+z2=8,x>0,y>0,z>0之下的条件极值。

L(x,y,z)=F(x,y,z)+λ(x2+y2+z2-8)

alt即3x2+2λx=0知3x+2λ=0。

依对称性得alt,驻点为alt

下求alt

alt

所以F(x,y,z)在P0处取得极小值,唯一的在定义区域的内点取得的极小值必是最小值。

问:最大值在哪儿取得?答:在边界圆周上,如alt处。

例5 求x>0,y>0,z>0时,函数

f(x,y,z)=lnx+2lny+3lnz

在球面x2+y2+z2=6r2上的极大值。并证明:a、b、c为正数时

alt

清华大学1981年)

解 设L(x,y,z)=lnx+2lny+3lnz+λ(x2+y2+z2-6r2

令Lx=Ly=Ly=Lr=0,解得alt

当P(x,y,z)靠近第一卦限的边界即三个坐标面时,f(x,y,z)趋于-∞。

从而唯一的稳定点P0必是f的最大值点。

所以

alt

两边取指数ef(x,y,z)≤ef(r,2r,3r)

得 alt

再令x2=a,y2=b,z2=c代入上式立得

alt

注 1.当且仅当a∶b∶c=1∶2∶3时上述不等式中等号成立。

  2.这种方法可用来证明许多的不等式(包括Haltlder不等式),还可以自行构建出一些新的不等式。

例6 抛物面x2+y2=z被平面x+y+z=1截得一个椭圆。求这个椭圆到原点的最长与最短距离。

解 求f=x2+y2+z2在条件alt之下的最值。

令L(x,y,z,λ,μ)=x2+y2+z2+λ(x2+y2-z)+μ(x+y+z-1)。

令Lx=Ly=Lz=0并结合约束条件解得:

alt

(注:注意到曲面方程关于字母的轮换对称性,在极值点处应有x=y,或从几何意义出发分析亦可以)。

结合问题实际意义,f在有界闭集(椭圆)上必有最值。

而f的最值只能在上述两个稳定点处取得(椭圆并无端点概念,故最值点一定是稳定点)。

从而算得最大距离为alt,最短距离为alt

又问:如何求此椭圆的长、短轴?

解一 从上面求解过程已知,椭圆长轴的两个端点是

alt

利用两点间距离公式立得长轴长为alt

相对来说,短轴长较难求一点。

椭圆的中心在AB的中点alt处。以下求短轴所在直线方程。

长轴AB的方向数是{xA-xB,yA-yB,zA-zB}化为{1,1,-2},平面x+y+z=1的法向量alt。短轴CD同时垂直于A B和alt,从而CD的方向数为:

alt

短轴CD的方程是 alt

联立z=x2+y2,解得交点alt

于是短轴长alt

解二 先求椭圆在xy平面上的投影曲线。

解方程组alt

由②,z=1-x-y,代入①:x2+y2=1-x-y

整理为圆方程alt

此圆的半径为alt

记平面x+y+z=1和xy面的交角为θ。

利用几何图形或利用法向量的内积,易得

alt

所以,长轴长alt

短轴CD平行于xy坐标面,故其投影即为圆③的直径,从而alt

习题6.5

1.求椭圆5x2+4xy+2y2=1的长半轴、短半轴长。

2.试求平面αx+βy+γz=0与圆柱面alt相交所成椭圆的面积。

3.求函数alt在D:1≤x2+y2+z2≤4上的最大值、最小值。

(浙江省高等数学竞赛2007年)

4.求函数f(x,y,z)=x5+y5+z5在x2+y2+z2=8,x≥0,y≥0,z≥0之下的条件极值。

5.求方程x3+y3-3ax=0(a>0)所确定的隐函数y(x)的极值。

6.求曲面z=xy-1上与原点最近的点的坐标。

中山大学1983年)

7.给定椭球面alt,求第一卦限中椭球面的切平面,使它与坐标平面围成的四面体体积最小。

8.已知三角形的周长为2p,求出这样的三角形,当它绕着自己的一边旋转时所得旋转体的体积最大。

9.分解已知正数a为n个正的因数,使得它们的倒数的和为最小。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈