第五章极点配置与观测器的设计要点,则状态反馈的闭环系统的状态空间表达式为,式中为矩阵称为输出反馈增益矩阵,移到第一个相加点之前时就时输出变量反馈到端的情况如图所示。
CH5《现代控制理论》讲稿
第五章 极点配置与观测器的设计 要点:
1状态反馈
2单输入系统的极点配置
3观测器及其设计
4用状态观测器的反馈系统概念
难点:
观测器及其设计
闭环系统极点的分布情况决定于系统的稳定性和动态品质,因此,可以根据对系统动态品质的要求,规定闭环系统的极点应有的分布情况,把极点的布置作为系统的动态品质指标。这种把极点不止在希望的位置的过程成为极点配置。在空间状态法中,一般采用反馈系统状态变量或输出变量的方法,实现系统的极点配置。
§5-1 概述
一 状态反馈
把系统状态变量按照一定的比例关系,反馈到系统的输出端称为状态反溃
设线性系统为
xAxBu yCx(5-1)
而反馈规律为
1
u=Kx+v (5-2)
其中A,B,C,K分别为n×n、n×m、p×n及m×n矩阵,v为参考输入。则状态反馈的闭环系统的状态空间表达式为
.
x(ABK)xBv yCx (5-3)
图5-1 状态反馈结构图
比较式(5-1)和式(5-3)可知,状态反馈前后的系统矩阵分别为A和(A+BK),特征方程分别为det[I-(A+BK)],可看出状态反馈的系统特征根(即系统的极点)不仅与系统本身的结构参数有关,而且与状态反馈K有关,我们正式利用着一点对极点进行配置。应该主出完全能控的系统经过状态反抗侯,仍是完全能控的,但状态反馈可能改变系统的能观性。
二、输出反馈
把系统的输出变量按照一定的比例关系反馈找系统的输入端或x端称为输出反溃由于状态变量不一定具有物理意义,所以状态反馈往往不易实现。而输出变量则有明显的物理意义,因而 2 .
输出反馈易实现。
现没有式(4-1)描述的线性系统,对其进行输出反馈,取如下的控制规律。
~uVKy ~(5-4) 式中K为1×P矩阵,称为输出反馈增益矩阵。将式(5-4)可将输出反馈侯的系统方程为
图5-2 输出反馈结构图
比较(5-1)和(5-5)式可以蔬菜反馈前后的系统特征方程分别为det[IA]和det[I(ABKC)],从而可见输出反馈后的系统极点与输出反抗矩阵K有关。当我们把图5-2输出反馈结构图中的B矩阵
移到第一个相加点之前时,就时输出变量反馈到x端的情况如图5-3所示。
3 .~~.x(ABKC)xBv yCx (5-5) ~
图5-3 输出反馈x结构图
此时,系统的状态方程为
.
x(AGC)xBu yCx. (5-6)
式中G为n×p矩阵,也称为输出反馈增益矩阵。
输出反馈不改变系统的能观性。
状态反馈和输出反馈(主要指输出反馈至x的情况)都能够对系统进行极点配置,且一般经验认为,用简单的比例反馈(即K,K或G为常数矩阵)就能使问题得到解决。
下一章我们接着讨论,利用反馈对系统进行极点配置的条件和反馈矩阵的选择。
第二章 单输入极点配置
一、 应用状态、反馈实现预期的极点配置。
对于式(4-1)描述的系统(A,B,C)采用状态反馈使闭环系统极点可任意配置的充要条件使系统完全能控。
证:由于系统(A,B,C)完全能控,故可用变换TX
4 ~.x化为能控标
准形。
即 0A0
anIn1 an1a1 ,0B 01取 [Kn,Kn1,K1]
则0ABK0
knanIn1 kn1an1k1a1
其特征方程为
f(λ
)=datI(ABK)=+(-nK1+a1)n-1+…+(-Kn-1+an-1)+(-kn+an)=0(5-7) 设希望闭环系统特征根为对称复数复合:
=1,2,n
则对应的特征方成为
(-1)(-2)…(-n)=n+1n-1+…+-1+n=0 (5-8) 式中的1,2…n全为实数
根据特性值不变原理,式(5-7)和式(5-8)应具有相同的特征根,则两个方程系数应分别相等,即
,…,n-1=-kn-1+an-1,n=-kn+an1=(-k1+a1)
5
knnan所以只要取kn1n1an1 k11a1 (i=1,2,…n)
原系统=(A,B,C)的状态反馈阵K可通过线性逆变换求得 x=Tx=(ABK)xBu
以上可有
xT(ABK)TxTBu
x(ABKT)xBu 11 (5-10) 上式与式(4-3)比较可得
K=KT(5-11)
只要按上(4-10)式选取K阵即可保证状态反馈系统具有给定的(预期)的极点配置。证毕。
对于由能控标准型状态方程描述的系统可不经变化直接选取K值,即相当于T=I
【例5-1】已知系统的传递函数为
Y(S)
U(S)=1
s33s22s
试确定状态反馈矩阵K,以使闭环系统的极点配置在s1=-2,s2,3=-1j
解:因所给系统的传递函数无对消银子,故系统能控,是能控标准形的状态方程为
6
0010x+0u x=0010231
设K=K3K2K1
则0
A+BK=0
K3102K21 3K10
是特征多项式为
f()=I(ABK)3(3K1)2(2K2)K3 因要求状态反馈后,系统的特征多项式为 f*()=(2)(1j)(1j)=34264 故令上两式相等,便可求得
3k142k26 k43
解的:k3=-4,k2=-4, k1=1
所以K=k3k2k1=441
二,非能控标准形的基点配置。
1, 按能控标准形求K=KnK1
2, 变换阵求法
P=001bAbAn1b (5-12) 1
则变换阵
PPA T=n1PA(5-13)
7
【例5-3】被控对象为x
使闭环极点为-2,-3。 111xu求系统的状态反馈增益阵,011
解:容易验证该系统是能控的,但不是能控标准形,其特征多项
式为f(s)=det(sI-A)=s2-1
由要求配置的基点所确定的特征多项式为
fd(s)=(s+2)(s+3)=s2+5s+6
可求得
k1a1d1055,k2a2d2167
即kk2k175
求变换矩阵T,由式(5-19)有
P01bAb11201611111 3
P111由式(5-12)得T PA123
由式(5-10)求得被控对象(原系统)的反馈增益阵为
11341即状态反馈为 KKT7531233
xukxv411v经状态反馈后的闭环系统的状态方x2
程为x(AbK)xbv301x1v 42
非能控标准形极点配置变换真的另外一种求法
8
T(QcR)1其中an1an2a11a
n2R= a101
第三节多输入系统的极点配置
一、 能控系统的极点配置
构造如下矩阵
S00200300m00 u1列u1+u2列 ui列
i1m1
n列
式中,i(i=2,3,…,m)为m维单位列向量,且位于S矩阵
的第uj列,显然S是m×n阶矩阵,令
j1i1
即 kSQ1 KQS (5-14)
为n阶多输入能控系统xAxBu(a)系统先构造一个状态反馈
uKxv (5-15)
系统式(a)在状态反馈式(5-15)作用下的闭环系统为
x(ABK)xBv(5-16)
若只考虑v的第一个输入v1时,且b1为B的第一列,则有单输入系统
9 x(ABK)xb1v1Axb1v1 _ (5-17)
定理5-3 若被控对象式a是完全能控的,则当取状态反馈式(5-14)的增益矩阵为kSQ1
则单输入系统(A,b1)是完全能控的。
定理5-4 若系统(A,B)是完全能控的,则对式(5-17)单输入系统的能控性矩阵c[b1b1n1b1]有
detcdetQ(5-18) 及a[001]Q1[001]c1 (5-19)
即Q1的最后一行行向量与c1的最后一行行向量相等。
二、不完全能控系统的极点配置
设不完全能控的多输入系统为
AxBu x(5-20) 经过坐标变换,即经过能控结构分解,式(5-20)可写成
CA11xx0NCA12xCB1x0u A22NC (5-21)
式中,(A11,B1)为能控子系统,式(5-20)和式(5-21)的极点集为
A110A12(A11)(A22) A22(5-22)
极点(A11)为能控极点,(A22)为不能控极点。考虑式(5-21)系统的任意状态反馈
uKCxCKNCv xNC(5-23)
在此反馈作用下,闭环系统为
CNCxxA11B1KC
0A12B12KNCxCB1v A22xNC0(5-24)
闭环系统极点为
(A11B1KC)(A22)(5-25) 由于(A11,B1)是能控的,所以适当选择KC,可使闭环系统(A11B1KC)部分的极点能任意配置。而不能控部分A22的特征值在任意状态下反馈都不会改变。如果A22的特征值均具有负实部,
则可以选择KC使能控部分的闭还极点(A11B1KC)均具有负的实部,因此存在状态反馈,使闭环系统稳定。若(A22)不具有负实部,显然不存在状态反馈使闭环系统稳定。
定理5-5 系统式(5-20)用状态反馈使闭环系统稳定的充分必要条件为系统的不能控极点(A22)都具有负实部。
§5-4 观测器及其设计方法
一、观测器的设计思路
状态观测器实质上是一个状态估计器(或动态补偿器),它是利用被控对象的输入变量u和输出y对系统的状态x进行估计,从而解决某些状态变量不能直接测量的难题。
考虑线性定常系统
AxBux yCx (5-26)
式(5-26)系统构造的状态观测器,其输入是输出y和输入u的
(zx)0,则z可以作为x的估计值,从综合,其输出z,使limt
而实现状态重构。
为了得到估计值z,用模拟部件去再实现系统式(5-26),即构造系统式(5-26)的模拟系统
AzBu z(5-27) 由于式(5-58)是构造的,故都是可测量的的信息,若以z去作为x的估值,则其估计误差为ezzx,用式(5-27)减去式(5-26),则误差满足方程
zAez(5-28) e
由于它是一个开环系统,当估计值产生误差时,没有反馈不能消除误差。所以,一个改进的措施是利用输出估计的误差
yCzy作为反溃 yy
此时,构造的动态系统,即龙伯格状态观测器的状态方程为
AzBuKz(Czy) z
(AKzC)zKzyBu(5-29) 即z
式中,Kz为反馈增益阵。用式(5-29)减去式(5-26)得估计误
差ez方程为
z(AKzC)ez(5-30) e
如果选择合适的Kz,使式(5-30)稳定,即(AKzC)都具有负实部,则对应的任意初值ez(0),x(0)以及任意输入u均有limezlim(zx)0。因而ttz可以用为x的估值,故式(5-30)为
系统式(5-26)的一个观测器。
二、全阶观测器的设计
定理5-6系统式(5-26)存在观测器,且观测器的极点可以任意配置的充分必要条件是该系统完全能观。
推理5-2若系统式(5-26)是不完全能观的,则其存在感测器的充分必要条件是其不能观的部分的极点具有负实部,并称这类系统是能检测的。
现在来讨论式(5-26)给出的n阶完全能观性系统,显然其对偶系统 ATCTTB(5-31) 是完全能控的,若对这个对偶系统给以状态反馈uKTx,则其闭环极点,即(AT
(ATCTKT)的特征值是可以任意配置的,而且CTKT)与(AKC)具有相同的特征值。因此,对式(5-26)的被控对象设计观测器就可以归之于对其对偶系统(5-31)求状态反馈,使对偶系统的闭环极点等于观测器所要求的极点,且观测器中的反馈增益矩阵KzK。这表明,观测器设计是极点配置的问题。
例5-11二阶系统
110x11xx00x1u 22
y21x1x2T
设计全阶观测器,要求观测器的极点为{-1,-1}。
解: 容易验证系统是完全能观的,其对偶系统的系统阵和输入阵分别为
AT10
00,CT2
1
按从前给出的极点配置方法,有Q220
111
c10,Qc1
21,a
211
Ta21aAT10
2
det(sIAT)s2s
fd(s)(s1)2s22s1
则反馈增益 K13,KKT21,所以,观测器的反馈增益为KZ21T
AK102
ZC0012132
21观测器方程为
z132z121
z
221z1y
21u
KzKT
CH2《现代控制理论》讲稿
第二章 状态方程的解 要点:
① 线性定常状态方程的解
② 状态转移矩阵的求法
③ 线性时变状态方程的解
④ 离散系统状态方程的解
难点:
① 状态转移矩阵的求法
② 非齐次状态方程的解
2-1 线性定常状态方程的解
一、齐次状态方程的解
考虑n阶线性定常齐次方程
x(t)Ax(t)
x(0)x
的解。
先复习标量微分方程的解。设标量微分方程为 xax
x(0)x
对式(2-2)取拉氏变换得
sX(s)X0aX(s)
1 2-1)2-2)§( (
移项(sa)X(s)x0
则X(s)x0 sa
at(at)k取拉氏反变换,得 x(t)ex0x0k!k0
标量微分方程可以认为是矩阵微分方程当n=1时的特征,因此矩阵微分方程的解与标量微分方程应具有形式的不变性,由此得如下定理:
定理2-1 n阶线性定常齐次状态方程(2-1)的解为
(At)k
x0(2-3)x(t)ex0 k!k0At
式中,eAt(At)k
k!k0
推论2-1 n阶线性定常齐次状态方程
(t)Ax(t)x(2-4) x(t)x00
的解为 x(t)eA(tt)x0 (2-5) 0
齐次状态方程解的物理意义是eA(tt)将系统从初始时刻t0的初始0
状态x0转移到t时刻的状态x(t)。故eA(tt)又称为定常系统的状态转移0
矩阵。
(状态转移矩阵有四种求法:即定义(矩阵指数定义)法、拉氏反变换法、特征向量法和凯来-哈密顿(Cayly-Hamilton)法和)
从上面得到两个等式
eAt(At)k
k!k0
2
eAtL1[(sIA)1]
其中,第一式为矩阵指数定义式,第二式可为eAt的频域求法或拉氏反变换法
二、矩阵指数eAt的性质
1. eAtL1[(sIA)1]
2. e0I
3. eAteAeA(t)
4. (eAt)1eAt
5. 若矩阵A,B满足交换律,即AB=BA,则有 eAteBte(AB)t
6. (eAt)kekAt
7. 设P是与A同阶的非奇异矩阵,则有eP
8. 1APtP1eAtP dAteAeAteAtA dt
210209. 传递性。对任意t2,t1,t0,且t2t1t0,有eA(tt)eA(t1t)eA(tt)
三、eAt的计算方法
1. 定义法
eAt(At)k
(2-6) k!k0
2. 拉氏变换法
eAtL1[(sIA)1] (2-7)3
3. 特征值法
这种方法分两种情况计算。
首先,考虑A的特征值不重时(互异),设A的特征值为i (i1,2,n)
则可经过非奇异变换把A化成对角标准形。
P1AP 即:A
根据eAt的性质7写出
e1t
0e2t0(2-8) nteetA
根据定义,得
t1A2t21A3t3eAtIA2!3!11IP1AP(P1AP)t2(P1AP)t32!3!
1111m(P1AP)PAPPAPPAPPAP mmeAtP1PP1APt
11221133PAPtPAPt 2!3!eAtP1(IAt
P1eAtP
从而可得:
e1t
P0e2t122At)P 2!eAt0P1 (2-9) nte
(2-9)式即为A的特征值不重时,计算eAt的公式。其中P阵为把A化为对角标准形的交换阵。P阵的特征向量的求法:4
(P[1,,n] ,(iIA)i0)(2-9) 若矩阵A的具有重根时,用上述的方法也可以推导出:重根所对应的约当块AJ的矩阵指数eAjt的分式为
jte
0tejtejtejt1tn1ejt(n1)! (2-10) tejtjteeAjt
求矩阵指数eAt的分式为:
jte
P0tejtejtejt1tn1ejt(n1)!1P (2-11) tejtjteeAtPeAjtP1
式中P是把Aj化为约当标准形的变换阵。当A既有j重根又有互异的根时:
eAteAjt
P1tP(2-12) Ae
P阵的特征向量的求法:
P[p1,p2,,pj,j1,,,n,] (2-13) (1IA)p10(IA)pp211
(IA)ppjj1(2-14) 1
(j1IA)j10(nIA)n0
(注:在(2-13)式中将重根对应的特征向量p1,p2,,pj可放在P阵的前部,也可以放后,无严格规定。)
5
4. 莱-哈密尔顿(Cayley-Hamilton)方法 考虑A的特征多项式
IA()na1n1an1an
显然对A的n个特征值i,i1,2,,n,有(i)0。根据Cayley-Hamilton定理有
(A)Ana1An1an1AanI0这里可以看出矩阵A与i具有同等地位。移项 Ana1Ana2An1an1A2anA上式表明,An是An1,An2,,A,I的线性组合。
因此,可设
e
Atk(t)Ak0(t)I1(t)An1(t)An1 (2-15)
k0n1式中,i(t)是待定系数,i0,1,,n1。下面分两种情况确定待定系数:
(1)A有n个不同特征值1,2,n,A的特征值i与A具有同等地位,则有ek(t)ik
itk0n1
i1,2,,n(2-16)
这里共有n个方程,可以唯一确定n个待定系数i(t)。(2) 当A的特征值有重时,设A有p个互异特征值,
r个不同的重特征值,且各重数为mj,j1,2,,r。若j是
mj重特征值,则将j满足的方程e
jtk(t)对i求mj1
k0j
n1k
次导,这样共有mj个独立方程。一般地,设A的特征值
为1,2,p为单特征值
p1 是m1重特征值 …………
pr 为mr重特征值。
有 pmjn
j1r
则 i(t)由下面n个独立方程确定:
itn1kp个方程ek(t)i
k0pjtn1
k(t)kpj
e
k0n1n个方程d(epjt)d((t)k)
kpj
mj个方程ddk0pjpjmj1n1dmj1t
dm(epj)m(k(t)kpj
jjddk0pjpj
i1,2,p
j1,2,r
(2-17)
例4阶系统(n=4),有一个根重了3次,即j=3,用莱-哈密尔顿(Cayley-Hamilton)方法求状态转移矩阵,即用(2-17)式推得:
0(t)11
(t)
011(t)
2(t)003(t)14
At212
2124n1k0
36134
3121
1
e1tt1ttte
t2e1tt (2-18) 14te
然后按(2-15)式计算ek(t)Ak0(t)I1(t)An1(t)An1
四、非齐次状态方程的解设n阶非齐次方程
x(t)x0
(t)Ax(t)Bu(t)x
(2-19)
将状态方程左乘eAt,有
(t)eAtAx(t)eAtBu(t)eAtx
移项 积分,再移项左乘eAt,得 x(t)eA(tt)x0teA(t)Bu()d
t
定理2-2n阶线性定常非齐次方程(2-19)的解为 x(t)eA(tt)x0teA(t)Bu()d
t
从非齐次状态方程解的表达式可以看出其解是由齐次方程的解与控制u(t)的作用两部分结合而成。
§2-2 线性时变系统状态方程的解
定理2-3 n阶线性时变齐次方程为
(t)A(t)x(t)x
(2-20)
x(t)x00
其解为x(t)(t,t0)x0(2-21) 式中,(t,t0)是状态转移矩阵,满足的矩阵微分方程
(t,t)A(t)(t,t)00
(2-22)
(t,t)I0
状态转移矩阵的性质:
1. 传递性 (t2,t1)(t1,t0)(t2,t0) 2. 可逆性 1(t,t0)(t0,t)
(t)A(t)x(t)的n个线性无关解为 3. 设x
x1(t),x2(t),xn(t)
则X(t)x1(t)x2(t)xn(t)称状态方程的基本矩
阵,则有
(t,t0)X(t)X1(t0)
定理2-4 n阶线性时变非齐次状态方程
x
(t)Ax(t)Bu(t)x(t 0)x0
其解为x(t)(t,tt
0)x0t(t,)B()d0
§2-3 离散系统状态方程的解
对n阶线性定常离散系统
x[k1]Fx[k]Gu[k]
x[0]x 0其求解方法有两种:
1. 递推法
x[0]x0
x[1]Fx[0]Gu[0]x[2]Fx[1]Gu[1]
F2x[0]FGu[0]Gu[1]
x[3]Fx[2]Gu[2]
F3x[0]F2Gu[0]FGu[1]Gu[2]
x[k]Fkx[0]Fk1Gu[0]Gu[k1]k1
Fkx[0]FjGu[kj1]
j02. Z变换法
Z是频域解法。对式(2-18)作Z变换,有zX[z]zx[0]FX[z]GU[z]
(2-16)
(2-17)
(2-18)
移项(zIF)X[z]zx[0]GU[z]
左乘(zIF)1 X[z](zIF)1zx[0](zIF)1GU[z] 取Z1x[k]Z1{(zIF)1[zx0GU[z]]} 定理2-4n阶线性定常离散系统式(2-18)的解为
x[k]Fx0Fki1GU[i]
k
i0k1
Fx0FiGU[ki1]
k
i0k1Z1{(zIF)1[zx0GU[z]]}
CH6《现代控制理论》讲稿
第六章 最优控制……..(侯媛彬) 要点:
1变分法与最优控制的概念
2 最大值原理
3 线性最优控制器的设计
难点:
线性最优控制器的设计
§6-1 变分法与最优控制
一、基本概念
1.泛函
变量J,如果对于某一类函数中的每一个函数x(t),都有一个确定的值与之对应,那么就称J为依赖于函数x(t)的泛函,记为
JJ[x(t)]
或简记为J。根据函数定义,泛函可理解为“函数的函数”,即泛函的值是由函数的选取而定的。例如, J0x(t)dt
是一个泛函,因为J的值是由函数x(t)的选取而定的。其中函数x(t)称为泛函J[x(t)]的宗量。
2.泛函的变分
在泛函极值问题中,泛函的变分是解决问题的一种重要方1
法,下面讨论泛函的变分及相关的概念。
(1)宗量的变分
泛函J[x(t)]的宗量x(t)的变分,是指两个函数间的差,记作x(t)x(t)x0(t)
(2)泛函的连续性
若对于函数x(t)的微小变化,泛函J[x(t)]的变换也很微小,那么就说泛函J[x(t)]是连续的。
(3)宗量函数的相近度
当函数x(t)与x0(t)之差的绝对值,即x(t)x0(t) (6-1)
对于函数x(t)的定义域中的一切t值均很小时,就说函数x(t) 与x0(t)是相差微小或相近的。
当两个函数之差的绝对值和它们的导数之差的绝对值,即
(t)x0(t) (6-2) x(t)x0(t)和x
同时很小时,就说函数x(t) 与x0(t)是相差微小或相近的。
为了区别上面两种情况,把满足式(6-1)的两个函数称为具有零阶相近度,满足式(6-2)的两个函数称为具有一阶相近度,具有一阶相近度的函数必然具有零阶相近度,反之,则不一定。根据一阶相近度的概念,很容易推广,即当
(k)(t)x0(t),,x(k)(t)x0(t) (6-3) x(t)x0(t),x
均很小时,称函数具有K阶相近度。
(4)空间距离
定义在区间[a,b]上连续函数的全体是一个函数的空间,记为C[a,b],其中对应atb的每个函数x(t)都是这个空间的一点,定义C[a,b]中两点的距离为
d(x,x0)atbx(t)x0(t)(6-4)
若定义[a,b]上连续且具有连续K阶导函数的函数的全体是
一个空间,记为Ck[a,b],定义Ck[a,b]中两点的距离为
(k)(t)x0(t),x(k)(t)x0 d(x,x0)atbx(t)x0(t),x(t) maxmax
(6-5)
显然,由式(6-4)和式(6-5)定义的距离可用来定量刻划两个函数的零阶和K阶相近度。
如果对于任意给定的一个函数,可以找到这样的一个,当d(x,x0)时,就有
J[x(t)]J[x0(t)]
那么就说泛函J[x(t)]在点x0(t)处是连续的。当d(x,x0)按式
(6-4)或(6-5)定义时,相应称为零阶连续或K阶连续。
(5)泛函的变分
如果连续泛函J[x(t)]的增量表达式为
J[x]J[xx]J[x] (6-6)
应用泰勒公式将(6-6)在x点展开,得
dJ1d2J2J[x][(xx)x][(xx)x]2dx2!dx(6-7) 2dJ1dJ2x(x)2dx2!dx
当x很小时,式(6-7)右边是关于x的线性连续泛函,而其余均为x的高阶无穷校若用x线性连续泛函和x高阶无穷小之和表示泛函的增量,即有
J[x]L[x,x]r[x,x] (6-8)
那么,就把第一项称为泛函的变分,记为JL[x,x]
当一泛函具有变分时,也称泛函是可微的。
泛函的变分还可以写成另一种形式,即
JJ[xx]0 (6-9)
(6)泛函的极值
若泛函J[x(t)]在xx0(t)的邻域内,即
d(x,x0)rr0(6-10) 其增量JJ[x(t)]J[x0(t)]0
或JJ[x(t)]J[x0(t)]0,则称泛函J[x(t)]在点x0(t)处有极大值或极小值。
(t)x0(t), 当距离d定义为d(x,x0)atb{x(t)x0(t),xmax
泛函J[x(t)]在点xx0(t)处达到极值,称为弱极值。具有强极值的泛函必有弱极值,反之不然。
(7)泛函极值存在的条件
泛函J[x(t)]在点xx0(t)处达到极值的必要条件是泛
函在点xx0(t)的变分为零,即
JL[x,x]xx0(6-11) 0
二、 欧拉方程
有了§6-1的概念,可以进一步讨论如何确定函数x(t),使泛函Jx(t)达到极值的问题。解决这一问题必须依赖一个重要的关系式,这一关系式称欧拉方程。
在最优控制系统中,其性能指标就是泛函J,因此用变分求解泛函极值的问题,也就是求解最优控制的过程。由于控制的多样性,其变分问题也各不相同,现分别讨论。
1、 点固定的情况
设泛函为
)dt(6-12) JF(t,x,xt0t1
且x(t0)x0,x(t1)x1 (6-13)
式中x0,x1均为常数。设x*(t)是满足边界条件式(6-13),使式(6-12)泛函J达到极值的最优函数。设x(t)是x*(t)邻域内的一个函数,它与x*(t)满足下列关系
x(t)x*(t)(t)(6-14) *x(t)x(t)(t)
式中,是一个数值很小的参数,(t)是任一有连续导数且满足条件
(t0)(t1)0
的函数。这样端点固定的条件得到了保证,即
x*(t0)x(t0)x0
x(t1)x(t1)x1*
显然,不管函数(t)如何选,当0时,恒有x*(t)x(t)
即获得了最优函数。
现将式(6-13)代入式(6-11),得
*)dt(6-15)J()1F(t,x*,xt0t
比较式(6-12)和(6-15)。当式(6-12)在xx*(t)时达到极值,相当于式(6-15)在0时取极值。应用式(6-11),要使J()取极值,必有J()(dJ())00d 要使上式在任何时均成立,只有 dJ()
d00(6-16)
所以,在用式(5-16),即可使J()取极值。
dJ()
d0dd
t1tt10)dtF(t,x,xd)dtF(t,x,xt0d
t1)dttF(t,x,x)F(t,x,x0xx
)具有二阶连续偏导数,故求导和积分可交换顺序。(注:设F(t,x,x)
对上式第二项进行分步积分,及
t1dddtFxFxFxtFxt0t00dtdtt1t1t0t1
dJ()则 d00t(Fx0t1d)dt0 Fxdt
根据拉格朗日定理:若连续函数M(t),对于任意(t),在区间[a,b]满足
则在[a,b]一定有M(t)0,所以有
Fxd0 (6-17) FxdtaM(t)(t)dt0b
将方程展开,得
txFxxFxx0(6-18)FxFxx
式(6-17)或(6-18)常常称为欧拉方程。因此,函数x(t)满足欧拉
)dt泛函取极值的必要条件。 方程使式(6-12)即JtF(t,x,x0t1
三、含有多个未知函数的泛函
为讨论多未知函数变分问题简单化,常采用向量表达式,此时泛函可记为
)dt(6-19) J[x]tF(t,x,x0t1
其中,F是x的数量函数,x是n维向量函数。
x1x
x2 xn
采用和数量函数情况相同的推论方法,可得向量形式的欧拉方程,
FdF0 (6-20) xdtx
上式中数量函数F对向量函数x得导数,定义为
Fx1FFx2(6-21) xFxn
设端点A是固定得,端点B可沿曲线
x(t1)(t1)
变动,此时B点得横截条件为
Fx)]t10 (6-22) [F(x
四、条件极值的变分
在控制理论中常遇到目标函数J依赖的函数需要满足一定约束条件的情况,在这种情况下使J达到极值得变分问题,类似函数条件极值问题。解决这类变分通常采用所谓的拉哥郎日乘子法,即构造一个常有乘子的辅助函数
HFifi (6-23)
i1m
式中i是乘子,它通常是时间t的函数;fi是泛函变量需满足的第i个约束方程。则泛函为
J0tHdt (6-24) 0t1
这样就得到了一个无条件限制的泛函。下面分两种约束形式进
行讨论。
1.几何约束
现有泛函
Jt1
t01,,xn)dt F(t,x1,,xn,x
求它在几何约束条件
fi(t,x1,xk,xn)0
下的极值。
设n2,m1,应用乘子构造函数为
1,x2)f(t,x1,x2)]dt (6-25) J0t[F(t,x1,x2,x
0i1,2,,m (mn)t1
1,x2)F(t,x1,x2,x1,x2)f(t,x1,x2) (6-26) 简记H(t,x1,x2,x
则式(6-25)可写成
J0tHdt 0t1
然后,求泛函J0的无条件极值,写出欧拉方程
d10Hx1dtHx (6-27) dHx2Hx20dt
将约束方程和欧拉方程联立求解,即可求得x1,x2和3个未知函
数。利用端点边界条件可确定欧拉方程中积分后4个任意常数。
2.运动约束
当约束方程中含有函数导数项时,我们称此时得约束条件为运动
约束,其一般表达式为
1,,xn)0f(t,x1,,xn,x
在这种约束条件下求泛函极值的方法,与求几何约束泛函极值的方法完全一致。
§6-2 最大值原理
最大值原理是又一种求解最优控制问题的方法。它是庞特里雅金等人提出的。这种方法是古典变分学的延伸,但能成功古典变分法不易解决的问题。
定理: 设U(t)是一个容许控制,x(t)是相应于U(t)的轨线,P(t)是相应于U(t)和x(t)得共态变量,则U(t)和x(t)为最优控制U*和最优轨线X*(t)的必要条件是:
对于在区间[t0,t1]上得每一个t值,作用U的函数H[x(t),P(t),u,t]必在点uU*(t)处达最大值。此定理就是“最大值原理”。
[例6-1] 有如下二阶系统
1xuxx2x1x1(0)1x2(0)0 且u(t)1,试求出最优控制U*(t)使系统在终态自由的情况下使泛函Jx2(t1)t1取极值。 1
解: 先构造H函数
HP1(x1u)P2x1
据一般形式最优控制问题中的泛函形式JCixi(t)可知,本n
例中C10,C21
根据哈密顿正则方程,得
PHP
1
x2P1
1
P2H
x02
又根据Xifi(x,u,t),Xi(t0)Xi0
Pi(ti)Ci有
P1(t1)P1(1)C10
P2(t1)P2(1)C21
下面解方程组
P1P1P2
P20
对上(b)式两边积分有
P2(t)C
代入终点条件,得 P2(t)1即
P2(t)1C1
将(c)式代入(a),有
P1P11
解方程 dP1
dtP11
则 通解为P1dt
11 i1i1,,n的终点条件,即(a)(b) (c)
代入终点条件,C1,有
P1(t)t11(d)
现利用最大值原理,为了使变量u的函数H在u1的约束条件下
达到最大值,即HP1u达最大值,
只有取
1,P1(t)0 u(t) 1,P(t)02
又因为在区间[0,1]内,由(d)式可见P1(t)0,所以应取
u(t)1
在P1(t)0时,u(t)没有定义。
故将u(t)1和初始条件代入系统方程,可得最优轨线方程为
*x1(t)2t1
x(t)2t2*
xt由此可求出J得极小值
Jx2(1)211
*应当注意得一点是,最大值原理仅是泛函取最小值得必要条件,并不充分,所以求得的解是否为极小值还要进行验证。易证明,本例中u*(t)1确使Jx2(1)达到了极小值。
§6-3 线性最优控制系统
一、 二次型性能指标得最优控制问题
当性能指标泛函具有形为
Jx(t1)Sx(t1)1
21t1 [xQxURU]dt (6-28)t20
的时候称为二次型性能指标。其中S和Q是半正定对称矩阵,R是正定对称矩阵。上式中第一项中系数是为了简化计算。 下面是关于有限时间的调节器的问题。
设n阶系统
A(t)x(t)B(t)u(t)x(6-29) x(t)x0012
现在需要确定使性能指标
J1t1 [xQxURU]dt(6-30)t02
取极小值得最优控制*U
其中t1是固定的,终态x(t1)没有约束。
YAAYYBR1BYQ (6-31) Y
求解里卡拉方程,并代入UR1BP,得
U*(t)R1BYxkx(kR1BY)(6-32)
上式为能够成状态反馈闭环系统的最优控制表达式。
现在把二次型性能指标的调节器问题求解过程写成如下定理
定理:若给定线性系统
A(t)x(t)B(t)u(t)xx(t)x00
其中控制u没有约束,A(t)和B(t)是连续的,且性能指标泛函为J1t1 [xQxURU]dt (6-33)t02
其中Q是连续、半正定、对称矩阵,R是连续、正定、对称矩阵,则使泛函J取最小值的最优控制为
U*(t)R1B(t)Y(t)x(t) (6-34) 而最优控制性能指标函数为
V*[x(t),t]x(t)Y(t)x(t)(6-35) 其中,矩阵Y(t)是矩阵里卡拉方程
YAAYYBR1BYQ满足终点条件Y(t)0的解。Y112
两点说明:
① 若把(6-33)式右边的舍去,则只相应地把(6-35)右边的1舍去即可; 212
② 若泛函J取更一般的形式
J11t1 x(t1)Sx(t1)[xQxURU]dt (6-36)t220
那么除了把里卡拉方程的终点条件相应改变外,其余结论没有改变。
现在举例说明定理的应用。
[例6-2]已知系统
u,xx
2x(0)x0
和性能指标函数
JSx2(t1)1
21t122[2xU]dt t02
求最优控制U*和最优性能指标V*。
解: 由题意知, A,B1,Q2,R1
则里卡拉方程为 12
yy22,yy(t1)s
用分离变量法求解方程
dydt 2yy2
分母配方后,两边积分得,yth(tc)其中积分常数决定于终点条件y(t1)s
若设s0,t11,则可解出C1.845 123232 最优控制为
U*(t)[0.51.5th(1.5t1.845)]x(t)最优性能指标函数
V*[x(t),t][0.51.5th(1.5t1.845)]x2(t)最优轨线为
x*(t)0xch(1.5t1.845) ch1.84512
【应届毕业生面试自我介绍汇编15篇】相关文章:
应届毕业生面试自我介绍范文汇编6篇01-04
应届毕业生面试自我介绍集锦15篇01-06
本科应届毕业生面试自我介绍6篇02-14
应届毕业生面试自我介绍范文九篇12-11
应届毕业生面试自我介绍范文合集7篇12-12
应届毕业生面试时的自我介绍范文09-03
关于应届毕业生面试自我介绍模板合集6篇01-09
应届毕业生面试自我介绍范文汇总八篇01-15
应届毕业生面试自我介绍范文集合六篇01-11
关于应届毕业生面试自我介绍范文合集6篇01-08