常数变易法

为什么写这篇文章

学过“常数变易法”的同学请直接点击“常数变易法的原理”
这里只讲述常数变易法的原理,为什么要用常数变易法请参见参考资料《常数变易法的解释 》

在学习高数的过程中,关于为什么在解一阶线性微分方程的时候要使用常数变易法,为什么可以使用常数变易法,常数变易法为什么是有效并且正确的,老师都语焉不详,一笔带过,导致一直不能很好地理解其中的数学思想。自己也只能接受老师的解释,将这个方法强行合理化。

但是最近再次看到一阶线性微分方程的求解,看到直接给出来的求解公式一头雾水,再去翻书,始终还是感觉隔靴搔痒,雾里看花,始终不自在,所以上网搜索了一下,搜到了一篇相关文章(常数变易法的解释 ),终于明白了其中蕴含的深刻而巧妙的数学思想,喜不自禁。

所以在此记录下个人的理解,一则梳理自己的思路,二则可供感兴趣的同学参考,倘能有助于大家理解常数变易法的“自然”性,亦是幸甚。

什么是常数变易法?

有以下一阶线性微分方程:

(1)

y

+

P

(

x

)

y

=

Q

(

x

)

y' +P(x)y=Q(x) \tag1

y+P(x)y=Q(x)(1)其中,

P

(

x

)

̸

0

P(x)\not \equiv 0

P(x)̸0

Q

(

x

)

̸

0

Q(x)\not \equiv 0

Q(x)̸0

若解其对应的齐次方程:

(2)

y

+

P

(

x

)

y

=

0

y' +P(x)y=0\tag2

y+P(x)y=0(2)则易有:

y

=

C

e

P

(

x

)

d

x

(

C

0

)

y=Ce^{-\int P(x)dx}(C\neq 0)

y=CeP(x)dx(C̸=0)即为齐次方程的通解

这时,我们可以用常数变易法来求非齐次方程

(

1

)

(1)

(1)的通解,即将齐次方程

(

2

)

(2)

(2)的通解中的常数

C

C

C换成(变易为)一个关于

x

x

x的未知函数

u

(

x

)

u(x)

u(x),变易之后,非齐次方程通解表示如下:

(3)

y

=

u

(

x

)

e

P

(

x

)

d

x

(

u

(

x

)

̸

0

)

y=u(x)\cdot e^{-\int P(x)dx} \Big(u(x)\not\equiv 0\Big)\tag3

y=u(x)eP(x)dx(u(x)̸0)(3)于是将该通解形式代入原方程

(

1

)

(1)

(1),可以解得:

u

(

x

)

=

Q

(

x

)

e

P

(

x

)

d

x

d

x

+

C

u(x)=\int Q(x)e^{\int P(x)dx}dx+C

u(x)=Q(x)eP(x)dxdx+C将上式代入

(

3

)

(3)

(3)式,即可解得:

y

=

e

P

(

x

)

d

x

(

Q

(

x

)

e

P

(

x

)

d

x

d

x

+

C

)

y=e^{-\int P(x)dx}\cdot (\int Q(x)e^{\int P(x)dx}dx+C)

y=eP(x)dx(Q(x)eP(x)dxdx+C)这就是所谓常数变易法
可以看到,这里把常数

C

C

C 直接代换为了函数

u

(

x

)

u(x)

u(x) ,显得十分生硬不自然,没有什么说服力。然而书上很少会对这个方法的由来作出介绍,所以想必会使很多人感到困惑。

错误的理解

对于常数变易法,我以前的理解是:
既然

y

=

C

e

P

(

x

)

d

x

(

C

0

)

y=Ce^{-\int P(x)dx}(C\neq 0)

y=CeP(x)dx(C̸=0) 可以使齐次方程

y

+

P

(

x

)

y

=

0

y' +P(x)y=0

y+P(x)y=0 成立,那么在其基础上增添一个函数,就应该使得该方程运算结果多出一个与自由项相关的余项

Q

(

x

)

Q(x)

Q(x),所以可以使用常数变易法。
这样的理解是基于表面形式做出的一个解释,然而还是不能够明确地说明这个方法的正当性与正确性。
所以我们需要进一步探究其内在的原理。

常数变易法的原理

基本

容易理解,我们可以把任意函数表示成为两个函数之积,即

(4)

y

(

x

)

=

u

(

x

)

v

(

x

)

y(x)=u(x)\cdot v(x)\tag4

y(x)=u(x)v(x)(4)

y

(

x

)

y(x)

y(x) 求导,得:

y

(

x

)

=

u

(

x

)

v

(

x

)

+

u

(

x

)

v

(

x

)

y'(x)=u'(x)v(x)+u(x)v'(x)

y(x)=u(x)v(x)+u(x)v(x)

计算

y

(

x

)

=

u

(

x

)

v

(

x

)

y(x)=u(x)\cdot v(x)

y(x)=u(x)v(x)

y

(

x

)

=

u

(

x

)

v

(

x

)

+

u

(

x

)

v

(

x

)

y'(x)=u'(x)v(x)+u(x)v'(x)

y(x)=u(x)v(x)+u(x)v(x) 代入非齐次方程

(

1

)

(1)

(1),整理得到:

(5)

u

(

x

)

v

(

x

)

+

u

(

x

)

[

v

(

x

)

+

P

(

x

)

v

(

x

)

]

=

Q

(

x

)

u'(x)v(x)+u(x)\cdot [v'(x)+P(x)v(x)]=Q(x)\tag5

u(x)v(x)+u(x)[v(x)+P(x)v(x)]=Q(x)(5)由解一阶线性微分方程的常用方法分离变量法容易想到,如果没有

u

(

x

)

[

v

(

x

)

+

P

(

x

)

v

(

x

)

]

u(x)\cdot [v'(x)+P(x)v(x)]

u(x)[v(x)+P(x)v(x)] 这一项,我们就可以简便地利用分离变量法进行计算。
现在单独考察

u

(

x

)

[

v

(

x

)

+

P

(

x

)

v

(

x

)

]

u(x)\cdot [v'(x)+P(x)v(x)]

u(x)[v(x)+P(x)v(x)] 这一项。其中

u

(

x

)

u(x)

u(x) 不确定,不能用来保持

u

(

x

)

[

v

(

x

)

+

P

(

x

)

v

(

x

)

]

̸

0

u(x)\cdot [v'(x)+P(x)v(x)]\not\equiv0

u(x)[v(x)+P(x)v(x)]̸0 ,所以考虑另一个因式

v

(

x

)

+

P

(

x

)

v

(

x

)

v'(x)+P(x)v(x)

v(x)+P(x)v(x) 。显然

v

(

x

)

v(x)

v(x) 是不确定的,在

u

(

x

)

u(x)

u(x) 不确定的情况下,可以任意取值。则假设

v

(

x

)

v(x)

v(x) 满足

(6)

v

(

x

)

+

P

(

x

)

v

(

x

)

0

v'(x)+P(x)v(x)\equiv0\tag6

v(x)+P(x)v(x)0(6) 观察式

(

6

)

(6)

(6) ,可以看到其形式与式

(

2

)

(2)

(2) 基本一致。
求解式

(

6

)

(6)

(6),可以得其通解形式:

(7)

v

(

x

)

=

C

1

e

P

(

x

)

d

x

v(x)=C_1\cdot e^{-\int P(x)dx}\tag7

v(x)=C1eP(x)dx(7)将所得通解代入

(

4

)

(4)

(4),则

(8)

y

(

x

)

=

u

(

x

)

C

1

e

P

(

x

)

d

x

y(x)=u(x)\cdot C_1\cdot e^{-\int P(x)dx}\tag8

y(x)=u(x)C1eP(x)dx(8)

(

8

)

(8)

(8) 式代入

(

5

)

(5)

(5) 式,得到:

u

(

x

)

C

1

e

P

(

x

)

d

x

=

Q

(

x

)

u'(x)\cdot C_1\cdot e^{-\int P(x)dx}=Q(x)

u(x)C1eP(x)dx=Q(x)使用分离变量法,容易解得:

(9)

u

(

x

)

=

1

C

1

Q

(

x

)

e

P

(

x

)

d

x

d

x

+

C

2

u(x)=\frac1{C_1}\int Q(x)\cdot e^{\int P(x)dx}dx+C_2\tag9

u(x)=C11Q(x)eP(x)dxdx+C2(9)

(

7

)

(7)

(7)

(

9

)

(9)

(9) 同时代入式

(

4

)

(4)

(4) ,则

y

(

x

)

=

e

P

(

x

)

d

x

(

Q

(

x

)

e

P

(

x

)

d

x

d

x

+

C

1

C

2

)

y(x)=e^{-\int P(x)dx}(\int Q(x)e^{\int P(x)dx}dx+C_1C_2)

y(x)=eP(x)dx(Q(x)eP(x)dxdx+C1C2)

C

=

C

1

C

2

C=C_1C_2

C=C1C2,则得原一阶线性微分方程的通解为:

y

(

x

)

=

e

P

(

x

)

d

x

(

Q

(

x

)

e

P

(

x

)

d

x

d

x

+

C

)

y(x)=e^{-\int P(x)dx}(\int Q(x)e^{\int P(x)dx}dx+C)

y(x)=eP(x)dx(Q(x)eP(x)dxdx+C)

推广

这一部分是在知乎看到了关于“常数变易法”在高阶作用的问题之后增补的

问题链接:常数变易法思想的来源或本质是什么?
现在有一般

n

n

n阶线性微分方程

(10)

P

n

(

x

)

y

(

n

)

+

P

n

1

(

x

)

y

(

n

1

)

+

P

n

2

(

x

)

y

(

n

2

)

.

.

.

+

P

1

(

x

)

y

+

P

0

(

x

)

y

=

Q

(

x

)

P_{n}(x)y^{(n)}+P_{n-1}(x)y^{(n-1)}+P_{n-2}(x)y^{(n-2)}…+P_{1}(x)y'+P_{0}(x)y=Q(x)\tag{10}

Pn(x)y(n)+Pn1(x)y(n1)+Pn2(x)y(n2)...+P1(x)y+P0(x)y=Q(x)(10)
由前述有,

y

(

x

)

y(x)

y(x)可以表示为

y

(

x

)

=

u

(

x

)

v

(

x

)

y(x)=u(x)v(x)

y(x)=u(x)v(x)
现在我们考察两函数乘积的高阶微分形式。
比较二项式展开定理我们不难发现,对

y

=

u

v

y=uv

y=uv的高阶微分具有类似的形式。
比如:

(

u

v

)

=

u

v

+

u

v

(uv)'=u'v+uv'

(uv)=uv+uv

(

u

v

)

=

(

u

v

+

u

v

)

=

u

v

+

2

u

v

+

u

v

(uv)''=(u'v+uv')'=u''v+2u'v'+uv''

(uv)=(uv+uv)=uv+2uv+uv

.

.

.

...
从原理上来看,展开多项式的每一项都应有

n

n

n阶微分,而这

n

n

n阶微分分别分配在

u

v

u、v

uv上;对于多项式的每一项,相当于任选

k

k

k个微分算子作用于

u

u

u,则另有

(

n

k

)

(n-k)

(nk)个微分算子作用于

v

v

v,与二项式展开定理本质相同,所以展开形式也应相同。
则有式

(

11

)

(11)

(11)

(11)

(

u

v

)

(

n

)

=

C

n

0

u

(

n

)

v

+

C

n

1

u

(

n

1

)

v

(

1

)

+

C

n

2

u

(

n

2

)

v

(

2

)

+

.

.

.

+

C

n

n

1

u

(

1

)

v

(

n

1

)

+

C

n

n

u

v

(

n

)

(uv)^{(n)}=C_n^0u^{(n)}v+C_n^1u^{(n-1)}v^{(1)}+C_n^2u^{(n-2)}v^{(2)}+…+C_n^{n-1}u^{(1)}v^{(n-1)}+C_n^nuv^{(n)}\tag{11}

(uv)(n)=Cn0u(n)v+Cn1u(n1)v(1)+Cn2u(n2)v(2)+...+Cnn1u(1)v(n1)+Cnnuv(n)(11)
将这个一般形式代回式

(

10

)

(10)

(10),假设将

u

u

u作为主要研究对象(以

v

v

v为主要研究对象亦可,二者地位相同),则按

u

u

u的导数降阶排列多项式:

(12)

M

n

1

(

x

)

u

(

n

)

+

M

n

2

(

x

)

u

(

n

1

)

+

.

.

.

+

M

0

(

x

)

u

+

(

P

n

(

x

)

v

(

n

)

+

P

n

1

(

x

)

v

(

n

1

)

+

.

.

.

+

P

1

(

x

)

v

+

P

0

(

x

)

v

)

u

=

Q

(

x

)

M_{n-1}(x)u^{(n)}+M_{n-2}(x)u^{(n-1)}+…+M_0(x)u'+\bigl(P_n(x)v^{(n)}+P_{n-1}(x)v^{(n-1)}+…+P_{1}(x)v'+P_0(x)v\bigr)u=Q(x)\tag{12}

Mn1(x)u(n)+Mn2(x)u(n1)+...+M0(x)u+(Pn(x)v(n)+Pn1(x)v(n1)+...+P1(x)v+P0(x)v)u=Q(x)(12)
其中,

M

i

(

x

)

M_i(x)

Mi(x)为关于

x

x

x的多项式。
按一阶情况下的原理,可以令多项式

(

P

n

(

x

)

v

(

n

)

+

P

n

1

(

x

)

v

(

n

1

)

+

.

.

.

+

P

1

(

x

)

v

+

P

0

(

x

)

v

)

0

\bigl(P_n(x)v^{(n)}+P_{n-1}(x)v^{(n-1)}+…+P_{1}(x)v'+P_0(x)v\bigr)\equiv0

(Pn(x)v(n)+Pn1(x)v(n1)+...+P1(x)v+P0(x)v)0消去

u

u

u项。解

v

v

v即为解式

10

10

10对应的齐次线性微分方程。
则剩下的式子为

M

n

1

(

x

)

u

(

n

)

+

M

n

2

(

x

)

u

(

n

1

)

+

.

.

.

+

M

0

(

x

)

u

=

Q

(

x

)

M_{n-1}(x)u^{(n)}+M_{n-2}(x)u^{(n-1)}+…+M_0(x)u'=Q(x)

Mn1(x)u(n)+Mn2(x)u(n1)+...+M0(x)u=Q(x)

α

(

x

)

=

u

(

x

)

\alpha(x)=u'(x)

α(x)=u(x),则上式化为

(13)

M

n

1

(

x

)

α

(

n

1

)

+

M

n

2

(

x

)

α

(

n

2

)

+

.

.

.

+

M

0

(

x

)

α

=

Q

(

x

)

M_{n-1}(x)\alpha^{(n-1)}+M_{n-2}(x)\alpha^{(n-2)}+…+M_0(x)\alpha=Q(x)\tag{13}

Mn1(x)α(n1)+Mn2(x)α(n2)+...+M0(x)α=Q(x)(13)
比较式

(

12

)

(

13

)

(12)、(13)

(12)(13),可以看到:通过常数变易法,成功地把求解一个

n

n

n阶线性微分非齐次方程的问题,为了求解一个对应的

n

n

n阶线性微分齐次方程和一个

(

n

1

)

(n-1)

(n1)阶线性微分非齐次方程的问题。

总结

很显然我们可以看到,常数变易法是蕴含了很深刻的数学思想、具有很强健的数学基础的解题方法,并非无根之萍,更不是突发奇想或是强行合理。
但是从其原理上来讲,将其称呼为“常数变易法”是不太妥当的,本质上它并非是单纯地使用一个函数来替代了齐次方程通解的常数。
常数变易法的称呼应该说为了便于日常应用和直观记忆,这里可以不必纠结。

参考资料

[1] lookof,常数变易法的解释
[2] 崔士襄,邯郸农业高等专科学校,“常数变易法”来历的探讨


版权声明:本文为w573719227原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/w573719227/article/details/83050039