Introdução

Seja V um espaço vetorial de dimensão n sobre um corpo K, A uma matriz quadrada de ordem n e T:V toV uma transformação linear, definida por

T(v) = Av

Pergunta: Será que existe algum vetor v inV, cuja imagem pela transformação T tenha a mesma direção que o vetor v, ou seja, será que existe um escalar μ inK tal que

T(v) = μ v

É evidente que o vetor nulo tem essa propriedade para qualquer escalar, mas observamos que o vetor nulo não pode ser utilizado em uma base do espaço vetorial V, objetivo fundamental no contexto do estudo de autovalores e autovetores.

Estamos procurando escalares μ inK para os quais

T(v) = Av = μ v

Subjacente ao processo de descoberta desses escalares e vetores estão as soluções de muitos problemas aplicados da Matemática, Física, Engenharias Civil e Elétrica, etc.

Autovalor e Autovetor

Seja A uma matriz quadrada de ordem n sobre um corpo K. Se existe um escalar μ inK e um vetor v neq0 tal que

Av = μ v

este escalar μ é denominado um autovalor de A e v é um autovetor associado a este escalar μ.

Sinônimos para a palavra autovalor são: valor próprio e valor característico.

Exemplo 1: Seja uma matriz A e um vetor genérico v tal que:

A =
1 0 0
0 2 0
0 0 3

e

v =
x
y
z

Observamos que:

A v =
1 0 0
0 2 0
0 0 3
.
x
y
z
=
1x
2y
3z

Procuramos escalares μ tal que Av=μ v, isto é:

1x
2y
3z
= μ
x
y
z

Na verdade, deveremos resolver o sistema de equações:

(1 − μ)x = 0
(2 − μ)y =0
(3 − μ)z =0

com a condição que v=(x,y,z) neq(0,0,0).

Temos três possibilidades para os autovalores:

  1. Se x neq0 então μ = 1 e usando tais valores nas outras equações, obtemos y=0 e z=0. Um vetor simples com estas propriedades é v1=(1,0,0) t.

  2. Se y neq0 obtemos μ = 2, o que implica que x=0 e z=0. Um vetor simples com estas propriedades é v2=(0,1,0) t.

  3. Se z neq0 então μ = 3, garantindo que x=0 e y=0. Um vetor simples com estas propriedades é v3=(0,0,1) t.

Neste caso específico, concluímos que para cada autovalor existe um único autovetor associado.

Exemplo 2: Seja agora uma matriz A e um vetor genérico v tal que:

A =
1 0 0
0 2 0
0 0 2
e    v =
x
y
z

Procuramos escalares μ tal que Av=μ v, isto é:

1x
2y
2z
= μ
x
y
z

Basta resolver o sistema de equações

(1 − μ)x = 0
(2 − μ)y =0
(2 − μ)z =0

exigindo que v=(x,y,z) neq(0,0,0).

Existem duas possibilidades para os autovalores.

  1. Se x neq0 então μ = 1, logo y=0 e z=0. Um vetor com estas propriedades é v1=(1,0,0) t.

  2. Se y neq0 então μ = 2, assim obtemos x=0 mas existem infinitas possibilidades para z, inclusive z=0. Um vetor simples que satisfaz a estas propriedades é v2=(0,1,0) t.

  3. Se z neq0 então μ = 2 e segue que x=0 mas existem infinitas possibilidades para y, inclusive y=0. Um vetor simples que satisfaz a estas propriedades é v3=(0,0,1) t.

Neste caso observamos que para o autovalor μ=1 existe apenas um autovetor, mas para o autovalor μ=2 existem dois autovetores.

Exemplo 3: Seja agora uma matriz A e um vetor genérico v tal que:

A =
2 0 0
0 2 0
0 0 2
e    v =
x
y
z

Procuramos escalares μ tal que Av=μ v, isto é:

2x
2y
2z
= μ
x
y
z

Basta resolver o sistema de equações

(2 − μ)x = 0
(2 − μ)y =0
(2 − μ)z =0

com a condição que v=(x,y,z) neq(0,0,0).

Aqui temos um único autovalor μ = 2. Realmente, se x neq0 ou y neq0 ou z neq0 ou xyz neq0 então μ = 2, garantindo que existem infinitas possibilidades para x, y e z, mas escolheremos três simples:

  1. Com x=1, y=0 e z=0, teremos v1=(1,0,0) t.

  2. Com x=0, y=1 e z=0, teremos v2=(0,1,0) t.

  3. Com x=0, y=0 e z=1, teremos v3=(0,0,1) t.

Neste caso, observamos que o mesmo autovalor μ=2 gerou três autovetores.

Levando em consideração os três exemplos, tem sentido definir o conceito de autoespaço associado a cada autovalor.

Autoespaço associado ao autovalor

Se μ é um autovalor de uma matriz A, definimos o autoespaço associado a μ como o conjunto de todos os vetores obtidos pela combinação linear dos autovetores associados a μ. Denotamos este conjunto por:

Sμ = { v inV : Av = μ v }

Proposição: O conjunto Sμ é um subespaço vetorial de V gerado pelos autovetores associados a μ.

Demonstração: O vetor nulo não é um autovetor mas 0 inSμ pois A 0 = μ 0.

Se v inSμ e w inSμ, então Av=μ v e Aw=μ w, logo

A(v+w) = Av + Aw = μ v + μ w = μ (v+w)

e concluímos que v+w inSμ.

Analogamente, se v inSμ e k inK, então:

A(kv) = μ (kv)

e concluímos que kv inSμ.

Ao invés de trabalhar diretamente com a resolução de sistemas como nos exemplos, existe um processo mais simples para obter os autovalores de A.

Polinômio característico

Seja A uma matriz nxn sobre K. Definimos o polinômio característico de A como:

f(μ) = det(μ I −A)

Exemplo: Seja a matriz definida por:

A =
1 2
4 9

Assim:

f(μ) =
μ −1 −2
−4 μ −9
= μ² − 10μ + 1

Algumas vezes vemos na literatura o polinômio característico da matriz A definido na forma trocada

f(μ)=det(A−μI)

Lema: Seja M uma matriz quadrada de ordem n. Um sistema Mv=0 tem solução não trivial se, e somente se, det(M)=0.

Teorema: Os autovalores de uma matriz quadrada A de ordem n são zeros do polinômio característico de A, isto é, escalares μ para os quais f(μ)=0.

Demonstração: Os autovalores da matriz A podem ser obtidos a partir da existência de escalares μ e vetores não nulos v=(x,y,z) t para os quais

Av = μ v

Este sistema pode ser reescrito como:

Av = μIv

ou seja

(μ I − A)v = 0

e este sistema terá uma solução não trivial se, e somente se, o determinante da matriz μI−A for nulo (que é uma conseqüência da Regra de Cramer), isto é:

det(A−μI) = 0

Observamos que det(A−μI) é uma função polinomial da variável μ , daí a razão de indicarmos esta expressão por:

f(μ) = det(A−μI)

A partir deste Teorema podemos obter os autovetores se resolvermos o sistema

(μI−A)v=0

Exemplo: Seja a matriz dada por

A =
0 1 1
−1 2 1
−1 1 2

O polinômio característico associado à matriz A é

f(μ) = μ³ − 4 μ² + 5μ −2

Como a soma dos coeficientes deste polinômio é igual a zero, segue que μ=1 é um zero de f=f(μ) e temos que f(1)=0. Assim dividimos este polinômio por (μ−1) para obter a forma decomposta:

f(μ) = (μ−1)(μ² − 3μ + 2)

e usando a fórmula quadrática (Bhaskara?), obtemos:

f(μ) = (μ−1)(μ−1)(μ−2)

o que significa que os autovalores de A são μ=1, μ=1 e μ=2.

Em geral, o sistema (μI−A)v=0 fica na forma

(μI−A)
x
y
z
=
μ −1 −1
1 μ−2 −1
1 −1 μ−2
.
x
y
z
=
0
0
0

Para μ=1, o sistema toma a forma:

1 −1 −1
1 −1 −1
1 −1 −1
.
x
y
z
=
0
0
0

e este sistema se reduz a apenas uma equação:

x − y − z = 0

Como temos duas variáveis livres, podemos escrever x=y+z, para obter valores para x em função de y e de z.

Se y=1 e z=0 então x=1 e v1 = (1,1,0) t é um autovetor. Se y=0 e z=1 então x=1 e v2 = (1,0,1) t é outro autovetor.

Para μ=2, o sistema toma a forma:

2 −1 −1
1 0 −1
1 −1 0
.
x
y
z
=
0
0
0

e este sistema se reduz a apenas uma relação x=y=z e tomando x=y=z=1, obtemos o terceiro autovetor da matriz A: v3=(1,1,1) t.

Matrizes Semelhantes

Duas matrizes A e B são semelhantes, se existe uma matriz inversível P tal que

A = P −1BP

Exercício: Consideremos a matriz A do exemplo anterior:

A =
0 1 1
−1 2 1
−1 1 2
  1. Construa uma matriz P que tem como colunas os autovetores v1, v2 e v3 da matriz A.

  2. Obtenha a inversa da matriz P.

  3. Calcule a matriz D semelhante a A, definida por D=P −1AP.

  4. Tire alguma conclusão sobre a posição dos autovalores na matriz D.

  5. Verifique que traço(D)=traço(A).

  6. Verifique que det(D)=det(A).

Exercício: Considere uma matriz A (com autovalores complexos) definida por:

A=
1 2 −1
0 0 1
1 1 0
  1. Mostre que o polinômio característico de A é dado por: f(μ)=μ³−μ²−1.

  2. Para obter os autovalores de A, resolva a equação f(μ)=0, cujos zeros são:

    μ1 = 1.4655712
    μ2 = −0.232786 + 0.792552   i
    μ3 = −0.232786 − 0.792552   i
  3. Obtenha os autovetores da matriz A.

  4. Construa uma matriz P que tem como colunas os autovetores v1, v2 e v3 da matriz A.

  5. Obtenha a inversa da matriz P.

  6. Calcule a matriz D semelhante a A, definida por D=P −1AP.

  7. Tire alguma conclusão sobre os autovalores na matriz D.

  8. Mostre que o operador traço possui a propriedade: traço(D) ≈ traço(A).

  9. Verifique que det(D) ≈ det(A).

Matriz ortogonal

Uma matriz M é dita ortogonal se M −1=Mt.

Exemplo: Uma típica matriz ortogonal é a matriz de rotação θ radianos, definida por:

Rθ =
cosθ −senθ
senθ cosθ

pois a inversa de Rθ é igual à transposta de Rθ.

Aplicações de autovalores em Geometria

Seja a curva plana determinada pela forma quadrática

ax² + 2bxy + cy² = d

onde a² + b² + c² neq0.

É possível reescrever o membro da esquerda da equação acima como:

ax² + 2bxy + cy² =
x y
a b
b c
x
y
= vt A v

onde

A =
a b
b c
e   v =
x
y

Pergunta: Será que podemos escrever x e y em função de duas novas variáveis x1 e y1 de modo que a nova forma quadrática nas novas variáveis x1 e y1 não possua o termo em x1y1 para que a forma quadrática esteja na forma canônica?

Uma resposta adequada é dada pela rotação de eixos, uma vez que o termo em xy que aparece na equação acima é responsável pela inclinação dos eixos principais associados à curva no sistema cartesiano.

Como a matriz de rotação de θ radianos é dada por:

Rθ =
cosθ −senθ
senθ cosθ

podemos realizar a mudança de variáveis com:

v =
x
y
=
cosθ −senθ
senθ cosθ
.
x1
y1

Tomando a relação acima, poderemos escrever:

Y =
x1
y1
=
cosθ senθ
−senθ cosθ
.
x
y
= Rθ−1 v

Para simplificar um pouco tomamos P=Rθ e como esta matriz P é ortogonal, podemos escrever a relação na forma:

vtAv=(PY) tA(PY)=Yt Pt APY=Yt(P −1AP)Y=b

Escolhendo adequadamente o valor de θ em função das constantes a, b e c da forma quadrática, poderemos escrever a matriz:

−1AP = D =
k1 0
0 k2

e a nova forma quadrática:

k1 x1² + k2 y1² = c1

não conterá o termo em x1y1.

Conclusão: Os valores k1 e k2 são os autovalores da matriz A e a matriz P é a matriz cujas colunas são os autovetores obtidos a partir da matriz A.

Aplicações de autovalores em EDO

Consideremos a equação diferencial ordinária (EDO)

2 y''(x)−6y'(x)+4y(x)=0

O polinômio característico associada a esta EDO é dada por:

p(k)=2k²−6k+4

cujos zeros (autovalores) são k1 = 1 e k2=2. Assim, as autofunções (autovetores) são: y1(x)=exp(k1x) e y2(x)=exp(k2x), garantindo que o conjunto de autofunções (autovetores) é:

W = {y1(x), y2(x) } = {exp(x), exp(2x) }

e a solução geral da EDO é a combinação linear dos elementos de W:

y(x) = C1 exp(x) + C2 exp(2x)
Construída por Ulysses Sodré.