Download - Unidad 2 matrices
Matrices
3.1 El concepto de matriz
3.2 Operaciones con matrices
3.3 Propiedades de las operaciones con
matrices
3.4 La inversa de una matriz
3.5 Aplicación: Distribución de población
matrices 1
3.1El concepto de matrizComo se vio en el capítulo anterior, la solución de sistemas deecuaciones lineales puede hallarse eficientemente utilizandosolamente los coeficientes de las incógnitas asociadas a los sistemaslineales. Este ordenamiento de números se conoce como una matriz,y los elementos de esta matriz se llaman entradas de la matriz.Ejemplos de matrices son:
El tamaño o dimensión de una matriz de define como el número defilas por el número de columnas. En el ejemplo, la primera matriz esde dimensión 3x2, la segunda es de 3x3, la tercera es de 1x4 y lacuarta es de 4x1. Si una matriz es de dimensión 1xn, como en eltercer ejemplo, se llamará un vector fila, mientras que una matriz nx1,como en el cuarto ejemplo, se llamará un vector columna. En generalse usarán las primeras letras mayúsculas del alfabeto para denotaruna matriz, es decir, se escribirán como A, B, C, etc.. Las entradas deuna matriz se denotarán como aij y representarán la entrada que seencuentra en la fila i-ésima y la columna j-ésima.
matrices 2
1
1
1
1
;
54
03
21
;
000
2/10
12
e ;1012
Entonces, en general una matriz de dimensión mxn se puederepresentar como
Si la matriz es de dimensión nxn, se llama matriz cuadrada deorden n, y las entradas a11, a22, ....,ann se dice que están sobre ladiagonal principal de A.
Dos matrices son iguales si tienen la misma dimensión y lasentradas correspondientes son iguales. Una matriz es cero,denotada con O, si todas sus entradas son idénticamente igual acero.
matrices 3
mnmm
n
n
ij
aaa
aaa
aaa
aA
21
22221
11211
nnnn
n
n
aaa
aaa
aaa
21
22221
11211
3.2 Operaciones con matrices
Definición (Suma de matrices): Sean A={aij} y B={bij} matrices de la
misma dimensión mxn. La suma A+B es la matriz C={cij} de
dimensión mxn, donde
cij = aij + bij ,
esto es, la suma de las entradas correspondientes.
Ejemplo:
Definición (Producto de una matriz por un escalar): Sea A={aij}
una matriz mxn y r un escalar. El producto rA del escalar r y la matriz
A es la matriz B={bij} de la misma dimensión de A tal que bij = r aij
Ejemplo:
matrices 4
221
220
151
201
130
421
0622
01668
0024
12402
0311
0834
0012
6201
2
Definición (Matriz transpuesta): Sea A={aij} una matriz mxn. La
matriz transpuesta, denotada como AT, es la matriz cuyas
columnas son las filas de A. Una matriz simétrica es aquella que
es igual a su transpuesta, es decir, A=AT. Evidentemente una
matriz simétrica tiene que ser cuadrada.
Ejemplos:
Definición (Matriz Identidad): La matriz identidad de dimensión
nxn, denotada In , es la matriz cuyos elementos sobre la diagonal
principal es igual a 1, y todas las otras entradas son iguales a cero.
Ejemplo:
matrices 5
024
201A
02
20
41TA
1085
860
501
A
1085
860
501TA
100
010
001
3I10
012I
Multiplicación de matrices:Como ya se había visto en el capítulo anterior, un sistema deecuaciones lineales, por ejemplo 2x1 - 3x2=7
3x1 - x2=2,
tiene asociado una matriz A correspondiente a las incógnitas, y unvector b correspondiente a los términos independientes, es decir,
Si ahora se escriben las incógnitas como un vector
se puede denotar el sistema de ecuaciones lineales
como Ax=b, es decir
Esta última ecuación sugiere la noción de multiplicación de una matrizA por un vector columna x. Como noción preliminar, se introducirá elconcepto de producto escalar o producto punto de dos vectores.
matrices 6
2
7b
13
32A
2
1
x
xx
2
7
13
32
2
1
x
x
Definición (Producto punto o escalar): Sean a un vector 1xn y b un
vector nx1, es decir,
entonces el producto punto o escalar, denotado como a.b o <a,b> se
define como
Ejemplo:
matrices 7
nn aaaaa 121
n
n
b
b
b
b
b
1
2
1
nnnn babababababa 112211,.
62401a
5
7
0
3
2
b
14)5)(6()7)(2()0)(4()3)(0()2)(1(,. baba
Definición (Multiplicación de matrices): Sean A={aik} una matriz dedimensión mxn y B={bkj} una matriz de dimensión nxs. El productoAB es la matriz C={cij} de dimensión mxs, donde la entrada cij de C esel producto punto de la i-ésima fila de A y la j-ésima columna de B.
Nota: Obsérvese que el producto de dos matrices está definidosolamente cuando el número de columnas de A es igual al número defilas de B.
Ejemplo:
(-3)(5) + (5)(0) + (8)(2) = 1
matrices 8
36166874
1618471
4102012
1254
4046
4583
.
870
853
012
Posición c23
Columna 3Fila 2
En general, el elemento cij está dado por
Por ejemplo, si A3x4 , B4x7 , C7x3 , los productos AB3x7, BC4x3 y CA7x4
están definidos, mientras que no es posible multiplicar BA, AC y CB.
Debe observarse que el producto de matrices en general no es
conmutativa, esto es, aún cuando los productos AB y BA están
definidos, no es necesariamente cierto que AB=BA, como muestra el
siguiente ejemplo
matrices 9
sj
mi
bacn
k
kjikij
,...,1
,...,1
;1
178
94
52
10.
43
21
1613
43
43
21.
52
10
Algunas veces es deseable calcular una fila o una columna particular
del producto AB. El siguiente resultado permite obtenerlas:
* La j-ésima columna del producto AB=A[j-ésima columna de la matriz
B]
* La i-ésima fila del producto AB=[i-ésima fila de la matriz A]B
Ejemplos:
matrices 10
122648
13302712
2572
1310
3414
.062
421
4
27
7
1
1
.062
421
13302712
2572
1310
3414
.421
3
9
1
3
1
2
.
212
321
231
3
9
1
2
3
2
3
1
2
3
)1(
2
1
1
2
De este último ejemplo se puede concluir que la j-ésima columna del
producto AB puede verse como una combinación de las columnas de
la matriz A con los coeficientes de la j-ésima columna de la matriz B.
matrices 11
122648
13302712
2572
1310
3414
.062
421
0
42
6
20
2
14
8
12
0
47
6
2)1(
2
11
4
27
0
45
6
23
2
14
26
30
0
42
6
21
2
13
12
13
3.3 Propiedades de las operaciones con
matrices
Propiedades del producto punto o escalara) Propiedad conmutativa u . v = v . u
b) Propiedad distributiva u . (v + w) = u . v + u . w
c) Propiedad homogénea (r u) . v = u . (r v) = r (u . v)
Propiedades de las transpuestasa) Transpuesta de la transpuesta ( AT )T = A
b) Transpuesta de la suma ( A + B )T = AT + BT
c) Transpuesta del producto ( AB )T = BT AT
matrices 12
Propiedades de la aritmética matricial
a) Conmutatividad de la suma A+B =B+A
b) Asociatividad de la suma (A + B) + C = A + (B +
C)
c) Identidad para la suma A + O = O + A = A
d) Ley distributiva izquierda r (A + B) = r A + r B
e) Ley distributiva derecha (r + s) A = r A + s A
f) Asociatividad del producto por un escalar (r.s) A = r (s A)
g) Asociatividad del producto de matrices A(BC) = (AB)C
h) Producto por matriz identidad I A = A y B I =
B
i) Ley distributiva izquierda A (B + C) = AB + AC
j) Ley distributiva derecha (A + B) C = AC + BC
matrices 13
3.4 La inversa de una matrizRecordando que un sistema de n ecuaciones lineales con n incógnitasx1 ,x2 ,....,xn se puede expresar en la forma matricial
Ax=bdonde A es la matriz de coeficientes de nxn, x es el vector columna denx1
y b es el vector columna de nx1 de valores constantes, se puedepensar que una manera de resolver esta ecuación sería hallar unamatriz C tal que CA=I, de modo que
C(Ax)=Cb (CA)x=Cb Ix=Cb x=CbLo cual muestra que la solución al vector de incógnitas x debe ser elvector columna Cb. La cuestión es saber cuándo existe una matriz Cde nxn tal que
CA=I.
matrices 14
nx
x
x
x2
1
Por ejemplo, para la matriz no es difícil verificar que lamatriz
satisface que
Se dice entonces que la matriz C es una inversa de la matriz A. Estose define enseguida:
Definición (Inversa de una matriz): Sea A una matriz nxn. Una matrizC de nxn es una inversa de A si CA=AC=I.
Teorema: Sea A una matriz nxn con inversa C tal que CA=AC=I. SiD es otra matriz nxn tal que AD=I, entonces C=D.
Demostración: Como la multiplicación de matrices es asociativa, setiene que
C(AD)=(CA)D, de donde, como AD=I y CA=I, se tiene que
C(AD)=CI=C y (CA)D=ID=D, por tanto, C=D.
matrices 15
21
94A
41
92C
10
01
21
94
41
92
Se denotará la inversa de una matriz A, cuando exista, como A-1.
Entonces A A-1 = A-1 A = I. Nótese que no se debe expresar A-1
como 1/A.
Definición: Una matriz cuadrada que tiene inversa se llama invertible.
Una matriz cuadrada que no tiene inversa se llama singular.
Teorema: La matriz
es invertible si ad - bc 0, en cuyo caso la inversa está dada por la
fórmula
Teorema: Sean A y B matrices invertibles nxn. Entonces:
a) AB es invertible
b) (AB)-1 = B-1 A-1matrices 16
dc
baA
bcad
a
bcad
cbcad
b
bcad
d
ac
bd
bcadA
11
Definición: Si A es una matriz cuadrada, entonces se definen las
potencias de A como
Más aún, si A es invertible, entonces
Teorema: Si A es una matriz cuadrada y r y s son enteros, entonces
Teorema: Si A es una matriz cuadrada invertible, entonces
a) A-1 es invertible y (A-1 )-1 = A.
b) An es invertible y (An )-1 = (A-1 )n para n=0,1,2,....
c) Para cualquier escalar k>0, la matriz kA es invertible y (kA)-1 =
(1/k)A-1 .
matrices 17
;0 IA )0( veces
nAAAAAAn
n
veces
1111)(n
nn AAAAA
rssrsrsr AAAAA )(
Cálculo de las inversas:
Sea A={aij}una matriz nxn. Para hallar A-1 si es que existe, se debe
encontrar una matriz X={xij} nxn tal que AX=I, esto es, tal que
Esto es un sistema de ecuaciones con n vectores de incógnitas, y
entonces es posible aplicar el Método de Gauss-Jordan para
encontrar la inversa de A. La idea es transformar, por medio de
operaciones elementales por filas, la matriz aumentada del sistema
(A,I) a un sistema (I, A-1)
A-1 (A,I) (A-1 A, A-1 I) (I, A-1)
matrices 18
100
010
001
21
22221
11211
21
22221
11211
nnnn
n
n
nnnn
n
n
xxx
xxx
xxx
aaa
aaa
aaa
O sea, lo siguiente:
matrices 19
100
010
001
21
22221
11211
nnnn
n
n
aaa
aaa
aaa
nnnn
n
n
ccc
ccc
ccc
21
22221
11211
100
010
001
Operaciones elementales por filas
(Método de Gauss-Jordan)
A I
I A-1
Solución del sistema de ecuaciones Ax=b
¿Cuando el sistema de ecuaciones con el mismo número de
incógnitas que ecuaciones
Ax=b
tiene solución única?
Evidentemente, de la discusión anterior, la solución es única cuando
la transformación de Gauss-Jordan lleva a una matriz identidad, en
cuyo caso la solución es de la forma
x=A-1b.
En el caso de la ecuación
Ax=0,
esta tiene solución única si y solo si A-1 existe. Sin embargo, en este
último caso, si la reducción de Gauss-Jordan lleva a una fila con todos
los elementos iguales a cero, entonces habrá infinitas soluciones. En
el caso de que el elemento del vector b correspondiente sea diferente
de cero, entonces no habrá solución.
matrices 20
Ejercicios:
a) Determine si el producto de dos matrices simétricas es simétrica
b) Demuestre que si una matriz A es simétrica e invertible, entonces
la inversa es simétrica.
c) Demuestre que si A y B son matrices simétricas, entonces la
transpuesta de A es simétrica y que A+B y A-B son simétricas.
d) ¿Cómo es la transpuesta de una matriz triangular superior?
e) ¿Cuando una matriz triangular (superior o inferior) es
invertible?¿cómo es la respectiva inversa?
matrices 21
Aplicación: Distribución de población
Consideremos situaciones en las que se por alguna razón se divide un
conjunto (una población) en varios subconjuntos de acuerdo a una
regla dada. Tómese por ejemplo el caso de que se divide a los
ciudadanos de un país de acuerdo con sus ingresos en pobres,
ingreso medio y ricos. Otro ejemplo es la división de los habitantes de
México de acuerdo con el clima en el que viven: caluroso, templado,
frío. En general se hablará de la población (ciudadanos de un país,
habitantes de México) y de los estados (pobres, ingresos medios,
ricos; caluroso, templado, frío).
Con frecuencia las poblaciones constan de personas, pero pueden
constar de la población de automóviles, de presas-predadores, etc.
El interés aquí consiste en determinar como la distribución de
población puede cambiar de estado durante un período de tiempo
(cuantos pobres se vuelven ricos, cuántos de ingresos medios se
vuelven pobres y cuántos ricos, etc.). Las matrices pueden
desempeñar un papel importante en este análisis.
matrices 22
La tendencia de una población a moverse entre n estados se puede
describir mediante una matriz nxn. Considérese una población
distribuida entre n=3 estados 1,2 y 3. Se asumirá que se conoce la
proporción de la población que se encuentra en un estado j que se
mueve al estado i en un determinado periodo de tiempo. Esto se
denotará como tij. La matriz formada con todos los elementos tij se
llamará una matriz de transición.
Tomemos como ejemplo la clasificación de un país en los estados:
Estado 1: Pobres
Estado 2: ingresos medios
Estado 3: Ricos
Supóngase que en un periodo de 20 años (alrededor de una
generación), se tienen los siguientes datos para la población y su
descendencia:
a) De la gente pobre, el 19% pasó a ingresos medios y el 1% a ricos
b) De la gente de ingresos medios, el 15% pasó a pobre y el 10% a
ricos.
c) De la gente rica, el 5% pasó a pobre, y el 30% a ingresos medios.
Entonces se pueden escribir las siguientes transiciones:matrices 23
t11 = .8 (80% permaneció pobre);
t12 = .19 (19% de pobre a ingresos medios)
t13 = .01 (1% de pobre a ricos)
t21 = .15 (15% de ingresos medios a pobre )
t22 = .75 (75% permaneció en ingresos medios)
t23 = .10 (10% de ingresos medios a ricos)
t31 = .05 (5% de ricos a pobres)
t32 = .30 (30% de ricos a ingresos medios)
t33 = .19 (19% permaneció ricos)
por lo cual la matriz de transición está dada por
Obsérvese que la suma de las entradas de cada columna es igual a 1,pues la suma refleja el movimiento de toda la población durante elperiodo de tiempo.
matrices 24
mediopobre
pobre
rico
medio
rico
65.10.01.
30.75.19.
05.15.80.
T
Supóngase que las proporciones iniciales de toda la población están
dadas en el vector x(0) de dimensión nx1, por ejemplo
indicaría que el total de la población estaría inicialmente dividida por igual
entre los estados. También la suma de las entradas de este vector x(0)
debe ser igual a 1. Ahora bien, ¿cuál es la proporción de la población que
se encuentra en el estado 1 después del periodo de 20 años? Para esto,
la proporción de la población del estado 1 que permanece en el estado 1
es t11 , por lo que la contribución a la proporción de toda la población que
se encontrará en el estado 1 después de 20 años es precisamente t11
x1(0). De la misma manera la contribución de los estados 2 y 3 será t12
x2(0) y t13 x3(0) respectivamente. Así, después de 20 años, la proporción
del estado 1 es t11 x1(0) + t12 x2(0) + t13 x3(0), que es precisamente el
primer elemento del producto
matrices 25
3/1
3/1
3/1
)0(
)0(
)0(
)0(
3
2
1
x
x
x
x
)0(
)0(
)0(
)0(
3
2
1
333231
232221
131211
x
x
x
ttt
ttt
ttt
Tx
De manera similar se hallan las componentes de población del estado
2 y el estado 3 después de un periodo de tiempo.
Supongamos ahora que la misma matriz de transición es válida para
os siguientes 20 años, y también para los sucesivos periodos, esto es,
existe una sucesión o cadena de periodos de 20 años para los cuales
es válida la matriz de transición. Una situación así se llama una
cadena de Markov.
Definición: Una matriz de transición para una cadena de Markov de n
estados es una matriz de nxn con todos las entradas no negativas y
con la propiedad adicional de que la suma de las entradas de cada
columna es igual a 1.
Las cadenas de Markov aparecen de manera natural en biología,
economía, psicología, y en muchas otras áreas. La entrada tij en una
matriz de transición T se conoce como la probabilidad de pasar del
estado j al estado i en un periodo de tiempo.
Ejemplo: Analizar la matriz
matrices 26
010
001
100
T
Retomado el ejemplo anterior, si se quiere calcular el valor del estado
después de un periodo, tomando como condición inicial el vector
anterior, entonces este estado, que denotaremos como x(1), será:
Asimismo, el estado x(2) después de otro periodo de 20 años será:
Nótese que el vector de estados x(2) = T x(1), pero dado que x(1) = T
x(0), entonces x(2) puede también escribirse como x(2) = T2 x(0), con
T2 dada por
matrices 27
3/76.
3/24.1
3/1
3/1
3/1
3/1
65.1.01.
3.75.19.
05.15.8.
)0()1( Txx
3/628.
3/348.1
3/024.1
3/76.
3/24.1
3/1
65.1.01.
3.75.19.
05.15.8.
)1()2( Txx
453.1415.0335.
4295.621.2975.
1175.2375.669.2T
Esto se puede extender a m periodos, es decir, una cadena de Markov
con matriz de transición T, tiene Tm como matriz de transición para m
periodos, y el estado después de m periodos está dado por
x(m)=Tmx(0).
Definición: Una matriz de transición T es regular si para algún entero
m, la matriz Tm no tiene ninguna entrada igual a cero. Una cadena de
Markov con una matriz de transición regular se llama cadena regular.
Ejemplo: Verificar la matriz de transición del ejemplo anterior.
Es posible demostrar que si una cadena de Markov es regular, entonces
después de muchos periodos de tiempo (o cuando el tiempo tiende al
infinito) , la distribución de población entre los estados tiende a un valor
fijo, o estado estacionario.
Teorema: Sea T una matriz de transición regular. Entonces existe un
única vector columna s con entradas estrictamente positivas cuya suma
es igual a 1 tal que satisface
a) Para m suficientemente grande, todas las columna de Tm tienden al
vector s
b) Ts = s matrices 28
En conclusión, para obtener el estado estacionario es necesario
resolver la ecuación Ts = s
o lo que es lo mismo, la ecuación
(T - I) s = 0
que puede resolverse usando el Método de Gauss-Jordan, verificando
que la suma de las entradas del vector s sea igual a 1.
En resumen, para resolver este tipo de problemas, hay que efectuar el
procedimiento siguiente:
Paso 1: Escribir la matriz de transición T.
Paso 2: Verificar que la cadena de Markov es regular, esto es, Tm no
tiene entradas cero para algún m.
Paso 3: Resolver la ecuación (T - I) s =0 con la restricción
s1 + s2 + ...+ sn = 1.
matrices 29
Ejemplo: Los habitantes de una comunidad con tendencias
vegetarianas acuerdan las reglas siguientes:
a) Nadie comerá carne dos días seguidos
b) Una persona que no coma carne un día, lanzará una moneda legal
al aire y comerá carne el día siguiente si y solo si, sale cruz.
Determinar la proporción de la población que no comen carne y las que
sí comen carne.
Solución: La matriz de transición es
Asimismo, por lo que la cadena de
Markov es regular.
Resolviendo la matriz aumentada se tiene que s1 =
2t; s2 = t, lo que, junto con la restricción
s1 + s2 = 1, resulta en 2t + t = 1, de donde t=1/3 y en consecuencia, el
estado estacionario es
matrices 30
05.0
15.0T
carne
No carne carneNo carne
5.25.
5.75.2T
0
0
15.
15.
3/1
3/2s