Geometría Analítica con Matlab/Matrices

Matrices

editar

Luego de la fundamentación de la teoría de matrices al final del sigo XIX, se observó que muchas nociones matemáticas que fueron consideradas ligeramente diferentes de las matrices, eran en efecto, similares. Por ejemplo, objetos tales como puntos en el plano bidimensional, puntos en el espacio tridimensional, polinomios, funciones continuas, funciones diferenciables satisfacen las mismas propiedades aditivas y propiedades de multiplicación por escalares. Por lo cual se pensó que era más eficiente y productivo estudiar muchos tópicos a la vez, al analizar las propiedades comunes que ellos satisfacen; este hecho condufo a la definición axiomática de espacio vectorial. La primera publicación sobre el tema se debe al polaco Hermann Grassmann (1808 - 1887), en 1844; en su trabajo dejó planteados los conceptos que se refieren a dependencia lineal, bases y dimensión.

El italiano Giuseppe Peano (1858 - 1932) dio una axiomatización similar a la que actualmente se usa y que fue propuesta posteriormente por el alemán Hermann Weyl (1885 - 1955) ignorando el trabajo de Peano. El éxito de Weyl radicó en el manejo geométrico del espacio vectorial.

Espacio Vectorial

editar

Un espacio vectorial involucra cuatro (4) "objetos": dos (2) conjuntos V y F, y dos operaciones algebraicas llamadas adición vectorial y multiplicación escalar; V es un conjunto no vacío de objetos llamados vectores. F es un campo escalar, ya se el campo de los número reales, o bien el campo de los números complejos.

La adición vectorial (denotada como  ) es una operación entre elementos de V. La multiplicación escalar (denotada como  ) es una operación entre elementos de F y de V. Entonces, el conjunto V es llamado espacio vectorial sobre F cuando la adición vectorial y la multiplicación escalar satisfacen las propiedades que se enuncian a continuación:

Para la adición de vectores

 


Propiedades para la multiplicación escalar:

 


Si al módulo   mencionadao en (A4) se le denomina vector nulo y se denota por O, y teniendo en cuenta que cualquier escalar t multiplicado por él da nuevamente el vector nulo,  , se puede decir:

NOTA 1 Si x es un vector no nulo y  , entonces el escalar K es 0.

Esto resulta al suponer que  , entonces  , lo cual es absurdo.

Independencia Lineal

editar

Dados los vectores   y los escalares  , una expresión de la forma

 


es llamada uan combinación lineal de ellos.

Un conjunto de vectores se dice linealmente independiente, o que es un sistema libre si la única combinación lineal igual al vector nulo es aquella en que todos los escalares son cero. En caso contrario, se dice que es linealmente dependiente o que es un sistema ligado.

Subespacio

editar

Si V es un espacio vectorial sobre F y si  , entonces W es un subespacio de V si bajo las operaciones de V, W mismo forma un espacio vectorial sobre F.

Para establecer la estructura de subespacio no es necesario revisar todas las 10 condiciones definidas para determinar si un subconjunto es también un subespacio. Para tal fin se plantean dos caracterizaciones:

 
atención
'Caracterización 1: Sea   un conjunto no vacío. Entonces W es un subespacio de V si y solo si
 

Prueba

Sólo si se quiere probar que W es subespacio de V.

Con  , resulta (A1). Las propiedades asociativa y conmutativa [(A2), (A3)] las conserva el subconjunto W. Con   se obtiene  , y con ello se cumple (A4). Ahora, dado  , tomando   se concluye que el opuesto   y en consecuencia por (A1) satisface (A4). Si   y   se tiene (M5).

Las restantes propiedades (M2), (M3), (M4) son consecuencia por ser W subconjunto del espacio vectorial V.

Una segunda caracterización tiene en cuenta únicamente las condiciones clausurativas (A1) y (M1):

 
atención
'Caracterización 2: Sea   un conjunto no vacío. Entonces W es un subespacio de V si y solo si
 

Prueba

Sólo se requiere establecer que (A1), (M1) implican que W es subespacio de V.

Siendo W subconjunto de V, salvo las propiedades (A4) y (A5) de manera inmediata se satisfacen las restantes. (A4) y (A5) se obtienen de (A1), (M1) al escribir  , dado cualquier elemento  .

La caracterización 2 permite deducir que para un conjunto   de vectores del espacio V, el espacio formado con todas las combinaciones lineales de sus elementos  , es un subespacio vectorial de V. Este subespacio es llamado el espacio generado por W.

La dimensión de un espacio vectorial V se refiere al máximo número de vectores, o bien al mínimo número de vectores linealmente independientes necesario para generar V. Y se denomina base todo conjunto de vectores, linealmente independientes, que genera el espacio V.

Producto Interior

editar

Al considerar F el campo de los número reales o el de los complejos, al espacio vectorial se le asocia un producto interior denotado  , que a cada par de vectores asocia un único escalar, y cumple las propiedades.

 

En el caso del espacio vectorial real de la forma   (con  ), un producto punto es el correspondiente a la suma de los productos de las respectivas componentes. Es decir, dados los vectores

 


se toma

 .


Al utilizar la notación matricial, los vectores habitualmente se toman en columna y, en este caso el producto anterior se desarrolla como  , donde   indica la transpuesta de u.

En el caso de vectores con componentes complejas, el producto interno debe ser modificado para tener la definición de longitud, y la modificación habitual es conjugar el primer vector en el producto interno. Esto significa que x es reemplazado por  , y el producto interno de x y y resulta:

 


Y se toma el producto interno de x con él mismo, se tiene el cuadrado de su longitud:  .

Puesto que en el caso complejo   no siempre coincide con  , se debe tener en cuenta el orden de los vectores para el producto interno. Hay otra novedad: si x es cambiada por cx, entonces el producto interno de x y y es multiplicado por  .

Nótese que si se tomara en el caso complejo tal como se desarrolla el caso real, con el vector   aparecería por ejemplo el resultado

 ,


incumpliendo la segunda parte de la propiedad (P1).

Una norma para un espacio vectorial V, real o complejo, es la función   definida sobre V que satiface:

 .


En un espacio V con producto interior  , dos vectores x, y son ortogonales si  . En   el producto interios habitual es  . En el espacio  , como se restringió antes, el producto interior usual es  .

Si los dos vectores ortogonales tiene norma o longitud 1, se dice que son ortonormales.

Matrices

editar

Arthur Cayley

Suma y multiplicación

editar

Recuérdese que una matriz es un arreglo rectangular de número que pueden ser reales o complejos y se representa normalmente entre paréntesis. El orden o tamaño de una matrz está dado por el número de filas y el de columnas.

Los elementos de una matriz general de tamaño   se representan normalmente utilizando un doble subíndice; el primer subíndice, j, indica el número de fila y el segundo, k, el número de columna. Así pues, el elemento,   está en la segunda fila, tercera columna de la matriz M; se puede representar de forma abreviada como  . También se usa la notación  .

La suma de dos matrices sólo está definida si ambas tienen el mismo tamaño. Así, dadas   y  , entonces la suma   se define como la matriz  , en la que  ; es decir, para sumar dos matrices de igual tamaño basta con sumar los elementos correspondientes.

En el conjunto de todas las matrices de un determinado tamaño, la adición tiene las propiedades asociativa y conmutativa. Además hay una matriz única O, denominada matriz cero o nula, tal que para cualquier matriz A, se cumple   y, para la matriz dada A existe una matriz única B tal que  .

La multiplicación de una matriz A por un escalar t (número real o complejo), da una matriz formada por todos los términos de A multiplicados por el escalar t, conservando su posición inicial.

De esta manera, el conjunto de todas las matrices de orden  , con la operación suma y la multiplicación por escalares tiene estructura de espacio vectorial.

La multiplicación o producto AB de dos matrices, A y B, está definido sólo si el número de columnas del factor izquierdo, A, es igual al número de filas del factor derecho, B; si   es de tamaño   y   es de mañaño  , el producto   es de tamaño   y   está dado por

 

.

Es decir, el elemento de la fila j y la columna k des producto, es la suma de los productos de cada uno de los elementos de la fila j de factor izquierdo multiplicado por el correspondiente elemento de la columna k del factor derecho.

Para el caso de una matriz cuadrada, se adopta la notación   para representar el producto AA.

La multiplicación de matrices no es conmutativa, pero si cumple la propiedad asociativa. Esto es

 . (1.1


El caso particular de la multiplicación de una matriz de orden   por una matriz de orden  , es una matriz de orden   (vector columna). De acuerdo con la definición es

 


la cual puede expresarse en la forma

  (1.2a


es decir, es una combinación lineal de las columnas de la matriz de orden  , y los escalares corresponden a las componentes del vector columna.

Cuando se tiene la multiplicación de una matriz   de orden  , por otra formada por dos (o más) columnas (dos vectores columna), se puede plantear en la forma

 ,


o brevemente, denotanto X el vector columna   y Y el vector  

 . (1.2b


Matriz inversa

editar

La matriz unidad, es una matriz cuadrada en la cual todos los elementos son cero, excepto los de la diagonal principal, que son 1 y es el elemento neutro para la multiplicación de matrices. Si A y B son dos matrices cuadradas de forma que  , la matriz B se llama inversa de A y se denota  .

Si una matriz no posee inversa se dice singular; en caso contrario se le dice no singular o regular (es inversible).

Si se supone que dos matrices B, C cumplen

 


de  , se tiene que la inversa, si existe es única. En particular  .

Sobre dos matrices M y N, inversibles, si son de igual tamaño se cumple

 . (1.3


Esto se sigue de la asociatividad de la multiplicación:

 


y de manera análoga se obtiene  , verificándose la propiedad (1.3)

.

En el caso sencillo de una matriz A de orden 2

 ,


su inversa, si existe, es de la forma

 ,


con  .

Además de la matriz nula y la matriz identidad, se tienen otras matrices. Matriz escalar es la matriz obtenida de multiplicar la identidad I por un escalar (real o complejo).

La matriz A es involutiva si ella es su propia inversa; es decir si  . Una matriz A se dice idempotente si  .

La matriz transpuesta de una matriz A de orden   es la matriz de orden  , denotada   (transpuesta de A), que se obtiene permutando las filas por las columnas. La fila j de   es la columna j de A, y la columna j de   es la fila j de A. En particular la transpuesta de la matriz unidad es ella misma, esto es  . También  .

Con la multiplicación se cumple:

 , (1.4


y con esta propiedad se establece una relación entre la inversa de la transpuesta con la inversa de la matriz dada. Esto es:

 , (1.5


ya que  ; y de la misma forma  .

En el caso de tener sólo números reales, la matriz se llama ortogonal si cumple

 ,


que equvale a

  (1.6


lo cual significa que la inversa de la matriz, simplemente es la transpuesta.

Con esto se puede decir:

NOTA 2 Una matriz A es regular si y solo si   lo es. O también, A es singular si y solo si   lo es.

Una matriz real A es simétrica si ella es igual a su transpuesta; es decir si  . Una matriz B es antisimétrica (hemisimétrica) si  ; en este caso los elementos de la diagonal principal son nulos. Resulta del hecho  , y esto implica  .

Una matriz cuadrada A de orden n se llama unitaria si:

 ,


o sea, si

 . (1.7


La matriz   se denomina matriz conjugada de A y se obtiene tomando el conjugado de cada elemento. En el producto se cumple  

En el caso de tener sólo números reales, es el caso de la matriz ortogonal.

Los Cuatro Subespacios Fundamentales

editar

Asociado a una matriz A de orden   se tienen cuatro subespacios vectoriales fundamentales. Dos de ellos, subespacios de   y los otros dos de  .

La conexión entre funciones lineales y matrices surgió de la observación de Cayley que la composición de dos funciones lineales puede representarse mediante la multiplicación de dos matrices. En general una función o transformación lineal relaciona dos espacios vectoriales U y V sobre el mismo cuerpo F, cumpliendo:

 .


 .


Así que, dada una matriz A de orden  , la función   de   en   definida por   es una aplicación lineal

Espacio columna, espacio fila

editar

Sea A una matriz real de tamaño  

 .


El espacio columna de A, es el subespacio de   generado por las n columnas de A y coincide con el recorrido de la aplicación lineal (o transformación lineal)  . Este subespacio se simboliza por  . Es decir,

 


Observando el producto Ax, en la forma (1.2)

, se observa efectivametne que   es el espacio generado por las columnas de A. Su dimensión es el número de columnas linealmente independientes.

Ahora, si a cambio de la matriz A se considera su transpuesta  , el recorrido de la aplicación lineal   constituye el espacio columna de  , el cual equivale al espacio generado por las filas de A.

NOTA 3 En esta sección se habla en términos de matrices reales y espacio real, pero todos los resultados obtenidos son análogos en matrices complejas, basta reemplazar   por  .

En resumen, dada una matriz  , por el momento hay dos espacios vectoriales asociados a ella:

a)   el espacio determinado por las columnas de A (Espacio Columna). Es decir
 .
b)   el espacio determinado por las filas de A (espacio fila): 
 .


Luego de obtener una matriz escalonada a través de la eliminación gaussiana, se puede calcular el rango r de la matriz escalonada, que corresonde precisamente a la dimensión del espacio fila de A.

Dicho de otra forma, la dimensión del espacio fila de A corresponde al número de filas distintas de cero que tenga la nueva matriz escalonada.

Algunas veces se desea saber si dos matrices tienen o no el mismo espacio fila o el mismo rango. El siguiente teorema, conocido como Teorema de Rangos iguales, establece una solución. Se hace uso de la notación   para indicar que existe una matriz regular P tal que  . Análogamente   significa que existe una matriz regular Q, tal que  .

Para dos matrices A y B de orden  :

 . (1.8


 . (1.9


Prueba

Para verificar (1.8)

, primero se asume  , esto es, existe una matriz regular P tal que  . Para ver que  , se sigue de:

 


Ahora, para el recíproco, si   entonces los espacios vectoriales generados por las filas de A y las filas de B coinciden. Esto es

 ,


por lo tanto cada fila de B es una combinación de las filas de A y viceversa. Con base en este hecho se puede decir que es posible reducir A a B usando solamente operaciones de filas, y de esta manera  . La prueba de B se sigue, reemplazando A y B con   y  .

Espacio nulo, espacio nulo a izquierda

editar

A partir de la transformación lineal   de   en  , definida por  , con A una matriz de orden  , el conjunto   es llamado espacio nulo de  . También se le representa como   haciendo referencia a la matriz que genera la transformación.

Este espacio nulo es un subespacio vectorial del dominio  . Para ello se revisa que se cumplen las propiedades A1, M1 enunciadas en la sección 1.1, Caracterización 2:

  Sean  , con  . Entonces la imagen de la suma

 ,


ya que la multiplicación de matrices es distributiva respecto de la suma, y puesto que  , resulta que  .

  Sea  , y   cualquier escalar del cuerpo F. Entonces

 

.

Si se sigue el proceso de eliminación para simplificar un sistema de ecuaciones lineales, el sistema   se reduce a  , siendo U la matriz escalonada obtenida de A, al aplicar la eliminación gaussiana, y este proceso es reversible. En este caso. Los elementos de este espacio son las soluciones del sistema homogéneo

 . (1.10


Ya que el espacio nulo de A, es el conjunto de vectores que satisfacen  , es el mismo espacio nulo de U y, de las m restricciones impuestas por las m ecuaciones de  , solo r son independientes, que corresponden a las r filas de A linealmente independientes, o también por las r filas no nulas de U.

De esta manera, el espacio nulo  , también llamado el kernel de A, es de dimensión  . Una base puede construirse reduciendo a  , que tiene   variables libres correspondientes a las columnas de U que no contienen pivotes. Entonces, seguidamente, se da a cada variable libre el valor 1, a las otras variables libres el valor 0, y se resuelve   sustituyendo en reversa las variables (básicas) faltantes; los   vectores producidos de esta forma son una base para  .

Siendo   un subespacio vectorial, contiene el vector nulo  ; es decir,   satisface el sistema (1.1)

, y se dice habitualmente que   es solución trivial.

NOTA 4 La condición necesaria y suficientes para que   tenga solución distinta de la trivial es que la característica de A sea  
NOTO 5 Si la característica de   es  , el sistema tiene, exactamente   soluciones linealmetne independientes de forma que cada solución es combinación lineal de estas  , y cada una de estas combinaciones lineales es una solución.

Si ahora se halla el espacio nulo para el operador generado por  , entonces   con  , es llamado el espacio nulo izquierdo de A porque es el conjunto de todas las soluciones del sistema homogéneo izquierdo

 .


En resumen, dada una matriz  , hay dos espacios nulos asociados a ella:

  el espacio nulo de A.

Es decir:

 


  el espacio nulo izquierdo de A.

Es decir:

 


Matriz Orgotonal

editar

Ya en la sección 1.2.2 se estableció que una matriz es ortogonal si su inversa es su propia transpuesta. En función de sus líneas, acudiendo al producto escalar de vectores, se puede decir que una matriz ortogonal es simplemente una matriz cuadrada con columna (filas) ortonormales.

Si Q es matriz ortogonal y   sus columnas las cuales satisfacen:   y  , se puede visualizar de la siguiente manera:

 .


A partide de la conexión entre la norma y el producto interior para vectores reales o complejos, pueden establecerse dos propiedades sobre las matrices orgonales:

 
atención
  Una matriz ortogonal preserva longitudes. Esto significa
 . (1.11a


  Una matriz ortogonal preserva productos internos y ángulos:

 . (1.11b

Prueba de 1

De la definición de norma (sección 1.1.3),

 .


Prueba de 2

Dados dos vectores x,y al tomar el producto punto entre sus imágenes mediante Q

 .


Cuando A es una matriz ortogonal, la ecuación   se soluciona fácilmente ya que resulta  , de donde  .

Inversa y multiplicación de matrices ortogonales

editar

Sobre este tipo de matrices se tiene que su inversa (transpuesta), también es matriz ortogonal; así mismo el producto de dos matrices ortogonales es otra matriz ortogonal. Se procede a verificar estas afirmaciones:

 
atención
Si A es ortogonal, entonces   es ortogonal.

Basta ver  . Lo cual se deduce de aplicar (1.5)

y la propiedad asociativa
 ,


y puesto que A es ortogonal

 .


 
atención
Si A,B son ortogonales, entonces AB es ortogonal.

Se debe probar  . Aplicando (1.4)

y la propiedad asociativa
 ,


ahora por ser A, B ortogonales

 .


De forma similar, se obtiene  .

Matriz hermitiana

editar

Una matriz cuadrada   tal que   se llama hermitiana o autoadjunta. Este es el análogo complejo de simetría. Los elementos de la diagonal principal de una matriz hermitiana han de ser números reales, puesto que deben cumplir  . Si la matriz es además unitaria, significa que  , es decir es involutiva. Si todos los elementos son reales, es una matriz simétrica, como se ha mencionado anteriormente.

Con la notación  , se tiene que A es hermitiana si  . Si A es de orden   entonces   es de orden  .

Sobre una matriz hermitiana sucede:

 
atención
Si H es hermitiana no siempre   lo es.

Se deriva del hecho  , que puede no coincidir con H.

Así mismo,

 
atención
Si H, T son hermitianas, entonces no siempre el producto HT lo es.

Se debe a que  , que no siempre es igual a  .

Una matriz cuadrada   tal que   se llama hemi-hermitiana. Este es el análogo complejo de antisimetría. Los elementos de la diagonal principal de una matriz hemi-hermitiana han de ser números nulos o imaginarios puros. Es consecuencia del hecho  , puesto que  , y esto implica  .

Entonces, si una matriz hermitiana H, se multiplica por un escalar k, resulta:

 


También a una matriz hermitiana se le denomina matriz hermitica.