jueves, 24 de febrero de 2011

El perro y los soldados

Es lo malo que tiene internet, tanto ver esto y lo otro, que a veces te enredas. Como leyendo el problema que salía hace poco en gaussianos del perro y los soldados, que dice (sin los resaltes de colores, que son de mi cosecha)
Un grupo de 400 soldados está preparado para marchar. Están colocados formando un cuadrado de 20 metros x 20 metros, y su mascota (un perro) está colocado en el centro de la primera fila. El grupo de soldados comienza la marcha con una velocidad constante, y el perro empieza al mismo tiempo su marcha siguiendo el perímetro del cuadrado formado por los soldados en el sentido de las agujas del reloj, también a una velocidad constante. El perro ha sido entrenado de tal forma que cuando el grupo avanza 20 metros, él recorre el perímetro completo del cuadrado y vuelve a su posición del centro de la primera fila.
Los soldados han avanzado 20 metros, pero ¿qué distancia ha recorrido el perro?

Aparte de pasar un rato "a ver si sale", tiene un aroma a movimiento relativo, y es un buen ejemplo de dónde suelen estar las dificultades de los problemas: en saber interpretar correctamente el enunciado, extraer todos los datos útiles, explícitos o implícitos, y establecer todas las relaciones pertinentes en forma matemática para dar con la o las incógnitas requeridas.

Se puede encontrar en la web planteado el mismo problema y multitud de soluciones variopintas, alguna coincidente con la expresada aquí.

En mi caso, a lo primero que me recuerda el enunciado es a movimiento relativo. El cuadrado de soldados de lado L (en el problema L=20m) se mueve con velocidad constante s respecto a... imagino que respecto al terreno fijo. Supongo por ejemplo que van en sentido sur-norte. El perro sigue el perímetro del cuadrado móvil con velocidad constante p respecto a... vuelvo a suponer que respecto al terreno fijo. Al empezar el perro recorre el lado superior del cuadrado de soldados en sentido oeste-este, luego baja por el lado derecho en sentido norte-sur, gira en sentido este-oeste por el lado inferior, sube por el izquierdo en sentido sur-norte y completa el cuadrado en el lado superior de nuevo en sentido oeste-este. Siempre a velocidad p constante respecto al terreno fijo. Pero la descripción usando los lados del cuadrado es desde el sistema de referencia móvil de los soldados. Para estos el perro lleva una velocidad u al desplazarse por el lado superior o inferior, una velocidad v al descender por el lado derecho, y una velocidad w al subir por el lado izquierdo. Usando unos vectores unitarios i en sentido oeste-este y j en el sentido sur-norte, el vector velocidad del perro, respecto al terreno fijo, en cada tramo es
Lado superior   p = u i + s j  = p (i + j)/√2
Lado derecho   p = (s - v) = - p j
Lado inferior    p = -u i + s j = p (-i + j )/√2
Lado izquierdo p = (s + w) j = p j

Ya se ve que me gustan las letras para denotar las cantidades con las que trabajar. Son más generales que los números cuando hay valores numéricos conocidos (poner L en vez de 20 por ejemplo), podemos usarlas a nuestra conveniencia para designar cualquier dato que pueda ser de interés, y todavía no hay que pagar a la SGAE por usarlas, creo.

Las letras en negrita indican vectores. Las cuatro expresiones anteriores encierran parte de la información del enunciado. La condición de que el perro en todo momento sigue el perímetro del cuadrado móvil de soldados es equivalente a decir que cuando va por los lados superior o inferior la componente j de su velocidad es igual que la de los soldados, pues la velocidad de estos siempre es s = s j ; y que por los lados derecho e izquierdo la velocidad del perro tiene sólo componente según j. Ponemos que la velocidad del perro relativa a los soldados es en módulo la misma, u, en el lado superior y en el inferior, y solo cambia de sentido la componente i. Puede argumentarse que esto es así pues la componente j es la misma, s, en ambos casos y el módulo de la velocidad absoluta del perro, p, es el mismo como indica el enunciado, luego la otra componente debe ser la misma en módulo, y diferir sólo en el sentido.

Una vez llenos de letras y relaciones, ¿qué? Pues hay que buscar más relaciones. Con velocidades y longitudes, habrá que considerar tiempos. Pongamos que T es el tiempo en que el perro da la vuelta al cuadrado de soldados mientras estos han avanzado L, la longitud del cuadrado, marchando a la velocidad s, es decir
T = L / s

Desde el punto de vista de los soldados (el sistema de referencia móvil) el tiempo que el perro emplea en recorrer los lados superior e inferior es
A = 2 L / u
El tiempo que el perro emplea en recorrer el lado derecho es
B = L / v
y el tiempo que el perro emplea en recorrer el lado izquierdo es
C = L / w

Como estamos en la relatividad de Galileo, no la de Einstein, los intervalos de tiempo medidos por los soldados y por alguién quieto respecto al terreno son iguales. Podemos tranquilamente poner que

T = A + B + C
es decir
L / s = (2 L/ u) + (L / v) + (L/w)

De las expresiones anteriores para la velocidad vectorial del perro en que aparecen s, p, u, v y w, resulta que podemos expresar u, v y w en términos de s y de p. ¡Ajá!, s es un "dato", y p la incógnita.

Como p = v - s = w + s = √(u2+s2) , tenemos que

v= p + s = s(p/s + 1) = s(x + 1)
w=p - s = s(p/s - 1) = s(x-1)
u = √(p2-s2) = s √((p/s)2-1) = s √(x2-1)

donde hemos introducido la nueva variable

x = p / s

ratio de la velocidad del perro respecto a la de los soldados. Lo de usar esta variable, y sacar factor común a s es para poder simplificar las expresiones matemáticas a manipular, pasando de

L / s = (2 L/ u) + (L / v) + (L/w)
a

1 =  ( 2/ √(x2-1)) + (1/(x+1)) + (1/(x-1))

que a su vez operando por aquí y por allá conduce a esta bonita ecuación polinómica de cuarto grado:

x4- 4x3- 2x2 + 4x + 5 =0

Nos ayudamos aquí del amigo Octave para calcular las raíces:
octave-3.2.4.exe:1> x=[1, -4, -2 , 4, 5]
x =
   1  -4  -2   4   5
octave-3.2.4.exe:2> roots(x)
ans =
   4.18113 + 0.00000i
   1.36734 + 0.00000i
  -0.77423 + 0.52454i
  -0.77423 - 0.52454i
El paso final es la "interpretación de las soluciones". Las dos complejas las descartamos sin más, y en cuanto a las dos reales, descartamos la segunda por ... Bueno, a mirar la secuencia de deducciones y dónde hay algo que permita descartarla. Tiempo al tiempo. Ah, al poner T=A+B+C se asume que cada uno de esos tiempos parciales es menor que el total. En concreto C < T se traduce también en que (1/(x-1))<1 , es decir, (x-1)>1 y por tanto debe ser x >2. 

Al final the winner is ... x = 4.18113 (5 decimales ya esta bien), es decir p = 4.18113 s.
Y el espacio recorrido por el perro, medido por un observador fijo respecto al terreno, es
p T = p L / s = L x = 4.18113 L
que para un cuadrado de 20 metros es una distancia de aproximadamente 83,623 metros.


De propina podemos ver los valores de las velocidades del perro en cada tramo, desde el punto de vista de los soldados:
 u = 4,0598 s ; v = 5,1811 s ; w = 3,1811 s

Y podemos decir mucho más. Que la distancia recorrida por el perro respecto al sistema móvil de los soldados es de 80 metros, el perímetro del cuadrado, aunque esto no subirá mucho la nota. Que el espacio recorrido por el perro no depende de la velocidad de los soldados. Ni del sentido de marcha, si despreciamos la aceleración de Coriolis (típico comentario para meter de rondón algo que suene a que sabemos lo que no nos preguntan y nos saldríamos de la escala si no fuese por la falta de tiempo). Y que la solución tampoco depende de que la mascota sea un perro con tal de que esté igual de bien entrenada, no ya marchando a la velocidad correcta en cada tramo sino, sobre todo, girando instantaneamente en las esquinas :-)

sábado, 15 de enero de 2011

averías

Para empezar el año, una avería del año pasado con final feliz.

El protagonista, un DVD grabador con disco duro marca Panasonic, modelo DMR-EX75, recibido como regalo de Reyes Magos el 2007, hace ya 4 años.

La avería, ocurrida hace ya más de 3 meses: la pérdida de la señal de todos los canales digitales de TV, que es como decir la pérdida de todos los canales de TV, dado el apagón analógico del pasado 2010. Por lo demás el DVD, el reproducir lo grabado en el disco duro, o incluso grabar una señal externa funcionaban perfectamente, lo único muerto era el sintonizador TDT propio del aparato.

El presupuesto, en el "Servicio Técnico", tras larga espera, que si cambiar una placa, que es cara, y mano de obra, algo más de 200€. Para eso mejor comprarse un grabador nuevo. Que es lo que hice.

La sorpresa. Un equipo idéntico al mío, regalado por mí (que estaba muy contento con las prestaciones del Panasonic) en octubre de 2007, "muere" hace unos días con exactamente los mismos síntomas. Vaya, vaya, qué NO casualidad.

Internet. La búsqueda. Que esto no ha sido un caso aislado de mala suerte, de azar fortuito conjuntado con una mala sobretensión o alguna peculiaridad única. A poner marca, modelo, y algo sobre averias, pero en inglés, y a ver qué dice Google. Bueno, pues la página con el dato clave fué una que describía el problema así

Panasonic DMR-EX75 has stoped receiving digital signal

y que enseguida enviaba mediante un enlace al Foro Salvador con el diagnóstico certero y la solución al problema

http://www.avforums.com/forums/dvd-blu-ray-recorders-media/996408-panasonic-dmr-ex75-no-freeview-fault.html

En esa maravilla de Foro, ese oráculo inesperado que responde a nuestras necesidades, además de la diagnosis de la avería y de la diáfana explicación de cómo proceder a su reparación, se siguen innumerables aportaciones de personas que han sufrido exactamente esa misma avería, y llenas de agradecimeinto casi casi bendicen al que encontró el camino haciendo partícipe del mismo a los demás. Empezó rusp191 un 12 de mayo de 2009 y desde entonces hasta hoy mismo se suceden los testimonios de sufrir el mismo problema, haber seguido los consejos del Foro, y haber vuelto a ver la señal. ¡Loado sea rusp191 y todos los contribuyentes y el Foro entero!

Puede parecer exagerado expresarse de una forma casi religiosa, pero es que afloran lágrimas de arrebatado agradecimiento cuando una avería inexplicable de 200€ de reparación se revela como un fallo de un único y sencillo componente pasivo, un condensador electrolítico de 680 μF, valorado en menos de 1 €. Además en el foro te ponen fotos para saber dónde está ese componente, oculto bajo una placa que hay que retirar, y te dan consejos para reemplazar el componente y tener cuidado con algún detalle, como que el condensador es polarizado y no da igual el - que el +.

Tan eficaz ha sido el foro, que he reparado los dos equipos averiados sin grandes complicaciones. Y qué sensación indescriptible la de probar el primer aparato tras la reparación, darle al setup para la detección de emisoras, y ver cómo gracias a ese nuevo condensador de euro y medio el DVD grabador vuelve a funcionar perfectamente sin más.

El final es feliz, al menos de momento. Hay varios aspectos positivos, además del final feliz. Por ejemplo, cuan útil puede llegar a ser Internet como forma de compartir conocimientos en general, y concretamente remedios a problemas específicos. También es reconfortante ver que uno mismo, aún siendo un tanto manazas, puede encargarse de una reparación sencilla. Incluso puede uno entrar en una vena más filosófica sobre lo cierto que es eso de que la cadena es tan fuerte como el eslabón más débil. Y esta vena filosófica es la que conduce a algunas preguntas.

El Panasonic DMR-EX75 tiene unas prestaciones y una interfaz de usuario realmente estupendas, realzadas aún más al contrastarle con el equipo sustiturio que me compré, un Samsung DVD-SH893 con unas características y un manejo inenarrablemente deficientes en comparación con el Panasonic. Este presenta además un aspecto interno pulcro y ordenado en lo que se refiere a sus circuitos y componentes.

Pero es obvio que hay un fallo de diseño cuando un mismo componente pasivo es el causante de una misma avería en un número de casos muy elevado, en un plazo que en mis dos "muestras estadísticas" está entre más de 3 y menos de 4 años. Como el componente está oculto por una placa, quizá la refrigeración no es suficiente. El componente original tenía un voltaje máximo de 6.8V. Yo no he encontrado de ese voltaje y he usado uno de 25V (el último de la tienda) y en el otro aparato uno de 30V (los que habían recibido después). La diferencia, parece que son algo más caros, en vez de 40 o 50 céntimos de euro, 150 céntimos de euro (a pesar de la crisis no me lo pensé, la casa por la ventana); y son algo más grandes, lo que me obligó a tumbarles un poco.

La duda que tengo es si un aparato tan bien manufacturado y de funcionamiento tan bueno puede tener esta avería generalizada por un ahorro de céntimos en un único componente. O es que la situación del mismo impide su refrigeración. O es tal vez un caso estudiado de obsolescencia programada, que no creo, pero es lo que tiene ver estos documentales de la 2 . Y la duda no me corroe, pero ¿habrán detectado el problema los de Panasonic?, y en tal caso ¿le han puesto remedio en las nuevas hornadas de productos similares?

Como enseñanza general me queda lo de "buscar en internet a ver si alguién más ha tenido este problema, y ¡encima lo ha resuelto!". En cuanto a los detalles de mi reparación, he seguido los consejos del foro. Lo más elemental e importante, cuidar de conectar bien las polaridades del condensador, + con +, y - con -.  Por otro lado casi lo más difícil es la parte mecánica. No me refiero a desatornillar los dos tornillos laterales y tres posteriores para quitar la tapa y ver el interior el aparato. En el medio se ve una placa, atornillada con tres tornillos que en la siguiente figura he remarcado en rojo.




Hay que quitar esos 3 tornillos, y quitar las cintas de conexiones (remarcadas en azul) tirando hacia arriba de las lengüetas que afortunadamente tienen (por cierto, conviene fijar esas cintas pendulantes con papel adhesivo para que no molesten). Sobre la placa grande hay otra más pequeña, que la aprisiona  y que molesta en el proceso de sacar la placa grande. Por eso ayuda aflojar algo los tornillos de la placa pequeña, que he remarcado en amarillo, para poder llevar esa placa pequeña un poco hacia arriba si hace falta. La placa a extraer va insertada en un conector inferior, hay que tirar hacia arriba de ella, y luego, tras notar la liberación del conector, deslizar la placa hacia la parte inferior de la imagen. Con un poco de paciencia y tiento, sale la placa grande y queda expuesto el difunto condensador C1533. Sin ser forense, en mis dos casos se apreciaba una traza anaranjada en la parte superior del condensador, prueba de que había perdido algo de electrolito.


Opté por la solución fácil, y creo que óptima, de cortar las patillas del condensador defectuoso, dejándolas lo más largas posible. A las patillas del nuevo condensador les doblé en ángulo y les hice terminar en un aro que se insertara en las anteriores patillas.



Con esa configuración mecánica fija que libera ambas manos, sólo queda dar dos puntos de soldadura, dejar enfriar, recolocar la placa en posición, insertada en su conector, venciendo con tiento la resistencia de la otra plaquita, insertar de nuevo las cintas en sus conectores, atornillar, conectar el aparato, ir al setup ... y recuper en perfecta sintonía esos canales TDT tan queridos y adecuados para, henchido de gozo y emoción, cantar con el Jefe 57 Channels (and nothin' On).

Y de paso en el camino se obtienen unas cuantas páginas web interesantes, para (no ha sido mi caso) comprar componentes electrónicos por internet, saber de los tipos y características de los condensadores (y otros tutoriales interesantes), o lo más básico de la soldadura.

martes, 30 de noviembre de 2010

ese tres irreducible y básico (tercera parte)

No hay dos sin tres, más si el título es ese tres ...

El caso es que al aplicar el método de los operadores P(α)ki a una función normalizada como
ξ = 1/√5 [ -1 -1 1 0 -1 1]T
las
ξij = √(|G|/nα) P(α)ki ξ
que resultan no son ortonormales, como sí sucedía en los casos vistos de φ y χ. En estos dos casos teníamos una única componente 1 y el resto 0, respecto a la base inicial del álgebra del grupo. Al aplicar los 6 operadores de la Representación Regular a φ o a χ se obtiene un conjunto ortonormal de 6 funciones, con una sola componente 1 cada vez en una posición diferente. En el caso de ξ tenemos 6 funciones normalizadas, de norma 1, pero no ortogonales, luego no forman una base ortonormal, y al aplicar los operadores √(|G|/nα) P(α)ki obtenemos funciones no ortonormales.

Lo que no impide que las 6 funciones formen una base respecto a la que la representación regular se diagonaliza, como se ve en Octave

xi = [-1 -1 1 0 -1 1]'; 
xi11=P3_11*xi;
xi22=P3_22*xi;
xi21=P3_21*xi;
xi12=P3_12*xi;
xi1=P1*xi; 
xi2=P2*xi; 
MCx=[xi1 xi2 xi11 xi21 xi12 xi22];
MCxI=eye(6)/MCx;
MCxI*Reg{1}*MCx
MCxI*Reg{2}*MCx
MCxI*Reg{3}*MCx
MCxI*Reg{4}*MCx
MCxI*Reg{5}*MCx
MCxI*Reg{6}*MCx

donde sin normalizar nada se consigue la diagonalización. Otra cosa sería hacer productos escalares con componentes referidas a esa base final no ortonormal, en que no valdrían las muchas y útiles expresiones que sólo son válidas usando una base ortonormal.

Es muy importante el hecho de que en la Representación Regular, al aplicar sus 6 operadores a un vector general, obtenemos 6 vectores linealmente independientes, y hay una matriz invertible que pasa de esos 6 vectores a otros 6 que forman una base final que diagonaliza las matrices de los operadores.  Esa matriz invertible 6x6 se compone de los elementos matriciales de todas las R.I. (Representaciones Irreducibles) del grupo: 4 elementos de la R.I. 3, que es 2x2, y un elemento de cada una de las 2 R.I. 1-dimensionales, por cada uno de los 6 operadores de la representación. Es lo mismo que expresan los operadores  P(α)ki pero puesto de otro modo. Si  ψ  es un vector general y ψg = Tg ψ , resulta que

  ψ(α)ki   =  √(|G|/nα) P(α)ki ψ  =  √(nα/|G|) ∑g U(α)*ki(g) ψg

A la derecha aparecen combinaciones lineales de las seis ψg generadas con los operadores Tg de la Representación Regular, hechas con coeficientes obtenidos de todas las R.I. A la izquierda, al ir dando valores uno por una a los k e i para cada α, tenemos los 6 vectores de la base final "diagonalizante", precisamente la base en la que los operadores tienen la forma diagonal por cajas cuyos elementos son los U(α)ki(g) . Concretamente en nuestro caso para α=1 y también para α=2, tenemos k=i=1; y para α=3, ki toma los valores 11, 21, 12, y 22. La matriz de paso de los seis ψa los seis ψ(α)ki  es unitaria gracias a las propiedades de ortogonalidad de los elementos matriciales de las R.I.

Pero ¿qué pasa si tenemos una representación reducible S de matrices 6x6 que contenga 3 veces la R.I. 3, y por tanto ninguna vez las R.I. 1 y 2? Encontraremos 3 bases de dos vectores cada una, transformándose según la R.I. 3, pero no será suficiente ahora partir de un único vector general para obtener las 3 bases. Resulta que en este caso nunca conseguiremos, al aplicar los operadores de esa representación a un vector general, más de 4 vectores linealmente independientes, en vez de los 6 del caso de la Representación Regular.

De un vector general  ψ  se obtienen ahora seis vectores ψg = Sg ψ . Pero podemos formar la combinación lineal
ψs = (ψ1 +ψ2 +ψ3 +ψ4 +ψ5 +ψ6 )
que verifica que para todo elemento del grupo
Sg ψs = ψs
con lo que ψs genera un subespacio invariante de dimensión 1 que se transforma como la R.I. 1, la trivial. Pero como esta R.I. no está contenida en la representación S, debe ser Sg ψs = 0 = ψs y tenemos una combinación lineal de los seis ψg igual a cero con coeficientes no nulos, por lo que son linealmente dependientes, y hay una relación entre ellos:
ψ1 +ψ2 +ψ3 +ψ4 +ψ5 +ψ6 = 0
Otra combinación posible es
ψa = (ψ1 -ψ2 -ψ3 -ψ4 +ψ5 +ψ6 )
que se transforma al aplicar los Sg como la R.I. 2, que de nuevo no está contenida en S por lo que también debe ser
ψ1 -ψ2 -ψ3 -ψ4 +ψ5 +ψ6  = 0
Estas dos relaciones reducen el conjunto de seis vectores ψg como máximo a cuatro vectores linealmente independientes.

Usando los  P(αS)ki definidos ahora usando los Sg , en vez de los Tg de la Representación Regular, lo que ocurre es que P(1S) y  P(2S) se anulan, algo coherente con que S no contiene ni la R.I. 1 ni la R.I. 2. Sólo nos quedan los cuatro  P(3S)ki  para, usando un ψ general, dar dos de las tres bases que se transforman según la R.I. 3. A partir de la diferencia entre ψ y su proyección sobre esas dos bases podemos obtener la tercera.

En el siguiente ejemplo con Octave se crea la representación S haciendo el producto de kronecker de la R.I. 3, matrices 2x2, con la matriz identidad 3x3, y obtener así una representación de matrices 6x6 que es reducible, por construcción, usando tres veces la R.I. 3, y sin contener pues las R.I. 1 y 2.  De hecho se definen las matrices de S respecto a la base "diagonalizante", y respecto a la misma se obtienen los operadores P(αS)ki , lo que no hace menos general el que sea P(1S) = 0 = P(2S) . Con un vector general ψ se generan los seis  ψg = Sg ψ y con la función rank() vemos que sólo 4 son linealmente independientes.


# representacion 6x6 contiene 3 veces R.I. 3
S33=cell(6,1);
for k=1:6
   S33{k}=kron(eye(3,3),U3{k});
endfor
# --- OPERADORES de PROYECCION y relacionados ---
Y3_11=(2/6)*(  U3{1}(1,1)*S33{1}+
               U3{2}(1,1)*S33{2}+
               U3{3}(1,1)*S33{3}+
               U3{4}(1,1)*S33{4}+
               U3{5}(1,1)*S33{5}+
               U3{6}(1,1)*S33{6});
Y3_22=(2/6)*(  U3{1}(2,2)*S33{1}+
               U3{2}(2,2)*S33{2}+
               U3{3}(2,2)*S33{3}+
               U3{4}(2,2)*S33{4}+
               U3{5}(2,2)*S33{5}+
               U3{6}(2,2)*S33{6});
Y3_21=(2/6)*(  U3{1}(2,1)*S33{1}+
               U3{2}(2,1)*S33{2}+
               U3{3}(2,1)*S33{3}+
               U3{4}(2,1)*S33{4}+
               U3{5}(2,1)*S33{5}+
               U3{6}(2,1)*S33{6});
Y3_12=(2/6)*(  U3{1}(1,2)*S33{1}+
               U3{2}(1,2)*S33{2}+
               U3{3}(1,2)*S33{3}+
               U3{4}(1,2)*S33{4}+
               U3{5}(1,2)*S33{5}+
               U3{6}(1,2)*S33{6});
Y3 = Y3_11 + Y3_22 # debe ser matriz identidad
Y1 = (1/6)*(U1{1}*S33{1}+U1{2}*S33{2}+U1{3}*S33{3}+U1{4}*S33{4}+U1{5}*S33{5}+U1{6}*S33{6}) # debe ser matriz 0
Y2 = (1/6)*(U2{1}*S33{1}+U2{2}*S33{2}+U2{3}*S33{3}+U2{4}*S33{4}+U2{5}*S33{5}+U2{6}*S33{6}) # debe ser matriz 0
psi=[1 2 -3 4 7 -13 ];
psig=cell(6,1);
for k=1:6
   psig{k}=S33{k}*psi';
endfor
psig{1}+psig{2}+psig{3}+psig{4}+psig{5}+psig{6} # debe dar 0
psig{1}-psig{2}-psig{3}-psig{4}+psig{5}+psig{6} # debe dar 0
[psig{1} psig{2} psig{3} psig{4} psig{5} psig{6} ]
rank([psig{1} psig{2} psig{3} psig{4} psig{5} psig{6} ]) # debe ser 4 o menos

domingo, 21 de noviembre de 2010

ese tres irreducible y básico (segunda parte)

Y los operadores muy especiales, que nos ayudan a "proyectar" son ...



Por cada Representación Irreducible (R.I.) α, de dimensión nα, se definen nα2 operadores como combinaciones lineales de los operadores Tgp (p=1,...,|G|) de la Representación Regular, combinaciones lineales cuyos coeficientes son los elementos de matriz de la R.I. α . De ellos (ver la primera línea de la anterior imagen) sólo los operadores con subíndices coincidentes son operadores de proyección, y su suma da el operador proyección sobre el subespacio invariante correspondiente a la R.I. α (ver la segunda línea). La suma sobre todas las R.I. de los operadores proyección sobre sus respectivos subespacios invariantes da el operador identidad (tercera línea).

La última línea indica la relación de la nomenclatura de las fórmulas con las variables usadas en Octave. Para S3 tenemos

# --- OPERADORES de PROYECCION y relacionados ---
# P3_11 es la proyeccion sobre la fila 1 de la R.I. 3
# En la R. Regular se proyecta sobre un subespacio de dimension 2
P3_11=(2/6)*(  U3{1}(1,1)*Reg{1}+
               U3{2}(1,1)*Reg{2}+
               U3{3}(1,1)*Reg{3}+
               U3{4}(1,1)*Reg{4}+
               U3{5}(1,1)*Reg{5}+
               U3{6}(1,1)*Reg{6});
# P3_22 es la proyeccion sobre la fila 2 de la R.I. 3
# En la R. Regular se proyecta sobre un subespacio de dimension 2
P3_22=(2/6)*(  U3{1}(2,2)*Reg{1}+
               U3{2}(2,2)*Reg{2}+
               U3{3}(2,2)*Reg{3}+
               U3{4}(2,2)*Reg{4}+
               U3{5}(2,2)*Reg{5}+
               U3{6}(2,2)*Reg{6});
# Los 2 operadores siguientes no son proyecciones, pero sirven para formar los partner que 
# completan las bases de los 2 subespacios de dimension 2 que se tranforman segun la R.I. 3 
P3_21=(2/6)*(  U3{1}(2,1)*Reg{1}+
               U3{2}(2,1)*Reg{2}+
               U3{3}(2,1)*Reg{3}+
               U3{4}(2,1)*Reg{4}+
               U3{5}(2,1)*Reg{5}+
               U3{6}(2,1)*Reg{6});
P3_12=(2/6)*(  U3{1}(1,2)*Reg{1}+
               U3{2}(1,2)*Reg{2}+
               U3{3}(1,2)*Reg{3}+
               U3{4}(1,2)*Reg{4}+
               U3{5}(1,2)*Reg{5}+
               U3{6}(1,2)*Reg{6});
# Con P3_11 y P3_21 se obtiene una base de un subespacio de dimension 2 que se transforma segun R.I. 3
# Con P3_12 y P3_22 se obtiene una base de otro subespacio de dimension 2 que se transforma segun R.I. 3
# P3 proyeccion asociada a la R.I. 3, de dimension 2
# como la R. Regular contiene dos veces la R.I. 3, se proyecta sobre un subespacio de dimension 4
P3 = P3_11 + P3_22;
# P1 proyeccion sobre la R.I. 1, de dimension 1, trivial
P1 = (1/6)*(U1{1}*Reg{1}+U1{2}*Reg{2}+U1{3}*Reg{3}+U1{4}*Reg{4}+U1{5}*Reg{5}+U1{6}*Reg{6});
# P2 proyeccion sobre la R.I. 2, de dimension 1, antisimetrica
P2 = (1/6)*(U2{1}*Reg{1}+U2{2}*Reg{2}+U2{3}*Reg{3}+U2{4}*Reg{4}+U2{5}*Reg{5}+U2{6}*Reg{6});
# Debe ser P1+P2+P3 = eye(6)
all(all(P1+P2+P3-eye(6) < ones(6,6)*0.00001)) # debe dar 1

Con la Representación Regular es posible obtener las funciones base de cada R.I. contenida en la misma.  Partimos de una función φ (vector en el espacio vectorial de dimensión 6 en que se define la Representación Regular) y generamos seis funciones, usando los operadores  P(α)ki  Estas funciones resultan ser ortonormales si la función  φ de partida es tal que {Tgp φ} es un conjunto de 6 vectores ortonormales, lo que se verifica si elegimos φ = [1 0 0 0 0 0]T .

Las R.I. 1 y 2 tienen dimensión 1, y figuran en la Representación Regular 1 vez, luego aportan cada una una función base:

φ1=√(6/1) P(1) φ (base de R.I. 1)
φ2=√(6/1) P(2) φ (base de R.I. 2)

Se usa directamente el operador proyección sobre el subespacio invariante unidimensional correspondiente, y el factor √(|S3|/nα) sirve en este caso para normalizar el resultado.

En cuanto a la R.I. 3, figura en la Representación Regular dos veces, tendremos dos subespacios invariantes que se transforman según R.I. 3, cada uno con una base de 2 funciones base. En cada base una función se transforma según la fila 1 de la R.I. 3, y la otra función según la fila 2.

Primera base de R.I. 3 :
φ11=√(6/2) P(3)11 φ  (se transforma  según la fila 1)
φ21=√(6/2) P(3)21 φ  (se transforma  según la fila 2)

Segunda base de R.I. 3 :
φ12=√(6/2) P(3)12 φ  (se transforma  según la fila 1)
φ22=√(6/2) P(3)22 φ  (se transforma  según la fila 2)

En este caso se deben usar los 4 operadores con dos subíndices, no sirve por demasiado general el operador  proyección P(3) sobre el subespacio invariante 4-dimensional. Tampoco basta con los operadores proyección  P(3)11=P(3)1 y P(3)22=P(3)2 , que proyectan sobre sendos subespacios 2-dimensionales de vectores que se transforman según la fila 1 por un lado, y según la fila 2 por el otro. Son imprescindibles los operadores con dos subindices distintos, que afortunadamente no son operadores de proyección, sino más bien de "cruce". Por ejemplo aplicando P(3)21 a un vector que se transforma según la fila 1 (como φ11 ) se obtiene otro "compañero" o partner, que se transforma según la fila 2 (como φ21) y ambos forman una base que se transforma según la R.I. 3.  Esto en el ejemplo concreto de la base formada por  φ11 y  φ21 quiere decir que para todo elemento g del grupo se verifica que

Tg φ11 = U(3)11(g) φ11 + U(3)21(g) φ21
Tg φ21 = U(3)12(g) φ11 + U(3)22(g) φ21

En código Octave:

fi = [1 0 0 0 0 0]';
# para obtener vectores de norma 1 debe multiplicarse por el factor sqrt del cociente
# entre el orden del grupo y la dimension de la R.I. respectiva
fi1=sqrt(6/1)*P1*fi; # R.I. 1
fi2=sqrt(6/1)*P2*fi; # R.I. 2
fi11=sqrt(6/2)*P3_11*fi; # R.I. 3
fi22=sqrt(6/2)*P3_22*fi; # R.I. 3
fi21=sqrt(6/2)*P3_21*fi; # R.I. 3
fi12=sqrt(6/2)*P3_12*fi; # R.I. 3
# comprobar que fi11 y fi21 forman una base, transformandose entre si
numok=0;
for i = 1:6
   numok = numok + all((U3{i}(1,1)*fi11+U3{i}(2,1)*fi21)-Reg{i}*fi11 < ones(6,1)*0.00001);
   numok = numok + all((U3{i}(1,2)*fi11+U3{i}(2,2)*fi21)-Reg{i}*fi21 < ones(6,1)*0.00001);
endfor
numok  # debe ser 12
# comprobar que fi12 y fi22 forman una base, transformandose entre si
numok=0;
for i = 1:6
   numok = numok + all((U3{i}(1,1)*fi12+U3{i}(2,1)*fi22)-Reg{i}*fi12 < ones(6,1)*0.00001);
   numok = numok + all((U3{i}(1,2)*fi12+U3{i}(2,2)*fi22)-Reg{i}*fi22 < ones(6,1)*0.00001);
endfor
numok  # debe ser 12

Puede comprobarse que los seis vectores de la base final así obtenidos son ortonormales. La matriz Mfinal de un operador lineal en la base final se obtiene a partir de la matriz Minicial del mismo operador en la base inicial mediante

Mfinal = C-1 Minicial C

cuando se define la matriz del cambio de base C como aquella cuya i-ésima columna da la expresión del i-ésimo vector de la base final como combinación lineal de los vectores de la base inicial.

(No es raro encontrar en la literatura que se llama matriz del cambio de base a la que tiene por columna i-ésima el desarrollo del i-ésimo vector de la base inicial en términos de los vectores de la final, con lo que según ese convenio C y C-1 intercambian posiciones en la expresión anterior. Este convenio alternativo suele aparecer al tratar de cómo cambian las coordenadas de un vector al cambiar de base. Otra fuente de confusión con la que tener cuidado.)

Usando la fórmula anterior para cada operador de la representación Regular, podemos comprobar que en la base final sus matrices son en efecto diagonales por cajas, y en cada caja de R.I. con la submatriz de la R.I. correspondiente.

# la matriz de cambio de base es
MC=[fi1 fi2 fi11 fi21 fi12 fi22];
MCI=eye(6)/MC;
# matrices en la base final de los 6 operadores de la Representacion Regular
MCI*Reg{1}*MC
MCI*Reg{2}*MC
MCI*Reg{3}*MC
MCI*Reg{4}*MC
MCI*Reg{5}*MC
MCI*Reg{6}*MC

Se pueden definir unos operadores P(α)ki para cualquier representación, usando sus correspondientes operadores Tgp . Si se trata de una representación reducible 3-dimensional que contiene por ejemplo una vez la R.I. 1 y una vez la R.I. 3, solo tenemos que obtener una base de esta R.I. 2-dimensional, y hay una redundancia en el uso de los cuatro operadores, nos basta con P(3)11 y P(3)22 . Para representaciones reducibles que contengan la R.I. 3 más de dos veces, tenemos que obtener más de las dos bases que se puede sacar con los cuatro P(3)ki en el caso de la Representación Regular, en que esos 4 operadores producían las 2 bases partiendo de un solo vector general.  Con más de 2 bases, se necesitá usar más de un vector de partida al que aplicar los operadores.

Pero volviendo a la Representación Regular, partiendo de φ = [1 0 0 0 0 0]T se obtienen dos bases {φ11 , φ21 } y {φ12 ,φ22 } con 4 vectores ortonormales entre sí. Partiendo de otro vector diferente χ = [0 0 0 0 1 0]T se obtienen otras dos bases ortonormales  (que se transforman según la R.I. 3)  {χ11 , χ21 } y {χ12 ,χ22 }.
Pues bien, hay dos resultados generales e importantes. Resulta que cualquier vector según la fila 1 de una base es ortogonal a un vector según la fila 2 de cualquier base. Por ejemplo :

φ11 . χ22 =  0 = φ21 . χ12

Y además, para cualesquiera dos bases el producto escalar de los respectivos vectores según la fila 1 y según la fila 2, son iguales. En nuestro ejemplo :

φ11 . χ12 = φ21 . χ22

De la misma forma para este otro par de bases :

φ12 . χ12 = φ22 . χ22

pero ¡ojo! puede ser que φ11 . χ12 ≠ φ12 . χ12  .

Conviene recordar que en las expresiones anteriores el primer subíndice indica la fila por la que se transforma el vector, y el segundo distingue las dos bases posibles partiendo de un vector dado, sea  φ  o  χ . En Octave podemos comprobar de golpe la última condición para los 4 posibles emparejamientos de las 2 bases obtenidas de un φ con las 2 obtenidas de un  χ , y las 8 condiciones de ortogonalidad:

fi = [1 0 0 0 0 0]';
fi11=sqrt(6/2)*P3_11*fi;
fi22=sqrt(6/2)*P3_22*fi;
fi21=sqrt(6/2)*P3_21*fi;
fi12=sqrt(6/2)*P3_12*fi;
chi = [0 0 0 0 1 0]'; 
chi11=sqrt(6/2)*P3_11*chi;
chi22=sqrt(6/2)*P3_22*chi;
chi21=sqrt(6/2)*P3_21*chi;
chi12=sqrt(6/2)*P3_12*chi;
# comprobar independencia de la fila del prod. escalar misma fila
# primer subindice indica fila, segundo diferencia bases 
# 4 combinaciones de 2 bases de fi con 2 de chi
all([  \
fi11'*chi11 - fi21'*chi21  \
fi12'*chi11 - fi22'*chi21  \
fi11'*chi12 - fi21'*chi22  \
fi12'*chi12 - fi22'*chi22  ] < ones(1,4)*0.00001) # debe dar 1
# Los 4 productos de cada combinacion no tienen por que coincidir :
[ fi11'*chi11 fi12'*chi11 fi11'*chi12 fi12'*chi12 ]
# comprobar ortogonalidad entre diferentes filas 
# de cualquier base de fi con cualquiera de chi
all([ 
fi11'*chi21 - 0  \
fi21'*chi11 - 0  \
fi12'*chi21 - 0  \
fi22'*chi11 - 0  \
fi11'*chi22 - 0  \
fi21'*chi12 - 0  \
fi12'*chi22 - 0  \
fi22'*chi12 - 0  ] < ones(1,8)*0.00001) # debe dar 1

Que el producto escalar entre vectores de distintas bases que se transforman según la misma fila de una R.I. sea independiente de la fila, está en la base del Teorema de Wigner-Eckart, y justifica que existan los elementos de matriz reducida.

Viene a implicar que, por ejemplo, si me topo con una representación reducible de dimensión 15 que contiene 5 veces una misma R.I. de dimensión 3, puedo encontrar para un operador escalar, como pueda ser el Hamiltoniano H de un sistema mecanocuántico suficientemente simétrico, una base 15-dimensional en que la matriz 15x15 de H se descomponga en 5x5 submatrices, cada una de ellas de 3 filas por 3 columnas, rellenas de ceros salvo en la diagonal, en que sus 3 elementos coinciden. Por tanto como valores distintos en la matriz 15x15 sólo tenemos 5x5 elementos, a los que se llama elementos de la matriz reducida. Y no está mal pasar de tener que calcular 225 números a reducir la cosa a sólo 25.

Fugaz felicidad que hay que aprovechar, ahora que creo entender lo que escribo, pues no tardando mucho veré esto mismo con extraños ojos de incomprensión.

lunes, 15 de noviembre de 2010

ese tres irreducible y básico (primera parte)

Un grupo como S3 es muy útil para plasmar en un ejemplo concreto las ideas abstractas, pues es muy sencillo, pero no totalmente trivial. Revisando la pasada entrega, qué grupo el ese tres, podemos decir que es un grupo no conmutativo de orden |S3| = 6, con 3 clases por conjugación, y una tabla de Cayley que plasma su ley de grupo.

Resulta que con Octave se puede "cargar" esa tabla de Cayley y usarla por ejemplo para comprobar si cierto conjunto de matrices se multiplican como  los elementos del grupo. En vez de usar las letras e para el elemento identidad, a b y c para los tres ciclos de longitud 2 y f y g para los dos ciclos de longitud 3, usamos índices numéricos del 1 al 6, en función de los cuales la tabla de Cayley queda como se ve a la derecha en la figura siguiente, que incluye las otras dos formas alternativas de poner lo mismo.

En Octave definimos la tabla como una matriz, así, con comentarios incluidos:

# tabla de Cayley de S3, con entradas en el orden 
# g1=(1)(2)(3) ; g2=(12) ; g3=(23) ; g4=(31) ; g5=(123) ; g6 = (321)
# de modo que gi o gj = gk con k=Cayley(i,j) 
Cayley=[ 1 2 3 4 5 6 ; 
         2 1 5 6 3 4 ; 
         3 6 1 5 4 2 ; 
         4 5 6 1 2 3 ; 
         5 4 2 3 6 1 ; 
         6 3 4 2 1 5 ];

Aquí está expresada la ley del grupo. El valor en la fila i, columna j, es el índice del elemento obtenido al multiplicar el i-ésimo (a la izquierda) por el j-ésimo elemento. Con esa información se puede construir automáticamente la llamada Representación Regular (por la izquierda), un conjunto de |S3| matrices de |S3| filas por |S3| columnas. A cada elemento i le asociamos una matriz |S3|x|S3|. Cada fila j de esa matriz esta llena de ceros, excepto un uno que se coloca en la columna k determinada por la ley de grupo gi o gj = gk.

Con Octave podemos usar dos importantes caracteristicas suyas: los Cell Array y las Permutation Matrices. Con lo primero tenemos un contenedor para guardar las 6 matrices, e indexarlas con un valor de 1 a 6. La peculiaridad de las permutation matrices es que permiten definir directamente cada matriz de la Representación Regular a partir de cada fila de la tabla de Cayley. En código queda más corto que cualquier explicación:

# matrices de la Representacion Regular, usando las "permutation matrices" de Octave
# la permutacion para el elemento k la establece la fila k de la tabla de Cayley
# usando un Cell Array ponemos las 6 matrices indexadas en un contenedor
Reg=cell(6,1);
for k=1:6
   Reg{k}=eye(6)(:,Cayley(k,:));
endfor

Tenemos pues 6 matrices distintas, en código Octave Reg{1} a Reg{6}. Para comprobar que se multiplican exactamente igual que los elementos de S3 podemos hacer todos los productos posibles y ver que se obtiene en cada caso lo correcto, algo como


# la funcion all() de Octave puede usarse para comprobar que las matrices 
# asi definidas cumplen la ley de grupo, concretada en la tabla de Cayley.
# all(all(Reg{6}==r6)) devuelve 1 mientras all(all(Reg{6}==r5)) devuelve 0 
# i=3;j=5; all(all(Reg{i}*Reg{j}==Reg{Cayley(i,j)})) debe dar 1
numok=0
for i = 1:6
   for j = 1:6
      numok = numok + all(all(Reg{i}*Reg{j}==Reg{Cayley(i,j)})) ;
   endfor
endfor
numok  # debe ser 36, 1 por cada producto correcto

Hacemos la prueba lógica de que Reg{i}*Reg{j} sea igual a Reg{Cayley(i,j)} y aprovechamos la función de Octave all(). La comprobación lógica al comparar dos matrices 6x6 da una matriz 6x6 llena de unos si las matrices comparadas son iguales. Solo entonces al aplicar la función all dos veces se llega a obtener el valor 1, mientras que si las matrices comparadas no son exactamente iguales, al final obtendriamos un 0.

Qué bonito representar nuestros abstractos e,a,b,c, f,g con matrices que les "siguen el rollo" de la ley de grupo. Por un lado la Representación Regular es una de una infinidad de representaciones posibles del grupo  con conjuntos de matrices.

Por otro lado, la Representación Regular es la Madre de Todas las Representaciones, pues la Representación Regular contiene todas las posibles Representaciones Irreducibles (R.I.), los bloques elementales en base a los cuales puede descomponerse cualquier representación del grupo. Además contiene cada R.I. repetida tantas veces como la dimensión de la R.I., el número de filas o columnas de las matrices que forman la R.I.

Nuestro pequeño y manejable grupo S3 tiene 3 representaciones irreducibles, dos de ellas de dimensión 1 ("matrices" 1x1, es decir, números), y otra de dimensión 2 (de matrices 2x2).

La primera es común a todo grupo, y se llama trivial con razón, pues se hace corresponder a cada elemento del grupo el mismo entero 1. La segunda es la que asigna 1 a las permutaciones pares (e,f y g) y -1 a las impares (a,b y c). Ambos casos son ejemplos de homomorfismo entre S3 y un conjunto de matrices. La ley de grupo se preserva estructuralmente, pero perdiendo detalle, al asociar a elementos diferentes de Sun mismo elemento del grupo de matrices. La tercera R.I. de S3 es sin embargo fiel o exacta, cada una de sus 6 matrices es diferente y forma un grupo isomorfo a S3. La elección de matrices de esta R.I. no es única, pero es conveniente usar matrices unitarias, como estas:

Con Octave definimos las 6 matrices que ponemos en un cell array para accederlas más convenientemente, y comprobar que en efecto se multiplican como debe ser. En la comprobación hay que hacer un "apaño" para tener en cuenta el error de redondeo al tratar con valores decimales y no enteros como antes.

# Representaciones Irreducibles (R.I.) de S3 :
# R.I. 1, de dimension 1, la trivial, unidad o simetrica, a todo elemento de S3 se le hace corresponder un 1
U1 = { 1 , 1 , 1 , 1 , 1 , 1};
# R.I. 2, de dimension 1, la de signo o antisimetrica, se asocia 1 a las 3 permutaciones pares, y -1 a las 3 impares
U2 = { 1 , -1 , -1 , -1 , 1 , 1};
# R.I. 3, de dimension 2, exacta o fiel. Sus matrices unitarias se definen a continuacion. 
um=0.5; # 1/2 un medio
mr=0.5*sqrt(3); #  1/2 por la raiz de 3
U3_1=[  1  0 ;  0   1];
U3_2=[  1  0 ;  0  -1];
U3_3=[-um  mr; mr  um];
U3_4=[-um -mr;-mr  um];
U3_5=[-um  mr;-mr -um];
U3_6=[-um -mr; mr -um];
U3 = {U3_1, U3_2, U3_3, U3_4, U3_5, U3_6};
# Comprobacion de la ley de grupo
# Como las entradas no son enteras hay que tener en cuenta el error de redondeo, 
# de ahí usar la resta y la desigualdad
numok=0
for i = 1:6
   for j = 1:6
      numok = numok + all(all( U3{i}*U3{j}-U3{Cayley(i,j)} < ones(2,2)*0.00001 )) ;
   endfor
endfor
numok  # debe ser 36, 1 por cada producto correcto
# comprobacion de la unitariedad. 
numok=0
for i = 1:6
   numok = numok + all(all( U3{i}*(U3{i}') - eye(2) < ones(2,2)*0.00001 )) ;
endfor
numok  # debe ser 6, 1 por cada matriz unitaria, o elemento del grupo

Las 6 matrices originales de la Representación Regular tienen sus unos repartidos por todas las filas y columnas. Son la expresión de 6 operadores lineales en una base concreta de un espacio vectorial de dimensión 6. Como tal espacio vectorial podemos tomar el constituido por todas las combinaciones lineales (con coeficientes ccomplejos, por ejemplo) de los elementos del grupo, considerados estos como vectores linealmente independientes que generan el espacio vectorial:

VG = { c1 g1 + c2 g2 + c3 g3 + c4 g4 + c5 g5 + c6 g6 }

Además de tener así un espacio vectorial, se tiene el llamado álgebra de grupo, pues además de la suma de vectores se define el producto de dos vectores en base al producto de grupo, extendido linealmente a todo elemento del espacio vectorial:

ici gi).(Σjdj gj) = ΣiΣj cidj gi.gj

Por tanto un g ∈ G puede considerarse según las circunstancias como un elemento del grupo, un vector del espacio vectorial, o un elemento del álgebra, que a la vez puede considerarse como un operador lineal, el de la acción por la izquierda, cuya matriz es la asociada a ese mismo elemento en la Representación Regular. Por tanto la Representación Regular esta definida, respecto a la base inicial de los elementos del grupo, de coordenadas g1=(1 0 0 0 0 0)T, ..., g6=(0 0 0 0 0 1) , por las matrices


Vamos a encontrar otra base final, respecto a la cual las matrices de esos 6 operadores tengan la forma diagonal por cajas correspondiente a las diferentes R.I. Esta segunda base expresa directamente la descomposición del espacio vectorial 6-dimensional como suma directa de un subespacio 1-dimensional  que corresponde a la R.I. 1, otro subespacio 1-dimensional  que corresponde a R.I. 2, y un subespacio 4-dimensional  que corresponde a dos copias de la R.I. 3, por lo que se desglosará en dos subespacios 2-dimensionales. La forma de obtener los vectores (o funciones en la jerga más fisico-mecano-cuantica) de esta segunda base es emplear unos operadores muy especiales, que nos ayudan a "proyectar" sobre cada uno de los 4 subespacios mencionados.

To be continued ...

martes, 7 de septiembre de 2010

qué grupo el ese tres

Una de las estructuras matemáticas más interesantes es la de grupo. La matemática es como un prestidigitador, capaz de empezar con apenas nada y sacar de la chistera más y más sorpresas.  Empecemos por ejemplo con un conjunto X = {1,2,3} de tres "cosas" distintas, que designamos por los símbolos 1, 2 y 3 por conveniencia, aunque podriamos poner {a,b,c} o {♠,♣,♥}. A partir de ahí podemos averiguar todas las permutaciones posibles, las transformaciones o aplicaciones biyectivas de X → X. La más sencilla es la identidad, Id(a)=a ∀ a ∈ X. Para un conjunto de 3 elementos es accesible enumerar explícitamente todas las permutaciones posibles, pues son sólo 6:

  • 1 → 1; 2 → 2; 3 → 3 , la identidad Id : (1)(2)(3)
  • 1 → 2; 2 → 1; 3 → 3 : (12)(3)
  • 1 → 1; 2 → 3; 3 → 2 : (1)(23)
  • 1 → 3; 2 → 2; 3 → 1 : (13)(2)
  • 1 → 2; 2 → 3; 3 → 1 : (123)
  • 1 → 3; 2 → 1; 3 → 2 : (321)

    La representación directa con flechas se suele sustituir por otras dos notaciones estándar. Una opción es usar dos filas encerradas entre paréntesis; en la fila superior se colocan ordenados los elementos origen (en nuestro caso 1, 2 y 3) y en la fila inferior, justo debajo de cada uno de los anteriores, su imagen por la permutación.

    Otra opción es usar la notación de ciclos, parecida a la indicada arriba, empleando una sola fila y agrupando entre paréntesis los elementos relacionados cíclicamente. En el ejemplo de la segunda fila (12) indica el ciclo 1 → 2 y 2 → 1. En la práctica se omiten los paréntesis con un único elemento, como (3) para representar 3 → 3, que se dan por supuestos. La base de esta notación es que toda permutación puede expresarse como producto de ciclos. En nuestro ejemplo tan sencillo con las 6 permutaciones usaremos esa notación de ciclos y también unas letras casi arbitrarias ( e es la letra fetén para designar al elemento neutro), como sigue :

    e = Id
    a = (12)
    b = (23)
    c = (31)
    f = (123)
    g = (321)

    Hay que tener en cuenta que (123) y (231) y (312) representan exactamente lo mismo, la permutación que designamos por f, o en la notación explícita de arriba por
    1 → 2; 2 → 3; 3 → 1

    Es cuestión de imaginar flechas desde cada elemento al siguiente, y desde el último hasta el primero, para completar el ciclo.

    Mientras que el conjunto X de partida, de 3 elementos, tenía un nombre arbitrario, al conjunto de sus permutaciones se le designa mediante S3. En general Sn es el grupo de permutaciones,o grupo simétrico, sobre un conjunto de n elementos. Ya se vé como crece la cosa, partimos de X con 3 elementos y sacamos S3 que tiene 6 elementos. En general, Sn tiene n! elementos.

    Además mientras que los elementos de X son "cosas" amorfas, los de Sn son aplicaciones biyectivas, que pueden componerse, y con la operación de "composición de aplicaciones" resulta que Sn tiene estructura de grupo. ¡Y qué grupo!, pues como demostró Cayley, todo grupo finito G es isomorfo a un subgrupo de Sn , con n el orden (número de elementos) de G.

    La composición o producto de los elementos de S3 se expresa comodamente mediante la tabla de Cayley



    Por ejemplo, la composición de aplicaciones de hacer primero la (31) y después la (23) se designa por (23)º(31), o simplemente por (23)(31), y es igual a (123). Los colores de la figura indican la forma de encontrar el producto, buscando el primer factor (el de la derecha) en la fila superior, el segundo factor (el de la izquierda) en la columna de la izquierda, y mirando la celda de cruce de la columna del primer factor y la fila del segundo.

    Esa tabla de multiplicación es la que determina la particular estructura algebraica de grupo de S3. Se obtiene de un caso concreto, el estudio de las permutaciones de un conjunto de tres elementos. Pero desde un punto de vista abstracto, esa tabla puede escribirse con símbolos cualesquiera, sin un significado intrínseco, idea que se recoge en la figura de más abajo.

    ¿Es el grupo S3 "simple", o puede verse de alguna forma como compuesto? La respuesta la da el concepto de subgrupo normal N de un grupo G, aquel subconjunto no trivial de G que conserva la estructura de grupo y que en cierto modo permite obtener un grupo cociente G/N.

    En el caso de S3 podemos encontrar, aparte de los triviales {e} y {e,a,b,c,f,g}, los 4 subgrupos no triviales siguientes: {e,a}, {e,b}, {e,c}, {e,f,g}.

    Resulta que el único subgrupo normal es el último, N={e,f,g}, que es isomorfo al grupo cíclico C3. El grupo cociente S3/N es isomorfo al grupo cíclico C2. De modo que podriamos poner

    S3/C3 ≈ C2

    que gráficamente puede expresarse con las tablas de Cayley así



    Los elementos e,f, y g del subgrupo normal (de color naranja en la figura), al multiplicarse entre ellos dan siempre otro elemento del mismo subgrupo: hacen como conjunto o clase el papel de elemento neutro. Los tres elementos restantes de S3, a,b y c (de color amarillo en la figura),  hacen el papel del elemento inversión de C2, pues al multiplicarse entre sí dan un elemento de N, y al multiplicarse por un elemento de N dan otro elemento de {a,b,c}. Es decir, S3 se particiona en dos clases disjuntas E = {e,f,g} e I = {a,b,c}, sobre las que se puede definir la operación de grupo a partir de la tabla de S3, dando lugar a una tabla como la de C2:

    {E,I} ≈ C2.

    Esto es el grupo cociente G/N: sus elementos son clases de equivalencia en que N particiona a G, y en las que surge una estructura de grupo directamente a partir de la que tiene G. La clase de equivalencia que tiene el papel de elemento neutro es la constituida por el propio subgrupo normal N.

    A un grupo normal también se le llama invariante, y esta es una faceta muy penetrante del significado de grupo normal. ¿Invariante respecto a qué? Repecto a todas las conjugaciones del grupo, que son las que encarnan la simetría de la ley de grupo. Una conjugación, o automorfismo interior, de G es una aplicación biyectiva τu : G → G de la forma

    τu(v) = u v u-1

    que preserva la ley de grupo, pues τu(v w) = u v w u-1 = u v u-1 u w u-1 = τu(v) τu(w).

    En los grupos abelianos la única conjugación existente es la identidad, y todo subgrupo es invariante, es decir, normal. En este caso la "normalidad" es la norma, multiplicar por la izquierda es lo mismo que multiplicar por la derecha, el orden de los factores no altera el producto.


    En el caso de los grupos no abelianos, la falta de conmutatitividad hace diferente izquierda y derecha e importante el orden de los factores, pero no obstante puede subyacer cierta simetría, plasmada en el conjunto de conjugaciones, que permita recuperar en ciertos casos la "normalidad" a pesar de la "no conmutatividad".

    Enumeremos las conjugaciones en el caso del grupo S3 dando las imagenes de los elementos e,a,b,c,f y g en este orden:

    τe : e , a , b , c , f , g .              τe = Id
    τa : e , a , c , b , g , f .              τa = (bc)(fg)
    τb : e , c , b , a , g , f .              τb = (ac)(fg)
    τc : e , b , a , c , g , f .              τc = (ab)(fg)
    τf : e , b , c , a , f , g .              τf = (abc)
    τg : e , c , a , b , f , g .              τg = (cba)

    A la vista de lo anterior, observamos que todas las conjugaciones transforman e en e, algo nada raro dada su condición de elemento neutro. Pero tambien observamos que transforman entre sí los elementos de {a,b,c}, y entre sí también los elementos de {f,g}. La simetría apreciable en la tabla de multiplicación de S3, se hace patente con la expresión de las conjugaciones como ciclos: mantenemos la estructura, la LEY del grupo S3, si al intercambiar cualesquiera dos de a,b, o c, a la vez intercambiamos f con g; o si "hacemos circular" a la vez a, b y c un paso a la izquierda o la derecha, dejando quietos f y g.

    El conjunto de conjugaciones divide a S3 en las tres clases de equivalencia por conjugación {e}, {a,b,c} y {f,g}. Sólo el subgrupo {e,f,g} permanece invariante por la acción de todas las conjugaciones, pues contiene por entero a clases de equivalencia por conjugación, en concreto a {e} y {f,g}. Sin embargo un subgrupo como {e,a} contiene a {e}, pero no la clase completa {a,b,c}, y no es invariante por la acción de todas las conjugaciones. Por ejemplo τb transforma el subgrupo {e,a} en el subgrupo {e,c}. Cada subgrupo {e,a}, {e,b} y {e,c} se queda "pequeño" para aprovechar la simetría subyacente plasmada por las conjugaciones, y vencer la no conmutatividad.

    El efecto de la no conmutatividad no superada por los tres subgrupos pequeños se ve tambien al tratar las clases adjuntas o contiguas por la izquierda y por la derecha respecto a un subgrupo.

    Consideremos el subgrupo A={e,a}. Multiplicando cada elemento de A por cada elemento del grupo
    S3 por la izquierda obtenemos las clases por la izquierda de S3 respecto a A:
    eA = {e,a}; aA ={a,e }; bA={b,f}; cA={c,g}; fA={f,b}; gA={g,c}

    Vemos que eA=aA, bA=fA, y cA=gA. Hay tres clases por la izquierda respecto a A: {e,a}, {b,f} y {c,g}.

    Algo similar puede hacerse pero "por la derecha" :
    Ae={e,a}; Aa={a,e}; Ab={b,g}; Ac={c,f}; Af={f,c}; Ag={g,b}

    Tenemos tres clases por la derecha respecto a A: {e,a}, {b,g} y {c,f}.

    Vemos que no coinciden con las anteriores por la izquierda, y de hecho bA ≠ Ab, cA ≠ Ac, fA ≠ Af, gA ≠ Ag.

    Podriamos decir que la no conmutatividad ha podido con el grupo A, e impedido hacer a partir de él un cociente.

    Sin embargo en el caso del subgrupo normal N={e,f,g} tenemos

    eN={e,f,g}; aN={a,c,b}; bN={b,a,c}; cN={c,b,a}; fN={f,g,e}; gN={g,e,f}

    luego hay sólo dos clases por la izquierda, {a,b,c} y {e,f,g}.

    Y por el otro lado:

    Ne={e,f,g}; Na={a,c,b}; Nb={b,a,c}; Nc={c,b,a}; Nf={f,g,e}; Ng={g,e,f}

    de modo que las clases por la derecha coinciden plenamente con las clases por la izquierda.

    Puede definirse una operación de grupo sobre las clases E={e,f,g} e I={a,b,c} en base a multiplicar cualquier representante y tomar la clase del elemento producto como la clase resultado. Por ejemplo EI es igual a I, pues fa = b ∈ I. Puede elegirse cualquier representante de E y de I y el resultado no varía, no depende del representante elegido. Esto no era posible en el caso del subgrupo A={e,a}.

    Las clases por la izquierda y por la derecha respecto a cualquier subgrupo pueden verse como las imagenes de ese subgrupo por el conjunto de traslaciones por la izquierda y por la derecha.

    Una traslación o desplazamiento por la izquierda en el grupo es una aplicación biyectiva
    γu: G →G , γu(v) = u v

    Una traslación o desplazamiento por la derecha en el grupo es una aplicación biyectiva
    δu: G →G , δu(v) = v u

    Cada elemento de G lleva asociada una traslación por la izquierda (y por la derecha) distinta. Ese conjunto de traslaciones por izquierda y derecha son biyecciones, aunque no automorfismos (salvo la identidad), pues no preservan la ley de grupo. Para los grupos abelianos γu = δu , igualdad que no se da en los no abelianos. En estos las conjugaciones nos agrupan en clases los elementos que en cierto modo restringido "casi" conmutan. Si τu(v) = u v u-1 = w , es que u v = w u. No conmutan u y v, pero al cambiarles de lado podemos encontrar un w "amigo" de v que nos consiga el mismo producto. Por aquí se ve la equivalencia plena entre la invariancia de un subgrupo, y el que las clases por la izquierda y por la derecha respecto a ese subgrupo coincidan.

    Empezando con un conjunto X de 3 "cosas", pasamos a un ente más estructurado, S3, con 6 elementos que ya no son meras "cosas" sino aplicaciones con una estructura interna que se estudia empleando varios conjuntos de aplicaciones biyectivas γu, δu, τu definidas sobre S3, de modo que ellas son elementos de... S6, el grupo de permutaciones de 6 elementos. S6 tiene 6!=720 elementos. De todas esas 720 biyecciones, ¿cuantos son automorfismos? En general los automorfismos de un grupo dado forman otro grupo que tiene como subgrupo normal el grupo de todo los automorfismos interiores, y el grupo cociente de ambos es el  grupo de los automorfismos exteriores. En el caso de S3 todos los automorfismos posibles son interiores, luego el grupo cociente de los automorfismos exteriores es trivial (isomorfo a {e}),  como lo es el centro, por todo lo cual S3 es completo, como esta entrada.