La seudoesfera es la superficie de revolución obtenida al girar \(360º\) la tractriz en torno a su asíntota. Es como una esfera, en cuanto a que en todos sus puntos la curvatura total es la misma, pero en vez de ser positiva es negativa, y en magnitud también es igual a la inversa del cuadrado del radio. Siguiendo con el símil, los meridianos en la esfera (que se genera también por la rotación de uno de ellos) son como las sucesivas posiciones de la tractriz. Y los paralelos, secciones perpendiculares al eje de giro, son por supuesto círculos tanto en la esfera como en la seudoesfera.
Igual que de la superficie esférica hacemos mapas, para representar en una hoja bien plana un terreno situado sobre el globo terráqueo, también con la seudoesfera podemos hacer algo similar. Vamos a representar en un plano \(x_S,y_S\) los puntos de la seudoesfera. Los paralelos van a aparecer horizontales, paralelos al eje \(x_S\). Los meridianos van a aparecer verticales, paralelos al eje \(y_S\). Para que el mapa sea útil, debemos saber deducir la distancia entre dos puntos medida sobre una curva en la seudoesfera a partir de mediciones sobre el mapa, aplicando las escalas y ajustes adecuados, lo que se llama técnicamente la métrica.
Al representar los meridianos como semirrectas verticales, la coordenada \(y_S\) será función de la distancia \(\sigma\), medida sobre un meridiano desde la base de la seudoesfera, \(y_S=y_S(\sigma)\).
Si todos los paralelos en el mapa se representam como segmentos paralelos al eje \(x_S\), entre por ejemplo \(x_S=-\pi\) y \(x_S=\pi\), al medir en el mapa lo que supone una vuelta completa sobre el paralelo, siempre medirá \(2\pi\). Pero la medida real sobre la seudoesfera depende de en qué paralelo se esté, luego el factor de ajuste dependerá de la coordenada \(y_S\) en el mapa, y de \(\sigma\). Será una función \(f(\sigma)\). Para un desplazamiento sobre un paralelo \(ds_{paralelo} = f(\sigma) dx_S\).
Para un desplazamiento sobre un meridiano, una tractriz generadora, \(ds_{meridiano} = g(\sigma) dy_S\), el factor correctivo a aplicar dependerá de \(y_S\) y \(\sigma\), pero no puede depender de \(x_S\), dada la simetría axial de la superficie y que esta coordenada del mapa refleja el cambio sobre un paralelo.
¿Cómo determinar \(f(\sigma)\)? La longitud de un paralelo cuyo radio sea \(X=X_T\) será \(2\pi X_T\), o para un arco infinitesimal \(ds_{paralelo} = dx_S X_T \). Vamos, que \(f(\sigma)=X_T\). No olvidemos que \(x_S\) es una coordenada del mapa, pero \(X_T\) es una coordenada de la superficie. Aunque simple, no parece prometedor, pero resulta que \(X_T\) se expresa en términos de la distancia \(\sigma\), medida sobre un meridiano desde la base de la seudoesfera. Tomando la tractriz \((X,Y)=(1/ \cosh(t), t-\tanh(t) )\):
\begin{equation*}
\begin{aligned}
\sigma & = \int_{(1,0)}^{(X_T,Y_T)} \sqrt{dX^2+dY^2} \\
& = \int_0^{t_T} \tanh(t) dt \\
& = \ln ( \cosh(t_T) ) = \ln ( 1 / X_T ) = - \ln (X_T)
\end{aligned}
\end{equation*}
es decir, \(X_T= e^{-\sigma}\), con lo que \(f(\sigma)=e^{-\sigma}\).
A la misma relación entre \(X_T\) y \(\sigma\) se llega de forma más geométrica (como se hace en el magnífico Visual Complex Analysis, de Tristan Needham) con los triángulos semejantes de la siguiente figura, donde aparece explícitamente \(R\), el radio de la seudoesfera.
¿Cual es la relación entre \(y_S\) y \(\sigma\)? Tenemos libertad de elegirla un tanto arbitrariamente, pero para simplificar la métrica nos interesa que \(g\) sea la misma función que \(f\), con lo que
\[
d\sigma=g(\sigma) dy_S= e^{-\sigma} dy_S
\]
\[
dy_S = e^{\sigma} d\sigma
\]
\[
y_S = e^{\sigma} + \text{Cte.}
\]
Si elegimos anular la constante, la base de la seudoesfera corresponde en el mapa a \(y_S=1\). Tenemos que \(y_S=e^{\sigma}\), luego \(f(\sigma)\equiv g(\sigma)=e^{-\sigma}=1/y_S\) y la métrica queda
\[
ds = \sqrt{ ds^2_{paralelo} + ds^2_{meridiano} } = \frac{\sqrt{dx_S^2+dy_S^2}}{y_S}
\]
La gran ventaja de esta elección es que nuestro mapa representa a la seudoesfera de manera conforme: los ángulos entre segmentos infinitesimales en el plano son iguales a los ángulos sobre la seudoesfera. El factor de paso de las medidas del mapa a la superficie, en lo pequeño, no depende de la dirección.
Estupendo, ya tenemos un mapa de la seudoesfera, esa superficie de curvatura negativa constante, igual a \(-1\) para radio unidad. El trozo de plano euclideo \(x_S,y_S\) que ocupa el mapa es una franja infinita en altura (desde \(y_S=1\) hasta \(\infty\)), y comprendida entre \(x_S=-\pi\) y \(x_S=\pi\). Y ahora el gran pase mágico. Ampliamos nuestro mapa, a izquierda y derecha sin límites, y hacia abajo hasta \(y_S=0\) sin llegar a incluir el eje de abcisas, y declaramos que sigue aplicandose la misma expresión de la métrica. Entonces resulta que este semiplano \(y_S > 0\) con la métrica
\[
ds = \frac{\sqrt{dx_S^2+dy_S^2}}{y_S}
\]
es un mapa completo del plano hiperbólico de Lobachevsky, Bolyai y Gauss, llamado el modelo del semiplano, atribuido a veces a Poincaré, aunque empleado antes por Beltrami.
No hay forma, según Hilbert, de obtener en el espacio tridimensional una superficie suave que tenga como geometría intrínseca la del plano hiperbólico. Pero para entender y expresar los resultados de esa geometría no hace falta tal superficie, basta con el mapa. Pues el mapa no es el territorio pero expresa fielmente sus propiedades geométricas.
La ampliación del mapa de la seudoesfera a lo ancho equivale a considerar en vez de una superficie cerrada sobre sí, cual cilindro como es la seudoesfera, una superficie que la recubre infinitamente. Y la ampliación en vertical más allá del borde base de la seudoesfera, hacia abajo hasta \(y_S=0\), que en el mapa es poca cosa, supone una distancia infinita debido a la forma de la métrica. Cuanto más cerca de \(y_S=0\) estamos, un mismo trocito en el mapa equivale a más y más longitud real en el plano hiperbólico. La franja horizontal entre \(0\) y \(1\) en el mapa representa una extensión de plano hiperbólico tan infinita como el resto del semiplano del mapa. Es la magia de lo infinito y de lo infinitésimo.
tránsito
miércoles, 28 de mayo de 2014
martes, 27 de mayo de 2014
La tractriz y la catenaria
La tractriz puede definirse como la curva que traza un extremo de una barra de longitud fija (radio de la tractriz), inicialmente perpendicular a un eje, al ser arrastrado cuando el otro extremo se desplaza sobre el eje, de modo que la barra siempre es tangente a la curva. En una versión más coloquial la tractriz la traza un perro arrastrado mediante una correa tensa e inextensible por su amo, que camina en perpendicular a la posición inicial de la correa.
La catenaria en su forma más habitual y sencilla se presenta, con la forma de cadena colgante, como la curva coseno hiperbólico \(y(x)=\cosh(x)\), que en forma paramétrica es \((x,y)=(t, \cosh(t))\). Pero en nuestro caso, para estudiar su relación con la tractriz dibujada con el eje vertical, vamos a usar la catenaria "tumbada" hacia la derecha, es decir, la curva expresada en forma paramétrica como \((x,y)=(\cosh(t), t)\).
La catenaria es la evoluta de la tractriz: la envolvente de las rectas normales a la tractriz, el lugar geométrico de los centros de curvatura de la tractriz.
Imaginemos un hilo inextensible con un extremo sujeto a la catenaria lejos en la parte superior derecha, tensado sobre la catenaria de modo que el otro extremo está en el vértice \((1,0)\). Si desenrollamos el hilo gradualmente manteniéndole siempre tenso, el extremo libre describe precisamente la curva tractriz, que por eso es la involuta, o evolvente, de la catenaria.
Desde el extremo libre el hilo va recto hasta contactar tangencialmente con la catenaria. El segmento del hilo entre la tractriz y el punto de tangencia a la catenaria tiene una longitud igual a la de la catenaria desde ese punto de tangencia hasta el vértice. Esa longitud es a la vez la medida del radio de curvatura de la tractriz en el punto en que se encuentra el extremo libre del hilo, y el segmento es normal a la tractriz en ese punto. Las sucesivas posiciones del segmento describen las tangentes a la catenaria que, como hemos dicho, la envuelven.
Así de simple. Y estas relaciones geométricas se plasman en otras analíticas que demuestran que la tractriz cumple la otra definición como "curva del perro"; que nos dan una expresión paramétrica para la tractriz; y también que la curvatura de la superficie de revolución generada por la tractriz, la seudoesfera, es constante.
Refiriéndonos a esta otra figura, \(CTE\) es tangente a la catenaria en el punto \(C(x_C,y_C)\), el punto \(T(x_T,y_T)\) de la tractriz es el extremo libre del hilo desenrrollado, y el punto \(E(x_E,y_E)\) es el de corte de la tangente con el eje \(y\), asíntota de la tractriz.
Primero veamos que \(CT=1/ET\), recordando que \(\cosh^2(t) - \sinh^2(t) = 1\), y las derivadas de funciones hiperbólicas. Por un lado \(CT\) es igual a la longitud de la catenaria entre \((1,0)\) y \(C: (\cosh(t),t)\)
\begin{equation*}
\begin{aligned}
CT & = \int_0^{x_C} \sqrt{1+\left( \frac{dy}{dx}\right)^2} \ dx \\
& = \int_0^{t_C} \sqrt{1+\frac{1}{\sinh^2(t)}} \ \sinh(t) dt \\
& =\int_0^{t_C} \sqrt{\sinh^2(t) +1 } \ dt = \int_0^{t_C} \cosh(t) dt \\
& = \sinh(t_C)
\end{aligned}
\end{equation*}
Por otro lado podemos calcular \(CE\) al conocer las coordenadas de sus puntos extremos. \(C:(x_C,y_C)=(\cosh(t_C),t_C)\) . La tangente \(CTE\) tiene como pendiente \(dy/dx = 1 / \sinh(t_C)\). La ecuación de la recta \(CTE\) es
\[
\frac{y - y_C}{x -x_C} = \frac{1}{\sinh(t_C)}
\]
Para el punto \(E\), por tanto para \(x=0\), resulta que
\[
y_E=y_C-\frac{x_C}{\sinh(t_C)} = t_C - \frac{\cosh(t_C)}{\sinh(t_C)}
\]
\[
CE=\sqrt{x_C^2 + (y_C-y_E)^2} = \frac{\cosh^2(t_C)}{\sinh(t_C)}
\]
\[
ET= CE - CT = \frac{\cosh^2(t_C)}{\sinh(t_C)} - \sinh(t_C) =
\frac{\cosh^2(t_C)-\sinh^2(t_C)}{\sinh(t_C)} = \frac{1}{\sinh(t_C)}=\frac{1}{CT}
\]
Esta es la justificación de que la superficie de revolución generada por la tractriz al girar entorno al eje \(y\), la seudoesfera, tenga curvatura constante. Pues \(CT\) es uno de los radios de curvatura principales, el de la propia tractriz en el plano del dibujo. Y \(ET\) es el otro radio de curvatura principal, en una sección perpendicular al plano del dibujo. El producto de ambos radios de curvatura principales es constante, independiente del punto \(T\) de la seudoesfera. En el caso contemplado aquí el producto es igual a \(1\) al haber elegido la tractriz de radio unidad.
La ecuación de la tangente \(CTE\) también la satisface el punto \(T\) de la tractriz,
\[
\frac{y_C - y_T}{x_C -x_T} = \frac{1}{\sinh(t_C)}
\]
junto otra condición:
\[
CT^2 = (x_C-x_T)^2+(y_C-y_T)^2 = \sinh^2(t_C)
\]
Usando la primera para eliminar \(y_T\) en la segunda, de esta se obtiene que \(x_T=1/\cosh(t_C)\), y entonces volviendo a la primera, resulta que \(y_T=t_C - \tanh(t_C)\). Obtenemos así una ecuación paramétrica de la tractriz:
\[
(x,y)= (1/ \cosh(t), t-\tanh(t) )
\]
Y una vez tenemos que \(T:(x_T,y_T)=(1/ \cosh(t_C), t-\tanh(t_C) )\), la recta que pasa por \(T\) y es perpendicular a \(CTE\), tiene por ecuación
\[
\frac{y - y_T}{x -x_T} = - \sinh(t_C)
\]
Las coordenadas del punto \(F\), son entonces \(F:(0, y_T+x_T \sinh(t_C)\) con lo que
\[
TF = \sqrt{ (y_F - y_T)^2+x_T^2} = \sqrt{\frac{ 1 + \sinh^2(t_C) }{\cosh^2(t_C}} = 1
\]
Es decir, la evolvente (o involuta) de la catenaria en efecto es la tractriz "curva del perro".
Las figuras y las expresiones analíticas se basan en Geometry of Surfaces, de John Stillwell, capítulo 4.
Los términos evoluta, evolvente, involuta, envolvente, pueden liarnos fácilmente. En Diccionario AKAL de Matemáticas , página 324, se define
La catenaria en su forma más habitual y sencilla se presenta, con la forma de cadena colgante, como la curva coseno hiperbólico \(y(x)=\cosh(x)\), que en forma paramétrica es \((x,y)=(t, \cosh(t))\). Pero en nuestro caso, para estudiar su relación con la tractriz dibujada con el eje vertical, vamos a usar la catenaria "tumbada" hacia la derecha, es decir, la curva expresada en forma paramétrica como \((x,y)=(\cosh(t), t)\).
La catenaria es la evoluta de la tractriz: la envolvente de las rectas normales a la tractriz, el lugar geométrico de los centros de curvatura de la tractriz.
Imaginemos un hilo inextensible con un extremo sujeto a la catenaria lejos en la parte superior derecha, tensado sobre la catenaria de modo que el otro extremo está en el vértice \((1,0)\). Si desenrollamos el hilo gradualmente manteniéndole siempre tenso, el extremo libre describe precisamente la curva tractriz, que por eso es la involuta, o evolvente, de la catenaria.
Desde el extremo libre el hilo va recto hasta contactar tangencialmente con la catenaria. El segmento del hilo entre la tractriz y el punto de tangencia a la catenaria tiene una longitud igual a la de la catenaria desde ese punto de tangencia hasta el vértice. Esa longitud es a la vez la medida del radio de curvatura de la tractriz en el punto en que se encuentra el extremo libre del hilo, y el segmento es normal a la tractriz en ese punto. Las sucesivas posiciones del segmento describen las tangentes a la catenaria que, como hemos dicho, la envuelven.
Así de simple. Y estas relaciones geométricas se plasman en otras analíticas que demuestran que la tractriz cumple la otra definición como "curva del perro"; que nos dan una expresión paramétrica para la tractriz; y también que la curvatura de la superficie de revolución generada por la tractriz, la seudoesfera, es constante.
Refiriéndonos a esta otra figura, \(CTE\) es tangente a la catenaria en el punto \(C(x_C,y_C)\), el punto \(T(x_T,y_T)\) de la tractriz es el extremo libre del hilo desenrrollado, y el punto \(E(x_E,y_E)\) es el de corte de la tangente con el eje \(y\), asíntota de la tractriz.
Primero veamos que \(CT=1/ET\), recordando que \(\cosh^2(t) - \sinh^2(t) = 1\), y las derivadas de funciones hiperbólicas. Por un lado \(CT\) es igual a la longitud de la catenaria entre \((1,0)\) y \(C: (\cosh(t),t)\)
\begin{equation*}
\begin{aligned}
CT & = \int_0^{x_C} \sqrt{1+\left( \frac{dy}{dx}\right)^2} \ dx \\
& = \int_0^{t_C} \sqrt{1+\frac{1}{\sinh^2(t)}} \ \sinh(t) dt \\
& =\int_0^{t_C} \sqrt{\sinh^2(t) +1 } \ dt = \int_0^{t_C} \cosh(t) dt \\
& = \sinh(t_C)
\end{aligned}
\end{equation*}
Por otro lado podemos calcular \(CE\) al conocer las coordenadas de sus puntos extremos. \(C:(x_C,y_C)=(\cosh(t_C),t_C)\) . La tangente \(CTE\) tiene como pendiente \(dy/dx = 1 / \sinh(t_C)\). La ecuación de la recta \(CTE\) es
\[
\frac{y - y_C}{x -x_C} = \frac{1}{\sinh(t_C)}
\]
Para el punto \(E\), por tanto para \(x=0\), resulta que
\[
y_E=y_C-\frac{x_C}{\sinh(t_C)} = t_C - \frac{\cosh(t_C)}{\sinh(t_C)}
\]
\[
CE=\sqrt{x_C^2 + (y_C-y_E)^2} = \frac{\cosh^2(t_C)}{\sinh(t_C)}
\]
\[
ET= CE - CT = \frac{\cosh^2(t_C)}{\sinh(t_C)} - \sinh(t_C) =
\frac{\cosh^2(t_C)-\sinh^2(t_C)}{\sinh(t_C)} = \frac{1}{\sinh(t_C)}=\frac{1}{CT}
\]
Esta es la justificación de que la superficie de revolución generada por la tractriz al girar entorno al eje \(y\), la seudoesfera, tenga curvatura constante. Pues \(CT\) es uno de los radios de curvatura principales, el de la propia tractriz en el plano del dibujo. Y \(ET\) es el otro radio de curvatura principal, en una sección perpendicular al plano del dibujo. El producto de ambos radios de curvatura principales es constante, independiente del punto \(T\) de la seudoesfera. En el caso contemplado aquí el producto es igual a \(1\) al haber elegido la tractriz de radio unidad.
La ecuación de la tangente \(CTE\) también la satisface el punto \(T\) de la tractriz,
\[
\frac{y_C - y_T}{x_C -x_T} = \frac{1}{\sinh(t_C)}
\]
junto otra condición:
\[
CT^2 = (x_C-x_T)^2+(y_C-y_T)^2 = \sinh^2(t_C)
\]
Usando la primera para eliminar \(y_T\) en la segunda, de esta se obtiene que \(x_T=1/\cosh(t_C)\), y entonces volviendo a la primera, resulta que \(y_T=t_C - \tanh(t_C)\). Obtenemos así una ecuación paramétrica de la tractriz:
\[
(x,y)= (1/ \cosh(t), t-\tanh(t) )
\]
Y una vez tenemos que \(T:(x_T,y_T)=(1/ \cosh(t_C), t-\tanh(t_C) )\), la recta que pasa por \(T\) y es perpendicular a \(CTE\), tiene por ecuación
\[
\frac{y - y_T}{x -x_T} = - \sinh(t_C)
\]
Las coordenadas del punto \(F\), son entonces \(F:(0, y_T+x_T \sinh(t_C)\) con lo que
\[
TF = \sqrt{ (y_F - y_T)^2+x_T^2} = \sqrt{\frac{ 1 + \sinh^2(t_C) }{\cosh^2(t_C}} = 1
\]
Es decir, la evolvente (o involuta) de la catenaria en efecto es la tractriz "curva del perro".
Las figuras y las expresiones analíticas se basan en Geometry of Surfaces, de John Stillwell, capítulo 4.
Los términos evoluta, evolvente, involuta, envolvente, pueden liarnos fácilmente. En Diccionario AKAL de Matemáticas , página 324, se define
Evoluta de una curva plana - Evolvente de las normales de esta curva. Es igualmente el lugar de sus centros de curvatura. La evoluta de un círculo está reducida al centro de ese círculo.comiéndose la "n" de "Envolvente" de manera desafortunada. Una evoluta de una curva es la eNvolvente de las rectas normales a esa curva. Sin embargo una evolvente no es la envolvente, la envolvente es la evoluta. En caso de duda, se puede recordar que la catenaria es la evoluta de la tractriz, envolvente de sus normales; y la tractriz es la evolvente, o involuta, de la catenaria. Claro ¿no?
Etiquetas:
catenaria,
geometría,
matemáticas,
tractriz
lunes, 19 de mayo de 2014
EMAS Geometry 9: Fundamentos
La última parte de la obra de Klein aborda los principios, o fundamentos de la Geometría. Matemáticamente se quiere, partiendo de unas nociones y enunciados (axiomas) simples, deducir mediante el razonmaiento lógico todo el contenido de la geometría, sin emplear argumentos basados en la percepción. Más concretamente, Klein quiere deducir los teoremas de la geometría analítica, empleando el análisis desde el principio, a diferencia de la ancestral aversión de los geómetras al empleo de los números.
Una posibilidad es partir de unas nociones básicas y unos axiomas, agrupados en teoremas de conexión, teoremas de orden y propiedades de continuidad, con los que derivar lógicamente toda la geometría proyectiva del espacio. Después, desde ella, pasar a la geometría métrica al introducir el plano en el infinito y el círculo esférico imaginario. Pero aunque este sea para Klein el camino más simple, pues empieza operando con variedades lineales en el ámbito proyectivo, y sólo después en la métrica se adjunta una variedad cuadrática, reconoce su carácter abstracto y tedioso. Para la enseñanza en general es preferible otro método, que pasa a exponer.
Partimos de la noción de punto y recta, y axiomas de conexión, orden y continuidad. Respecto a los de conexión, a través de dos puntos siempre pasa una y sólo una recta, mientras que dos rectas tienen uno o ningún punto en común.
Se evita el rodeo por las proyectividades introduciendo de principio el grupo de \(\infty ^3\) movimientos en el plano, que han de definirse mediante una serie de axiomas guiados por nuestra experiencia con cuerpos rígidos. Un movimiento debe transformar todo punto en otro del espacio finito. Debe transformar toda recta en otra, sin excepciones, luego debe ser una colineación.
Dados dos puntos \(A\) y \(A'\), y rayos \(a\) y \(a'\) que pasan por tales puntos, siempre hay un único movimiento que transforma \(A\) en \(A'\) y \(a\) en \(a'\).
Es de especial relevancia que el grupo de los movimientos cuenta con un subgrupo, el de las \(\infty ^2\) traslaciones del plano. Una traslación que aplique \(A\) en \(A'\), aplica la línea que pasa por ambos puntos en sí misma. Aplicando repetidamente una traslación, un punto \(A\) se aplica sucesivamente en otros puntos \(A'\), \(A''\), etc., de la misma línea. Con las traslaciones convenientemente definidas aún no puede hablarse de coordenadas rectangulares, pero sí de coordenadas paralelas generales. Empleando dos rectas \(x\) e \(y\) que se cortan, y una traslación "unidad" según cada una de esas direcciones, el punto de intersección puede llevarse a cualquier otro de coordenadas enteras componiendo tales traslaciones unidad repetidas cierto número de veces. Pero también es factible definir las traslaciones "fraccionarias" sobre cada eje. La traslación que lleva el punto \(2\) del eje \(y\) sobre el punto \(1\) del eje \(x\) resulta que también lleva el punto \(1\) del eje \(y\) al que podemos definir como punto \(1/2\) del eje \(x\). Aunque parezca obvio, que esa traslación en efecto llegue a un punto del eje \(x\) debe asegurarse mediante un axioma de "entresidad": una línea que entre en un triángulo por un lado debe abandonarle atravesando por otro lado. Las coordenadas no se asignan midiendo segmentos, sino en base al grupo de traslaciones. Y una vez obtenidas las racionales, para conseguir las irracionales hay que emplear los axiomas de continuidad, que establecen la correspondencia única entre los puntos de una recta y los números reales. En este sentido Klein habla del trayecto (path curve) descrito por un punto \(A\) trasladado en cierta direccción, trayecto que es una línea recta. Al moverse el punto en una dirección dada recorre una línea recta, y va pasando de forma continua por los puntos de la recta en que \(A\) se aplica por las traslaciones en esa dirección.
Tras todo lo anterior se consigue relacionar todo punto del plano con su par de coordenadas numéricas. Podemos emplear el aparato analítico y expresar que toda línea recta viene dada por una ecuación de primer grado \(\alpha x + \beta y + \gamma =0\), que por ello se llama ecuación lineal.
Hasta aquí, usando el subgrupo de \(\infty ^2\) traslaciones podriamos también deducir la geometría afín y la proyectiva. En el ámbito de esta se citó el teorema de Möbius de que cada colineación es una transformación proyectiva, dada por tanto por una sustitución lineal integral o lineal fracional. Como en el caso métrico que nos ocupa los movimientos son colineaciones, pero transforman puntos finitos en puntos finitos, todo movimiento corresponderá a una sustitución lineal integral de las coordenadas \(x,y\).
Para llegar a introducir la noción de métrica y de ángulo entre líneas ya no bastan las traslaciones, hemos de usar el grupo entero de movimientos, como las rotaciones en torno a un punto \(O\) que dejan al mismo fijo. Por el axioma anterior, solo hay un movimiento que lleve un rayo \(a\) a otro \(a'\), ambos pasando por \(O\). Al igual que en las traslaciones se asumía una continuidad, y un punto trazaba un trayecto rectilíneo, las rotaciones de forma continua llevan un punto \(A\) distinto a \(O\) según un trayecto cerrado, comunmente llamado circunferencia de centro \(O\). Los segmentos \(OA\), \(OA'\), etc., para cada punto del trayecto de \(A\) por las rotaciones en torno a \(O\), son congruentes.
También la repetición de rotaciones puede establecer una escala numérica para las mismas, como pasaba con las traslaciones. Como hay una rotación que debe equivaler a la identidad, podría tomarse como unidad, pero por tradición Klein elige la rotación de ángulo recto, aquella que repetida cuatro veces equivale a la identidad. En tal caso las rotaciones se parametrizan por el intervalo desde \(0\) a \(4\).
Las traslaciones permiten llevar la escala de las rotaciones respecto a un punto \(O\) para usarla en las rotaciones respecto a otro punto \(O_1\). Para ello se emplea el carácter de grupo que tienen los movimientos. Se consigue así el equivalente a "todos los ángulos rectos son congruentes" de los elementos de Euclides.
Las rotaciones permiten llevar la escala sobre una línea \(x\) a otra \(y\) que la corte, dando sentido al concepto de distancia entre dos puntos. Y con el ángulo recto disponible, podemos emplear las coordenadas rectangulares en lugar de las coordenadas paralelas generales.
Para determinar las expresiones analíticas de las rotaciones en coordenadas rectangulares, Klein apela al conocimiento de la exponencial compleja. Por esa vía, sin apelar a noción geométrica alguna, se llega a la conveniencia de usar como escala de rotaciones no 1 para el ángulo recto, sino \(\pi/2\), con lo que una rotación de parámetro o ángulo \(\omega\) se expresa por las fórmulas habituales. Entonces, interpretando geometricamente los resultados analíticos, se deduce el teorema de pitágoras, y el significado geométrico de las funciones trigonométricas. Se tienen las expresiones analíticas de la distancia entre dos puntos, o del ángulo entre dos direcciones.
Finalmente se introduce el concepto de área, llegando a la expresión del área de un triángulo mediante el determinante con los tres pares de coordenadas, expresión con la que se empezó la obra. También trata la noción de curva plana en general, la de longitud del arco de una curva, y la de área del sector entre la curva y dos radiovectores a puntos sobre la misma.
En resumen,
Primero se parte como antes de los puntos, líneas y axiomas de conexión, orden y continuidad. En segundo lugar se introducen de principio la distancia entre dos puntos y el ángulos entre dos líneas, junto con los axiomas que permitan su medida mediante números. En tercer lugar, a falta de movimientos, se llega al primer teorema de congruencia: si dos triángulos tienen iguales dos lados y el ángulo incluido, entonces son congruentes, iguales en todas sus partes. Después puede proseguirse con la presentación tradicional del teorema de pitágoras y otros resultados.
Pero resulta necesario introducir un último axioma referido a la teoría de las paralelas. En el primer desarrollo, el carácter del grupo de traslaciones establecía las paralelas como caminos trazados a resultas de las traslaciones en la misma dirección. Pero ahora, considerando una línea \(g\) y un punto exterior \(O\), los rayos desde \(O\) a puntos distintos de \(g\) que se alejan de \(O\) en uno u otro sentido llegan a definir en el límite de alejamiento infinito dos rayos, candidatos a ser llamados "paralela a \(g\) que pasa por \(O\)". El axioma necesario viene a decir que esas dos posibiliddes son una misma y única línea, la paralela a \(g\) por \(O\).
Cita Klein los intentos, desde la antigüedad, de convertir este hecho intuitivamente cierto en teorema deducible del resto de axiomas precedentes, y que sólo en el siglo XIX se llegó a establecer que otra geometría sin ese axioma de las paralelas era posible. Artífices principales fueron Gauss, en secreto, y el ruso Lobatschefsky y el húngaro Bolyay. Pero a continuación cita Klein a otro protagonista, Riemann, y su famoso "Über die Hypothesen welche der Geometrie zugrunge liegen". Ahí Riemann cuestiona la suposición de que la línea recta haya de ser de longitud infinita, y diferencia entre los conceptos de espacio infinito y espacio ilimitado. La superficie de una esfera no es infinita, pero es ilimitada. En ella la línea recta puede ser una curva cerrada, similar al círculo. Los rayos desde un punto exterior \(O\) a los puntos de una recta tal, al alejarse por ambos lados de la cercanía de \(O\) pueden "dar la vuelta" y retornar a las cercanías de \(O\), resultando que ¡no hay paralela alguna a \(g\) pasando por \(O\)! Aparece pues con Riemann una segunda clase de geometría no euclídea, en contraste con la descubierta por Gauss, Bolyai y Lobatschefsky.
Tras lo cual Klein entra en unas breves consideraciones "filosóficas". La aparición de alternativas geometrías no euclídeas con soporte lógico igual de válido que la euclídea indica la insuficiencia de nuestra percepción para establecer la validez de un postulado como el de las paralelas.
Después entra Klein en el tratamiento matemático de la geometría no euclídea a través de la geometría proyectiva. Desde esta se había llegado a la geometría métrica adjuntando una forma cuadrática especial, \(\Phi_0=\alpha^2+\beta^2+\gamma^2\), en coordenadas de plano, y que igualada a cero representaba el círculo esférico imaginario. Las expresiones para el ángulo entre dos planos y la distancia entre dos puntos eran invariantes simultáneos de la figura dada (los dos planos o los dos puntos) y la forma \(\Phi_0\).
Pues bien, a la geometría no euclídea se llega por el mismo camino pero empleando otra forma cuadrática "próxima" a la anterior, \(\Phi =\alpha^2+\beta^2+\gamma^2- \epsilon \delta^2\), siendo \(\epsilon\) un parámetro que puede llegar a ser arbirariamente pequeño, positivo (caso no euclideo de Gauss), negativo (caso no euclideo de Riemann), o nulo (caso euclideo precedente con \(\Phi_0\)).
La adaptación para encontrar la expresión no euclídea del ángulo entre planos es bastante directa. Para la distancia no euclídea entre dos puntos hay más detalles, pero juega un papel esencial la forma \(f=\epsilon(\xi^2+\eta^2+\zeta^2) - \tau^2\).
Volviendo a la primera forma de desarrollar la geometría euclídea, basada en los movimientos, la configuración del grupo de traslaciones llevaba ya implícita el axioma euclideo de las paralelas. Pero la geometría no euclídea puede desarrollarse también así.
Pero en el caso no euclideo no hay un subgrupo de los "movimientos" que pueda jugar el papel de las traslaciones en el caso euclideo.
Concluye Klein esta parte con varias observaciones: el reconocimiento de la geometría no euclídea y su relación con otras ramas de la matemática; la necesidad de que los maestros conozcan algo sobre la geometría no euclídea, pero que esta no se incluya en la docencia normal de la escuela. Sobre la influencia de la geometría no euclídea, destaca su impulso para estudiar el papel de cada uno de los axiomas y su dependencia lógica, en especial los de continuidad, y cita como fruto ejemplar de tales esfuerzos los "Grundlagen del Geometrie" de Hilbert. Pueden desarrollarse "pseudogeometrías" discretas, prescindiendo de los axiomas de continuidad, o una geometría no arquimediana. Lejos queda con esto la pretensión de una, la geometría, acorde con nuestra percepción.
Pero Klein se opone, no obstante, a una corriente nominalista en que todo se reduzca a un juego lógico con axiomas establecidos "por capricho"
El remate final del libro aborda consideraciones sobre las matemáticas griegas y sobre su obra principal, los Elementos de Euclides. Klein discrepa con la idea general de que los griegos de la antigüedad se esmeraron en unos pocos campos de saber en los que alcanzaron los mayores logros, como el de la geometría en el caso de las matemáticas, y con la excesiva consideración por los Elementos:
No es una postura arrogante de Klein, sino tratar con justicia los Elementos. Esta obra de Euclides tiene un caracter muy específico, es un compendio o recolección pensada como una introducción, útil como preparación para los estudios filosóficos en general, interesada en construir un sistema lógico cerrado. Para tal fin Euclides prescindió de gran cantidad de conocimiento matemático existente en la época, como el referente a las cónicas sobre las que el mismo Euclides escribió una obra hoy perdida. Tampoco son representativos los Elementos de la forma de entender la matemática de los Griegos. Representa una corriente despectiva con los aspectos prácticos, o de matemática aplicada, como algo inferior. En contraste Klein cita la obra de Arquímedes y el carácter más global, incluyendo aspectos genéticos (como en el Método, los aspectos de génesis de las ideas que luego se plasman con rigor), práctivos y de cómputo, como la aproximación de \(22/7\) para \(\pi\). Como al parecer de Klein esa visión despectiva de los aspectos prácticos persiste en su tiempo, en la docencia de algunas universidades, deja clara su posición al respecto:
Tambien señala Klein algunas de las carencias de las matemáicas Griegas que se remediaron sólo con el Renacimiento: no tenían una aritmética o análisis independientes, ni fracciones decimales, ni una notación con el uso de letras, ni números negativos o imaginarios, su cálculo era geométrico, con operaciones que habían de interpretarse como segmentos u otras magnitudes geométricas y no con números.
En el repaso de los 13 libros de Euclides elogia especialmente el quinto, al parecer debido a Eudoxo, en que se establece en forma geométrica el equivalente del número real positivo, equiparable al desarrollo moderno de Dedekind.
Lo que se hace en el libro V es definir la igualdad entre dos razones \(a/b\) y \(c/d\)
de segmentos cualesquiera \(a,b,c,d\). La razón \(a/b\) la llama Euclides logos, y la igualdad de las dos razones, analogía, pero el significado de esta palabra ha sufrido una deriva, salvo en trigonometría al citar las analogías de Neper. Son agradables estos toques léxicos de Klein.
La igualdad de las razones se establece si resulta que para cualesquiera enteros \(m,n\), resulta que si \(m a > n b\) entonces \(m c > n d\), y si \(m a = n b\) entonces \(m c = n d\), y si \(m a < n b\) entonces \(m c < n d\).
Lo que no le gusta a Klein es que pueda seguirse enseñando en las escuelas esta exposición euclídea cuando los alumnos han tenido ya una presentación moderna del mismo tema, lo que puede conducir más a confusión que a otra cosa.
Los libros 7, 8 y 9 dedicados a la teoría de enteros y las fracciones racionales, en forma parcialmente geométrica, se muestra ajeno por completo al libro 5. En la actualidad, las fracciones racionales son un tipo especial de número real. El libro 10 es "especialmente tedioso y difícil de entender debido a su forma geométrica de expresión". Ya en el libro 11 empieza la estereometría, pero separada completamente de la planimetría. EL libro 12 aplica el método de exhaución. El 13 contiene la teoría de los sólidos regulares.
Con los Elementos la intención de Euclides era "la derivación lógica de todos los teoremas geométricos a partir de un conjunto de premisas establecidas de antemano". La nobleza del ideal ha dotado de una autoridad a los Elementos que hace que algunos (en Inglaterra especialmente) les consideren como insuperable exposición de los fundamentes de la geometría. Klein no discute el mérito e importancia histórica de los Elementos, pero hace un examen de los mismos desde la modernidad.
Y aquí concluye el repaso a la Geometría de La Matemática Elemental desde un punto de vista superior, de Felix Klein.
Una posibilidad es partir de unas nociones básicas y unos axiomas, agrupados en teoremas de conexión, teoremas de orden y propiedades de continuidad, con los que derivar lógicamente toda la geometría proyectiva del espacio. Después, desde ella, pasar a la geometría métrica al introducir el plano en el infinito y el círculo esférico imaginario. Pero aunque este sea para Klein el camino más simple, pues empieza operando con variedades lineales en el ámbito proyectivo, y sólo después en la métrica se adjunta una variedad cuadrática, reconoce su carácter abstracto y tedioso. Para la enseñanza en general es preferible otro método, que pasa a exponer.
Desarrollo de la geometría plana con énfasis en los Movimientos
Partimos de la noción de punto y recta, y axiomas de conexión, orden y continuidad. Respecto a los de conexión, a través de dos puntos siempre pasa una y sólo una recta, mientras que dos rectas tienen uno o ningún punto en común.
Se evita el rodeo por las proyectividades introduciendo de principio el grupo de \(\infty ^3\) movimientos en el plano, que han de definirse mediante una serie de axiomas guiados por nuestra experiencia con cuerpos rígidos. Un movimiento debe transformar todo punto en otro del espacio finito. Debe transformar toda recta en otra, sin excepciones, luego debe ser una colineación.
Dados dos puntos \(A\) y \(A'\), y rayos \(a\) y \(a'\) que pasan por tales puntos, siempre hay un único movimiento que transforma \(A\) en \(A'\) y \(a\) en \(a'\).
Es de especial relevancia que el grupo de los movimientos cuenta con un subgrupo, el de las \(\infty ^2\) traslaciones del plano. Una traslación que aplique \(A\) en \(A'\), aplica la línea que pasa por ambos puntos en sí misma. Aplicando repetidamente una traslación, un punto \(A\) se aplica sucesivamente en otros puntos \(A'\), \(A''\), etc., de la misma línea. Con las traslaciones convenientemente definidas aún no puede hablarse de coordenadas rectangulares, pero sí de coordenadas paralelas generales. Empleando dos rectas \(x\) e \(y\) que se cortan, y una traslación "unidad" según cada una de esas direcciones, el punto de intersección puede llevarse a cualquier otro de coordenadas enteras componiendo tales traslaciones unidad repetidas cierto número de veces. Pero también es factible definir las traslaciones "fraccionarias" sobre cada eje. La traslación que lleva el punto \(2\) del eje \(y\) sobre el punto \(1\) del eje \(x\) resulta que también lleva el punto \(1\) del eje \(y\) al que podemos definir como punto \(1/2\) del eje \(x\). Aunque parezca obvio, que esa traslación en efecto llegue a un punto del eje \(x\) debe asegurarse mediante un axioma de "entresidad": una línea que entre en un triángulo por un lado debe abandonarle atravesando por otro lado. Las coordenadas no se asignan midiendo segmentos, sino en base al grupo de traslaciones. Y una vez obtenidas las racionales, para conseguir las irracionales hay que emplear los axiomas de continuidad, que establecen la correspondencia única entre los puntos de una recta y los números reales. En este sentido Klein habla del trayecto (path curve) descrito por un punto \(A\) trasladado en cierta direccción, trayecto que es una línea recta. Al moverse el punto en una dirección dada recorre una línea recta, y va pasando de forma continua por los puntos de la recta en que \(A\) se aplica por las traslaciones en esa dirección.
Tras todo lo anterior se consigue relacionar todo punto del plano con su par de coordenadas numéricas. Podemos emplear el aparato analítico y expresar que toda línea recta viene dada por una ecuación de primer grado \(\alpha x + \beta y + \gamma =0\), que por ello se llama ecuación lineal.
Hasta aquí, usando el subgrupo de \(\infty ^2\) traslaciones podriamos también deducir la geometría afín y la proyectiva. En el ámbito de esta se citó el teorema de Möbius de que cada colineación es una transformación proyectiva, dada por tanto por una sustitución lineal integral o lineal fracional. Como en el caso métrico que nos ocupa los movimientos son colineaciones, pero transforman puntos finitos en puntos finitos, todo movimiento corresponderá a una sustitución lineal integral de las coordenadas \(x,y\).
Para llegar a introducir la noción de métrica y de ángulo entre líneas ya no bastan las traslaciones, hemos de usar el grupo entero de movimientos, como las rotaciones en torno a un punto \(O\) que dejan al mismo fijo. Por el axioma anterior, solo hay un movimiento que lleve un rayo \(a\) a otro \(a'\), ambos pasando por \(O\). Al igual que en las traslaciones se asumía una continuidad, y un punto trazaba un trayecto rectilíneo, las rotaciones de forma continua llevan un punto \(A\) distinto a \(O\) según un trayecto cerrado, comunmente llamado circunferencia de centro \(O\). Los segmentos \(OA\), \(OA'\), etc., para cada punto del trayecto de \(A\) por las rotaciones en torno a \(O\), son congruentes.
También la repetición de rotaciones puede establecer una escala numérica para las mismas, como pasaba con las traslaciones. Como hay una rotación que debe equivaler a la identidad, podría tomarse como unidad, pero por tradición Klein elige la rotación de ángulo recto, aquella que repetida cuatro veces equivale a la identidad. En tal caso las rotaciones se parametrizan por el intervalo desde \(0\) a \(4\).
Las traslaciones permiten llevar la escala de las rotaciones respecto a un punto \(O\) para usarla en las rotaciones respecto a otro punto \(O_1\). Para ello se emplea el carácter de grupo que tienen los movimientos. Se consigue así el equivalente a "todos los ángulos rectos son congruentes" de los elementos de Euclides.
Las rotaciones permiten llevar la escala sobre una línea \(x\) a otra \(y\) que la corte, dando sentido al concepto de distancia entre dos puntos. Y con el ángulo recto disponible, podemos emplear las coordenadas rectangulares en lugar de las coordenadas paralelas generales.
Para determinar las expresiones analíticas de las rotaciones en coordenadas rectangulares, Klein apela al conocimiento de la exponencial compleja. Por esa vía, sin apelar a noción geométrica alguna, se llega a la conveniencia de usar como escala de rotaciones no 1 para el ángulo recto, sino \(\pi/2\), con lo que una rotación de parámetro o ángulo \(\omega\) se expresa por las fórmulas habituales. Entonces, interpretando geometricamente los resultados analíticos, se deduce el teorema de pitágoras, y el significado geométrico de las funciones trigonométricas. Se tienen las expresiones analíticas de la distancia entre dos puntos, o del ángulo entre dos direcciones.
Finalmente se introduce el concepto de área, llegando a la expresión del área de un triángulo mediante el determinante con los tres pares de coordenadas, expresión con la que se empezó la obra. También trata la noción de curva plana en general, la de longitud del arco de una curva, y la de área del sector entre la curva y dos radiovectores a puntos sobre la misma.
En resumen,
este primer desarrollo de la geometría se caracteriza por situar en primer plano la existencia y la estructura de un grupo triparamétrico de movimientos, introduciendo coordenadas para hacer las subsiguientes inferencias exclusivamente dentro del campo de la aritmética.
Otro desarrollo de la geometría métrica - El rol del axioma de las paralelas
La alternativa al primer desarrollo expuesto sigue la senda empleada desde Euclides, evitando escrupulosamente usar la idea de movimiento, pues ello conllevaría usar la noción de tiempo, ajena a la geometría.Primero se parte como antes de los puntos, líneas y axiomas de conexión, orden y continuidad. En segundo lugar se introducen de principio la distancia entre dos puntos y el ángulos entre dos líneas, junto con los axiomas que permitan su medida mediante números. En tercer lugar, a falta de movimientos, se llega al primer teorema de congruencia: si dos triángulos tienen iguales dos lados y el ángulo incluido, entonces son congruentes, iguales en todas sus partes. Después puede proseguirse con la presentación tradicional del teorema de pitágoras y otros resultados.
Pero resulta necesario introducir un último axioma referido a la teoría de las paralelas. En el primer desarrollo, el carácter del grupo de traslaciones establecía las paralelas como caminos trazados a resultas de las traslaciones en la misma dirección. Pero ahora, considerando una línea \(g\) y un punto exterior \(O\), los rayos desde \(O\) a puntos distintos de \(g\) que se alejan de \(O\) en uno u otro sentido llegan a definir en el límite de alejamiento infinito dos rayos, candidatos a ser llamados "paralela a \(g\) que pasa por \(O\)". El axioma necesario viene a decir que esas dos posibiliddes son una misma y única línea, la paralela a \(g\) por \(O\).
Cita Klein los intentos, desde la antigüedad, de convertir este hecho intuitivamente cierto en teorema deducible del resto de axiomas precedentes, y que sólo en el siglo XIX se llegó a establecer que otra geometría sin ese axioma de las paralelas era posible. Artífices principales fueron Gauss, en secreto, y el ruso Lobatschefsky y el húngaro Bolyay. Pero a continuación cita Klein a otro protagonista, Riemann, y su famoso "Über die Hypothesen welche der Geometrie zugrunge liegen". Ahí Riemann cuestiona la suposición de que la línea recta haya de ser de longitud infinita, y diferencia entre los conceptos de espacio infinito y espacio ilimitado. La superficie de una esfera no es infinita, pero es ilimitada. En ella la línea recta puede ser una curva cerrada, similar al círculo. Los rayos desde un punto exterior \(O\) a los puntos de una recta tal, al alejarse por ambos lados de la cercanía de \(O\) pueden "dar la vuelta" y retornar a las cercanías de \(O\), resultando que ¡no hay paralela alguna a \(g\) pasando por \(O\)! Aparece pues con Riemann una segunda clase de geometría no euclídea, en contraste con la descubierta por Gauss, Bolyai y Lobatschefsky.
Esto puede al principio parecer paradójico, pero el matemático observa pronto aquí una relación con la teoría ordinaria de las ecuaciones cuadráticas, que apunta una mejor comprensión del asunto. De hecho, una ecuación cuadrática tiene dos raices reales diferentes, o ninguna (siendo ambas imaginarias), o bien, como caso de transición, una raíz real doble. Esto es enteramente análogo a las dos paralelas diferentes de Gauss, a la ausencia de paralelas en Riemann, y finalmente al caso de transición de una paralela contada en dos formas, como la misma posición límite, en la geometría euclídea.
Tras lo cual Klein entra en unas breves consideraciones "filosóficas". La aparición de alternativas geometrías no euclídeas con soporte lógico igual de válido que la euclídea indica la insuficiencia de nuestra percepción para establecer la validez de un postulado como el de las paralelas.
En vista del hecho de que nuestra percepción espacial está adaptada solo a una parte limitada de espacio, y solo con un limitado grado de precisión, puede obviamente ser satisfecha tanto por una de las geometrías no euclídeas como por la euclídea.
Después entra Klein en el tratamiento matemático de la geometría no euclídea a través de la geometría proyectiva. Desde esta se había llegado a la geometría métrica adjuntando una forma cuadrática especial, \(\Phi_0=\alpha^2+\beta^2+\gamma^2\), en coordenadas de plano, y que igualada a cero representaba el círculo esférico imaginario. Las expresiones para el ángulo entre dos planos y la distancia entre dos puntos eran invariantes simultáneos de la figura dada (los dos planos o los dos puntos) y la forma \(\Phi_0\).
Pues bien, a la geometría no euclídea se llega por el mismo camino pero empleando otra forma cuadrática "próxima" a la anterior, \(\Phi =\alpha^2+\beta^2+\gamma^2- \epsilon \delta^2\), siendo \(\epsilon\) un parámetro que puede llegar a ser arbirariamente pequeño, positivo (caso no euclideo de Gauss), negativo (caso no euclideo de Riemann), o nulo (caso euclideo precedente con \(\Phi_0\)).
La adaptación para encontrar la expresión no euclídea del ángulo entre planos es bastante directa. Para la distancia no euclídea entre dos puntos hay más detalles, pero juega un papel esencial la forma \(f=\epsilon(\xi^2+\eta^2+\zeta^2) - \tau^2\).
Si buscamos el significado geométrico de la forma \(f\), y de las expresiones analíticas alcanzadas, resulta que tenemos, para \(\epsilon>0\), la geometría no euclídea de la primera clase, para \(\epsilon<0\) la de la segunda clase, y para \(\epsilon=0\) por supuesto la geometría euclídea. Desde luego no puedo dar aquí el argumento completo. Para ello he de referirles a mi artículo en el volumen 4 del Mathematische annalen. Entonces propuse para estas tres geometrías los nombres hiperbólica, elíptica, y parabólica, pues la existencia de dos paralelas reales, dos imaginarias, o dos coincidentes, corresponde precisamente con el comportamiento de las asíntotas de estas tres cónicas, respectivamente. Encontrará estos nombres frecuentemente en la literatura.
Volviendo a la primera forma de desarrollar la geometría euclídea, basada en los movimientos, la configuración del grupo de traslaciones llevaba ya implícita el axioma euclideo de las paralelas. Pero la geometría no euclídea puede desarrollarse también así.
Una ecuación homogénea general de segundo grado tiene diez términos y por tanto nueve constantes esenciales. En la colineación espacial más general hay quince parámetros arbitrarios, de modo que hay una sextuple infinidad de colineaciones que transforman una forma cuadrática dada, por ejemplo nuestra forma \(\Phi\), en sí misma. De hecho, esta es la condición de que las relaciones de medida que hemos introducido deban permanecer sin cambio. Así pues, también en cada geometría no euclídea hay un grupo sextuple-infinito de "movimientos" que dejan inalterados \(\omega\) y \(r\). (ángulo entre planos y distancia entre puntos)
Pero en el caso no euclideo no hay un subgrupo de los "movimientos" que pueda jugar el papel de las traslaciones en el caso euclideo.
Concluye Klein esta parte con varias observaciones: el reconocimiento de la geometría no euclídea y su relación con otras ramas de la matemática; la necesidad de que los maestros conozcan algo sobre la geometría no euclídea, pero que esta no se incluya en la docencia normal de la escuela. Sobre la influencia de la geometría no euclídea, destaca su impulso para estudiar el papel de cada uno de los axiomas y su dependencia lógica, en especial los de continuidad, y cita como fruto ejemplar de tales esfuerzos los "Grundlagen del Geometrie" de Hilbert. Pueden desarrollarse "pseudogeometrías" discretas, prescindiendo de los axiomas de continuidad, o una geometría no arquimediana. Lejos queda con esto la pretensión de una, la geometría, acorde con nuestra percepción.
Pero Klein se opone, no obstante, a una corriente nominalista en que todo se reduzca a un juego lógico con axiomas establecidos "por capricho"
Los axiomas de la geometría, de acuerdo a mi forma de pensar, no son arbitrarios, sino asertos razonables, inducidos en general por la percepción, y determinados en cuanto a su contenido preciso por su conveniencia.
El remate final del libro aborda consideraciones sobre las matemáticas griegas y sobre su obra principal, los Elementos de Euclides. Klein discrepa con la idea general de que los griegos de la antigüedad se esmeraron en unos pocos campos de saber en los que alcanzaron los mayores logros, como el de la geometría en el caso de las matemáticas, y con la excesiva consideración por los Elementos:
Los Griegos trabajaron fructíferamente no solo en geometría, sino en los más variados campos de las matemáticas; sin embargo hoy hemos ido más allá que ellos en todos los campos y ciertamente también en geometría.
No es una postura arrogante de Klein, sino tratar con justicia los Elementos. Esta obra de Euclides tiene un caracter muy específico, es un compendio o recolección pensada como una introducción, útil como preparación para los estudios filosóficos en general, interesada en construir un sistema lógico cerrado. Para tal fin Euclides prescindió de gran cantidad de conocimiento matemático existente en la época, como el referente a las cónicas sobre las que el mismo Euclides escribió una obra hoy perdida. Tampoco son representativos los Elementos de la forma de entender la matemática de los Griegos. Representa una corriente despectiva con los aspectos prácticos, o de matemática aplicada, como algo inferior. En contraste Klein cita la obra de Arquímedes y el carácter más global, incluyendo aspectos genéticos (como en el Método, los aspectos de génesis de las ideas que luego se plasman con rigor), práctivos y de cómputo, como la aproximación de \(22/7\) para \(\pi\). Como al parecer de Klein esa visión despectiva de los aspectos prácticos persiste en su tiempo, en la docencia de algunas universidades, deja clara su posición al respecto:
Debemos valorar con alta estima cualquier logro admirable, ya sea en el campo teórico o en el práctico, y debemos permitir que cada individuo se dedique a aquello a lo que sienta mayor inclinación. De esta forma cada persona se sentirá más versatil cuantos más talentos posea. Los más eminentes matemáticos, como Arquímedes, Newton, Gauss, siempre han incluido uniformemente tanto la teoría como las aplicaciones.
Tambien señala Klein algunas de las carencias de las matemáicas Griegas que se remediaron sólo con el Renacimiento: no tenían una aritmética o análisis independientes, ni fracciones decimales, ni una notación con el uso de letras, ni números negativos o imaginarios, su cálculo era geométrico, con operaciones que habían de interpretarse como segmentos u otras magnitudes geométricas y no con números.
En el repaso de los 13 libros de Euclides elogia especialmente el quinto, al parecer debido a Eudoxo, en que se establece en forma geométrica el equivalente del número real positivo, equiparable al desarrollo moderno de Dedekind.
Lo que se hace en el libro V es definir la igualdad entre dos razones \(a/b\) y \(c/d\)
de segmentos cualesquiera \(a,b,c,d\). La razón \(a/b\) la llama Euclides logos, y la igualdad de las dos razones, analogía, pero el significado de esta palabra ha sufrido una deriva, salvo en trigonometría al citar las analogías de Neper. Son agradables estos toques léxicos de Klein.
La igualdad de las razones se establece si resulta que para cualesquiera enteros \(m,n\), resulta que si \(m a > n b\) entonces \(m c > n d\), y si \(m a = n b\) entonces \(m c = n d\), y si \(m a < n b\) entonces \(m c < n d\).
Lo que no le gusta a Klein es que pueda seguirse enseñando en las escuelas esta exposición euclídea cuando los alumnos han tenido ya una presentación moderna del mismo tema, lo que puede conducir más a confusión que a otra cosa.
Los libros 7, 8 y 9 dedicados a la teoría de enteros y las fracciones racionales, en forma parcialmente geométrica, se muestra ajeno por completo al libro 5. En la actualidad, las fracciones racionales son un tipo especial de número real. El libro 10 es "especialmente tedioso y difícil de entender debido a su forma geométrica de expresión". Ya en el libro 11 empieza la estereometría, pero separada completamente de la planimetría. EL libro 12 aplica el método de exhaución. El 13 contiene la teoría de los sólidos regulares.
Con los Elementos la intención de Euclides era "la derivación lógica de todos los teoremas geométricos a partir de un conjunto de premisas establecidas de antemano". La nobleza del ideal ha dotado de una autoridad a los Elementos que hace que algunos (en Inglaterra especialmente) les consideren como insuperable exposición de los fundamentes de la geometría. Klein no discute el mérito e importancia histórica de los Elementos, pero hace un examen de los mismos desde la modernidad.
Y aquí concluye el repaso a la Geometría de La Matemática Elemental desde un punto de vista superior, de Felix Klein.
Etiquetas:
Felix Klein,
geometría,
matemáticas
EMAS Geometry 8 - Discusión sistemática
Klein presenta su visión de la estructura de la geometría, desarrollada en el famoso Erlanger Programm de 1872. Los elementos geométricos se representan por coordenadas. Se admite un cierto grupo de transformaciones que cambian las coordenadas. La geometría se ocupa de aquellas relaciones entre coordenadas que no cambian ante tales transformaciones, es la teoría de sus invariantes.
Distintos grupos de transformaciones dan lugar a distintos tipos de geometría. Los movimientos (traslaciones, rotaciones , reflexiones) dan lugar a la geometría métrica, donde tienen sentido conceptos como distancia entre puntos y ángulo entre rectas, o que una cónica tiene determinados focos y ejes principales. Con las más amplias transformaciones afines se pierde el concepto invariante de distancia, ángulo, o la distinción entre círculo y elipse; pero se mantienen conceptos como el paralelismo entre rectas, centro y diámetros conjugados de una cónica, y la clasificación de las mismas en tres clases, o la diferencia entre finito e infinito.
Más generales que las afines son las transformaciones proyectivas. Ahora desaparece toda barrera entre las cónicas, o entre lo finito y el infinito. Pero persiste la relación entre polo y polar respecto de una cónica.
Otro tipo de transformaciones como las de radios recíprocos dan lugar a una geometría en que línea y círculo, o plano y esfera, son miembros de un mismo colectivo.
Los grupos de transformaciones pueden depender de un número finito, o incluso infinito, de parámetros. En el espacio, las transformaciones proyectivas dependen de 16 coeficientes, pero como es inesencial un factor multiplicador, su grupo depende de 15 parámetros independientes; un subgrupo del anterior es el de las transformaciones afines, que depende de 12 parámetros; y un subgrupo de este es el llamado grupo principal, que depende de 7 parámetros: los movimientos comportan 6, y el cambio de escala 1.
A partir de la geometría de un grupo, imponiendo ciertas condiciones restrictivas, se obtiene la geometría de un subgrupo. Del más general grupo proyectivo se pasa al afín imponiendo que el plano en el infinito permanezca inalterado, lo que se plasma en 3 ecuaciones, que reducen el número de parámetros de 15 a 12. Y si a las transformaciones afines se les impone dejar invariante, además del plano del infinito, el círculo esférico imaginario, entonces se obtiene el grupo principal con 7 parámetros. Este círculo es una cónica con 6 constantes homogéneas, es decir, su invariancia impone 5 condiciones, que hacen pasar los parámetros "libres" de 12 a 7.
Esta forma de ver las cosas se debe a A. Cayley, en 1859, que declaró "la geometría proyectiva es toda la geometría", dado que la geometría afín y la métrica pueden presentarse como casos concretos englobables dentro del marco proyectivo. Por ejemplo, que métricamente una recta sea perpendicular a un plano se corresponde con que el punto en que la recta corta al plano en el infinito, y la recta en que el plano corta al plano en el infinito, son polo y polar respecto del círculo esférico imaginario, toma proyección.
En este punto se abre una digresión para entender cómo el principio de Cayley "hace posible una estructura sistemática completa de la geometría sobre una base analítica", gracias al desarrollo de la teoría de invariantes de las sustituciones lineales.
Tenemos unas variables \(\xi,\eta,\zeta,\tau\) , que podemos someter a sustituciones lineales generales
\begin{equation}\label{ec1p136}
\begin{aligned}
\xi' & = a_1 \xi + \ldots + d_1 \tau\\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \\
\tau' & = a_4 \xi + \ldots + d_4 \tau
\end{aligned}
\end{equation}
¿Cómo afectan estas sustituciones a posibles expresiones que dependan de uno o más conjuntos de tales variables?
Por ejemplo, pueden considerarse funciones enteras racionales homogéneas, llamadas formas. Concretamente una forma lineal se define por
\begin{equation}
\phi = \alpha \xi + \ldots + \delta \tau
\end{equation}
y una forma cuadrática por
\begin{equation}
f = A \xi^2 + \ldots + 2G\xi \tau + \ldots + K \tau^2
\end{equation}
Nos preguntamos cómo se transforman los coeficientes de tales formas al someter las variables a las sustituciones \eqref{ec1p136}. Resulta que para la forma lineal \(\phi\) tenemos que los antiguos coeficientes \(\alpha,\ldots,\delta\) se expresan en términos de los nuevos \(\alpha',\ldots,\delta'\) igual que las variables nuevas \(\xi',\ldots,\tau'\) se expresaban por \eqref{ec1p136} en términos de las variables viejas \(\xi,\ldots,\tau\), salvo por una transposición de la matriz de los coeficientes
\begin{equation}\label{ec2p137}
\begin{aligned}
\alpha & = a_1 \alpha' + \ldots + a_4 \delta' \\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \\
\delta & = d_1 \alpha' + \ldots + d_4 \delta'
\end{aligned}
\end{equation}
Esta sustitución \eqref{ec2p137} transpuesta y con los roles de nuevo y viejo cambiados se llama contragrediente de la original \eqref{ec1p136}, y se dice que los coeficientes \(\alpha,\ldots,\delta\) on contragredientes a las variables \(\xi,\ldots,\tau\). Cualquier conjunto de valores similar a estos, \(\xi_1,\ldots,\tau_1\), \(\xi_2,\ldots,\tau_2\), ... que se someta a la sustitución \eqref{ec1p136} se llaman variables cogredientes.
En cuanto a las formas cuadráticas como \(f\), al realizar la sustitución \eqref{ec1p136} a cada factor de los productos \(\xi^2,\ldots,\xi\tau,\ldots,\tau^2\) que aparecen en ellas, se obtiene una relación lineal entre estos y \(\xi'^2,\ldots,\xi'\tau',\ldots,\tau'^2\).
\begin{equation}\label{ec3p138}
\begin{aligned}
\xi'^2 & = a^2_1 \xi^2 + \ldots + 2 a_1 d_1 \xi \tau + \ldots + d^2_1 \tau^2\\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\
\xi'^2 & = a^2_1 \xi^2 + \ldots + (a_1 d_4 + a_4 d_1) \xi \tau + \ldots + d^2_1 \tau^2\\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\
\tau'^2 & = a^2_4 \xi^2 + \ldots + 2 a_4 d_4 \xi \tau + \ldots + d^2_4 \tau^2\\
\end{aligned}
\end{equation}
También hay una relación lineal, precisamente cogrediente respecto de la anterior, entre los coeficientes "viejos" \(A,\ldots,G,\ldots,K\) y los "nuevos" \(A',\ldots,G',\ldots,K'\).
Con estos prolegómenos, Klein formula así el problema general de la teoría de invariantes:
A continuación aparecen unos términos tan conocidos como potencialmente confusos
La cita esta abreviada y un tanto editada. Actualmente, si partimos de un vector \(\mathbf{v} \in V\), a sus coordenadas \(v^i\), equivalentes a las \(\xi,\ldots,\tau\), se las llama contravariantes. Una forma es un vector del espacio dual, \(\boldsymbol{\sigma} \in V^*\), y a sus coordenadas \(\sigma_i\), equivalentes a las \(\alpha,\ldots,\delta\), se las llama covariantes. Cuando se define un producto escalar en \(V\), de dimensión finita, hay un isomorfismo canónico que asocia a cada vector de \(V\) una forma de \(V^*\), y las coordenadas de ésta pueden considerarse las coordenadas covariantes \(v_i\) del vector \(\mathbf{v}\). Lo que no se ha perdido es la idea de dualidad.
Klein concreta aún más la noción de invariante, circunscribiendose a las funciones racionales de las coordenadas y los coeficientes que sean homogéneas en las coordenadas de cada punto y los coeficientes de cada forma. Entonces tal invariante puede ponerse como cociente de dos funciones enteras racionales homogéneas, que pueden no ser invariantes en sí mismas, llamándose en tal caso invariantes relativos. Cada uno de ellos, numerador y denominador, puede transformarse cual invariante, salvo por un factor, que necesariamente ha de ser una potencia del determinante \(r\) de los términos que definen la transformación \eqref{ec1p136}. Si el factor es \(r^\lambda\) el invariante es relativo de peso \(\lambda\). Para que el cociente sea un invariante absoluto, numerador y denominador deben ser invariantes relativos con el mismo peso. Los invariantes relativos más sencillos son los polinomios de menor grado posible formados con las variables. A partir de ellos pueden formarse los de grado mayor. Mediante productos y sumas de invariantes relativos de igual peso pueden deducirse nuevos invariantes. Uno de los grandes logros de Hilbert fue demostrar que para todo número finito de cantidades dadas siempre hay un "sistema completo de invariantes", finito, a partir del cual todos los demás pueden construirse racional e integralmente, es decir, mediante cocientes de polinomios. No está de más recordar la nomenclatura de Klein.
El ejemplo más sencillo descrito por Klein es el de los invariantes formados con las coordenadas \(\xi_i,\tau_i\) de \(n\) puntos en el plano. Las transformaciones a considerar son
\begin{equation*}
\begin{split}
\xi' & = a_1 \xi + d_1 \tau \\
\tau' & = a_4 \xi + d_4 \tau
\end{split}
\end{equation*}
Entonces
\begin{equation}
\Delta'_{ik} = \left\lvert
\begin{array}{lcl}
\xi'_i & \tau'_i \\
\xi'_k & \tau'_k
\end{array} \right\rvert = \left\lvert
\begin{array}{lcl}
a_1 \xi_i+ d_1 \tau_i & a_4 \xi_i+ d_4 \tau_i \\
a_1 \xi_k + d_1 \tau_k & a_4 \xi_k+d_4 \tau_k
\end{array} \right\rvert = \left\lvert
\begin{array}{lcl}
a_1 & d_1 \\
a_4 & d_4
\end{array} \right\rvert \cdot \left\lvert
\begin{array}{lcl}
\xi_i & \tau_i \\
\xi_k & \tau_k
\end{array} \right\rvert = r \Delta_{ik}
\end{equation}
Los \(n(n-1)/2\) invariantes \(\Delta_{ik}\) de peso \(1\) forman el sistema completo de invariantes. A partir de ellos cualquier invariante relativo puede ponerse como suma de términos \( C \cdot \Delta^s_{ik} \cdot \Delta^t_{lm}\) que tengan igual peso \(s+t\). Cualquier invariante absoluto puede ponerse como cociente de dos inavriantes relativos de igual peso. Un invariante absoluto bien sencillo sería por ejemplo \(\Delta_{ik} / \Delta_{lm}\).
De paso Klein nos explica qué es un syzygy, una identidad entre invariantes del sistema completo, que indica un "acoplamiento" entre invariantes. En el caso del plano, y de los invariantes formados con las coordenadas de \(4\) puntos, resulta que un syzygy es
\begin{equation}\label{ecCp141}
\Delta_{12} \Delta_{34} + \Delta_{13} \Delta_{42} +\Delta_{14} \Delta_{23} =0
\end{equation}
Si se tienen varios syzygys, pueden combinarse para dar otros, y resulta que también hay un sistema completo de los mismos a partir de los que se obtienen todos los demás. En el caso de los \(4\) puntos del plano el anterior es el único syzygy.
El "inciso invariante" cobra sentido cuando Klein aplica la teoría de invariantes a la geometría. Si se toman las variables \(\xi,\ldots,\tau\) como coordenadas rectangulares ordinarias (no homogéneas) en un espacio \(n\)-dimensional, las sustituciones lineales homogéneas \eqref{ec1p136} de la teoría de invariantes representan las transformaciones afines de tal espacio que mantienen el origen fijo. Un invariante relativo, salvo por una constante, no se altera por esas transformaciones, luego tiene un significado geométrico en la geometría afín. Recíprocamente, toda magnitud geométrica afín debe poder expresarse mediante el sistema completo de invariantes.
En el caso de dos dimensiones, el invariante relativo \(\Delta_{12}\) representa dos veces el área del triángulo determinado por el origen \(0\) y los puntos \(1,2\), lo que se denotó al principio del libro mediante \((012)\). El cociente \(\Delta_{12}/\Delta_{34}\) es un invarante absoluto, como absoluto es el carácter de la ecuación \(\Delta_{12}=0\) que indica que los tres puntos son colineales.
Para un conjunto de puntos bidimensionales \(1,2,3,4,\ldots\) el sistema completo de invariantes son los \(\Delta_{ik}\). Recordando lo visto en la primera parte, el área del polígono formado por cuatro puntos era
\begin{equation}
(1,2,3,4) = \Delta_{12} +\Delta_{23} +\Delta_{34} +\Delta_{41}
\end{equation}
ejemplo de que una carácterística geométrica se expresa polinómicamente en términos del sistema completo de invariantes. El syzygy \eqref{ecCp141} representa, geométricamente, una identidad entre las áreas de los seis triángulos formados por cuatro puntos arbitrarios y el origen, un teorema general de la geometría afín. Y todo teorema, como relación expresable entre invarientes, conllevará un syzygy. Es decir
Pero hay otra forma de interpretar las variables \(\xi,\ldots,\tau\): como \(n\) coordenadas homogéneas de un espacio proyectivo \(n-1\) dimensional. Dos transformaciones como \eqref{ec1p136} que difieran en un factor constante serán equivalentes. Como las coordenadas que interesan son los cocientes \(\xi/\tau,\ldots\), en el marco de la geometría proyectiva de entre todos los invariantes hay que considerar solo aquellos que sean homogéneos de orden cero en las variables \(\xi,\ldots,\tau\).
En el caso de dos variables \(\xi,\tau\), tenemos la recta proyectiva cuyos puntos se indican por la coordenada \(x= \xi/\tau\). Que un invariante \(\Delta_{12}\) tome un valor concreto no tiene sentido proyectivamente, salvo que se anule, lo que indica simplemente la obviedad que \(1\) y \(2\) coinciden.
Para tener un invariante numérico hay que considerar al menos cuatro puntos, para poder formar el cociente
\begin{equation}\label{ecBp146}
\frac{\Delta_{12}\Delta_{34}}{\Delta_{14}\Delta_{32}}
\end{equation}
que es homogéneo de dimensión cero en cada uno de los cuatro pares de variables \((\xi_1,\tau_1),\ldots,(\xi_4,\tau_4)\), luego es un invariante absoluto, el más simple posible, y que no es otra cosa que... ¡la razón doble!.
El syzygy fundamental \eqref{ecCp141} cobra ahora otra interpretación. Dividiendo por el último sumando y teniendo en cuenta \(\Delta_{23}=-\Delta_{32}, \Delta_{24}=-\Delta_{42}\)
\begin{equation}
\frac{\Delta_{12}\Delta_{34}}{\Delta_{14}\Delta_{32}}=1-\frac{\Delta_{13}\Delta_{24}}{\Delta_{14}\Delta_{23}}
\end{equation}
que relaciona la razón doble de \(1,2,3,4\) definida por \eqref{ecBp146} con la formada por los mismos puntos al permutar \(2\) con \(3\). Con otras formas de manipular el syzygy \eqref{ecCp141} se deducen las relaciones entre los seis valores distintos que surgen de la razón doble de cuatro puntos con todas las permutaciones posibles en su orden.
Tras indicar la relación de la teoría de invariantes con las magnitudes y teoremas de las geometrías afín y proyectiva, Klein remata con la sistematización de la geometría afín y métrica basada en el principio de Cayley:
En el caso más sencillo de la geometría afín, de entre todas las transformaciones proyectivas nos quedamos con el subgrupo que deja invariante el plano del infinito, de modo que toda transformación de dicho subgrupo siempre transforma un punto de ese plano en otro punto del mismo plano \(\tau=0\). Recordemos que en el espacio \(4\)-dimensional todo plano que pasa por el origen viene dado por
\begin{equation}
\alpha \xi +\beta \eta + \gamma \zeta + \delta \tau = 0
\end{equation}
siendo las coordenadas de plano \((\alpha,\beta,\gamma,\delta)\) , y \((\xi,\eta,\zeta,\tau)\) las coordenadas de punto. Esa expresión analítica muestra la dualidad punto-plano. Pues bien, también podemos considerar las coordenadas de plano como los coeficientes de una forma \(\phi\). El plano del infinito se describe por las coordenadas de plano \((0,0,0,1)\). Podemos considerar que viene representado por la forma \(\phi_\infty = 1 \cdot \tau\), que se anula precisamente para todo punto del plano del infinito.
Klein no usa la notación \(\phi_\infty\). Más bien habla de la forma \(\tau\) usando la misma letra que se emplea para la última de las coordenadas \(\xi,\eta,\zeta,\tau\), lo que me resultaba confuso.
Esta forma concreta es la que, en la teoría de invariantes, hemos de considerar adjunta al sistema de cantidades (coordenadas de puntos, formas, etc) que se quiera considerar. El valor de esa forma (como de cualquiera) es un escalar, por propia definición de lo que entendemos por forma. El adjuntar la forma \(\phi_\infty\) quiere decir que los invariantes relativos de la geometría afín necesitarán emplear esa forma. Por ejemplo el volumen del tetraedro determinado por \(4\) puntos \(P_i(x_i,y_i,z_i)\) se expresa por
\begin{equation*} T =
\left\lvert \begin{array}{cccc}
x_1 & y_1 & z_1 & 1 \\ x_2 & y_2 & z_2 & 1 \\ x_3 & y_3 & z_3 & 1 \\ x_4 & y_4 & z_4 & 1
\end{array}\right\rvert =
\frac{1}{\tau_1 \tau_2 \tau_3 \tau_4}
\left\lvert \begin{array}{cccc}
\xi_1 & \eta_1 & \zeta_1 & \tau_1 \\ \xi_2 & \eta_2 & \zeta_2 & \tau_2 \\ \xi_3 & \eta_3 & \zeta_3 & \tau_3 \\ \xi_4 & \eta_4 & \zeta_4 & \tau_4
\end{array}\right\rvert
\end{equation*}
El determinante de la derecha es un invariante relativo fundamental de \(4\) puntos, lineal en las coordenadas de cada punto. En el denominador tenemos los valores de la forma \(\phi_\infty\) para cada uno de los cuatro puntos, es decir, podriamos haber puesto más exactamente \(\phi_\infty (P_i)\) en lugar de cada \(\tau_i\). La clave es que el cociente \(T\) es un invariante relativo homogéneo de dimensión cero en la coordenadas de cada punto. Esta era la condición expresada antes, para interpretar la teoría de invariantes con \(n\) variables en un marco proyectivo de dimensión \(n-1\). Tenemos que las \(4\) coordenadas homogéneas \((\xi,\eta,\zeta,\tau)\) correponden a un espacio proyectivo tridimensional, y el espacio afín tridimensional ( y sus invariantes relativos) se obtiene al hacer intervenir la forma \(\phi_\infty\). En el caso general proyectivo para conseguir un invariante relativo homogéneo de grado cero puede usarse cualquier forma. En el caso específico afín nos limitamos a lo que pueda conseguirse con \(\phi_\infty\).
La restricción a la geometría métrica se consigue adjuntando una forma cuadrática en coordenadas de plano. El círculo esférico imaginario, que se describe en coordenads de punto por el par de ecuaciones \(\tau=0\) y \(\xi^2+\eta^2+\zeta^2=0\), puede expresarse en coordenadas de plano mediante una sola ecuación \(\alpha^2+\beta^2+\gamma^2=0\), que es la que cumplen todos los planos envolventes del círculo esférico imaginario.
Un plano tangente a uno de los puntos \((\xi_P,\eta_P,\zeta_P,0)\) debe tener coordenadas \((\alpha_P,\beta_P,\gamma_P,\delta_P)\) que cumplan \(\alpha_P \xi_P +\beta_P \eta_P + \gamma_P \zeta_P + \delta_P 0 = 0 \), lo que se consigue con \(\alpha_P=\xi_P,\beta_P=\eta_P,\gamma_P=\zeta_P\) y entonces también se anula la suma de los cuadrados de estas coordenadas de plano, excluyendo la irrelevante \(\delta_P\).
Se considera la forma cuadrática en coordenadas de plano \(\Phi_0=\alpha^2+\beta^2+\gamma^2\), definida por unos coeficientes \((1,1,1,0)\). Esta es la forma a adjuntar (al sistema de magnitudes de las que obtener los invariantes) para conseguir la geometría métrica, empleando la dualización punto-plano cuando sea menester. Por ejemplo, en la expresión del ángulo entre dos planos (o dos formas) \(\phi_1=(\alpha_1,\beta_1,\gamma_1,\delta_1)\) y \(\phi_2=(\alpha_2,\beta_2,\gamma_2,\delta_2)\)
\begin{equation}
\omega = arc cos \left( \frac{\alpha_1 \alpha_2 +\beta_1 \beta_2 +\gamma_1 \gamma_2}{\sqrt{\alpha_1^2+\beta_1^2+\gamma_1^2}\sqrt{\alpha_2^2+\beta_2^2+\gamma_2^2}} \right)
\end{equation}
aparecen los valores de la forma cuadrática \(\Phi_0\) para cada forma: \(\Phi_0(\phi_1)\) y \(\Phi_0(\phi_1)\), y su versión bilineal, la denominada por Klein forma polar
\begin{equation}
\Phi_{0b}(\phi_1,\phi_2) = \alpha_1 \alpha_2 +\beta_1 \beta_2 +\gamma_1 \gamma_2
\end{equation}
Entonces " \(cos(\omega)\) es homogéneo de dimensión cero en cada uno de los dos sistemas \(\alpha_1,\ldots,\delta_1\) y \(\alpha_2,\ldots,\delta_2\) así como en los coeficientes \(1,1,1,0\) de la forma cuadrática dada, de modo que la expresión tiene un significado independiente en la geometría métrica".
En el caso de la distancia entre dos puntos en el espacio, se usa dualmente la forma cuadrática \(\Phi_0\) aplicada a coordenadas de punto, en vez de a coordenadas de plano. El determinante de los coeficientes de la forma es un invariante, del que pueden obtenerse otros cuando se flanquea el determinante con columna(s) y fila(s) (a la derecha y abajo) con las coordenadas de un punto (o de varios). Flanqueando con las coordenadas de cada punto \(P_1\) o \(P_2\), o con las de ambos, se llega a expresar la distancia entre ambos mediante tales invariantes, en un cociente homogéneo de dimensión cero. Pero la distancia así obtenida resulta ser un invariante de peso \(-2\), y por tanto no es un invariante absoluto. El invariante absoluto se consigue adjuntando un segmento arbitrario, tomado como unidad, y usando el cociente entre la distancia de dos puntos cualesquiera y la distancia entre los extremos del segmento.
En el marco de la teoría de invariantes cobra más sentido el principio del determinante de Grassmann, empleado al principio de la obra para definir las magnitudes geométricas elementales. También se desprende que "el principio del determinante de Grassmann es algo especial, y no da por sí mismo todas las variedades de la geometría afín". A esta conclusión llega Klein tras estudiar el ejemplo de geometría tridimensional afín con centro fijo, y cómo se transforman los nueve términos obtenidos al multiplicar cada coordenada \(\xi_1,\eta_1,\tau_1\) de un punto por las de otro \(\xi_2,\eta_2,\tau_2\).
\begin{equation}
\xi_1\xi_2, \ \ \xi_1\eta_2, \ \ \xi_1\tau_2, \ \ \eta_1\xi_2, \ \ \eta_1\eta_2, \ \ \eta_1\tau_2, \ \ \tau_1\xi_2, \ \ \tau_1\eta_2, \ \ \tau_1\tau_2
\end{equation}
Con esos nueve términos pueden formarse seis combinaciones simétricas respecto de las coordenadas de los dos puntos, y tres combinaciones antisimétricas.
\begin{equation}
\begin{split}
2\xi_1\xi_2, \ \ \xi_1\eta_2+\eta_1\xi_2, \ \ \xi_1\tau_2+&\tau_1\xi_2, \ \ 2\eta_1\eta_2 , \ \ \eta_1\tau_2+\tau_1\eta_2, \ \ \tau_1\tau_2 \\
\xi_1\eta_2-\eta_1\xi_2, \ \ \xi_1\tau_2-&\tau_1\xi_2, \ \ \eta_1\tau_2-\tau_1\eta_2
\end{split}
\end{equation}
Las combinaciones simétricas por un lado, y las antisimétricas por otro, se transforman entre sí, sin mezclarse con las de simetría diferente. Las nueve cantidades definen un tensor, que puede expresarse como suma de una parte simétrica y otra antisimétrica. Las tres componentes de la parte antisimétrica son las que pueden asociarse a una magnitud geométrica definida mediante el principio del determinante de Grassmann . Pero ajeno a este principio, en el "marco invariante" tenemos como significativos geométricamente el propio tensor general de nueve componentes, así como su parte simétrica.
En fin, esta es una parte especialmente "dura" de la obra de Klein, para leer (y releer) con calma y atención.
Distintos grupos de transformaciones dan lugar a distintos tipos de geometría. Los movimientos (traslaciones, rotaciones , reflexiones) dan lugar a la geometría métrica, donde tienen sentido conceptos como distancia entre puntos y ángulo entre rectas, o que una cónica tiene determinados focos y ejes principales. Con las más amplias transformaciones afines se pierde el concepto invariante de distancia, ángulo, o la distinción entre círculo y elipse; pero se mantienen conceptos como el paralelismo entre rectas, centro y diámetros conjugados de una cónica, y la clasificación de las mismas en tres clases, o la diferencia entre finito e infinito.
Más generales que las afines son las transformaciones proyectivas. Ahora desaparece toda barrera entre las cónicas, o entre lo finito y el infinito. Pero persiste la relación entre polo y polar respecto de una cónica.
Otro tipo de transformaciones como las de radios recíprocos dan lugar a una geometría en que línea y círculo, o plano y esfera, son miembros de un mismo colectivo.
Los grupos de transformaciones pueden depender de un número finito, o incluso infinito, de parámetros. En el espacio, las transformaciones proyectivas dependen de 16 coeficientes, pero como es inesencial un factor multiplicador, su grupo depende de 15 parámetros independientes; un subgrupo del anterior es el de las transformaciones afines, que depende de 12 parámetros; y un subgrupo de este es el llamado grupo principal, que depende de 7 parámetros: los movimientos comportan 6, y el cambio de escala 1.
A partir de la geometría de un grupo, imponiendo ciertas condiciones restrictivas, se obtiene la geometría de un subgrupo. Del más general grupo proyectivo se pasa al afín imponiendo que el plano en el infinito permanezca inalterado, lo que se plasma en 3 ecuaciones, que reducen el número de parámetros de 15 a 12. Y si a las transformaciones afines se les impone dejar invariante, además del plano del infinito, el círculo esférico imaginario, entonces se obtiene el grupo principal con 7 parámetros. Este círculo es una cónica con 6 constantes homogéneas, es decir, su invariancia impone 5 condiciones, que hacen pasar los parámetros "libres" de 12 a 7.
Esta forma de ver las cosas se debe a A. Cayley, en 1859, que declaró "la geometría proyectiva es toda la geometría", dado que la geometría afín y la métrica pueden presentarse como casos concretos englobables dentro del marco proyectivo. Por ejemplo, que métricamente una recta sea perpendicular a un plano se corresponde con que el punto en que la recta corta al plano en el infinito, y la recta en que el plano corta al plano en el infinito, son polo y polar respecto del círculo esférico imaginario, toma proyección.
En este punto se abre una digresión para entender cómo el principio de Cayley "hace posible una estructura sistemática completa de la geometría sobre una base analítica", gracias al desarrollo de la teoría de invariantes de las sustituciones lineales.
Tenemos unas variables \(\xi,\eta,\zeta,\tau\) , que podemos someter a sustituciones lineales generales
\begin{equation}\label{ec1p136}
\begin{aligned}
\xi' & = a_1 \xi + \ldots + d_1 \tau\\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \\
\tau' & = a_4 \xi + \ldots + d_4 \tau
\end{aligned}
\end{equation}
¿Cómo afectan estas sustituciones a posibles expresiones que dependan de uno o más conjuntos de tales variables?
Por ejemplo, pueden considerarse funciones enteras racionales homogéneas, llamadas formas. Concretamente una forma lineal se define por
\begin{equation}
\phi = \alpha \xi + \ldots + \delta \tau
\end{equation}
y una forma cuadrática por
\begin{equation}
f = A \xi^2 + \ldots + 2G\xi \tau + \ldots + K \tau^2
\end{equation}
Nos preguntamos cómo se transforman los coeficientes de tales formas al someter las variables a las sustituciones \eqref{ec1p136}. Resulta que para la forma lineal \(\phi\) tenemos que los antiguos coeficientes \(\alpha,\ldots,\delta\) se expresan en términos de los nuevos \(\alpha',\ldots,\delta'\) igual que las variables nuevas \(\xi',\ldots,\tau'\) se expresaban por \eqref{ec1p136} en términos de las variables viejas \(\xi,\ldots,\tau\), salvo por una transposición de la matriz de los coeficientes
\begin{equation}\label{ec2p137}
\begin{aligned}
\alpha & = a_1 \alpha' + \ldots + a_4 \delta' \\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \\
\delta & = d_1 \alpha' + \ldots + d_4 \delta'
\end{aligned}
\end{equation}
Esta sustitución \eqref{ec2p137} transpuesta y con los roles de nuevo y viejo cambiados se llama contragrediente de la original \eqref{ec1p136}, y se dice que los coeficientes \(\alpha,\ldots,\delta\) on contragredientes a las variables \(\xi,\ldots,\tau\). Cualquier conjunto de valores similar a estos, \(\xi_1,\ldots,\tau_1\), \(\xi_2,\ldots,\tau_2\), ... que se someta a la sustitución \eqref{ec1p136} se llaman variables cogredientes.
En cuanto a las formas cuadráticas como \(f\), al realizar la sustitución \eqref{ec1p136} a cada factor de los productos \(\xi^2,\ldots,\xi\tau,\ldots,\tau^2\) que aparecen en ellas, se obtiene una relación lineal entre estos y \(\xi'^2,\ldots,\xi'\tau',\ldots,\tau'^2\).
\begin{equation}\label{ec3p138}
\begin{aligned}
\xi'^2 & = a^2_1 \xi^2 + \ldots + 2 a_1 d_1 \xi \tau + \ldots + d^2_1 \tau^2\\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\
\xi'^2 & = a^2_1 \xi^2 + \ldots + (a_1 d_4 + a_4 d_1) \xi \tau + \ldots + d^2_1 \tau^2\\
\ldots & \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\
\tau'^2 & = a^2_4 \xi^2 + \ldots + 2 a_4 d_4 \xi \tau + \ldots + d^2_4 \tau^2\\
\end{aligned}
\end{equation}
También hay una relación lineal, precisamente cogrediente respecto de la anterior, entre los coeficientes "viejos" \(A,\ldots,G,\ldots,K\) y los "nuevos" \(A',\ldots,G',\ldots,K'\).
Con estos prolegómenos, Klein formula así el problema general de la teoría de invariantes:
Dado cualquier conjunto de puntos \(1,2,\ldots\), y también ciertas formas lineales, cuadráticas, o superiores, \(\phi_1,\phi_2,\ldots,f_1,f_2,\ldots\), llamamos invariante a una función de las coordenadas \(\xi_1,\ldots,\tau_1; \xi_2,\ldots,\tau_2; \ldots\) y de los coeficientes
\(\alpha_1,\ldots, \delta_1\) ; \(\alpha_2, \ldots, \delta_2\) ; ... ; \(A_1,\ldots,K_1\) ; \(A_2,\ldots; K_2\) ; ... que permanece inalterada bajo las sustituciones lineales \eqref{ec1p136} de las variables y las sustituciones asociadas del sistema de coeficientes que acabamos de determinar. Se ha de estudiar el agregado de todos los posibles invariantes.
A continuación aparecen unos términos tan conocidos como potencialmente confusos
Las palabras covariante y contravariante se usan a veces para tipos particulares de lo que en general se llaman invariantes. Si en la expresión invariante aparecen las propias variables \(\xi_1,\ldots,\tau_1; \xi_2,\ldots,\tau_2; \ldots\) , hablamos de covariantes; si aparecen los coeficientes de las formas lineales \(\alpha_1,\ldots, \delta_1;\alpha_2,\ldots, \delta_2;\ldots\), hablamos de contravariantes. Si unas sufren una sustitución lineal, las otras experimentan la sustitución contragrediente, ya empecemos con las variables, ya con los coeficientes. En cuanto a la interpretación geométrica, aquí estamos obviamente ante una expresión del principio de dualidad, pues \(\alpha,\ldots,\delta\) devienen coordenadas homogéneas de líneas o planos si consideramos \(\xi,\ldots,\tau\) como coordenadas de puntos.
La cita esta abreviada y un tanto editada. Actualmente, si partimos de un vector \(\mathbf{v} \in V\), a sus coordenadas \(v^i\), equivalentes a las \(\xi,\ldots,\tau\), se las llama contravariantes. Una forma es un vector del espacio dual, \(\boldsymbol{\sigma} \in V^*\), y a sus coordenadas \(\sigma_i\), equivalentes a las \(\alpha,\ldots,\delta\), se las llama covariantes. Cuando se define un producto escalar en \(V\), de dimensión finita, hay un isomorfismo canónico que asocia a cada vector de \(V\) una forma de \(V^*\), y las coordenadas de ésta pueden considerarse las coordenadas covariantes \(v_i\) del vector \(\mathbf{v}\). Lo que no se ha perdido es la idea de dualidad.
Klein concreta aún más la noción de invariante, circunscribiendose a las funciones racionales de las coordenadas y los coeficientes que sean homogéneas en las coordenadas de cada punto y los coeficientes de cada forma. Entonces tal invariante puede ponerse como cociente de dos funciones enteras racionales homogéneas, que pueden no ser invariantes en sí mismas, llamándose en tal caso invariantes relativos. Cada uno de ellos, numerador y denominador, puede transformarse cual invariante, salvo por un factor, que necesariamente ha de ser una potencia del determinante \(r\) de los términos que definen la transformación \eqref{ec1p136}. Si el factor es \(r^\lambda\) el invariante es relativo de peso \(\lambda\). Para que el cociente sea un invariante absoluto, numerador y denominador deben ser invariantes relativos con el mismo peso. Los invariantes relativos más sencillos son los polinomios de menor grado posible formados con las variables. A partir de ellos pueden formarse los de grado mayor. Mediante productos y sumas de invariantes relativos de igual peso pueden deducirse nuevos invariantes. Uno de los grandes logros de Hilbert fue demostrar que para todo número finito de cantidades dadas siempre hay un "sistema completo de invariantes", finito, a partir del cual todos los demás pueden construirse racional e integralmente, es decir, mediante cocientes de polinomios. No está de más recordar la nomenclatura de Klein.
El ejemplo más sencillo descrito por Klein es el de los invariantes formados con las coordenadas \(\xi_i,\tau_i\) de \(n\) puntos en el plano. Las transformaciones a considerar son
\begin{equation*}
\begin{split}
\xi' & = a_1 \xi + d_1 \tau \\
\tau' & = a_4 \xi + d_4 \tau
\end{split}
\end{equation*}
Entonces
\begin{equation}
\Delta'_{ik} = \left\lvert
\begin{array}{lcl}
\xi'_i & \tau'_i \\
\xi'_k & \tau'_k
\end{array} \right\rvert = \left\lvert
\begin{array}{lcl}
a_1 \xi_i+ d_1 \tau_i & a_4 \xi_i+ d_4 \tau_i \\
a_1 \xi_k + d_1 \tau_k & a_4 \xi_k+d_4 \tau_k
\end{array} \right\rvert = \left\lvert
\begin{array}{lcl}
a_1 & d_1 \\
a_4 & d_4
\end{array} \right\rvert \cdot \left\lvert
\begin{array}{lcl}
\xi_i & \tau_i \\
\xi_k & \tau_k
\end{array} \right\rvert = r \Delta_{ik}
\end{equation}
Los \(n(n-1)/2\) invariantes \(\Delta_{ik}\) de peso \(1\) forman el sistema completo de invariantes. A partir de ellos cualquier invariante relativo puede ponerse como suma de términos \( C \cdot \Delta^s_{ik} \cdot \Delta^t_{lm}\) que tengan igual peso \(s+t\). Cualquier invariante absoluto puede ponerse como cociente de dos inavriantes relativos de igual peso. Un invariante absoluto bien sencillo sería por ejemplo \(\Delta_{ik} / \Delta_{lm}\).
De paso Klein nos explica qué es un syzygy, una identidad entre invariantes del sistema completo, que indica un "acoplamiento" entre invariantes. En el caso del plano, y de los invariantes formados con las coordenadas de \(4\) puntos, resulta que un syzygy es
\begin{equation}\label{ecCp141}
\Delta_{12} \Delta_{34} + \Delta_{13} \Delta_{42} +\Delta_{14} \Delta_{23} =0
\end{equation}
Si se tienen varios syzygys, pueden combinarse para dar otros, y resulta que también hay un sistema completo de los mismos a partir de los que se obtienen todos los demás. En el caso de los \(4\) puntos del plano el anterior es el único syzygy.
El "inciso invariante" cobra sentido cuando Klein aplica la teoría de invariantes a la geometría. Si se toman las variables \(\xi,\ldots,\tau\) como coordenadas rectangulares ordinarias (no homogéneas) en un espacio \(n\)-dimensional, las sustituciones lineales homogéneas \eqref{ec1p136} de la teoría de invariantes representan las transformaciones afines de tal espacio que mantienen el origen fijo. Un invariante relativo, salvo por una constante, no se altera por esas transformaciones, luego tiene un significado geométrico en la geometría afín. Recíprocamente, toda magnitud geométrica afín debe poder expresarse mediante el sistema completo de invariantes.
En el caso de dos dimensiones, el invariante relativo \(\Delta_{12}\) representa dos veces el área del triángulo determinado por el origen \(0\) y los puntos \(1,2\), lo que se denotó al principio del libro mediante \((012)\). El cociente \(\Delta_{12}/\Delta_{34}\) es un invarante absoluto, como absoluto es el carácter de la ecuación \(\Delta_{12}=0\) que indica que los tres puntos son colineales.
Para un conjunto de puntos bidimensionales \(1,2,3,4,\ldots\) el sistema completo de invariantes son los \(\Delta_{ik}\). Recordando lo visto en la primera parte, el área del polígono formado por cuatro puntos era
\begin{equation}
(1,2,3,4) = \Delta_{12} +\Delta_{23} +\Delta_{34} +\Delta_{41}
\end{equation}
ejemplo de que una carácterística geométrica se expresa polinómicamente en términos del sistema completo de invariantes. El syzygy \eqref{ecCp141} representa, geométricamente, una identidad entre las áreas de los seis triángulos formados por cuatro puntos arbitrarios y el origen, un teorema general de la geometría afín. Y todo teorema, como relación expresable entre invarientes, conllevará un syzygy. Es decir
la teoría de los invariantes permite la enumeración sistemática de todas las posibles magnitudes y teoremas, sin excepción, pues suministra el sistema completo de invariantes y syzygys
Pero hay otra forma de interpretar las variables \(\xi,\ldots,\tau\): como \(n\) coordenadas homogéneas de un espacio proyectivo \(n-1\) dimensional. Dos transformaciones como \eqref{ec1p136} que difieran en un factor constante serán equivalentes. Como las coordenadas que interesan son los cocientes \(\xi/\tau,\ldots\), en el marco de la geometría proyectiva de entre todos los invariantes hay que considerar solo aquellos que sean homogéneos de orden cero en las variables \(\xi,\ldots,\tau\).
En el caso de dos variables \(\xi,\tau\), tenemos la recta proyectiva cuyos puntos se indican por la coordenada \(x= \xi/\tau\). Que un invariante \(\Delta_{12}\) tome un valor concreto no tiene sentido proyectivamente, salvo que se anule, lo que indica simplemente la obviedad que \(1\) y \(2\) coinciden.
Para tener un invariante numérico hay que considerar al menos cuatro puntos, para poder formar el cociente
\begin{equation}\label{ecBp146}
\frac{\Delta_{12}\Delta_{34}}{\Delta_{14}\Delta_{32}}
\end{equation}
que es homogéneo de dimensión cero en cada uno de los cuatro pares de variables \((\xi_1,\tau_1),\ldots,(\xi_4,\tau_4)\), luego es un invariante absoluto, el más simple posible, y que no es otra cosa que... ¡la razón doble!.
El syzygy fundamental \eqref{ecCp141} cobra ahora otra interpretación. Dividiendo por el último sumando y teniendo en cuenta \(\Delta_{23}=-\Delta_{32}, \Delta_{24}=-\Delta_{42}\)
\begin{equation}
\frac{\Delta_{12}\Delta_{34}}{\Delta_{14}\Delta_{32}}=1-\frac{\Delta_{13}\Delta_{24}}{\Delta_{14}\Delta_{23}}
\end{equation}
que relaciona la razón doble de \(1,2,3,4\) definida por \eqref{ecBp146} con la formada por los mismos puntos al permutar \(2\) con \(3\). Con otras formas de manipular el syzygy \eqref{ecCp141} se deducen las relaciones entre los seis valores distintos que surgen de la razón doble de cuatro puntos con todas las permutaciones posibles en su orden.
Tras indicar la relación de la teoría de invariantes con las magnitudes y teoremas de las geometrías afín y proyectiva, Klein remata con la sistematización de la geometría afín y métrica basada en el principio de Cayley:
la geometría afín, o la geometría métrica, surgen de la geometría proyectiva cuando adjuntamos a la variedad dada el plano en el infinito \(\tau=0\), o este plano junto con el círculo esférico imaginario \(\tau=0, \xi^2+\eta^2+\zeta^2=0\), respectivamente.
En el caso más sencillo de la geometría afín, de entre todas las transformaciones proyectivas nos quedamos con el subgrupo que deja invariante el plano del infinito, de modo que toda transformación de dicho subgrupo siempre transforma un punto de ese plano en otro punto del mismo plano \(\tau=0\). Recordemos que en el espacio \(4\)-dimensional todo plano que pasa por el origen viene dado por
\begin{equation}
\alpha \xi +\beta \eta + \gamma \zeta + \delta \tau = 0
\end{equation}
siendo las coordenadas de plano \((\alpha,\beta,\gamma,\delta)\) , y \((\xi,\eta,\zeta,\tau)\) las coordenadas de punto. Esa expresión analítica muestra la dualidad punto-plano. Pues bien, también podemos considerar las coordenadas de plano como los coeficientes de una forma \(\phi\). El plano del infinito se describe por las coordenadas de plano \((0,0,0,1)\). Podemos considerar que viene representado por la forma \(\phi_\infty = 1 \cdot \tau\), que se anula precisamente para todo punto del plano del infinito.
Klein no usa la notación \(\phi_\infty\). Más bien habla de la forma \(\tau\) usando la misma letra que se emplea para la última de las coordenadas \(\xi,\eta,\zeta,\tau\), lo que me resultaba confuso.
Esta forma concreta es la que, en la teoría de invariantes, hemos de considerar adjunta al sistema de cantidades (coordenadas de puntos, formas, etc) que se quiera considerar. El valor de esa forma (como de cualquiera) es un escalar, por propia definición de lo que entendemos por forma. El adjuntar la forma \(\phi_\infty\) quiere decir que los invariantes relativos de la geometría afín necesitarán emplear esa forma. Por ejemplo el volumen del tetraedro determinado por \(4\) puntos \(P_i(x_i,y_i,z_i)\) se expresa por
\begin{equation*} T =
\left\lvert \begin{array}{cccc}
x_1 & y_1 & z_1 & 1 \\ x_2 & y_2 & z_2 & 1 \\ x_3 & y_3 & z_3 & 1 \\ x_4 & y_4 & z_4 & 1
\end{array}\right\rvert =
\frac{1}{\tau_1 \tau_2 \tau_3 \tau_4}
\left\lvert \begin{array}{cccc}
\xi_1 & \eta_1 & \zeta_1 & \tau_1 \\ \xi_2 & \eta_2 & \zeta_2 & \tau_2 \\ \xi_3 & \eta_3 & \zeta_3 & \tau_3 \\ \xi_4 & \eta_4 & \zeta_4 & \tau_4
\end{array}\right\rvert
\end{equation*}
El determinante de la derecha es un invariante relativo fundamental de \(4\) puntos, lineal en las coordenadas de cada punto. En el denominador tenemos los valores de la forma \(\phi_\infty\) para cada uno de los cuatro puntos, es decir, podriamos haber puesto más exactamente \(\phi_\infty (P_i)\) en lugar de cada \(\tau_i\). La clave es que el cociente \(T\) es un invariante relativo homogéneo de dimensión cero en la coordenadas de cada punto. Esta era la condición expresada antes, para interpretar la teoría de invariantes con \(n\) variables en un marco proyectivo de dimensión \(n-1\). Tenemos que las \(4\) coordenadas homogéneas \((\xi,\eta,\zeta,\tau)\) correponden a un espacio proyectivo tridimensional, y el espacio afín tridimensional ( y sus invariantes relativos) se obtiene al hacer intervenir la forma \(\phi_\infty\). En el caso general proyectivo para conseguir un invariante relativo homogéneo de grado cero puede usarse cualquier forma. En el caso específico afín nos limitamos a lo que pueda conseguirse con \(\phi_\infty\).
La restricción a la geometría métrica se consigue adjuntando una forma cuadrática en coordenadas de plano. El círculo esférico imaginario, que se describe en coordenads de punto por el par de ecuaciones \(\tau=0\) y \(\xi^2+\eta^2+\zeta^2=0\), puede expresarse en coordenadas de plano mediante una sola ecuación \(\alpha^2+\beta^2+\gamma^2=0\), que es la que cumplen todos los planos envolventes del círculo esférico imaginario.
Un plano tangente a uno de los puntos \((\xi_P,\eta_P,\zeta_P,0)\) debe tener coordenadas \((\alpha_P,\beta_P,\gamma_P,\delta_P)\) que cumplan \(\alpha_P \xi_P +\beta_P \eta_P + \gamma_P \zeta_P + \delta_P 0 = 0 \), lo que se consigue con \(\alpha_P=\xi_P,\beta_P=\eta_P,\gamma_P=\zeta_P\) y entonces también se anula la suma de los cuadrados de estas coordenadas de plano, excluyendo la irrelevante \(\delta_P\).
Se considera la forma cuadrática en coordenadas de plano \(\Phi_0=\alpha^2+\beta^2+\gamma^2\), definida por unos coeficientes \((1,1,1,0)\). Esta es la forma a adjuntar (al sistema de magnitudes de las que obtener los invariantes) para conseguir la geometría métrica, empleando la dualización punto-plano cuando sea menester. Por ejemplo, en la expresión del ángulo entre dos planos (o dos formas) \(\phi_1=(\alpha_1,\beta_1,\gamma_1,\delta_1)\) y \(\phi_2=(\alpha_2,\beta_2,\gamma_2,\delta_2)\)
\begin{equation}
\omega = arc cos \left( \frac{\alpha_1 \alpha_2 +\beta_1 \beta_2 +\gamma_1 \gamma_2}{\sqrt{\alpha_1^2+\beta_1^2+\gamma_1^2}\sqrt{\alpha_2^2+\beta_2^2+\gamma_2^2}} \right)
\end{equation}
aparecen los valores de la forma cuadrática \(\Phi_0\) para cada forma: \(\Phi_0(\phi_1)\) y \(\Phi_0(\phi_1)\), y su versión bilineal, la denominada por Klein forma polar
\begin{equation}
\Phi_{0b}(\phi_1,\phi_2) = \alpha_1 \alpha_2 +\beta_1 \beta_2 +\gamma_1 \gamma_2
\end{equation}
Entonces " \(cos(\omega)\) es homogéneo de dimensión cero en cada uno de los dos sistemas \(\alpha_1,\ldots,\delta_1\) y \(\alpha_2,\ldots,\delta_2\) así como en los coeficientes \(1,1,1,0\) de la forma cuadrática dada, de modo que la expresión tiene un significado independiente en la geometría métrica".
En el caso de la distancia entre dos puntos en el espacio, se usa dualmente la forma cuadrática \(\Phi_0\) aplicada a coordenadas de punto, en vez de a coordenadas de plano. El determinante de los coeficientes de la forma es un invariante, del que pueden obtenerse otros cuando se flanquea el determinante con columna(s) y fila(s) (a la derecha y abajo) con las coordenadas de un punto (o de varios). Flanqueando con las coordenadas de cada punto \(P_1\) o \(P_2\), o con las de ambos, se llega a expresar la distancia entre ambos mediante tales invariantes, en un cociente homogéneo de dimensión cero. Pero la distancia así obtenida resulta ser un invariante de peso \(-2\), y por tanto no es un invariante absoluto. El invariante absoluto se consigue adjuntando un segmento arbitrario, tomado como unidad, y usando el cociente entre la distancia de dos puntos cualesquiera y la distancia entre los extremos del segmento.
En el marco de la teoría de invariantes cobra más sentido el principio del determinante de Grassmann, empleado al principio de la obra para definir las magnitudes geométricas elementales. También se desprende que "el principio del determinante de Grassmann es algo especial, y no da por sí mismo todas las variedades de la geometría afín". A esta conclusión llega Klein tras estudiar el ejemplo de geometría tridimensional afín con centro fijo, y cómo se transforman los nueve términos obtenidos al multiplicar cada coordenada \(\xi_1,\eta_1,\tau_1\) de un punto por las de otro \(\xi_2,\eta_2,\tau_2\).
\begin{equation}
\xi_1\xi_2, \ \ \xi_1\eta_2, \ \ \xi_1\tau_2, \ \ \eta_1\xi_2, \ \ \eta_1\eta_2, \ \ \eta_1\tau_2, \ \ \tau_1\xi_2, \ \ \tau_1\eta_2, \ \ \tau_1\tau_2
\end{equation}
Con esos nueve términos pueden formarse seis combinaciones simétricas respecto de las coordenadas de los dos puntos, y tres combinaciones antisimétricas.
\begin{equation}
\begin{split}
2\xi_1\xi_2, \ \ \xi_1\eta_2+\eta_1\xi_2, \ \ \xi_1\tau_2+&\tau_1\xi_2, \ \ 2\eta_1\eta_2 , \ \ \eta_1\tau_2+\tau_1\eta_2, \ \ \tau_1\tau_2 \\
\xi_1\eta_2-\eta_1\xi_2, \ \ \xi_1\tau_2-&\tau_1\xi_2, \ \ \eta_1\tau_2-\tau_1\eta_2
\end{split}
\end{equation}
Las combinaciones simétricas por un lado, y las antisimétricas por otro, se transforman entre sí, sin mezclarse con las de simetría diferente. Las nueve cantidades definen un tensor, que puede expresarse como suma de una parte simétrica y otra antisimétrica. Las tres componentes de la parte antisimétrica son las que pueden asociarse a una magnitud geométrica definida mediante el principio del determinante de Grassmann . Pero ajeno a este principio, en el "marco invariante" tenemos como significativos geométricamente el propio tensor general de nueve componentes, así como su parte simétrica.
En fin, esta es una parte especialmente "dura" de la obra de Klein, para leer (y releer) con calma y atención.
Etiquetas:
Felix Klein,
geometría,
matemáticas,
MathJax
jueves, 19 de diciembre de 2013
Gaia en camino a su destino
Llegó el gran día para Gaia, heredera de Hipparcos, que de momento ha arrancado (toco madera según escribo) con mucho menos sobresalto que la anterior misión catalogadora de estrellas.
Toda la información sobre la misión está en la web, y hay videos como este Mapping the Milky Way, o este gaia El censo galáctico de la ESA, o esta entrada calentita de El blog de Daniel Marín. Desde el punto de vista hispano son especialmente interesantes una serie de cinco vídeos, en youtube, sobre la participación española en el proyecto:
La misión Gaia. Participación española (1/5)
Gaia, el satélite (2/5)
La misión Gaia. Contribución científica española (3/5)
Empresas españolas en Gaia (4/5)
Ciencia con Gaia (5/5)
La Universitat de Barcelona ha tenido un papel muy especial en todo el desarrollo, así como otras instituciones académicas y varias empresas españolas. Supongo que una de ellas, Sener, seguirá con nervios contenidos a la espera de uno de los momentos especiales de la misión, el despliegue del parasol. ¡Anda que si no se abre! Para eso están los ensayos, claro, y mejor que todo funcione como la seda, porque no es viable darse un paseo hasta Lagrange L2 a dar un toquecito.
Pero aparte de esta visión parcial de la aportación española, lo más edificante del desarrollo de un proyecto como Gaia es el trabajo en equipo de la ciencia e industria europeas, no en abstracto sino con nombres y apellidos, con el noble ánimo de que toda la humanidad humana, de ahora y del futuro, sin exclusión alguna, mejore el conocimiento de nuestra lechosa galaxia.
Toda la información sobre la misión está en la web, y hay videos como este Mapping the Milky Way, o este gaia El censo galáctico de la ESA, o esta entrada calentita de El blog de Daniel Marín. Desde el punto de vista hispano son especialmente interesantes una serie de cinco vídeos, en youtube, sobre la participación española en el proyecto:
La misión Gaia. Participación española (1/5)
Gaia, el satélite (2/5)
La misión Gaia. Contribución científica española (3/5)
Empresas españolas en Gaia (4/5)
Ciencia con Gaia (5/5)
La Universitat de Barcelona ha tenido un papel muy especial en todo el desarrollo, así como otras instituciones académicas y varias empresas españolas. Supongo que una de ellas, Sener, seguirá con nervios contenidos a la espera de uno de los momentos especiales de la misión, el despliegue del parasol. ¡Anda que si no se abre! Para eso están los ensayos, claro, y mejor que todo funcione como la seda, porque no es viable darse un paseo hasta Lagrange L2 a dar un toquecito.
Pero aparte de esta visión parcial de la aportación española, lo más edificante del desarrollo de un proyecto como Gaia es el trabajo en equipo de la ciencia e industria europeas, no en abstracto sino con nombres y apellidos, con el noble ánimo de que toda la humanidad humana, de ahora y del futuro, sin exclusión alguna, mejore el conocimiento de nuestra lechosa galaxia.
Etiquetas:
astronomía,
Gaia,
Hipparcos
jueves, 16 de mayo de 2013
EMAS Geometry 7 - Teoría de lo imaginario
Ya me había tomado algún descanso de la lectura de "Elementary Mathematics from an Advanced Standpoint. Geometry", cuando a la altura del final de la segunda parte me tuve que tomar unas vacaciones completas y ocuparme en lecturas más llevaderas.
Pero como dijo Euclides, al primero de los Ptolomeos, "no hay camino Real a la Geometría". La atribución de la cita la leo en la mejor historia concisa de las matemáticas, "A Concise History of Mathematics", de Dirk J. Struik, en la cuarta edición revisada editada por Dover Publications. Su gran valor bien merece el bajo precio de adquirir esta obra. Pero obviamente "concisa" indica que no es comparable a obras de otro calibre, como los tres tomos de "El Pensamiento Matemático desde la antigüedad a nuestros días", de Morris Kline, que ahora al parecer existe editada en un solo volumen.
El caso es que en la versión inglesa de Struik la frase de Euclides al rey Ptolomeo I es "there is no royal road to geometry"; por muy rey que sea, no hay acceso fácil. Pero queda muy bien el juego de palabras en la versión en castellano, para cambiar el sentido, tergiversar al pobre Euclides, y dar a entender que el camino a la geometría no es solamente Real, sino que tiene un sesgo Imaginario. Vamos, que es Complejo.
La geometría proyectiva, al incorporar elementos "impropios", como los puntos o la recta en el infinito, permite enunciar teoremas de una forma general, sin excepciones o casos particulares. Un beneficio similar se consigue en el álgebra, el análisis y la geometría analítica al incorporar los valores imaginarios, y trabajar con los números complejos en vez de simplemente con los reales. Se gana generalidad y una comprensión más profunda de muchos resultados, pero desde el punto de vista geométrico intuitivo perdemos pie. Aún así Klein intenta aplicar ambas incorporaciones a la vez y explicar algunos términos.
Seguimos empleando las coordenadas homogéneas ya conocidas, en el plano \(x:y:1 = \xi:\eta:\tau\), pero ahora se admiten para todas ellas valores complejos, no solo reales, aunque excluyendo como siempre la anulación simultánea de todas las coordenadas homogéneas. Un conjunto de puntos que satisfacen una ecuación cuadrática homogénea definen una curva de segundo grado, y si satisfacen una ecuación lineal definen una curva de primer grado. Una curva de primer grado y una de segundo siempre se intersecan en dos puntos, que pueden ser reales o complejos, a distancia finita o infinita, separados o coincidentes. De forma similar, en el espacio se definen de forma analítica las superficies de primer grado (un plano) o de segundo grado, y hay resultados generales sobre las intersecciones a las que dan lugar.
Un iniciador de tales resultados, en el caso concreto de círculos y esfera, fue Poncelet con su "Traité des propietés projectives des figures" de 1822. Empleó su fuerte sentido de continuidad geométrica, pero no las coordenadas homogéneas. Klein las emplea para expresar la ecuación del círculo
\begin{equation*}
(x-a)^2 + (y-b)^2=r^2
\end{equation*}
en forma homogénea así
\begin{equation*}
(\xi - a \tau)^2 + (\eta - b \tau )^2 - r^2 \tau^2 = 0
\end{equation*}
La intersección de este círculo con la línea del infinito, \(\tau=0\), se describe por las dos ecuaciones
\begin{equation*}
\xi^2+\eta^2=0 \ \ , \ \ \tau=0
\end{equation*}
Las constantes \(a,b,r\) que caracterizan el círculo no aparecen, y por tanto todo círculo corta a la línea del infinito en los mismos dos puntos fijos, denominados puntos circulares imaginarios
\begin{equation*}
\xi : \eta = \pm i \ , \ \tau=0
\end{equation*}
Hay que recordar que las coordenadas homogéneas determinan un punto, salvo por un factor común, que ahora puede ser complejo. Coordenadas posibles de los puntos circulares imaginarios serían \((i,1,0)\) y \((-i,1,0)\), o cualquier múltiplo complejo.
En el espacio, por tanto con cuatro coordenadas homogéneas, una superficie de segundo grado se corta con otra de primer grado en una curva de segundo grado. Por ejemplo cualquier esfera corta el plano en el infinito en la misma cónica imaginaria, el círculo esférico imaginario
\begin{equation*}
\xi ^2 + \eta ^2 + \zeta ^2 = 0 \ \ , \ \ \tau=0
\end{equation*}
Aunque puede costar algo comprender el alcance de esta expresión analítica, más cuesta imaginar intuitivamente ese círculo, en el infinito, e imaginario. Pero sirve para cuadrar las cuentas: dos esferas, como superficies de segundo grado, deben cortarse en una curva de cuarto grado. En efecto siempre tenemos una intersección como un círculo, real o imaginario, y además el círculo esférico imaginario, el producto de esas dos curvas de segundo grado da la de cuarto.
Klein explica que una forma de hacer más reales los puntos circulares imaginarios (del plano) es someterles a la transformación imaginaria
\begin{equation*}
\xi' = \xi \ , \ \eta'=i \eta \ , \ \tau'=\tau
\end{equation*}
Entonces la ecuación \(\xi^2+\eta^2=0\) se convierte en \(\xi'^2-\eta'^2=0\) y convierte los puntos circulares imaginarios \(\xi : \eta = \pm i \ , \ \tau=0\) en los puntos reales en el infinito
\begin{equation*}
\xi' : \eta' = \pm 1 \ , \ \tau'=0
\end{equation*}
Estos puntos corresponden a las direcciones que hacen 45º con los ejes de coordenadas \(x', y'\). Todos los círculos se transforman en cónicas que "pasan" por estos puntos, es decir, en hipérbolas equilateras cuyas asíntotas hacen esos 45º con los ejes \(x'\) e \(y'\), aunque no pasan necesariamente por el origen de coordenadas.
¿Hay una forma puramente geométrica de expresar tales conceptos "imaginarios"? Poncelet y Steiner no fueron claros al respecto, pero von Staudt desarrolló ideas clave al respecto.
Por un lado, una curva dada por una ecuación con coeficientes reales determina un sistema polar, que proporciona una representación real, y puede usarse como objeto a investigar en vez de la curva. El sistema polar se define por la relación polo-polar asociada a una cónica. Si los coeficientes de ésta son reales, aún admitiendo para las coordenadas homogéneas valores complejos, siempre hay una relación para valores reales: un punto de coordenadas reales tiene asociada una polar real, incluso ¡aunque la cónica no tenga puntos reales! Además una cónica, al cortarse con una recta, determina en ésta una relación polar unidimensional, que es una involución. Esta involución tendrá dos puntos fijos, que pueden ser reales o imaginarios, pero en todo caso está definida perfectamente en base a su acción sobre puntos reales.
Un ejemplo, un círculo cualquiera se define en coordenadas homogéneas por
\begin{equation*}
\xi^2 + \eta^2- 2 a \xi \eta- 2 b \eta \tau + (a^2+b^2-r^2)=0
\end{equation*}
que se asocia a la relación polar
\begin{equation*}
\xi \xi' + \eta \eta' - a (\xi \tau' + \xi' \tau) - b(\eta \tau' + \eta' \tau) + (a^2+b^2-r^2) \tau \tau' =0
\end{equation*}
Esta relación polar induce, al considerar el corte del círculo con la recta en el infinito \(\tau=0=\tau'\), la relación polar unidimensional dada por
\begin{equation}\label{ec4bp123}
\xi \xi ' + \eta \eta' =0 \ , \ \tau = 0 \ , \ \tau'=0
\end{equation}
que como se ve es la misma para cualquier círculo, y es una involución. Esta relación está definida completamente en base a su comportamiento para valores reales. Las direcciones desde el origen hacia los dos puntos relacionados por la involución, \(P(\xi,\eta,0)\) y \(P'(\xi',\eta',0)\), son perpendiculares. Las tangentes a cualquier círculo (\(C_1\) o \(C_2\)) en una dirección dada, es decir, hacia un mismo punto del infinito \(P\), el polo, tienen asociadas polares (\(p'_1\), \(p'_2\)) que son perpendiculares a tal dirección, determinando por tanto otro punto \(P'\) en el infinito. Esta perpendicularidad geométricamente evidente, de las tangentes "reales" a los círculos y sus polares, ilustrada en la figura 92, página 122, de EMAS Geometry, es la plasmación de los dos puntos circulares imaginarios.
Estos son precisamente los puntos fijos de la involución definida por \eqref{ec4bp123}, aquellos que se relacionan consigo mismos. En efecto los puntos fijos deben cumplir \(\xi=\xi',\eta=\eta',\tau=\tau'=0\) y de \eqref{ec4bp123} se obtiene que \(\xi:\eta = \pm i\).
Da igual el punto \(P\) elegido sobre la recta del infinito como polo, la dirección de las tangentes, la polar siempre será perpendicular, y la involución definida en la recta del infinito será la misma, por lo que se denomina involución absoluta. Ésta es equivalente, en la idea de von Staudt, al concepto mismo de puntos circulares del infinito.
Toma ya moreno.
Pero para Klein esto es una forma de eludir lo imaginario más que una interpretación. Propiamente tal interpretación de los puntos, líneas y planos imaginarios la consiguió von Staudt en su "Beiträge" de 1856-60.
Empezamos asociando a un punto imaginario \(P\), dado por sus coordenadas homogéneas complejas
\begin{equation*}
\xi = \xi_1+ i \xi_2 \ , \ \eta = \eta_1+ i \eta_2 \ , \ \tau = \tau_1+ i \tau_2
\end{equation*}
los dos puntos reales \(P_1: \xi_1,\eta_1,\tau_1 \) y \(P_2: \xi_2,\eta_2,\tau_2 \), que no coinciden, no son proporcionales, si \(P\) es propiamente imaginario. Estos puntos determinan una recta real, que también contiene tanto al punto imaginario \(P\) como al conjugado \(\overline{P} : \xi_1- i \xi_2,\eta_1- i \eta_2,\tau_1- i \tau_2 \). Pero en la perspectiva proyectiva que hemos de mantener siempre, \(P\) se determina por sus coordenadas homogéneas salvo un factor común, complejo, como \(\rho = \rho_1 + i \rho_2\), y entonces podemos asociar a \(P\) otros pares de puntos reales \(P'_1, P'_2\).
Al dar todos los valores posibles a \(\rho_1, \rho_2\) se obtiene una variedad geométrica de puntos reales que representa al punto geométrico \(P\) de una forma netamente proyectiva. Dos pares de puntos igualmente representativos, como \(P_1,P_2\) y \(P'_1, P'_2\), están intercalados sobre la misma línea, es más, resulta que cada par se relaciona por una misma involución de dicha línea, y los puntos fundamentales o fijos de dicha involución son precisamente \(P\), el punto imaginario de partida, y su conjugado \(\overline{P}\). Se llega a una situación parecida a la alcanzada antes con los puntos circulares del infinito, relacionando un punto imaginario (y su conjugado) con una involución en una recta real. Para obtener una expresión propia sólo de \(P\) y no de su conjugado, se elige un sentido concreto de recorrido de la involución, el de movimiento del punto real \(P'_1\) cuando el parámetro \(\lambda = -\rho_2 / \rho_1\) varía desde \(0\) a \(\infty\) y de vuelta a \(0\) desde \(-\infty\). El sentido opuesto para igual variación de \(\lambda\) corresponde al \(\overline{P}\).
Recíprocamente, "cada figura real tal, consistente en una línea recta, dos pares de puntos intercalados sobre ella, \(P_1, P_2\) y \(P'_1, P'_2\) (o una involución sin puntos reales dobles, junto con una flecha de dirección, representa un único punto imaginario".
Acaba así Klein, requiriendo buenas dosis de imaginación para hacer real lo imaginario, la segunda parte de la obra.
Pero como dijo Euclides, al primero de los Ptolomeos, "no hay camino Real a la Geometría". La atribución de la cita la leo en la mejor historia concisa de las matemáticas, "A Concise History of Mathematics", de Dirk J. Struik, en la cuarta edición revisada editada por Dover Publications. Su gran valor bien merece el bajo precio de adquirir esta obra. Pero obviamente "concisa" indica que no es comparable a obras de otro calibre, como los tres tomos de "El Pensamiento Matemático desde la antigüedad a nuestros días", de Morris Kline, que ahora al parecer existe editada en un solo volumen.
El caso es que en la versión inglesa de Struik la frase de Euclides al rey Ptolomeo I es "there is no royal road to geometry"; por muy rey que sea, no hay acceso fácil. Pero queda muy bien el juego de palabras en la versión en castellano, para cambiar el sentido, tergiversar al pobre Euclides, y dar a entender que el camino a la geometría no es solamente Real, sino que tiene un sesgo Imaginario. Vamos, que es Complejo.
La geometría proyectiva, al incorporar elementos "impropios", como los puntos o la recta en el infinito, permite enunciar teoremas de una forma general, sin excepciones o casos particulares. Un beneficio similar se consigue en el álgebra, el análisis y la geometría analítica al incorporar los valores imaginarios, y trabajar con los números complejos en vez de simplemente con los reales. Se gana generalidad y una comprensión más profunda de muchos resultados, pero desde el punto de vista geométrico intuitivo perdemos pie. Aún así Klein intenta aplicar ambas incorporaciones a la vez y explicar algunos términos.
Seguimos empleando las coordenadas homogéneas ya conocidas, en el plano \(x:y:1 = \xi:\eta:\tau\), pero ahora se admiten para todas ellas valores complejos, no solo reales, aunque excluyendo como siempre la anulación simultánea de todas las coordenadas homogéneas. Un conjunto de puntos que satisfacen una ecuación cuadrática homogénea definen una curva de segundo grado, y si satisfacen una ecuación lineal definen una curva de primer grado. Una curva de primer grado y una de segundo siempre se intersecan en dos puntos, que pueden ser reales o complejos, a distancia finita o infinita, separados o coincidentes. De forma similar, en el espacio se definen de forma analítica las superficies de primer grado (un plano) o de segundo grado, y hay resultados generales sobre las intersecciones a las que dan lugar.
Un iniciador de tales resultados, en el caso concreto de círculos y esfera, fue Poncelet con su "Traité des propietés projectives des figures" de 1822. Empleó su fuerte sentido de continuidad geométrica, pero no las coordenadas homogéneas. Klein las emplea para expresar la ecuación del círculo
\begin{equation*}
(x-a)^2 + (y-b)^2=r^2
\end{equation*}
en forma homogénea así
\begin{equation*}
(\xi - a \tau)^2 + (\eta - b \tau )^2 - r^2 \tau^2 = 0
\end{equation*}
La intersección de este círculo con la línea del infinito, \(\tau=0\), se describe por las dos ecuaciones
\begin{equation*}
\xi^2+\eta^2=0 \ \ , \ \ \tau=0
\end{equation*}
Las constantes \(a,b,r\) que caracterizan el círculo no aparecen, y por tanto todo círculo corta a la línea del infinito en los mismos dos puntos fijos, denominados puntos circulares imaginarios
\begin{equation*}
\xi : \eta = \pm i \ , \ \tau=0
\end{equation*}
Hay que recordar que las coordenadas homogéneas determinan un punto, salvo por un factor común, que ahora puede ser complejo. Coordenadas posibles de los puntos circulares imaginarios serían \((i,1,0)\) y \((-i,1,0)\), o cualquier múltiplo complejo.
En el espacio, por tanto con cuatro coordenadas homogéneas, una superficie de segundo grado se corta con otra de primer grado en una curva de segundo grado. Por ejemplo cualquier esfera corta el plano en el infinito en la misma cónica imaginaria, el círculo esférico imaginario
\begin{equation*}
\xi ^2 + \eta ^2 + \zeta ^2 = 0 \ \ , \ \ \tau=0
\end{equation*}
Aunque puede costar algo comprender el alcance de esta expresión analítica, más cuesta imaginar intuitivamente ese círculo, en el infinito, e imaginario. Pero sirve para cuadrar las cuentas: dos esferas, como superficies de segundo grado, deben cortarse en una curva de cuarto grado. En efecto siempre tenemos una intersección como un círculo, real o imaginario, y además el círculo esférico imaginario, el producto de esas dos curvas de segundo grado da la de cuarto.
Klein explica que una forma de hacer más reales los puntos circulares imaginarios (del plano) es someterles a la transformación imaginaria
\begin{equation*}
\xi' = \xi \ , \ \eta'=i \eta \ , \ \tau'=\tau
\end{equation*}
Entonces la ecuación \(\xi^2+\eta^2=0\) se convierte en \(\xi'^2-\eta'^2=0\) y convierte los puntos circulares imaginarios \(\xi : \eta = \pm i \ , \ \tau=0\) en los puntos reales en el infinito
\begin{equation*}
\xi' : \eta' = \pm 1 \ , \ \tau'=0
\end{equation*}
Estos puntos corresponden a las direcciones que hacen 45º con los ejes de coordenadas \(x', y'\). Todos los círculos se transforman en cónicas que "pasan" por estos puntos, es decir, en hipérbolas equilateras cuyas asíntotas hacen esos 45º con los ejes \(x'\) e \(y'\), aunque no pasan necesariamente por el origen de coordenadas.
¿Hay una forma puramente geométrica de expresar tales conceptos "imaginarios"? Poncelet y Steiner no fueron claros al respecto, pero von Staudt desarrolló ideas clave al respecto.
Por un lado, una curva dada por una ecuación con coeficientes reales determina un sistema polar, que proporciona una representación real, y puede usarse como objeto a investigar en vez de la curva. El sistema polar se define por la relación polo-polar asociada a una cónica. Si los coeficientes de ésta son reales, aún admitiendo para las coordenadas homogéneas valores complejos, siempre hay una relación para valores reales: un punto de coordenadas reales tiene asociada una polar real, incluso ¡aunque la cónica no tenga puntos reales! Además una cónica, al cortarse con una recta, determina en ésta una relación polar unidimensional, que es una involución. Esta involución tendrá dos puntos fijos, que pueden ser reales o imaginarios, pero en todo caso está definida perfectamente en base a su acción sobre puntos reales.
Un ejemplo, un círculo cualquiera se define en coordenadas homogéneas por
\begin{equation*}
\xi^2 + \eta^2- 2 a \xi \eta- 2 b \eta \tau + (a^2+b^2-r^2)=0
\end{equation*}
que se asocia a la relación polar
\begin{equation*}
\xi \xi' + \eta \eta' - a (\xi \tau' + \xi' \tau) - b(\eta \tau' + \eta' \tau) + (a^2+b^2-r^2) \tau \tau' =0
\end{equation*}
Esta relación polar induce, al considerar el corte del círculo con la recta en el infinito \(\tau=0=\tau'\), la relación polar unidimensional dada por
\begin{equation}\label{ec4bp123}
\xi \xi ' + \eta \eta' =0 \ , \ \tau = 0 \ , \ \tau'=0
\end{equation}
que como se ve es la misma para cualquier círculo, y es una involución. Esta relación está definida completamente en base a su comportamiento para valores reales. Las direcciones desde el origen hacia los dos puntos relacionados por la involución, \(P(\xi,\eta,0)\) y \(P'(\xi',\eta',0)\), son perpendiculares. Las tangentes a cualquier círculo (\(C_1\) o \(C_2\)) en una dirección dada, es decir, hacia un mismo punto del infinito \(P\), el polo, tienen asociadas polares (\(p'_1\), \(p'_2\)) que son perpendiculares a tal dirección, determinando por tanto otro punto \(P'\) en el infinito. Esta perpendicularidad geométricamente evidente, de las tangentes "reales" a los círculos y sus polares, ilustrada en la figura 92, página 122, de EMAS Geometry, es la plasmación de los dos puntos circulares imaginarios.
¡Puntos circulares imaginarios! |
Estos son precisamente los puntos fijos de la involución definida por \eqref{ec4bp123}, aquellos que se relacionan consigo mismos. En efecto los puntos fijos deben cumplir \(\xi=\xi',\eta=\eta',\tau=\tau'=0\) y de \eqref{ec4bp123} se obtiene que \(\xi:\eta = \pm i\).
Da igual el punto \(P\) elegido sobre la recta del infinito como polo, la dirección de las tangentes, la polar siempre será perpendicular, y la involución definida en la recta del infinito será la misma, por lo que se denomina involución absoluta. Ésta es equivalente, en la idea de von Staudt, al concepto mismo de puntos circulares del infinito.
Toma ya moreno.
Pero para Klein esto es una forma de eludir lo imaginario más que una interpretación. Propiamente tal interpretación de los puntos, líneas y planos imaginarios la consiguió von Staudt en su "Beiträge" de 1856-60.
Empezamos asociando a un punto imaginario \(P\), dado por sus coordenadas homogéneas complejas
\begin{equation*}
\xi = \xi_1+ i \xi_2 \ , \ \eta = \eta_1+ i \eta_2 \ , \ \tau = \tau_1+ i \tau_2
\end{equation*}
los dos puntos reales \(P_1: \xi_1,\eta_1,\tau_1 \) y \(P_2: \xi_2,\eta_2,\tau_2 \), que no coinciden, no son proporcionales, si \(P\) es propiamente imaginario. Estos puntos determinan una recta real, que también contiene tanto al punto imaginario \(P\) como al conjugado \(\overline{P} : \xi_1- i \xi_2,\eta_1- i \eta_2,\tau_1- i \tau_2 \). Pero en la perspectiva proyectiva que hemos de mantener siempre, \(P\) se determina por sus coordenadas homogéneas salvo un factor común, complejo, como \(\rho = \rho_1 + i \rho_2\), y entonces podemos asociar a \(P\) otros pares de puntos reales \(P'_1, P'_2\).
Al dar todos los valores posibles a \(\rho_1, \rho_2\) se obtiene una variedad geométrica de puntos reales que representa al punto geométrico \(P\) de una forma netamente proyectiva. Dos pares de puntos igualmente representativos, como \(P_1,P_2\) y \(P'_1, P'_2\), están intercalados sobre la misma línea, es más, resulta que cada par se relaciona por una misma involución de dicha línea, y los puntos fundamentales o fijos de dicha involución son precisamente \(P\), el punto imaginario de partida, y su conjugado \(\overline{P}\). Se llega a una situación parecida a la alcanzada antes con los puntos circulares del infinito, relacionando un punto imaginario (y su conjugado) con una involución en una recta real. Para obtener una expresión propia sólo de \(P\) y no de su conjugado, se elige un sentido concreto de recorrido de la involución, el de movimiento del punto real \(P'_1\) cuando el parámetro \(\lambda = -\rho_2 / \rho_1\) varía desde \(0\) a \(\infty\) y de vuelta a \(0\) desde \(-\infty\). El sentido opuesto para igual variación de \(\lambda\) corresponde al \(\overline{P}\).
Recíprocamente, "cada figura real tal, consistente en una línea recta, dos pares de puntos intercalados sobre ella, \(P_1, P_2\) y \(P'_1, P'_2\) (o una involución sin puntos reales dobles, junto con una flecha de dirección, representa un único punto imaginario".
Acaba así Klein, requiriendo buenas dosis de imaginación para hacer real lo imaginario, la segunda parte de la obra.
Etiquetas:
Dover Publications,
Felix Klein,
geometría,
libros,
matemáticas
lunes, 13 de mayo de 2013
EMAS Geometry 6 - Transformaciones de contacto
Las transformaciones de contacto se asocian al matemático noruego Sophus Lie, con el que Klein compartió unos años de intenso intercambio de ideas.
Klein presenta estas transformaciones como "evolución" de las anteriores transformaciones dualísticas: la relación bilineal de \(x\) e \(y\) con \(x'\) e \(y'\),
\[
a_1 x x'+b_1 x y' + c_1 x + a_2 y x' + b_2 y y'+c_2 y - a_3 x' - b_3 y' - c_3=0
\]
se generaliza a cualquier relación expresada mediante la aequatio directrix, o ecuación directriz, denominación debida a Plücker:
\begin{equation}\label{eq1p111}
\Omega(x,y;x',y') = 0
\end{equation}
siendo \(\Omega\) una función de las coordenadas de los planos \(E\) y \(E'\), arbitraria salvo por cumplir unas mínimas condiciones de continuidad. La siguiente figura, esta vez una recreación de las figuras 79 y 80 de "Elementary Mathematics from an Advanced Standpoint. Geometry", o de Geometría traducido por R. Fontanilla, es muy conveniente para entender la relación entre los dos planos.
A cada punto \(P\) del plano \(E\) se le asocia una curva \(C'_P\) en el plano \(E'\) determinada precisamente por esa ecuación (\ref{eq1p111}) tomando las coordenadas de \(P\) como constantes. A cada punto \(Q'\) del plano \(E'\) le corresponde una curva \(C_{Q'}\) en el plano \(E\). Si \(Q'\) pertenece a la curva \(C'_P\), entonces su curva asociada, \(C_{Q'}\), debe pasar por \(P\).
Al recorrer \(P\) una curva \(K\) en \(E\) se obtiene una familia de curvas en \(E'\) cuya envolvente es otra curva \(K'\) en \(E'\). Así se establece una relación entre las curvas de los planos \(E\) y \(E'\) obtenida de \(\Omega=0\) . En detalle, lo que se deduce es una relación entre elementos-de-línea entendidos como un punto \(P(x,y)\) y una dirección \(PP_1\), la de la tangente a \(K\) en \(P\) cuando \(P_1(x+dx,y+dy)\) se acerca a \(P\) sobre \(K\).
La curva \(C'_P\) asociada a \(P\) es \(\Omega(x,y;x',y')=0\) y la \(C'_{P_1}\) asociada a \(P_1\) en el límite hasta términos lineales puede ponerse como
\[
\Omega(x+dx,y+dy;x',y') = \Omega(x,y;x',y') + \frac{\partial\Omega}{\partial x}dx + \frac{\partial\Omega}{\partial y}dy= 0
\]
Usando \(p=dy/dx\), tangente del ángulo definido por \(PP_1\), la intersección de ambas curvas, en el límite, da el punto \(P'\) de tangencia a \(K'\). \(P'\) se obtiene por tanto de las dos ecuaciones
\begin{equation}\label{eq2p112}
\begin{aligned}
\Omega(x,y;x',y') &= 0 \\
\frac{\partial\Omega}{\partial x} + \frac{\partial\Omega}{\partial y} p &= 0
\end{aligned}
\end{equation}
La tangente a \(K'\) en \(P'\) es la tangente a \(C'_P\) en ese mismo punto, que se expresa por
\[
\frac{\partial\Omega}{\partial x'}dx' + \frac{\partial\Omega}{\partial y'}dy'= 0
\]
y puede ponerse, empleando \(p'=dy'/dx'\), como
\begin{equation}\label{eq3p112}
\frac{\partial\Omega}{\partial x'} + \frac{\partial\Omega}{\partial y'} p'= 0
\end{equation}
Así, dados en \(E\) un punto \(P\) y una dirección \(p\) , mediante \(\Omega\) se les hace corresponder un punto \(P'\) y una dirección \(p'\) en \(E'\), que se determinan resolviendo las ecuaciones (\ref{eq2p112}) y (\ref{eq3p112}). Queda claro el nombre dado por Lie de transformaciones de contacto: dos curvas que se tocan en un punto \(P\), son tangentes una a la otra, se transforman en otras que también se tocan, son tangentes una a la otra en \(P'\). La tangencia de dos curvas es un invariante bajo una transformación de contacto.
Conviene no dejarse engañar por la notación, no hay una correspondencia entre los puntos \(P\) y \(P'\), pues \(P'\) depende tanto de \(P\) como de \(p\), o de la curva \(K\) que se considere.
En cuanto al excelente MathJax, que llevo usando hace ya bastantes entradas, hoy he practicado por primera vez con la numeración de ecuaciones y con la referencia a dichas ecuaciones. Nada como esas páginas de ejemplo para aprender. He tenido que actualizar la plantilla de blogger para incluir lo indicado sobre numeración automática de ecuaciones.
Klein presenta estas transformaciones como "evolución" de las anteriores transformaciones dualísticas: la relación bilineal de \(x\) e \(y\) con \(x'\) e \(y'\),
\[
a_1 x x'+b_1 x y' + c_1 x + a_2 y x' + b_2 y y'+c_2 y - a_3 x' - b_3 y' - c_3=0
\]
se generaliza a cualquier relación expresada mediante la aequatio directrix, o ecuación directriz, denominación debida a Plücker:
\begin{equation}\label{eq1p111}
\Omega(x,y;x',y') = 0
\end{equation}
siendo \(\Omega\) una función de las coordenadas de los planos \(E\) y \(E'\), arbitraria salvo por cumplir unas mínimas condiciones de continuidad. La siguiente figura, esta vez una recreación de las figuras 79 y 80 de "Elementary Mathematics from an Advanced Standpoint. Geometry", o de Geometría traducido por R. Fontanilla, es muy conveniente para entender la relación entre los dos planos.
A cada punto \(P\) del plano \(E\) se le asocia una curva \(C'_P\) en el plano \(E'\) determinada precisamente por esa ecuación (\ref{eq1p111}) tomando las coordenadas de \(P\) como constantes. A cada punto \(Q'\) del plano \(E'\) le corresponde una curva \(C_{Q'}\) en el plano \(E\). Si \(Q'\) pertenece a la curva \(C'_P\), entonces su curva asociada, \(C_{Q'}\), debe pasar por \(P\).
Al recorrer \(P\) una curva \(K\) en \(E\) se obtiene una familia de curvas en \(E'\) cuya envolvente es otra curva \(K'\) en \(E'\). Así se establece una relación entre las curvas de los planos \(E\) y \(E'\) obtenida de \(\Omega=0\) . En detalle, lo que se deduce es una relación entre elementos-de-línea entendidos como un punto \(P(x,y)\) y una dirección \(PP_1\), la de la tangente a \(K\) en \(P\) cuando \(P_1(x+dx,y+dy)\) se acerca a \(P\) sobre \(K\).
La curva \(C'_P\) asociada a \(P\) es \(\Omega(x,y;x',y')=0\) y la \(C'_{P_1}\) asociada a \(P_1\) en el límite hasta términos lineales puede ponerse como
\[
\Omega(x+dx,y+dy;x',y') = \Omega(x,y;x',y') + \frac{\partial\Omega}{\partial x}dx + \frac{\partial\Omega}{\partial y}dy= 0
\]
Usando \(p=dy/dx\), tangente del ángulo definido por \(PP_1\), la intersección de ambas curvas, en el límite, da el punto \(P'\) de tangencia a \(K'\). \(P'\) se obtiene por tanto de las dos ecuaciones
\begin{equation}\label{eq2p112}
\begin{aligned}
\Omega(x,y;x',y') &= 0 \\
\frac{\partial\Omega}{\partial x} + \frac{\partial\Omega}{\partial y} p &= 0
\end{aligned}
\end{equation}
La tangente a \(K'\) en \(P'\) es la tangente a \(C'_P\) en ese mismo punto, que se expresa por
\[
\frac{\partial\Omega}{\partial x'}dx' + \frac{\partial\Omega}{\partial y'}dy'= 0
\]
y puede ponerse, empleando \(p'=dy'/dx'\), como
\begin{equation}\label{eq3p112}
\frac{\partial\Omega}{\partial x'} + \frac{\partial\Omega}{\partial y'} p'= 0
\end{equation}
Así, dados en \(E\) un punto \(P\) y una dirección \(p\) , mediante \(\Omega\) se les hace corresponder un punto \(P'\) y una dirección \(p'\) en \(E'\), que se determinan resolviendo las ecuaciones (\ref{eq2p112}) y (\ref{eq3p112}). Queda claro el nombre dado por Lie de transformaciones de contacto: dos curvas que se tocan en un punto \(P\), son tangentes una a la otra, se transforman en otras que también se tocan, son tangentes una a la otra en \(P'\). La tangencia de dos curvas es un invariante bajo una transformación de contacto.
Conviene no dejarse engañar por la notación, no hay una correspondencia entre los puntos \(P\) y \(P'\), pues \(P'\) depende tanto de \(P\) como de \(p\), o de la curva \(K\) que se considere.
En cuanto al excelente MathJax, que llevo usando hace ya bastantes entradas, hoy he practicado por primera vez con la numeración de ecuaciones y con la referencia a dichas ecuaciones. Nada como esas páginas de ejemplo para aprender. He tenido que actualizar la plantilla de blogger para incluir lo indicado sobre numeración automática de ecuaciones.
Etiquetas:
Felix Klein,
geometría,
matemáticas,
MathJax,
Sophus Lie
Suscribirse a:
Entradas (Atom)