Geometría hiperbólica,
tocándola con las manos
Arrastra puntos, mueve sliders y mira cómo responde el espacio curvo. Cada herramienta calcula la geometría real (la misma del paper), no una caricatura: lo que ves medido es lo que ocurre en la bola de Poincaré.
Hay tres geometrías, y la curvatura las distingue
En la esfera (curvatura \(K>0\)) la suma de los ángulos de un triángulo pasa de \(180°\); en el plano (\(K=0\)) es exactamente \(180°\); en el plano hiperbólico (\(K<0\)) es menos. No podemos dibujar \(\mathbb{H}^2\) sin distorsión en una hoja plana, así que usamos mapas — igual que con la Tierra. El más famoso es el disco de Poincaré: todo cabe dentro de un círculo, y un factor de escala corrige las distancias.
Las herramientas de abajo trabajan todas en el disco de Poincaré. La regla mental: lo que el dibujo encoge cerca del borde, la geometría lo estira.
La métrica: una escala que crece hacia el borde
Medir es sumar pasitos (Pitágoras: \(ds^2=dx^2+dy^2\)). En el disco, cada pasito del mapa se multiplica por un factor de escala local \(\lambda_x=\dfrac{2}{1-\lVert x\rVert^2}\): vale 2 en el centro y se dispara cerca del borde. Por eso el borde está a distancia infinita aunque en el dibujo parezca pegado.
Arrastra el punto
El color es \(\log_{10}\lambda\). Fíjate: mover el punto un poco cerca del borde dispara la distancia real al origen.
El camino más corto se curva — y eso es "ser recta"
Como los pasos son más baratos cerca del centro, el camino más corto (la geodésica) se comba hacia dentro. "Recta" no significa 90°: significa el camino que gasta exactamente la distancia (el test del andarín). Arrastra A y B y compara el segmento recto del dibujo con la geodésica real.
Arrastra A y B
El segmento azul parece recto pero malgasta longitud; la geodésica roja es la verdadera línea recta del espacio hiperbólico.
Por un punto pasan infinitas paralelas
Niega el quinto postulado de Euclides: por \(P\) pasan infinitas geodésicas que no cortan a \(L\). Y son de dos tipos: paralelas límite (se acercan a \(L\) sin tocarla) y ultraparalelas (guardan una distancia mínima positiva). Arrastra \(P\).
Arrastra P
Todas evitan a \(L\) (la azul); que se corten entre sí en \(P\) no es un fallo: "paralela" es una relación con \(L\).
El espacio crece exponencialmente
La circunferencia de radio real \(\rho\) mide \(2\pi\sinh\rho\approx \pi e^{\rho}\): crece exponencialmente, frente al \(2\pi\rho\) del plano. Por eso un árbol —cuyos nodos crecen como \(b^\ell\)— cabe sin amontonarse en el plano hiperbólico, y no en el euclídeo. Mueve el radio:
El mapa exponencial: meter vectores en la bola (y la saturación)
Una red neuronal produce vectores euclídeos \(v\) sin límite de norma. El mapa exponencial \(\exp_0^c(v)=\tanh(\sqrt c\,\lVert v\rVert)\,\frac{v}{\sqrt c\,\lVert v\rVert}\) los mete en la bola. Sube la norma: verás que con \(c=1\) todos se aplastan contra el borde (saturación / shell collapse) — el problema real al entrenar. Activa el clipping o baja la curvatura \(c\) y mira cómo se recupera.
Controles
Clipping = techo (no normalización): los vectores cortos pasan intactos, solo se recorta el exceso.
El mismo espacio, tres mapas
Poincaré, Klein y el semiplano superior son el mismo espacio hiperbólico dibujado distinto. Arrastra los vértices del triángulo en el disco de Poincaré y mira cómo se ve simultáneamente en los otros dos: Klein endereza las geodésicas (a cambio de mentir en los ángulos), el semiplano manda el borde al eje real.
Poincaré (arrastra aquí)
Klein (rectas)
Semiplano superior
Promediar puntos: Einstein vs Fréchet
El punto medio de Einstein es una fórmula cerrada y rápida (pasa por Klein); la media de Fréchet es el verdadero minimizador de \(\sum_i d^2\), pero hay que iterar. Coinciden con 2 puntos; con 3+ no, y Einstein queda sesgado hacia los puntos del borde — exactamente el efecto que penaliza al modelo 5-shot del experimento.
Arrastra los puntos
Las líneas verdes son las geodésicas del Fréchet a cada punto. Mete un punto al borde y mira cómo Einstein se va hacia él.
¿Para qué sirve todo esto? Few-shot learning en CIFAR-FS
Pusimos la teoría a prueba en CIFAR-FS, un benchmark real de few-shot (imágenes de CIFAR-100). Misma red prototípica con encoder Conv4 idéntico, solo cambia la geometría de la cabeza: la euclídea usa media + distancia euclídea; la hiperbólica proyecta al disco con exp₀, promedia con el punto medio de Einstein y clasifica por distancia de Poincaré.
El primer choque con la realidad: la hiperbólica "tal cual" (c=1) se hunde, porque las normas del encoder (~17–24) saturan el tanh y todos los embeddings colapsan al borde — exactamente la saturación que viste en la herramienta del mapa exponencial. Las defensas de la lección (feature clipping, curvatura pequeña, curvatura aprendible) recuperan ~8 puntos, pero la euclídea gana igualmente: CIFAR-FS no es fuertemente jerárquico y la dimensión (256) es alta.
| Cabeza (CIFAR-FS, 5-way) | 1-shot | 5-shot |
|---|---|---|
| Euclídea | 50.8% | 71.9% |
| Hiperbólica vanilla (c=1) | 41.7% | 50.0% |
| Hiperbólica + clip + curvatura aprendible | 48.5% | 57.3% |
Moraleja —y confirmación de la teoría por sus dos caras—: el espacio hiperbólico es un sesgo inductivo útil cuando los datos son jerárquicos y la dimensión es baja, no una mejora universal. La historia completa (diagnóstico de saturación y las tres defensas) está en EXPERIMENTS.md del proyecto.