Proyecto divulgativo-técnico interactivo

Anatomía de un
Modelo de Lenguaje Grande

Quítale la magia. Entiende qué son, cómo funcionan y qué implica ejecutar LLMs reales, desde el concepto hasta el bit que viaja por un bus de silicio.

Un LLM no es magia

Es matemáticas sobre silicio. Todo se puede medir, todo se puede explicar.

🧠

Fundamentos

Parámetros, memoria, cuantización y la calculadora de VRAM. ¿Cuánto ocupa un modelo? ¿En qué GPU cabe?

Explorar →
🔌

Hardware

El bus de memoria, el ancho de banda, la jerarquía completa y por qué la inferencia es memory-bound.

Explorar →
🏗️

Arquitectura Transformer

Atención, Feed-Forward, el bloque completo y cómo se ensamblan 32 capas para formar un LLM.

Explorar →

Inferencia

Bucle autoregresivo, KV Cache, velocidad real y la calculadora de tokens/s para tu GPU.

Explorar →
🔤

Tokenización & Embeddings

De texto a números, BPE, el espacio semántico 3D y cómo las palabras encuentran su lugar.

Explorar →
📚

Entrenamiento

Pre-training, SFT, RLHF, alucinaciones y por qué el modelo no sabe qué es verdad.

Explorar →

¿Qué es un LLM en 30 segundos?

Un LLM es una máquina que predice la siguiente palabra.

"El gato está sobre la" "mesa"
Prompt Predicción

No "piensa", no "razona", no "entiende" como un humano. Simplemente:

  1. Recibe una secuencia de palabras
  2. Calcula cuál es la palabra más probable que sigue
  3. La elige (con algo de creatividad)
  4. La añade a la secuencia y vuelve al paso 1

💡 Eso es todo. La magia está en cómo hace ese cálculo. Y de eso trata esta guía: desmontar la máquina pieza por pieza.

"Un LLM no es magia. Es matemáticas sobre silicio. El conocimiento cabe en números que viajan por autopistas de bits a velocidades finitas. Todo se puede medir, todo se puede explicar."

— Filosofía del proyecto