Proyecto divulgativo-técnico interactivo

Anatomía de un
Modelo de Lenguaje Grande

Quítale la magia. Entiende qué son, cómo funcionan y qué implica ejecutar LLMs reales, desde el concepto hasta el bit que viaja por un bus de silicio.

Empezar a aprender → 📖 Glosario rápido

Un LLM no es magia

Es matemáticas sobre silicio. Todo se puede medir, todo se puede explicar.

🧠

Fundamentos

Parámetros, memoria, cuantización y la calculadora de VRAM. ¿Cuánto ocupa un modelo? ¿En qué GPU cabe?

Explorar → 🔌

Hardware

El bus de memoria, el ancho de banda, la jerarquía completa y por qué la inferencia es memory-bound.

Explorar → 🏗️

Arquitectura Transformer

Atención, Feed-Forward, el bloque completo y cómo se ensamblan 32 capas para formar un LLM.

Explorar → ⚡

Inferencia

Bucle autoregresivo, KV Cache, velocidad real y la calculadora de tokens/s para tu GPU.

Explorar → 🔤

Tokenización & Embeddings

De texto a números, BPE, el espacio semántico 3D y cómo las palabras encuentran su lugar.

Explorar → 📚

Entrenamiento

Pre-training, SFT, RLHF, alucinaciones y por qué el modelo no sabe qué es verdad.

Explorar →

¿Qué es un LLM en 30 segundos?

Un LLM es una máquina que predice la siguiente palabra.

"El gato está sobre la" → "mesa"

Prompt Predicción

No "piensa", no "razona", no "entiende" como un humano. Simplemente:

Recibe una secuencia de palabras
Calcula cuál es la palabra más probable que sigue
La elige (con algo de creatividad)
La añade a la secuencia y vuelve al paso 1

💡 Eso es todo. La magia está en cómo hace ese cálculo. Y de eso trata esta guía: desmontar la máquina pieza por pieza.

Empezar por los fundamentos →

"Un LLM no es magia. Es matemáticas sobre silicio. El conocimiento cabe en números que viajan por autopistas de bits a velocidades finitas. Todo se puede medir, todo se puede explicar."

— Filosofía del proyecto

Anatomía de un Modelo de Lenguaje Grande