Las entrevistas de system design son las guardianas de los roles de ingeniería senior en las principales empresas tech.
En 2026, estas entrevistas han evolucionado más allá de "diseña Twitter" o "diseña Uber". Los entrevistadores ahora esperan que discutas escalabilidad de sistemas IA, edge computing y procesamiento de datos en tiempo real junto con conceptos tradicionales.
Si te entrevistas para posiciones de senior software engineer, staff engineer o arquitecto—especialmente en empresas FAANG—enfrentarás al menos una (frecuentemente dos) rondas de system design.
Esta guía te mostrará exactamente cómo prepararte.
¿Qué Es una Entrevista de System Design?
Una entrevista de system design evalúa tu habilidad para diseñar sistemas distribuidos de gran escala desde cero.
Te dan un problema amplio como "Diseña YouTube" o "Diseña un acortador de URLs" y 45-60 minutos para:
- Clarificar requisitos
- Diseñar una arquitectura de alto nivel
- Discutir trade-offs
- Profundizar en componentes específicos
- Abordar escalabilidad, fiabilidad y rendimiento
Lo que los entrevistadores realmente evalúan:
Profundidad Técnica
¿Entiendes conceptos fundamentales de sistemas distribuidos como teorema CAP, sharding, caching y load balancing?
¿Puedes explicar trade-offs entre SQL vs NoSQL? ¿Procesamiento síncrono vs asíncrono?
Enfoque de Resolución de Problemas
¿Haces preguntas clarificadoras antes de saltar a soluciones?
¿Empiezas simple e iteras, o sobrediseñas desde el inicio?
Habilidades de Comunicación
¿Puedes explicar sistemas complejos claramente?
¿Usas diagramas? ¿Comunicas trade-offs?
Experiencia del Mundo Real
¿Has construido sistemas distribuidos antes?
Tus respuestas revelan si realmente has lidiado con escala, manejado incidentes de producción y tomado decisiones arquitectónicas bajo presión.
Preguntas Top de System Design para 2026
Preguntas Clásicas (Todavía Relevantes)
1. Diseña un Acortador de URLs (como bit.ly)
Por qué se pregunta: Evalúa tu comprensión de hashing, diseño de base de datos y caching.
Conceptos clave a cubrir:
- Codificación Base62 para URLs cortas
- Manejo de colisiones hash
- Esquema de base de datos (tabla de mapeo URL)
- Caching Redis para URLs populares
- Rate limiting para prevenir abuso
- Tracking de analytics (clics, geografía)
Giro 2026: Añade dashboard de analytics en tiempo real y rate limiting de API con protección DDoS.
2. Diseña Instagram / Plataforma de Compartir Fotos
Por qué se pregunta: Evalúa tu conocimiento de blob storage, CDN y generación de feed.
Conceptos clave a cubrir:
- Object storage (S3) para imágenes
- CDN para entrega global de imágenes
- Generación de newsfeed (fan-out on write vs read)
- Pipeline de procesamiento de imágenes (thumbnails, compresión)
- Estrategia de sharding para datos de usuario
Giro 2026: Incluye moderación de contenido con IA y ranking personalizado de feed usando ML.
3. Diseña YouTube / Plataforma de Streaming de Video
Por qué se pregunta: Evalúa tu comprensión de manejo de archivos grandes, streaming adaptativo y CDN.
Conceptos clave a cubrir:
- Pipeline de upload y procesamiento de video
- Streaming de bitrate adaptativo (HLS, DASH)
- Arquitectura CDN para entrega de video
- Diseño de base de datos (videos, usuarios, comentarios)
- Motor de recomendaciones
Giro 2026: Añade soporte de live streaming con ultra-baja latencia (WebRTC) y chat en tiempo real.
Preguntas Enfocadas en AI/ML (Nuevas en 2026)
4. Diseña un Sistema de Recomendaciones en Tiempo Real
Por qué se pregunta: Evalúa tu conocimiento de ML serving, feature stores e inferencia en tiempo real.
Conceptos clave a cubrir:
- Pipeline de feature engineering
- Feature stores online vs offline
- Model serving (TensorFlow Serving, Seldon)
- Infraestructura de A/B testing
- Predicciones en tiempo real vs batch
- Monitoreo de modelos y detección de drift
5. Diseña ChatGPT / Aplicación Potenciada por LLM
Por qué se pregunta: Evalúa tu comprensión de infraestructura LLM, prompt caching y rate limiting.
Conceptos clave a cubrir:
- Integración de API LLM (OpenAI, Anthropic)
- Prompt caching para reducir costos
- Streaming de respuestas (Server-Sent Events)
- Gestión de context window
- Rate limiting y control de costos
- Base de datos vectorial para RAG
6. Diseña un Motor de Búsqueda con Búsqueda Semántica
Por qué se pregunta: Evalúa conocimiento de vector embeddings, similarity search y búsqueda híbrida.
Conceptos clave a cubrir:
- Índice invertido tradicional (búsqueda por palabras clave)
- Vector embeddings para búsqueda semántica
- Bases de datos vectoriales (Pinecone, Weaviate, pgvector)
- Búsqueda híbrida (combinando keyword + semántica)
- Modelos de re-ranking
El Framework Paso a Paso
Toda entrevista de system design debe seguir esta estructura:
Paso 1: Clarifica Requisitos (5-10 minutos)
Nunca empieces a diseñar sin hacer preguntas.
Requisitos funcionales:
- ¿Qué características debe soportar el sistema?
- ¿Cuál es el flujo principal del usuario?
- ¿Hay restricciones específicas?
Requisitos no funcionales:
- ¿Cuántos usuarios? (Escala)
- ¿Proporción lectura vs escritura?
- ¿Requisitos de latencia?
- ¿Trade-offs consistencia vs disponibilidad?
Paso 2: Cálculos de Servilleta (5 minutos)
Estima la escala para informar decisiones de diseño.
Ejemplo de cálculos:
- 500M usuarios activos diarios
- Cada usuario postea 2 tweets/día = 1B tweets/día
- Tamaño promedio de tweet: 200 bytes
- Almacenamiento diario necesario: 1B × 200 bytes = 200 GB/día
Paso 3: Diseño de Alto Nivel (10-15 minutos)
Dibuja un diagrama de arquitectura simple con componentes principales.
Para la mayoría de sistemas:
- Cliente (app web/móvil)
- Load Balancer (distribuir tráfico)
- Servidores de Aplicación (lógica de negocio)
- Capa de Cache (Redis/Memcached)
- Base de Datos (SQL/NoSQL)
- Blob Storage (S3 para media)
- CDN (entrega de contenido estático)
- Cola de Mensajes (procesamiento async)
Paso 4: Deep Dive (15-20 minutos)
El entrevistador te pedirá profundizar en 2-3 componentes.
Áreas comunes de deep-dive:
- Diseño de esquema de base de datos
- Diseño de API (endpoints REST)
- Estrategia de caching
- Enfoque de escalado (horizontal vs vertical)
- Escenarios de falla y recuperación
Paso 5: Aborda Cuellos de Botella y Trade-offs (5-10 minutos)
Discute problemas potenciales y cómo resolverlos.
Cuellos de botella comunes:
- Punto único de falla (añade redundancia)
- Hot spots de base de datos (sharding, read replicas)
- Ancho de banda de red (compresión, CDN)
- Límites de memoria (cache distribuido)
Trade-offs a discutir:
- Consistencia vs Disponibilidad (teorema CAP)
- Latencia vs Throughput
- Costo vs Rendimiento
- Complejidad vs Mantenibilidad
Conceptos Fundamentales que DEBES Conocer
1. Load Balancing
Distribuye tráfico a través de múltiples servidores.
Algoritmos:
- Round Robin (simple, distribución uniforme)
- Least Connections (ruta al servidor menos ocupado)
- IP Hash (persistencia de sesión)
Herramientas: Nginx, HAProxy, AWS ALB, Google Cloud Load Balancer
2. Caching
Almacena datos de acceso frecuente en memoria rápida.
Niveles de cache:
- Cache de navegador (assets estáticos)
- Cache CDN (ubicaciones edge)
- Cache de aplicación (Redis, Memcached)
- Cache de base de datos (cache de resultados de query)
Estrategias:
- Cache-aside: App verifica cache, luego DB si miss
- Write-through: Escribe a cache y DB simultáneamente
- Write-behind: Escribe a cache, escritura async a DB
3. Diseño de Base de Datos
SQL vs NoSQL:
Usa SQL cuando:
- Se requiere consistencia fuerte (transacciones financieras)
- Queries complejas y joins
- Se necesitan garantías ACID
Usa NoSQL cuando:
- Escala masiva (billones de registros)
- Se requiere flexibilidad de esquema
- Se necesita alto throughput de escritura
- Consistencia eventual es aceptable
Sharding:
Divide datos a través de múltiples bases de datos.
Estrategias de sharding:
- Basado en hash:
shard = hash(user_id) % num_shards - Basado en rango:
user_id 1-1M → shard1, 1M-2M → shard2 - Geográfico:
usuarios US → shard US, usuarios EU → shard EU
4. Content Delivery Network (CDN)
Sirve contenido estático desde ubicaciones edge cerca de usuarios.
Beneficios:
- Latencia reducida (geográficamente más cerca)
- Carga reducida en servidor origen
- Protección DDoS
Herramientas: CloudFlare, Fastly, AWS CloudFront, Akamai
5. Colas de Mensajes
Desacopla servicios con comunicación asíncrona.
Casos de uso:
- Enviar emails asincrónicamente
- Procesar imágenes subidas en background
- Arquitecturas dirigidas por eventos
- Manejar picos de tráfico (cola buffer de requests)
Herramientas: Apache Kafka, RabbitMQ, AWS SQS, Google Pub/Sub
6. Teorema CAP
Solo puedes garantizar 2 de 3:
Consistencia: Todos los nodos ven los mismos datos al mismo tiempo
Disponibilidad: El sistema siempre responde (aunque los datos estén desactualizados)
Tolerancia a Particiones: El sistema funciona a pesar de fallos de red
Elecciones del mundo real:
- Sistemas CP: Banca (consistencia sobre disponibilidad)
- Sistemas AP: Feeds de redes sociales (disponibilidad sobre consistencia)
Errores Comunes a Evitar
1. Saltar a Soluciones Demasiado Rápido
No empieces a diseñar antes de clarificar requisitos.
2. Sobre-Ingeniería
No diseñes para 1 billón de usuarios cuando tienes 1,000.
Empieza simple. Escala cuando sea necesario.
3. Ignorar Trade-Offs
Toda decisión tiene trade-offs. Reconócelos.
4. No Hacer Preguntas Clarificadoras
Los entrevistadores quieren ver que recoges requisitos.
5. Comunicación Pobre
Usa la pizarra. Dibuja diagramas. Explica tu pensamiento en voz alta.
6. Descuidar Requisitos No Funcionales
No te enfoques solo en features. Discute:
- Escalabilidad
- Fiabilidad
- Seguridad
- Monitoreo
Cómo Prepararte
1. Estudia Conceptos Fundamentales (2-3 semanas)
Temas esenciales:
- Algoritmos de load balancing
- Estrategias de caching
- Sharding y replicación de base de datos
- Teorema CAP
- Consistent hashing
- Colas de mensajes
- Arquitectura CDN
Mejores recursos:
- Designing Data-Intensive Applications de Martin Kleppmann
- System Design Primer (repositorio GitHub)
- Canal de YouTube ByteByteGo
2. Practica Preguntas Comunes (3-4 semanas)
Trabaja a través de 15-20 problemas clásicos de system design.
Preguntas para practicar:
- Diseña URL shortener
- Diseña Instagram
- Diseña YouTube
- Diseña Uber
- Diseña WhatsApp
- Diseña Netflix
- Diseña Twitter newsfeed
- Diseña Dropbox
3. Haz Entrevistas de Práctica
Practica con compañeros o usa el entrevistador IA de Interview Whisper.
4. Revisa Arquitecturas de Sistemas Reales
Lee blogs de ingeniería de empresas top: Netflix, Uber, AirBnb, Meta, Google.
Empieza a Practicar Hoy
Las entrevistas de system design son la parte más difícil del proceso de entrevista técnica—pero también la más gratificante de dominar.
Con la preparación correcta, puedes entrar a cualquier entrevista FAANG confiado en que puedes diseñar sistemas escalables.
¿Listo para dominar system design?
Practica con el Entrevistador IA de Interview Whisper →
Obtén feedback en tiempo real sobre tus diseños de sistema. Practica preguntas ilimitadas. Construye confianza antes de tu entrevista FAANG.
Artículos Relacionados: