Вы настраивали CI/CD пайплайны, деплоили приложения в Kubernetes и управляли инфраструктурой с Terraform.
Но когда интервьюер спрашивает "Как бы вы спроектировали стратегию деплоя без downtime?" — нужно больше чем практический опыт.
Это руководство даёт 55+ реальных вопросов DevOps и cloud собеседований от Amazon, Google, Microsoft.
Что Оценивают DevOps Собеседования
- Техническая глубина: Инфраструктура, сети, безопасность
- System design: Надёжные, масштабируемые системы
- Troubleshooting: Отладка продакшен проблем
- Автоматизация: Всё как код
- Операционное совершенство: Мониторинг, инциденты
Вопросы о CI/CD
1. Объясните CI/CD и преимущества
Continuous Integration (CI):
- Разработчики часто сливают код
- Автоматические сборки и тесты
- Раннее обнаружение проблем
Continuous Delivery (CD):
- Код всегда готов к деплою
- Автоматический деплой на staging
Преимущества:
- Быстрый feedback
- Меньший риск
- Высокое качество
- Продуктивность разработчиков
2. Разница между blue-green и canary деплоем?
Blue-Green:
- Два идентичных production окружения
- Мгновенное переключение трафика
- Плюс: Мгновенный откат
- Минус: Двойная стоимость инфраструктуры
Canary:
- Деплой на малый процент серверов/пользователей
- Постепенное увеличение трафика
- Плюс: Меньший риск, реальная валидация
- Минус: Более медленный rollout
Вопросы о Kubernetes
3. Разница между Docker контейнерами и VM?
| Аспект | VM | Контейнер |
|---|---|---|
| Изоляция | Уровень hardware | Уровень OS |
| Размер | ГБ | МБ |
| Старт | Минуты | Секунды |
| Накладные расходы | Высокие | Низкие |
| Безопасность | Сильная изоляция | Слабее (общий kernel) |
4. Объясните архитектуру Kubernetes
Control Plane:
- API Server: Точка входа для REST команд
- etcd: Распределённое хранилище состояния
- Scheduler: Назначает pods на nodes
- Controller Manager: Запускает контроллеры
Worker Nodes:
- kubelet: Агент, запускает контейнеры
- kube-proxy: Сетевой прокси
- Container runtime: Docker, containerd
5. Что такое probes в Kubernetes?
Liveness Probe:
- Цель: Жив ли контейнер?
- При сбое: Перезапуск контейнера
- Случай: Deadlocks, зависшие процессы
Readiness Probe:
- Цель: Готов ли контейнер принимать трафик?
- При сбое: Удаление из endpoints
- Случай: Прогрев, проверка зависимостей
Startup Probe:
- Цель: Успешно ли стартовал контейнер?
- Случай: Приложения с долгим стартом
Cloud и Инфраструктура
6. Как спроектировать высокодоступную архитектуру в AWS?
Multi-AZ дизайн:
Route 53 (DNS)
│
CloudFront (CDN)
│
Application Load Balancer
/ \
AZ-1 AZ-2
Auto Scaling Auto Scaling
RDS Primary ←──────→ RDS Standby
Ключевые компоненты:
- DNS: Route 53 с health checks
- CDN: CloudFront
- Load Balancing: ALB между AZ
- Compute: Auto Scaling Groups
- Database: RDS Multi-AZ
7. Объясните VPC, subnets, security groups и NACLs
VPC: Изолированная сеть в облаке Subnets: Подразделения VPC (публичные/приватные)
| Аспект | Security Group | NACL |
|---|---|---|
| Уровень | Instance/ENI | Subnet |
| Состояние | Stateful | Stateless |
| Правила | Только Allow | Allow и Deny |
Мониторинг и Observability
8. Три столпа observability
1. Метрики:
- Числовые данные во времени
- CPU, requests, latency percentiles
2. Логи:
- Дискретные события
- Сообщения об ошибках, audit trails
3. Трейсы:
- Поток запроса через сервисы
- Breakdown латентности
Зачем все три:
- Метрики: "Что-то не так"
- Логи: "Что пошло не так"
- Трейсы: "Где пошло не так"
9. Объясните SLI, SLO и SLA
SLI: Количественная мера сервиса (availability, latency)
SLO: Целевое значение SLI (внутренняя цель)
SLA: Контракт с клиентами (с последствиями за невыполнение)
Error budget:
Error budget = 100% - SLO = 0.1% запросов могут падать
Безопасность
10. Как защитить Kubernetes кластер?
Control plane:
- RBAC
- Network policies
- Audit logging
Pod security:
securityContext:
runAsNonRoot: true
readOnlyRootFilesystem: true
allowPrivilegeEscalation: false
Secrets:
- Не храните в ConfigMaps
- Используйте Vault, AWS Secrets Manager
Troubleshooting
11. Production сервис тормозит. Как диагностировать?
Шаг 1: Triage (1-2 мин)
- Scope: Все пользователи или часть?
- Когда началось?
Шаг 2: Следуй пути запроса
User → CDN → Load Balancer → App → Database
Шаг 3: Исследуй каждый уровень
- Сеть: DNS, TLS
- Приложение: CPU/память, connection pools
- База данных: Медленные запросы, locks
Практикуйте с ИИ
Interview Whisper позволяет:
- Практиковать объяснение архитектурных решений
- Отвечать на scenario-based вопросы
- Получать feedback о технической ясности
Лучшие DevOps инженеры объясняют сложное просто.
Практикуйте DevOps Вопросы с ИИ
Связанные Статьи
DevOps собеседования оценивают техническую глубину И коммуникацию. Практикуйтесь объяснять эти концепты ясно.