Оголошення про створення робочої групи Checkpoint/Restore Working Group
Спільнота навколо Kubernetes включає в себе ряд спеціальних груп за інтересами (SIG) та робочих груп (WG), які сприяють обговоренню важливих тем між зацікавленими учасниками. Сьогодні ми хотіли б оголосити про створення нової робочої групи Kubernetes Checkpoint Restore WG, яка зосередиться на інтеграції функціоналу Checkpoint/Restore в Kubernetes.
Мотивація та випадки використання
Робоча група обговорює кілька сценаріїв високого рівня:
- Оптимізація використання ресурсів для інтерактивних робочих навантажень, таких як Jupyter notebook та чат-боти зі штучним інтелектом
- Прискорення запуску застосунків з тривалим часом ініціалізації, включаючи Java-застосунки та служби LLM-інференції
- Використання періодичних контрольних точок для забезпечення відмовостійкості довготривалих робочих навантажень, таких як розподілене навчання моделей
- Забезпечення планування з урахуванням переривань з прозорою перевіркою/відновленням, що дозволяє витісняти Pod з нижчим пріоритетом, зберігаючи стан виконання застосунків
- Спрощення міграції Podʼів між вузлами для балансування навантаження та обслуговування без переривання робочих навантажень.
- Увімкнення перевірки для розслідування та аналізу інцидентів безпеки, таких як кібератаки, порушення безпеки даних та несанкціонований доступ.
У всіх цих сценаріях мета полягає в тому, щоб сприяти обговоренню ідей між спільнотою Kubernetes та екосистемою Checkpoint/Restore in Userspace (CRIU), яка постійно розширюється. Спільнота CRIU включає кілька проєктів, що підтримують ці випадки використання, зокрема:
- CRIU — інструмент для створення контрольних точок та відновлення запущених застосунків і контейнерів
- checkpointctl — інструмент для поглибленого аналізу контрольних точок контейнерів
- criu-coordinator — інструмент для скоординованого створення контрольних точок/відновлення розподілених застосунків за допомогою CRIU
- checkpoint-restore-operator — оператор Kubernetes для управління контрольними точками
Більше інформації про інтеграцію контрольних точок/відновлення з Kubernetes також доступно тут.
Повʼязані події
Після нашої презентації про прозорі контрольні точки на KubeCon EU 2025, ми раді запросити вас до участі в нашій панельній дискусії та сесії AI + ML на KubeCon + CloudNativeCon Europe 2026.
Звʼяжіться з нами
Якщо ви зацікавлені у співпраці з Kubernetes або CRIU, є кілька способів взяти участь:
- Приєднуйтесь до наших зустрічей щодругого четверга о 17:00 UTC за посиланням Zoom у наших нотатках про зустрічі; записи наших попередніх зустрічей доступні тут.
- Поспілкуйтеся з нами на Kubernetes Slack: #wg-checkpoint-restore
- Надішліть нам електронного листа на адресу розсилки wg-checkpoint-restore