Оголошення про створення робочої групи Checkpoint/Restore Working Group

Спільнота навколо Kubernetes включає в себе ряд спеціальних груп за інтересами (SIG) та робочих груп (WG), які сприяють обговоренню важливих тем між зацікавленими учасниками. Сьогодні ми хотіли б оголосити про створення нової робочої групи Kubernetes Checkpoint Restore WG, яка зосередиться на інтеграції функціоналу Checkpoint/Restore в Kubernetes.

Мотивація та випадки використання

Робоча група обговорює кілька сценаріїв високого рівня:

  • Оптимізація використання ресурсів для інтерактивних робочих навантажень, таких як Jupyter notebook та чат-боти зі штучним інтелектом
  • Прискорення запуску застосунків з тривалим часом ініціалізації, включаючи Java-застосунки та служби LLM-інференції
  • Використання періодичних контрольних точок для забезпечення відмовостійкості довготривалих робочих навантажень, таких як розподілене навчання моделей
  • Забезпечення планування з урахуванням переривань з прозорою перевіркою/відновленням, що дозволяє витісняти Pod з нижчим пріоритетом, зберігаючи стан виконання застосунків
  • Спрощення міграції Podʼів між вузлами для балансування навантаження та обслуговування без переривання робочих навантажень.
  • Увімкнення перевірки для розслідування та аналізу інцидентів безпеки, таких як кібератаки, порушення безпеки даних та несанкціонований доступ.

У всіх цих сценаріях мета полягає в тому, щоб сприяти обговоренню ідей між спільнотою Kubernetes та екосистемою Checkpoint/Restore in Userspace (CRIU), яка постійно розширюється. Спільнота CRIU включає кілька проєктів, що підтримують ці випадки використання, зокрема:

  • CRIU — інструмент для створення контрольних точок та відновлення запущених застосунків і контейнерів
  • checkpointctl — інструмент для поглибленого аналізу контрольних точок контейнерів
  • criu-coordinator — інструмент для скоординованого створення контрольних точок/відновлення розподілених застосунків за допомогою CRIU
  • checkpoint-restore-operator — оператор Kubernetes для управління контрольними точками

Більше інформації про інтеграцію контрольних точок/відновлення з Kubernetes також доступно тут.

Після нашої презентації про прозорі контрольні точки на KubeCon EU 2025, ми раді запросити вас до участі в нашій панельній дискусії та сесії AI + ML на KubeCon + CloudNativeCon Europe 2026.

Звʼяжіться з нами

Якщо ви зацікавлені у співпраці з Kubernetes або CRIU, є кілька способів взяти участь: