1 - Метрики SLI компонентів Kubernetes

Високорівневі показники для вимірювання надійності та продуктивності компонентів Kubernetes.
СТАН ФУНКЦІОНАЛУ: Kubernetes v1.32 [stable](стандартно увімкнено)

Типово Kubernetes 1.36 публікує метрики Індикаторів Рівня Обслуговування (SLI) для кожного компонентного бінарного файлу Kubernetes. Ця точка доступу метрики відкривається на порту HTTPS кожного компонента за шляхом /metrics/slis. Функціональна можливість ComponentSLIs типово увімкнена для кожного компонента Kubernetes починаючи з версії v1.27.

Метрики SLI

З увімкненими метриками SLI кожен компонент Kubernetes відкриває дві метрики, позначені для кожної перевірки стану:

  • вимірювач (gauge, який представляє поточний стан перевірки стану)
  • лічильник (counter, який записує накопичувальні підрахунки, спостережені для кожного стану перевірки стану)

Ви можете використовувати інформацію метрики для розрахунку статистики доступності кожного компонента. Наприклад, сервер API перевіряє стан etcd. Ви можете визначити та повідомити, наскільки доступним чи недоступним був etcd — як повідомляє його клієнт, сервер API.

Дані вимірювача Prometheus виглядають так:

# HELP kubernetes_healthcheck [ALPHA] Ця метрика записує результат однієї перевірки стану.
# TYPE kubernetes_healthcheck gauge
kubernetes_healthcheck{name="autoregister-completion",type="healthz"} 1
kubernetes_healthcheck{name="autoregister-completion",type="readyz"} 1
kubernetes_healthcheck{name="etcd",type="healthz"} 1
kubernetes_healthcheck{name="etcd",type="readyz"} 1
kubernetes_healthcheck{name="etcd-readiness",type="readyz"} 1
kubernetes_healthcheck{name="informer-sync",type="readyz"} 1
kubernetes_healthcheck{name="log",type="healthz"} 1
kubernetes_healthcheck{name="log",type="readyz"} 1
kubernetes_healthcheck{name="ping",type="healthz"} 1
kubernetes_healthcheck{name="ping",type="readyz"} 1

Дані лічильника виглядають так:

# HELP kubernetes_healthchecks_total [ALPHA] Ця метрика записує результати всіх перевірок стану.
# TYPE kubernetes_healthchecks_total counter
kubernetes_healthchecks_total{name="autoregister-completion",status="error",type="readyz"} 1
kubernetes_healthchecks_total{name="autoregister-completion",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="autoregister-completion",status="success",type="readyz"} 14
kubernetes_healthchecks_total{name="etcd",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="etcd",status="success",type="readyz"} 15
kubernetes_healthchecks_total{name="etcd-readiness",status="success",type="readyz"} 15
kubernetes_healthchecks_total{name="informer-sync",status="error",type="readyz"} 1
kubernetes_healthchecks_total{name="informer-sync",status="success",type="readyz"} 14
kubernetes_healthchecks_total{name="log",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="log",status="success",type="readyz"} 15
kubernetes_healthchecks_total{name="ping",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="ping",status="success",type="readyz"} 15

Використання цих даних

Точка доступу метрик компонентів SLI призначена для збору даних з високою частотою. Збір даних з високою частотою означає, що ви отримуєте більш точний сигнал вимірювача, який можна потім використовувати для розрахунку SLO. Точка доступу /metrics/slis надає необроблені дані, необхідні для розрахунку SLO доступності для відповідного компонента Kubernetes.

2 - Дані метрик вузла

Механізми доступу до метрик на рівні вузла, томів, Pod та контейнерів, як їх бачить kubelet.

kubelet збирає статистичні дані метрик на рівні вузла, томів, pod та контейнерів, і надає цю інформацію через Summary API.

Ви можете надіслати запит з проксі до Summary API через сервер API Kubernetes.

Ось приклад запиту до Summary API для вузла з іменем minikube:

kubectl get --raw "/api/v1/nodes/minikube/proxy/stats/summary"

Ось той самий виклик API за допомогою curl:

# Спочатку потрібно запустити "kubectl proxy"
# Змініть 8080 на порт, який призначає "kubectl proxy"
curl http://localhost:8080/api/v1/nodes/minikube/proxy/stats/summary

Примітка:

Починаючи з metrics-server версії 0.6.x, metrics-server запитує кінцеву точку kubelet /metrics/resource, а не /stats/summary.

Джерело метрик Summary API

Стандартно, Kubernetes отримує дані метрик вузлів, використовуючи вбудований cAdvisor, який працює в kubelet. Якщо ви увімкнете функціональну можливість PodAndContainerStatsFromCRI у вашому кластері та використовуєте середовище виконання контейнерів, яке підтримує доступ до статистики через Інтерфейс Виконання Контейнерів (CRI), тоді kubelet отримує дані метрик на рівні Pod та контейнерів за допомогою CRI, а не через cAdvisor.

Pressure Stall Information (PSI)

СТАН ФУНКЦІОНАЛУ: Kubernetes v1.36 [stable](стандартно увімкнено)

У Kubernetes ви можете налаштувати kubelet для збору інформації про використання ядром Linux Pressure Stall Information (PSI) щодо використання CPU, памʼяті та вводу-виводу. Інформація збирається на рівні вузлів, podʼів та контейнерів. Докладну схему див. у Summary API. Починаючи з Kubernetes v1.36, функціональна можливість KubeletPSI заблокована в значенні true і не може бути вимкнена. Інформація також доступна у Prometheus метриках.

Для того, щоб зрозуміти метрики PSI, ви можете ознайомитися зі статею Розуміння метрик PSI.

Вимоги

Pressure Stall Information вимагає:

Що далі

На сторінках завдань для Виправлення неполадок у кластерах обговорюється, як використовувати конвеєр метрик, який залежить від цих даних.

3 - Метрики Pod та Контейнерів CRI

Збір метрик Pod та контейнерів через CRI.
СТАН ФУНКЦІОНАЛУ: Kubernetes v1.23 [alpha]

kubelet збирає метрики Pod та контейнерів через cAdvisor. Як альфа-функція, Kubernetes дозволяє налаштувати збір метрик Pod та контейнерів через Інтерфейс Виконання Контейнерів (CRI). Ви повинні увімкнути функціональну можливість PodAndContainerStatsFromCRI та використовувати сумісну реалізацію CRI (containerd >= 1.6.0, CRI-O >= 1.23.0), щоб використовувати механізм збору через CRI.

Метрики Pod та Контейнерів CRI

З увімкненим PodAndContainerStatsFromCRI, kubelet опитує підлегле середовище виконання контейнерів для отримання статистики Pod та контейнерів замість того, щоб безпосередньо перевіряти хост-систему за допомогою cAdvisor. Переваги використання середовища виконання контейнерів для цієї інформації, на відміну від прямого збору за допомогою cAdvisor, включають:

  • Потенційне покращення продуктивності, якщо середовище виконання контейнерів вже збирає цю інформацію під час нормальної роботи. У цьому випадку дані можуть бути повторно використані замість того, щоб бути знову агрегованими kubelet.

  • Це ще більше розʼєднує kubelet і середовище виконання контейнерів, дозволяючи збирати метрики для середовищ виконання контейнерів, які не запускають процеси безпосередньо на хості з kubelet, де вони спостережувані за допомогою cAdvisor (наприклад: середовища виконання контейнерів, що використовують віртуалізацію).

4 - Підтримка нативних гістограм для метрик Kubernetes

СТАН ФУНКЦІОНАЛУ: Kubernetes v1.36 [alpha](стандартно вимкнено)

Компоненти Kubernetes можуть експонувати метрики гістограм у форматі Prometheus Native Histogram, поряд із класичним форматом гістограм. Нативні гістограми використовують експоненційні межі кошиків замість фіксованих меж, що забезпечує значну ефективність зберігання, покращену продуктивність запитів та більш детальне відображення розподілів.

Перш ніж почати

Щоб використовувати нативні гістограми, вам потрібно мати:

  • Kubernetes v1.36 або новішу версію з увімкненою функціональною можливістю NativeHistograms.
  • Prometheus 2.40 або новішу версію для збору та зберігання нативних гістограм. Рекомендується Prometheus 3.0+ для конфігурації на рівні завдань.

Що таке нативні гістограми?

Класичні гістограми Prometheus використовують фіксовані межі кошиків (наприклад, [0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 1, 2.5, 5, 10] секунд). Кожен кошик створює окрему часову серію (_bucket, _count, _sum), що може призвести до:

  • Високих витрат на зберігання у великих масштабах, оскільки кожна гістограма генерує багато часових серій.
  • Проблем з точністю, оскільки дані в межах широкого кошика є невідрізненими. Наприклад, запит, що виконується за 1 мкс, і запит, що виконується за 4 мс, обидва потрапляють у той самий кошик le="0.005".

Нативні гістограми вирішують ці обмеження, використовуючи експоненційні межі кошиків, які автоматично підлаштовуються під розподіл даних. Переваги включають:

  • ~10x зменшення кількості часових серій для кожної метрики гістограми, що значно зменшує обсяг зберігання Prometheus і покращує продуктивність запитів.
  • Більш детальна роздільна здатність для виявлення регресій продуктивності та встановлення точних порогів SLO.

Як це працює

Коли функціональна можливість NativeHistograms увімкнена, компоненти Kubernetes одночасно експонують метрики гістограм у класичному та нативному форматах (подвійна експозиція). Формат, що повертається, залежить від заголовка Accept у HTTP-запиті (узгодження вмісту Prometheus). Prometheus автоматично встановлює цей заголовок на основі вашої конфігурації збору; вам потрібно враховувати це лише при безпосередньому запиті до точки доступу /metrics.

  • Текстовий формат (Accept: text/plain, OpenMetrics 1.0): Повертає лише класичні кошики гістограм. Зворотно сумісний з усіма наявними інструментами.

    # Classic histogram buckets (always present)
    apiserver_request_duration_seconds_bucket{le="0.005"} 1000
    apiserver_request_duration_seconds_bucket{le="0.01"} 2000
    ...
    apiserver_request_duration_seconds_bucket{le="+Inf"} 10000
    apiserver_request_duration_seconds_count 10000
    apiserver_request_duration_seconds_sum 450.5
    
  • Формат Protobuf (Accept: application/vnd.google.protobuf): Містить як класичні кошики, так і дані нативних гістограм. Prometheus автоматично запитує цей формат, коли scrape_native_histograms: true встановлено в конфігурації збору Prometheus для відповідного завдання збору.

Ця стратегія подвійної експозиції забезпечує:

  • Наявні інфопанелі та сповіщення продовжують працювати без змін.
  • Користувачі можуть поступово переносити запити на нативні гістограми.
  • Prometheus зберігає той формат, який він налаштований збирати.

Увімкнення нативних гістограм

Увімкнення нативних гістограм є двоетапним процесом: увімкніть функціональну можливість на компонентах Kubernetes і налаштуйте Prometheus для збору нативних гістограм.

Крок 1: Увімкніть функціональну можливість Kubernetes

Увімкніть функціональну можливість NativeHistograms на компонентах Kubernetes, з яких ви хочете експонувати нативні гістограми:

--feature-gates=NativeHistograms=true

Ця функціональна можливість застосовується до наступних компонентів:

  • kube-apiserver
  • kube-controller-manager
  • kube-scheduler
  • kubelet
  • kube-proxy

Метрики кожного компонента є незалежними; ви можете увімкнути або вимкнути функціональну можливість для кожного компонента окремо.

Крок 2: Налаштуйте Prometheus

Конфігурація Prometheus залежить від вашої версії Prometheus.

Версія PrometheusПідтримка нативних гістограмКонфігураціяПримітки
< 2.40НемаєN/AТільки класичні гістограми. Увімкнення функціональної можливості Kubernetes не має ефекту.
2.40 – 2.xЕкспериментальна--enable-feature=native-histograms (глобально)Все або нічого; немає контролю на рівні завдання.
3.0 – 3.7СтабільнаНа рівні завдання scrape_native_histograms та always_scrape_classic_histogramsРекомендовано конфігурацію на рівні завдання. Глобальний прапорець все ще підтримується.
3.8СтабільнаКонфігурація на рівні завдання (необхідна для точного контролю)Глобальний прапорець лише змінює значення за замовчуванням для всіх завдань.
3.9+СтабільнаНа рівні завдання scrape_native_histograms тількиГлобальний прапорець видалено. Потрібно використовувати конфігурацію на рівні завдання.

Для Prometheus 3.x використовуйте конфігурацію на рівні завдання для точного контролю:

scrape_configs:
  - job_name: 'kubernetes-apiservers'
    scrape_native_histograms: true            # Використовує нативні гістограми
    always_scrape_classic_histograms: true    # Зберігає класичний формат під час міграції

Встановіть обидві опції в true під час періоду міграції. Це дозволяє збирати нативні гістограми, зберігаючи класичні гістограми для наявних інформаційних панелей.

Примітка:

Нативні гістограми вимагають формату експозиції Protobuf. Це обробляється автоматично Prometheus за замовчуванням. Однак, якщо ви налаштували scrape_protocols, переконайтеся, що PrometheusProto включено до списку.

Міграція інформаційних панелей та сповіщень

Увага:

Якщо Prometheus налаштовано з scrape_native_histograms: true, але always_scrape_classic_histograms: false (стандартно), Prometheus збирає лише нативні гістограми. Наявні інформаційні панелі, які використовують класичні запити гістограм (наприклад, histogram_quantile(..._bucket...)), не відображатимуть дані. Завжди встановлюйте always_scrape_classic_histograms: true під час міграції.

Під час міграції з класичних запитів гістограм на нативні гістограми, дотримуйтесь цього робочого процесу:

  1. Увімкніть обидва формати: Встановіть scrape_native_histograms: true та always_scrape_classic_histograms: true у конфігурації збору Prometheus.

  2. Міграція запитів: Оновіть запити інформаційних панелей та вирази сповіщень з класичних функцій гістограм на еквіваленти нативних гістограм.

    Класичний запит:

    histogram_quantile(0.99, rate(apiserver_request_duration_seconds_bucket[5m]))
    

    Запит для нативних гістограм:

    histogram_quantile(0.99, rate(apiserver_request_duration_seconds[5m]))
    
  3. Перевірка на staging: Перевірте всі інформаційні панелі та сповіщення з запитами нативних гістограм перед впровадженням в експлуатацію.

  4. Вимкнення класичного збору: Після завершення та перевірки міграції встановіть always_scrape_classic_histograms: false, щоб зменшити обсяг зберігання.

Вимкнення нативних гістограм

Ви можете вимкнути нативні гістограми в будь-який час, використовуючи один із двох підходів:

  • На стороні Prometheus (найшвидший, не потребує перезапуску Kubernetes; тільки Prometheus 3.x): Встановіть scrape_native_histograms: false для кожного завдання збору. Prometheus відновлює збір класичного формату на наступному інтервалі збору.

  • Функціональна можливість Kubernetes: Перезапустіть компонент з --feature-gates=NativeHistograms=false. Після перезапуску буде доступний тільки класичний формат гістограм.

Коли нативні гістограми вимкнено, точка доступу метрик повертається до класичного формату гістограм. Історичні дані нативних гістограм у Prometheus залишаються доступними для запитів.

Усунення несправностей

  • Інформаційні панелі не відображають дані після увімкнення нативних гістограм: Це відбувається, коли Prometheus налаштовано з scrape_native_histograms: true, але always_scrape_classic_histograms: false (зазвичай), і ваші інформаційні панелі все ще використовують класичні запити гістограм (наприклад, histogram_quantile(..._bucket...)).

    Виправлення: Встановіть always_scrape_classic_histograms: true, щоб відновити збір класичного формату під час міграції інформаційних панелей.

  • Збільшення використання памʼяті після увімкнення нативних гістограм: Невелике збільшення памʼяті очікується для зберігання кошиків нативних гістограм, обмежене максимумом 160 кошиків на гістограму. Відстежуйте process_resident_memory_bytes для виявлення несподіваних збільшень.

    Виправлення: Якщо тиск на памʼять значний, вимкніть збір нативних гістограм у Prometheus (scrape_native_histograms: false) або вимкніть функціональну можливість Kubernetes.

  • Логи Prometheus повідомляють про невідомий формат метрик: Ваша версія Prometheus занадто стара, щоб розуміти нативні гістограми.

    Виправлення: Оновіть Prometheus до версії 2.40+ або вимкніть нативні гістограми в Kubernetes.

  • Не впевнені, чи нативні гістограми експонуються: Перевірте стан функціональної можливості, виконавши запит kubernetes_feature_enabled{name="NativeHistograms"} у Prometheus. Значення 1 вказує на те, що функціональна можливість увімкнена. Ви також можете безпосередньо запитати кінцеву точку метрик у форматі protobuf:

    curl -H "Accept: application/vnd.google.protobuf;proto=io.prometheus.client.MetricFamily;encoding=delimited" \
      https://<component-address>/metrics
    

    Відповідь повинна містити кодування нативних гістограм для метрик гістограм.

Посилання

5 - Розуміння метрик Pressure Stall Information (PSI)

Детальне пояснення метрик Pressure Stall Information (PSI) та їх використання для виявлення тиску на ресурси в Kubernetes.
СТАН ФУНКЦІОНАЛУ: Kubernetes v1.36 [stable](стандартно увімкнено)

Kubernetes дозволяє налаштувати kubelet для збору інформації про тиск на ресурси в Linux Pressure Stall Information (PSI) про використання CPU, памʼяті та вводу-виводу. Інформація збирається на рівні вузлів, podʼів та контейнерів. Починаючи з Kubernetes v1.36, функціональна можливість KubeletPSI заблокована в значенні true і не може бути вимкнена.

Метрики PSI надаються через два різні джерела:

  • Summary API kubelet, який надає дані PSI на рівні вузлів, podʼів та контейнерів.
  • Точка доступу /metrics/cadvisor на kubelet, яка надає метрики PSI у форматі Prometheus.

Вимоги

Pressure Stall Information вимагає наступного на ваших вузлах Linux:

  • Ядро Linux має бути версії 4.20 чи новіше.
  • Ядро має бути скомпільоване з параметром CONFIG_PSI=y. Що у більшість сучасних дистрибутивів є стандартно увімкненим. Ви можете перевірити конфігурацію вашого ядра, виконавши команду zgrep CONFIG_PSI /proc/config.gz.
  • Деякі дистрибутиви Linux можуть скомпілювати PSI в ядро, але мати його стандартно вимкненим. Якщо це так, вам потрібно увімкнути його під час завантаження, додавши параметр psi=1 до командного рядка ядра.
  • Вузол має використовувати cgroup v2.

Розуміння метрик PSI

Метрики Pressure Stall Information (PSI) надаються для трьох ресурсів: CPU, памʼяті та вводу-виводу. Вони поділяються на два основних типи тиску: some та full.

  • some: Це значення вказує на те, що деякі завдання (одне або кілька) заблоковані на ресурсі. Наприклад, якщо деякі завдання чекають на ввід-вивід, ця метрика зросте. Це може бути раннім показником конкуренції за ресурси.
  • full: Це значення вказує на те, що всі не-очікувальні завдання заблоковані на ресурсі одночасно. Це свідчить про більш серйозний дефіцит ресурсів, коли вся система не може рухатись далі.

Кожен тип тиску надає чотири метрики: avg10, avg60, avg300 та total. Значення avg представляють відсоток часу, протягом якого завдання були заблоковані за 10-секундними, 60-секундними та 5-хвилинними ковзаючими середніми. Значення total є кумулятивним лічильником в мікросекундах, що показує загальний час, протягом якого завдання були заблоковані.

Розглянемо, наприклад, наступний запит до Summary API: kubectl get --raw "/api/v1/nodes/$(kubectl get nodes -o jsonpath='{.items[0].metadata.name}')/proxy/stats/summary" | jq '.pods[].containers[] | select(.name=="<CONTAINER_NAME>") | {name, cpu: .cpu.psi, memory: .memory.psi, io: .io.psi}'. Це повертає інформацію у форматі JSON, як показано нижче.

{
  "name": "<CONTAINER_NAME>",
  "cpu": {
    "full": {
      "total": 0,
      "avg10": 0,
      "avg60": 0,
      "avg300": 0
    },
    "some": {
      "total": 35232438,
      "avg10": 0.74,
      "avg60": 0.52,
      "avg300": 0.21,
    },
  },
  "memory": {
    "full": {
      "total": 539105,
      "avg10": 0,
      "avg60": 0,
      "avg300": 0
    },
    "some": {
      "total": 658164,
      "avg10": 0.01,
      "avg60": 0.01,
      "avg300": 0.00,
    },
    }
  },
  "io": {
    "full": {
      "total": 33190987,
      "avg10": 0.31,
      "avg60": 0.22,
      "avg300": 0.05,
    },
    "some": {
      "total": 40809937,
      "avg10": 0.52,
      "avg60": 0.45,
      "avg300": 0.12,
    }
  }
}

Це простий сценарій сплеску. Значення avg10 для cpu.some рівне 0.74 вказує на те, що за останні 10 секунд принаймні одне завдання в цьому контейнері було заблоковане на CPU протягом 0.74% часу (0.0074 секунди або 74 мілісекунди). Оскільки avg10 (0.74) значно перевищує avg300 (0.21) для того ж ресурсу, це свідчить про недавній сплеск конкуренції за ресурси, а не про тривалу проблему. Якщо спостерігати за цими метриками постійно і значення avg300 також зросте, можна діагностувати більш серйозну, тривалу проблему.

Крім того, зверніть увагу, що в цьому прикладі cpu.some показує тиск, тоді як cpu.full залишається на рівні 0.00. Це означає, що хоча деякі процеси були затримані в очікуванні часу на CPU, контейнер в цілому все ще просувався вперед. Ненульове значення full вказувало б на те, що всі неактивні завдання були заблоковані одночасно, що є набагато більшою проблемою. Хоча не так зрозуміло для людини, значення total рівне 35232438 представляє кумулятивний час блокування в мікросекундах, що дозволяє виявляти сплески затримки, які інакше можуть не відображатися в середніх значеннях.

Як останнє зауваження, при спостереженні високого тиску на I/O разом з низьким тиском на памʼять, це може вказувати на те, що застосунок очікує на пропускну здатність диска, а не через нестачу доступної оперативної памʼяті. Вузол не перевантажений по памʼяті, і можна розслідувати іншу діагностику для споживання диска.

Приклад сценаріїв

Ви можете використовувати простий Pod з інструментом для стрес-тестування, щоб згенерувати тиск на ресурси та спостерігати за метриками PSI. У наступних прикладах використовується образ контейнера agnhost, який включає інструмент stress.

Генерація тиску на CPU

Створіть Pod, який генерує тиск на CPU за допомогою утиліти stress. Це навантаження створить сильне навантаження на один CPU-ядро.

Створіть файл з назвою cpu-pressure-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: cpu-pressure-pod
spec:
  restartPolicy: Never
  containers:
  - name: cpu-stress
    image: registry.k8s.io/e2e-test-images/agnhost:2.47
    args:
    - "stress"
    - "--cpus"
    - "1"
    resources:
      limits:
        cpu: "500m"
      requests:
        cpu: "500m"

Застосуйте його до вашого кластера: kubectl apply -f cpu-pressure-pod.yaml

Спостереження за тиском на CPU

Після запуску Podʼа ви можете спостерігати за тиском на CPU через Summary API або через точку моніторингу метрик Prometheus.

Використовуючи Summary API:

Спостерігайте за підсумковими статистиками для вашого вузла. У окремому терміналі виконайте:

# Замініть <node-name> на імʼя вузла у вашому кластері
kubectl get --raw "/api/v1/nodes/<node-name>/proxy/stats/summary" | jq '.pods[] | select(.podRef.name | contains("cpu-pressure-pod"))'

Ви побачите, що метрики PSI some для CPU зростають у виводі Summary API. Значення avg10 для тиску some повинно перевищити нуль, що вказує на те, що завдання витрачають час на блокування на CPU.

Використовуючи точку моніторингу метрик Prometheus:

Надіщліть запит до точки /metrics/cadvisor, щоб побачити метрику container_pressure_cpu_waiting_seconds_total.

# Замініть <node-name> на імʼя вузла, на якому працює Pod
kubectl get --raw "/api/v1/nodes/<node-name>/proxy/metrics/cadvisor" | \
    grep 'container_pressure_cpu_waiting_seconds_total{container="cpu-stress"}'

Вихідні дані повинні показувати зростаюче значення, що вказує на те, що контейнер витрачає час на блокування в очікуванні ресурсів CPU.

Очищення

Вилучіть Pod, коли закінчите:

kubectl delete pod cpu-pressure-pod

Генерація тиску на памʼять

Цей приклад створює Pod, який безперервно записує у файли в записуваному шарі контейнера, що призводить до зростання кешу сторінок ядра та примусового відновлення памʼяті, що генерує тиск.

Створіть файл з назвою memory-pressure-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: memory-pressure-pod
spec:
  restartPolicy: Never
  containers:
  - name: memory-stress
    image: registry.k8s.io/e2e-test-images/agnhost:2.47
    command: ["/bin/sh", "-c"]
    args:
    - "i=0; while true; do dd if=/dev/zero of=testfile.$i bs=1M count=50 &>/dev/null; i=$(((i+1)%5)); sleep 0.1; done"
    resources:
      limits:
        memory: "200M"
      requests:
        memory: "200M"

Застосуйте його до кластера: kubectl apply -f memory-pressure-pod.yaml

Спостереження за тиском на памʼять

Використовуючи Summary API:

У виводі підсумків ви спостерігатимете зростання метрик PSI full для памʼяті, що вказує на те, що система зазнає значного тиску на памʼять.

# Замініть <node-name> на імʼя вузла у вашому кластері
kubectl get --raw "/api/v1/nodes/<node-name>/proxy/stats/summary" | jq '.pods[] | select(.podRef.name | contains("memory-pressure-pod"))'

Використовуючи точку моніторингу метрик Prometheus:

Надіщліть запит до точки доступу /metrics/cadvisor, щоб побачити метрику container_pressure_memory_waiting_seconds_total.

# Замініть <node-name> на імʼя вузла, на якому працює Pod
kubectl get --raw "/api/v1/nodes/<node-name>/proxy/metrics/cadvisor" | \
    grep 'container_pressure_memory_waiting_seconds_total{container="memory-stress"}'

У виводі ви спостерігатимете зростання значення метрики, що вказує на те, що система зазнає значного тиску на памʼять.

Очищення

Вилучіть Pod, коли закінчите:

kubectl delete pod memory-pressure-pod

Генерація тиску на I/O

Цей Pod генерує тиск на I/O, безперервно записуючи файл на диск і використовуючи sync для скидання даних з памʼяті, що створює затримки I/O.

Створіть файл з назвою io-pressure-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: io-pressure-pod
spec:
  restartPolicy: Never
  containers:
  - name: io-stress
    image: registry.k8s.io/e2e-test-images/agnhost:2.47
    command: ["/bin/sh", "-c"]
    args:
      - "while true; do dd if=/dev/zero of=testfile bs=1M count=128 &>/dev/null; sync; rm testfile &>/dev/null; done"

Застосуйте це до вашого кластера: kubectl apply -f io-pressure-pod.yaml

Спостереження за тиском на I/O

Використовуючи Summary API:

Ви побачите, що деякі метрики PSI для I/O зростають, оскільки Pod безперервно записує на диск.

# Замініть <node-name> на імʼя вузла у вашому кластері
kubectl get --raw "/api/v1/nodes/<node-name>/proxy/stats/summary" | jq '.pods[] | select(.podRef.name | contains("io-pressure-pod"))'

Використовуючи точку моніторингу метрик Prometheus:

Надіщліть запит до точки доступу /metrics/cadvisor, щоб побачити метрику container_pressure_io_waiting_seconds_total.

# Замініть <node-name> на імʼя вузла, на якому працює Pod
kubectl get --raw "/api/v1/nodes/<node-name>/proxy/metrics/cadvisor" | \
    grep 'container_pressure_io_waiting_seconds_total{container="io-stress"}'

Ви побачите, що значення метрики зростає, оскільки Pod безперервно записує на диск.

Очищення

Вилучіть Pod, коли закінчите:

kubectl delete pod io-pressure-pod

Що далі

Сторінки завдань для Усунення несправностей кластерів містять опис того, як використовувати конвеєр метрик, який спирається на ці дані.

6 - Kubernetes z-pages

Забезпечують діагностику під час роботи компонентів Kubernetes, надаючи інформацію про стан роботи компонентів та прапорці конфігурації.
СТАН ФУНКЦІОНАЛУ: Kubernetes v1.36 [beta]

Компоненти ядра Kubernetes можуть надавати набір z-endpoints, щоб полегшити користувачам налагодження кластера та його компонентів. Ці точки доступу мають використовуватися виключно для перевірки людиною для отримання інформації про налагодження двійкового коду компонента у реальному часі. У Kubernetes 1.36 це бета функція, і формат відповіді може змінитися у майбутніх випусках.

z-pages

Kubernetes v1.36 дозволяє увімкнути z-pages, які допоможуть вам усунути проблеми з компонентами основної панелі управління. Ці спеціальні налагоджувальні точки доступу надають внутрішню інформацію про запущені компоненти. У Kubernetes 1.36 компоненти обслуговують такі точки доступу (якщо їх увімкнено):

statusz

Увімкнена за допомогою функціональної можливості ComponentStatusz, точка доступу /statusz показує високорівневу інформацію про компонент, таку як версія Kubernetes, версія емуляції, час запуску тощо.

Відповідь у вигляді простого тексту /statusz від сервера API виглядає приблизно так:

kube-apiserver statusz
Warning: This endpoint is not meant to be machine parseable, has no formatting compatibility guarantees and is for debugging purposes only.

Started: Wed Oct 16 21:03:43 UTC 2024
Up: 0 hr 00 min 16 sec
Go version: go1.23.2
Binary version: 1.32.0-alpha.0.1484&#43;5eeac4f21a491b-dirty
Emulation version: 1.32.0-alpha.0.1484
Paths: /healthz /livez /metrics /readyz /statusz /version

statusz (структуровано)

СТАН ФУНКЦІОНАЛУ: Kubernetes v1.36 [beta](стандартно увімкнено)

Починаючи з Kubernetes v1.35, точка доступу /statusz підтримує структурований формат відповіді з версіями, якщо запит надсилається з відповідним заголовком Accept. Без заголовка Accept точка доступу типово повертає відповідь у форматі простого тексту.

Щоб отримати структуровану відповідь, використовуйте:

Accept: application/json;v=v1beta1;g=config.k8s.io;as=Statusz

Примітка:

Якщо ви запитуєте application/json без вказання всіх необхідних параметрів (g, v та as), сервер відповість 406 Not Acceptable.

Приклад структурованої відповіді:

{
  "kind": "Statusz",
  "apiVersion": "config.k8s.io/v1beta1",
  "metadata": {
    "name": "kube-apiserver"
  },
  "startTime": "2025-10-29T00:30:01Z",
  "uptimeSeconds": 856,
  "goVersion": "go1.23.2",
  "binaryVersion": "1.35.0",
  "emulationVersion": "1.35",
  "paths": [
    "/healthz",
    "/livez",
    "/metrics",
    "/readyz",
    "/statusz",
    "/version"
  ]
}

Схема config.k8s.io/v1beta1 для структурованої відповіді /statusz виглядає наступним чином:

// Statusz — це схема config.k8s.io/v1beta1 для точки доступу /statusz.
type Statusz struct {
	// Kind є "Statusz".
	Kind string `json:"kind"`
	// APIVersion — це версія обʼєкта, наприклад, "config.k8s.io/v1beta1".
	APIVersion string `json:"apiVersion"`
	// Стандартні метадані обʼєкта.
	// +опціонально
	Metadata metav1.ObjectMeta `json:"metadata,omitempty"`
	// StartTime — час, коли було розпочато процес компонента.
	StartTime metav1.Time `json:"startTime"`
	// UptimeSeconds — це тривалість у секундах, протягом якої компонент працював безперервно.
	UptimeSeconds int64 `json:"uptimeSeconds"`
	// GoVersion — це версія мови програмування Go, яка використовується для створення бінарного файлу.
	// Не гарантується, що формат буде однаковим для різних збірок Go.
	// +опціонально
	GoVersion string `json:"goVersion,omitempty"`
	// BinaryVersion — це версія бінарного файлу компонента.
	// Формат не обовʼязково відповідає семантичному версіонуванню і може бути довільним рядком.
	BinaryVersion string `json:"binaryVersion"`
	// EmulationVersion — це версія API Kubernetes, яку емулює цей компонент.
	// якщо присутня, форматується як "<major>.<minor>"
	// +опціонально
	EmulationVersion string `json:"emulationVersion,omitempty"`
	// MinimumCompatibilityVersion — це мінімальна версія API Kubernetes, з якою компонент призначений для роботи.
	// якщо присутня, форматується як "<major>.<minor>"
	// +опціонально
	MinimumCompatibilityVersion string `json:"minimumCompatibilityVersion,omitempty"`
	// Шляхи містять відносні URL-адреси інших важливих точок доступу, доступних тільки для читання, для налагодження та усунення несправностей.
	// +опціонально
	Paths []string `json:"paths,omitempty"`
}

flagz

Увімкнена за допомогою функціональної можливості ComponentFlagz, точка доступу /flagz показує вам аргументи командного рядка, які було використано для запуску компонента.

Відповідь у вигляді простого тексту /flagz від сервера API виглядає приблизно так:

kube-apiserver flags
Warning: This endpoint is not meant to be machine parseable, has no formatting compatibility guarantees and is for debugging purposes only.

advertise-address=192.168.8.2
contention-profiling=false
enable-priority-and-fairness=true
profiling=true
authorization-mode=[Node,RBAC]
authorization-webhook-cache-authorized-ttl=5m0s
authorization-webhook-cache-unauthorized-ttl=30s
authorization-webhook-version=v1beta1
default-watch-cache-size=100

flagz (структуровано)

СТАН ФУНКЦІОНАЛУ: Kubernetes v1.36 [beta](стандартно увімкнено)

Починаючи з Kubernetes v1.35, точка доступу /flagz підтримує структурований формат відповіді з версіями, якщо запит надсилається з відповідним заголовком Accept. Без заголовка Accept точка доступу типово повертає відповідь у форматі простого тексту.

Щоб отримати структуровану відповідь, використовуйте:

Accept: application/json;v=v1beta1;g=config.k8s.io;as=Flagz

Примітка:

Якщо ви запитуєте application/json без вказання всіх необхідних параметрів (g, v та as), сервер відповість 406 Not Acceptable.

Example structured response:

{
  "kind": "Flagz",
  "apiVersion": "config.k8s.io/v1beta1",
  "metadata": {
    "name": "kube-apiserver"
  },
  "flags": {
    "advertise-address": "192.168.8.4",
    "allow-privileged": "true",
    "anonymous-auth": "true",
    "authorization-mode": "[Node,RBAC]",
    "enable-priority-and-fairness": "true",
    "profiling": "true",
    "default-watch-cache-size": "100"
  }
}

Схема config.k8s.io/v1beta1 для структурованої відповіді /flagz виглядає наступним чином:

// Flagz — це схема config.k8s.io/v1beta1 для точки доступу /flagz.
type Flagz struct {
	// Kind ' "Flagz".
	Kind string `json:"kind"`
	// APIVersion — це версія обʼєкта, наприклад, "config.k8s.io/v1beta1".
	APIVersion string `json:"apiVersion"`
	// Стандартні метадані обʼєкта.
	// +опціонально
	Metadata metav1.ObjectMeta `json:"metadata,omitempty"`
	// Flags містить прапорці командного рядка та їхні значення.
	// Ключі — це імена прапорців, а значення — це значення прапорців,
	// можливо, з вилученими конфіденційними значеннями.
	// +опціонально
	Flags map[string]string `json:"flags,omitempty"`
}

Примітка:

Структуровані відповіді для /statusz та /flagz є бета-функціями у версії 1.36 і можуть бути змінені в майбутніх версіях. Вони призначені для надання машиночитаного виводу для інструментів налагодження та інтроспекції.

7 - Довідник Метрик Kubernetes

Деталі щодо метрик, які експортують компоненти Kubernetes.

Метрики (v1.36)

Ця сторінка містить деталі метрик, які експортують різні компоненти Kubernetes. Ви можете запитувати точки доступу метрик для цих компонентів за допомогою HTTP-запиту та отримувати поточні дані метрик у форматі Prometheus.

Список стабільних метрик Kubernetes

Стабільні метрики дотримуються суворих API контрактів, і жодні мітки не можуть бути додані або видалені зі стабільних метрик протягом їхнього життєвого циклу.

apiserver_admission_controller_admission_duration_seconds
Гістограма затримки контролера допуску в секундах, визначена за назвою та розподілена для кожної операції та ресурсу API і типу (перевірка або допуск).
  • STABLE
  • Histogram
  • nameoperationrejectedtype
    • kube-apiserver (/metrics)
apiserver_admission_step_admission_duration_seconds
Гістограма затримки підетапу допуску в секундах для кожної операції, ресурсу API та типу етапу (валідація або допуск).
  • STABLE
  • Histogram
  • operationrejectedtype
    • kube-apiserver (/metrics)
apiserver_admission_webhook_admission_duration_seconds
Гістограма затримки вебхука в секундах, ідентифікована за назвою та розбита за кожною операцією, ресурсом API та типом (валідація або допуск).
  • STABLE
  • Histogram
  • nameoperationrejectedtype
    • kube-apiserver (/metrics)
apiserver_current_inflight_requests
Максимальна кількість поточних використаних запитів цього apiserver на тип запиту за останню секунду.
  • STABLE
  • Gauge
  • request_kind
    • kube-apiserver (/metrics)
apiserver_longrunning_requests
Вимірювач усіх активних тривалих запитів apiserver, розділених за дієсловом, групою, версією, ресурсом, областю та компонентом. Не всі запити відстежуються таким чином.
  • STABLE
  • Gauge
  • componentgroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_request_duration_seconds
Розподіл затримки відповіді в секундах для кожного дієслова, значення dry run, групи, версії, ресурсу, субресурсу, області застосування та компонента.
  • STABLE
  • Histogram
  • componentdry_rungroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_request_total
Лічильник запитів apiserver з розбивкою по кожному дієслову, dry run, групі, версії, ресурсу, області застосування, компоненту і коду HTTP-відповіді.
  • STABLE
  • Counter
  • codecomponentdry_rungroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_requested_deprecated_apis
Вимірювач запитуваних застарілих API, розподілених за групами API, версією, ресурсом, субресурсом і видаленим_випуском.
  • STABLE
  • Gauge
  • groupremoved_releaseresourcesubresourceversion
    • kube-apiserver (/metrics)
apiserver_response_sizes
Розподіл розміру відповіді в байтах для кожної групи, версії, дієслова, ресурсу, субресурсу, області дії та компонента.
  • STABLE
  • Histogram
  • componentgroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_storage_objects
[ЗАСТАРІЛО, розгляньте можливість використання apiserver_resource_objects замість цього]Кількість збережених обʼєктів на момент останньої перевірки з розподілом за типом. У разі помилки вибірки значення буде -1.
  • STABLE
  • Gauge
  • resource
    • kube-apiserver (/metrics)
  • 1.34.0
apiserver_storage_size_bytes
Розмір сховища для файлу бази даних, фізично виділеного в байтах.
  • STABLE
  • Custom
  • storage_cluster_id
    • kube-apiserver (/metrics)
container_cpu_usage_seconds_total
Сукупний час процесора, який споживає контейнер, у секундах ядра
  • STABLE
  • Custom
  • containerpodnamespace
    • kubelet (/metrics)
container_memory_working_set_bytes
Поточний робочий набір контейнера в байтах
  • STABLE
  • Custom
  • containerpodnamespace
    • kubelet (/metrics)
container_start_time_seconds
Час запуску контейнера в секундах епохи Unix
  • STABLE
  • Custom
  • containerpodnamespace
    • kubelet (/metrics)
cronjob_controller_job_creation_skew_duration_seconds
Час між запланованим запуском cronjob і створенням відповідного завдання
  • STABLE
  • Histogram
    • kube-controller-manager (/metrics)
job_controller_job_pods_finished_total
Кількість завершених Podʼів, які повністю відстежуються
  • STABLE
  • Counter
  • completion_moderesult
    • kube-controller-manager (/metrics)
job_controller_job_sync_duration_seconds
Час, необхідний для синхронізації завдання
  • STABLE
  • Histogram
  • actioncompletion_moderesult
    • kube-controller-manager (/metrics)
job_controller_job_syncs_total
Кількість синхронізацій завдання
  • STABLE
  • Counter
  • actioncompletion_moderesult
    • kube-controller-manager (/metrics)
job_controller_jobs_finished_total
Кількість завершених завдань
  • STABLE
  • Counter
  • completion_modereasonresult
    • kube-controller-manager (/metrics)
kube_pod_resource_limit
Ліміт ресурсів для робочих навантажень в кластері, з розбивкою за Podʼами. Це показує використання ресурсів, яке планувальник і kubelet очікують на кожен Pod для ресурсів, а також одиницю виміру для ресурсу, якщо така є.
  • STABLE
  • Custom
  • namespacepodnodeschedulerpriorityresourceunit
    • kube-scheduler (/metrics)
kube_pod_resource_request
Ресурси, запитувані робочими навантаженнями в кластері, з розбивкою за Podʼами. Це показує використання ресурсів, яке планувальник і kubelet очікують на кожен Pod для ресурсів, а також одиницю виміру для ресурсу, якщо така є.
  • STABLE
  • Custom
  • namespacepodnodeschedulerpriorityresourceunit
    • kube-scheduler (/metrics)
kubernetes_healthcheck
Ця метрика фіксує результат однієї перевірки справності.
  • STABLE
  • Gauge
  • nametype
    • cloud-controller-manager (/metrics/slis)
    • kube-apiserver (/metrics/slis)
    • kube-controller-manager (/metrics/slis)
    • kube-proxy (/metrics/slis)
    • kube-scheduler (/metrics/slis)
    • kubelet (/metrics/slis)
kubernetes_healthchecks_total
Ця метрика фіксує результати всіх перевірок справності.
  • STABLE
  • Counter
  • namestatustype
    • cloud-controller-manager (/metrics/slis)
    • kube-apiserver (/metrics/slis)
    • kube-controller-manager (/metrics/slis)
    • kube-proxy (/metrics/slis)
    • kube-scheduler (/metrics/slis)
    • kubelet (/metrics/slis)
node_collector_evictions_total
Кількість виселень Node, що відбулися з моменту запуску поточного екземпляра NodeController.
  • STABLE
  • Counter
  • zone
    • kube-controller-manager (/metrics)
node_cpu_usage_seconds_total
Сукупний час процесора, споживаний вузлом у секундах ядра
  • STABLE
  • Custom
    • kubelet (/metrics/resource)
node_memory_working_set_bytes
Поточний робочий набір вузла в байтах
  • STABLE
  • Custom
    • kubelet (/metrics/resource)
pod_cpu_usage_seconds_total
Сукупний час процесора, споживаний Podʼом у секундах ядра
  • STABLE
  • Custom
  • podnamespace
    • kubelet (/metrics/resource)
pod_memory_working_set_bytes
Поточний робочий набір Podʼа в байтах
  • STABLE
  • Custom
  • podnamespace
    • kubelet (/metrics/resource)
resource_scrape_error
1, якщо сталася помилка під час отримання метрик контейнера, 0 в іншому випадку
  • STABLE
  • Custom
    • kubelet (/metrics/resource)
scheduler_framework_extension_point_duration_seconds
Затримка для запуску всіх втулків певної точки розширення.
  • STABLE
  • Histogram
  • extension_pointprofilestatus
    • kube-scheduler (/metrics)
scheduler_pending_pods
Кількість відкладених Podʼів за типом черги. 'active' означає кількість Podʼів в activeQ; 'backoff' означає кількість Pods у backoffQ; 'unschedulable' означає кількість Podʼів в unschedulablePods, які планувальник намагався запланувати, але не зміг; 'gated' означає кількість незапланованих Podʼів, які планувальник ніколи не намагався запланувати, тому що вони є gated.
  • STABLE
  • Gauge
  • queue
    • kube-scheduler (/metrics)
scheduler_pod_scheduling_attempts
Кількість спроб успішно запланувати Pod.
  • STABLE
  • Histogram
    • kube-scheduler (/metrics)
scheduler_preemption_attempts_total
Загальна кількість спроб випередження в кластері до цього часу
  • STABLE
  • Counter
    • kube-scheduler (/metrics)
scheduler_preemption_victims
Кількість обраних жертв випередження
  • STABLE
  • Histogram
    • kube-scheduler (/metrics)
scheduler_queue_incoming_pods_total
Кількість Podʼів, доданих до черг планування за подіями та типами черг.
  • STABLE
  • Counter
  • eventqueue
    • kube-scheduler (/metrics)
scheduler_schedule_attempts_total
Кількість спроб запланувати Podʼи, за результатом. "unscheduled" означає, що Pod не вдалося запланувати, тоді як "error" означає внутрішню проблему планувальника.
  • STABLE
  • Counter
  • profileresult
    • kube-scheduler (/metrics)
scheduler_scheduling_attempt_duration_seconds
Затримка спроби планування в секундах (алгоритм планування + привʼязка)
  • STABLE
  • Histogram
  • profileresult
    • kube-scheduler (/metrics)

Список бета-метрик Kubernetes

Бета-метрики дотримуються менш суворих API контрактів порівняно зі стабільними метриками. Жодні мітки не можуть бути видалені з бета-метрик протягом їхнього життєвого циклу, проте мітки можуть бути додані, поки метрика перебуває на етапі бета-тестування. Це забезпечує впевненість у тому, що бета-метрики підтримуватимуть існуючі панелі моніторингу та оповіщення, водночас дозволяючи вносити зміни в майбутньому.

apiserver_authentication_config_controller_automatic_reload_last_timestamp_seconds
Мітка часу останнього автоматичного перезавантаження конфігурації автентифікації, розділена за статусом та ідентифікатором apiserver.
  • BETA
  • Gauge
  • apiserver_id_hashstatus
    • kube-apiserver (/metrics)
apiserver_authentication_config_controller_automatic_reloads_total
Загальна кількість автоматичних перезавантажень конфігурації автентифікації, розподілених за статусом та ідентифікацією apiserver.
  • BETA
  • Counter
  • apiserver_id_hashstatus
    • kube-apiserver (/metrics)
apiserver_authorization_config_controller_automatic_reload_last_timestamp_seconds
Мітка часу останнього автоматичного перезавантаження конфігурації авторизації, розділена за статусом та ідентифікатором apiserver.
  • BETA
  • Gauge
  • apiserver_id_hashstatus
    • kube-apiserver (/metrics)
apiserver_authorization_config_controller_automatic_reloads_total
Загальна кількість автоматичних перезавантажень конфігурації авторизації, розподілених за статусом та ідентифікатором apiserver.
  • BETA
  • Counter
  • apiserver_id_hashstatus
    • kube-apiserver (/metrics)
apiserver_cel_compilation_duration_seconds
Час компіляції CEL у секундах.
  • BETA
  • Histogram
    • kube-apiserver (/metrics)
apiserver_cel_evaluation_duration_seconds
CEL evaluation time in seconds.
  • BETA
  • Histogram
    • kube-apiserver (/metrics)
apiserver_flowcontrol_current_executing_requests
Кількість запитів на початковій (для WATCH) або будь-якій (для не-WATCH) стадії виконання в підсистемі API Priority and Fairness
  • BETA
  • Gauge
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_current_executing_seats
Паралельність (кількість місць), яку займають поточні запити, що виконуються (початкова стадія для WATCH, будь-яка інша стадія) у підсистемі API Priority and Fairness
  • BETA
  • Gauge
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_current_inqueue_requests
Кількість запитів, що перебувають у чергах підсистеми API Priority and Fairness
  • BETA
  • Gauge
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_dispatched_requests_total
Кількість виконаних запитів в підсистемі API Priority and Fairness
  • BETA
  • Counter
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_nominal_limit_seats
Номінальна кількість місць виконання, налаштована для кожного рівня пріоритету
  • BETA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_rejected_requests_total
Кількість запитів, відхилених підсистемою API Priority and Fairness
  • BETA
  • Counter
  • flow_schemapriority_levelreason
    • kube-apiserver (/metrics)
apiserver_flowcontrol_request_wait_duration_seconds
Час очікування запиту в черзі
  • BETA
  • Histogram
  • executeflow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_validating_admission_policy_check_duration_seconds
Затримка допуску валідації для окремих виразів валідації в секундах, позначена політикою, а також включно із зобовʼязуючими та примусовими діями, що були вжиті.
  • BETA
  • Histogram
  • enforcement_actionerror_typepolicypolicy_binding
    • kube-apiserver (/metrics)
apiserver_validating_admission_policy_check_total
Перевірка політики допуску перевіряє загальну суму, позначену політикою, і далі ідентифікує обовʼязковість та вжиті заходи щодо забезпечення дотримання.
  • BETA
  • Counter
  • enforcement_actionerror_typepolicypolicy_binding
    • kube-apiserver (/metrics)
apiserver_validation_declarative_validation_mismatch_total
Кількість разів, коли результати декларативної валідації відрізнялися від результатів рукописної валідації для основних типів.
  • BETA
  • Counter
    • kube-apiserver (/metrics)
apiserver_validation_declarative_validation_panic_total
Кількість випадків, коли декларативна валідація панікувала під час валідації.
  • BETA
  • Counter
    • kube-apiserver (/metrics)
apiserver_watch_list_duration_seconds
Розподіл часу відгуку в секундах для запитів зі списку спостереження з розбивкою за групами, версіями, ресурсами та областями дії.
  • BETA
  • Histogram
  • groupresourcescopeversion
    • kube-apiserver (/metrics)
disabled_metrics_total
Кількість вимкнених метрик.
  • BETA
  • Counter
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
hidden_metrics_total
Кількість прихованих метрик.
  • BETA
  • Counter
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
kubelet_image_volume_mounted_errors_total
Кількість невдалих спроб монтування тому образу.
  • BETA
  • Counter
    • kubelet (/metrics)
kubelet_image_volume_mounted_succeed_total
Кількість успішних підключень томів образів.
  • BETA
  • Counter
    • kubelet (/metrics)
kubelet_image_volume_requested_total
Кількість запитаних томів образів.
  • BETA
  • Counter
    • kubelet (/metrics)
kubernetes_build_info
Метрика з постійним значенням '1', що містить такі позначки: основна версія, другорядна версія, версія Git, коміт Git, стан дерева Git, дата збірки, версія Go, компілятор, на якому було зібрано Kubernetes, та платформа, на якій він працює.
  • BETA
  • Gauge
  • build_datecompilergit_commitgit_tree_stategit_versiongo_versionmajorminorplatform
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
kubernetes_feature_enabled
Ця метрика фіксує дані про стадію та ввімкнення функції k8s.
  • BETA
  • Gauge
  • namestage
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
prober_probe_total
Кумулятивний номер проби життєздатності, готовності або запуску для контейнера за результатом.
  • BETA
  • Counter
  • containernamespacepodpod_uidprobe_typeresult
    • kubelet (/metrics)
registered_metrics_total
Кількість зареєстрованих метрик з розбивкою за рівнем стабільності та версією застарівння.
  • BETA
  • Counter
  • deprecated_versionstability_level
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
running_managed_controllers
Показує, де в даний момент працюють екземпляри контролера
  • BETA
  • Gauge
  • managername
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
scheduler_pod_scheduling_sli_duration_seconds
E2e затримка для пакета, що планується, з моменту потрапляння пакета в чергу на планування і може включати декілька спроб планування.
  • BETA
  • Histogram
  • attempts
    • kube-scheduler (/metrics)
workqueue_adds_total
Загальна кількість доданих елементів, оброблених робочою чергою
  • BETA
  • Counter
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
workqueue_depth
Поточна глибина робочої черги
  • BETA
  • Gauge
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
workqueue_longest_running_processor_seconds
Скільки секунд працює процесор із найтривалішим часом роботи для черги завдань?
  • BETA
  • Gauge
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
workqueue_queue_duration_seconds
Скільки секунд елемент перебуває в черзі завдань перед тим, як його буде запрошено.
  • BETA
  • Histogram
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
workqueue_retries_total
Загальна кількість повторних спроб, оброблених чергою завдань
  • BETA
  • Counter
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
workqueue_unfinished_work_seconds
Скільки секунд роботи виконується і ще не було зафіксовано за допомогою work_duration. Великі значення вказують на завислі потоки. Можна визначити кількість завислих потоків, спостерігаючи за швидкістю збільшення цього показника.
  • BETA
  • Gauge
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
workqueue_work_duration_seconds
Скільки секунд займає обробка елемента з черги завдань.
  • BETA
  • Histogram
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)

Список альфа-метрик Kubernetes

Альфа-метрики не мають жодних гарантій API. Ці метрики слід використовувати на свій страх і ризик, наступні версії Kubernetes можуть взагалі вилучити ці метрики або мутувати API таким чином, щоб зламати наявні інформаційні панелі та сповіщення.

aggregator_discovery_aggregation_count_total
Лічильник кількості разів, коли виявлення (discovery) було агреговано
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
aggregator_discovery_nopeer_requests_total
Лічильник кількості запитів на виявлення без агрегації партнерів (non peer-aggregated)
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
aggregator_discovery_peer_aggregated_cache_hits_total
Лічильник кількості разів, коли виявлення було надано з кешу, агрегованого партнерами (peer-aggregated cache)
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
aggregator_discovery_peer_aggregated_cache_misses_total
Лічильник кількості виявлень, агрегований по всіх API-серверах
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
aggregator_openapi_v2_regeneration_count
Лічильник кількості регенерацій специфікації OpenAPI v2 розбито за назвою APIService та причиною.
  • ALPHA
  • Counter
  • apiservicereason
    • kube-apiserver (/metrics)
aggregator_openapi_v2_regeneration_duration
Показник тривалості регенерації специфікації OpenAPI v2 у секундах.
  • ALPHA
  • Gauge
  • reason
    • kube-apiserver (/metrics)
aggregator_unavailable_apiservice
Кількість APIService, які позначені як недоступні, з розбивкою за назвою APIService.
  • ALPHA
  • Custom
  • name
    • kube-apiserver (/metrics)
aggregator_unavailable_apiservice_total
Лічильник APIServices, які позначені як недоступні, з розбивкою за назвою APIService та причиною.
  • ALPHA
  • Counter
  • namereason
    • kube-apiserver (/metrics)
apiextensions_apiserver_validation_ratcheting_seconds
Час для порівняння старого з новим для цілей CRDValidationRatcheting під час UPDATE в секундах.
  • ALPHA
  • Histogram
    • kube-apiserver (/metrics)
apiextensions_openapi_v2_regeneration_count
Лічильник кількості регенерацій специфікації OpenAPI v2, розбитий за назвою та причиною виклику CRD.
  • ALPHA
  • Counter
  • crdreason
    • kube-apiserver (/metrics)
apiextensions_openapi_v3_regeneration_count
Лічильник кількості регенерацій специфікації OpenAPI v3 з розбивкою за групами, версіями, джерелом CRD та причиною.
  • ALPHA
  • Counter
  • crdgroupreasonversion
    • kube-apiserver (/metrics)
apiserver_admission_match_condition_evaluation_errors_total
Кількість помилок оцінки умов допуску, ідентифікованих за назвою ресурсу, що містить умову допуску, з розбивкою для кожного типу, що містить matchConditions ("вебхук" або "політика"), операцію та тип допуску (валідація або допуск).
  • ALPHA
  • Counter
  • kindnameoperationtype
    • kube-apiserver (/metrics)
apiserver_admission_match_condition_evaluation_seconds
Час оцінки відповідності умов допуску в секундах, ідентифікований за назвою і розбитий для кожного типу, що містить matchConditions ("вебхук" або "політика"), операцію і тип (валідація або допуск).
  • ALPHA
  • Histogram
  • kindnameoperationtype
    • kube-apiserver (/metrics)
apiserver_admission_match_condition_exclusions_total
Кількість виключень для оцінки відповідності умов допуску, ідентифікована за назвою ресурсу, що містить умову відповідності, і розбита для кожного типу, що містить matchConditions ("вебхук" або "політика"), операцію і тип допуску (валідація або допуск).
  • ALPHA
  • Counter
  • kindnameoperationtype
    • kube-apiserver (/metrics)
apiserver_admission_step_admission_duration_seconds_summary
Зведення затримок на підетапах допуску в секундах для кожної операції, ресурсу API та типу етапу (валідація або допуск) для кожної операції та ресурсу API.
  • ALPHA
  • Summary
  • operationrejectedtype
    • kube-apiserver (/metrics)
apiserver_admission_webhook_fail_open_count
Кількість відкритих помилок вебхука допуску, ідентифікованих за іменами та розбитих за кожним типом допуску (валідація або допуск).
  • ALPHA
  • Counter
  • nametype
    • kube-apiserver (/metrics)
apiserver_admission_webhook_rejection_count
Кількість відмов від вебхуків допуску, ідентифікованих за іменами та розбитих за кожним типом допуску (валідація або допуск) та операцією. Додаткові мітки вказують на тип помилки (error_webhook_error або apiserver_internal_error, якщо сталася помилка; no_error в іншому випадку) і необовʼязково ненульовий код відмови, якщо вебхук відхиляє запит з кодом HTTP-статусу (обробляється apiserver, коли код більше або дорівнює 400). Коди, більші за 600, усікаються до 600, щоб обмежити кардинальність метрики.
  • ALPHA
  • Counter
  • error_typenameoperationrejection_codetype
    • kube-apiserver (/metrics)
apiserver_admission_webhook_request_total
Загальна кількість запитів на вебхук, ідентифікована за назвою та розбита за типом допуску (валідація чи модифікація) та операцією. Додаткові мітки вказують, чи був запит відхилений, і код статусу HTTP. Коди, що перевищують 600, усікаються до 600, щоб обмежити кардинальність метрики.
  • ALPHA
  • Counter
  • codenameoperationrejectedtype
    • kube-apiserver (/metrics)
apiserver_audit_error_total
Лічильник подій аудиту, які не були перевірені належним чином. Мітка plugin визначає втулок, на який вплинула помилка.
  • ALPHA
  • Counter
  • plugin
    • kube-apiserver (/metrics)
apiserver_audit_event_total
Лічильник подій аудиту, що генеруються та надсилаються до бекенду аудиту.
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_audit_level_total
Лічильник рівнів політики для подій аудиту (1 на запит).
  • ALPHA
  • Counter
  • level
    • kube-apiserver (/metrics)
apiserver_audit_requests_rejected_total
Лічильник запитів apiserver, відхилених через помилку в логах аудиту в бекенді.
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_authentication_config_controller_last_config_info
Інформація про останню застосовану конфігурацію автентифікації з хешем як міткою, розділена за ідентифікатором apiserver.
  • ALPHA
  • Custom
  • apiserver_id_hashhash
    • kube-apiserver (/metrics)
apiserver_authentication_jwt_authenticator_jwks_fetch_last_key_set_info
Інформація про останній JWKS, отриманий автентифікатором JWT з хешем як міткою, розділена за ідентифікатором сервера API та емітентом jwt.
  • ALPHA
  • Custom
  • jwt_issuer_hashapiserver_id_hashhash
    • kube-apiserver (/metrics)
apiserver_authentication_jwt_authenticator_jwks_fetch_last_timestamp_seconds
Часовий відбиток останнього успішного або невдалого виклику JWKS, розділений за результатом, ідентифікатором API-сервера та емітентом JWT для автентифікатора JWT.
  • ALPHA
  • Gauge
  • apiserver_id_hashjwt_issuer_hashresult
    • kube-apiserver (/metrics)
apiserver_authentication_jwt_authenticator_latency_seconds
Затримка операцій автентифікації jwt у секундах. Це час, витрачений на автентифікацію токена лише у випадку пропуску в кеші (тобто коли токен не знайдено в кеші).
  • ALPHA
  • Histogram
  • jwt_issuer_hashresult
    • kube-apiserver (/metrics)
apiserver_authorization_config_controller_last_config_info
Інформація про останню застосовану конфігурацію авторизації з хешем як міткою, розділена за ідентифікатором apiserver.
  • ALPHA
  • Custom
  • apiserver_id_hashhash
    • kube-apiserver (/metrics)
apiserver_authorization_decisions_total
Загальна кількість кінцевих рішень, прийнятих авторизатором, з розбивкою за типом авторизатора, імʼям та рішенням.
  • ALPHA
  • Counter
  • decisionnametype
    • kube-apiserver (/metrics)
apiserver_authorization_match_condition_evaluation_errors_total
Загальна кількість помилок, коли вебхук авторизації стикається з помилкою умови збігу, з розбивкою за типом та іменем авторизації.
  • ALPHA
  • Counter
  • nametype
    • kube-apiserver (/metrics)
apiserver_authorization_match_condition_evaluation_seconds
Час оцінки умови збігу авторизації в секундах, з розбивкою за типом та іменем авторизатора.
  • ALPHA
  • Histogram
  • nametype
    • kube-apiserver (/metrics)
apiserver_authorization_match_condition_exclusions_total
Загальна кількість винятків, коли вебхук авторизації пропускається, оскільки умови збігу виключають його.
  • ALPHA
  • Counter
  • nametype
    • kube-apiserver (/metrics)
apiserver_authorization_webhook_duration_seconds
Затримка запиту в секундах.
  • ALPHA
  • Histogram
  • nameresult
    • kube-apiserver (/metrics)
apiserver_authorization_webhook_evaluations_fail_open_total
Результат NoOpinion через тайм-аут вебхуку або помилку.
  • ALPHA
  • Counter
  • nameresult
    • kube-apiserver (/metrics)
apiserver_authorization_webhook_evaluations_total
Перехід туди-назад до вебхуків авторизації.
  • ALPHA
  • Counter
  • nameresult
    • kube-apiserver (/metrics)
apiserver_cache_list_fetched_objects_total
Кількість об’єктів, зчитаних із кешу спостереження під час обслуговування запиту LIST
  • ALPHA
  • Counter
  • groupindexresource
    • kube-apiserver (/metrics)
apiserver_cache_list_returned_objects_total
Кількість об’єктів, повернутих за запитом LIST із кешу спостереження
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_cache_list_total
Кількість запитів LIST, наданих із кешу спостереження
  • ALPHA
  • Counter
  • groupindexresource
    • kube-apiserver (/metrics)
apiserver_certificates_registry_csr_honored_duration_total
Загальна кількість виданих CSR із запитаною тривалістю, яка була виконана, розділена за підписувачами (лише імена підписувачів kubernetes.io визначено окремо)
  • ALPHA
  • Counter
  • signerName
    • kube-apiserver (/metrics)
apiserver_certificates_registry_csr_requested_duration_total
Загальна кількість виданих CSR із запитаною тривалістю, розділена за підписувачами (лише імена підписантів kubernetes.io визначено конкретно)
  • ALPHA
  • Counter
  • signerName
    • kube-apiserver (/metrics)
apiserver_client_certificate_expiration_seconds
Розподіл залишкового терміну служби сертифіката, який використовується для автентифікації запиту.
  • ALPHA
  • Histogram
    • kube-apiserver (/metrics)
apiserver_clusterip_repair_ip_errors_total
Кількість помилок, виявлених в clusterips циклом ремонту, за типами: leak, repair, full, outOfRange, duplicate, unknown, invalid
  • ALPHA
  • Counter
  • type
    • kube-apiserver (/metrics)
apiserver_clusterip_repair_reconcile_errors_total
Кількість збоїв узгодження в циклі узгодження ремонту clusterip
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_conversion_webhook_duration_seconds
Затримка запиту конверсії вубхука
  • ALPHA
  • Histogram
  • failure_typeresult
    • kube-apiserver (/metrics)
apiserver_conversion_webhook_request_total
Лічильник конверсійних запитів вубхук з успішністю/неуспішністю та типом помилки
  • ALPHA
  • Counter
  • failure_typeresult
    • kube-apiserver (/metrics)
apiserver_crd_conversion_webhook_duration_seconds
Тривалість конверсії CRD вебхука в секундах
  • ALPHA
  • Histogram
  • crd_namefrom_versionsucceededto_version
    • kube-apiserver (/metrics)
apiserver_current_inqueue_requests
Максимальна кількість запитів у черзі в цьому apiserver для кожного типу запитів за останню секунду.
  • ALPHA
  • Gauge
  • request_kind
    • kube-apiserver (/metrics)
apiserver_delegated_authn_request_duration_seconds
Затримка запиту в секундах. Розбито за кодом статусу.
  • ALPHA
  • Histogram
  • code
    • kube-apiserver (/metrics)
apiserver_delegated_authn_request_total
Кількість HTTP-запитів, розділених за кодом статусу.
  • ALPHA
  • Counter
  • code
    • kube-apiserver (/metrics)
apiserver_delegated_authz_request_duration_seconds
Затримка запиту в секундах. Розбито за кодом статусу.
  • ALPHA
  • Histogram
  • code
    • kube-apiserver (/metrics)
apiserver_delegated_authz_request_total
Кількість HTTP-запитів, розділених за кодом статусу.
  • ALPHA
  • Counter
  • code
    • kube-apiserver (/metrics)
apiserver_egress_dialer_dial_duration_seconds
Гістограма затримки набору в секундах, позначена протоколом (http-connect або grpc), транспортом (tcp або uds)
  • ALPHA
  • Histogram
  • protocoltransport
    • kube-apiserver (/metrics)
apiserver_egress_dialer_dial_failure_count
Кількість невдалих спроб зʼєднання, позначених протоколом (http-connect або grpc), транспортом (tcp або uds) та стадією (зʼєднання або проксі). Етап вказує на те, на якому етапі сталася помилка зʼєднання
  • ALPHA
  • Counter
  • protocolstagetransport
    • kube-apiserver (/metrics)
apiserver_egress_dialer_dial_start_total
Стартує зʼєднання, позначене протоколом (http-connect або grpc) і транспортом (tcp або uds).
  • ALPHA
  • Counter
  • protocoltransport
    • kube-apiserver (/metrics)
apiserver_encryption_config_controller_automatic_reload_last_timestamp_seconds
Мітка часу останнього успішного або невдалого автоматичного перезавантаження конфігурації шифрування, розділена за ідентифікатором apiserver.
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
    • kube-apiserver (/metrics)
apiserver_encryption_config_controller_automatic_reloads_total
Загальна кількість успішних і невдалих перезавантажень конфігурації шифрування, розподілених за ідентифікаторами apiserver.
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
    • kube-apiserver (/metrics)
apiserver_encryption_config_controller_last_config_info
Інформація про останню застосовану конфігурацію шифрування з хешем як міткою, розділена за ідентифікатором apiserver.
  • ALPHA
  • Custom
  • apiserver_id_hashhash
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_dek_cache_fill_percent
Відсоток слотів кешу, які наразі зайняті кешованими DEK.
  • ALPHA
  • Gauge
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_dek_cache_inter_arrival_time_seconds
Час (у секундах) між надходженням запитів на трансформацію.
  • ALPHA
  • Histogram
  • transformation_type
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_dek_source_cache_size
Кількість записів у вихідному кеші ключа шифрування даних (DEK). При перезапуску це значення є наближеним значенням кількості розшифрованих RPC-викликів, які сервер зробить до втулка KMS.
  • ALPHA
  • Gauge
  • provider_name
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_invalid_key_id_from_status_total
Кількість разів, коли невірний keyID повертається викликом Status RPC з розбивкою по помилках.
  • ALPHA
  • Counter
  • errorprovider_name
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_key_id_hash_last_timestamp_seconds
Останній раз в секундах, коли було використано keyID.
  • ALPHA
  • Gauge
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_key_id_hash_status_last_timestamp_seconds
Останній час у секундах, коли ідентифікатор ключа було повернуто викликом Status RPC.
  • ALPHA
  • Gauge
  • apiserver_id_hashkey_id_hashprovider_name
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_key_id_hash_total
Кількість разів використання keyID з розподілом за типом перетворення, провайдером та ідентичністю apiserver.
  • ALPHA
  • Counter
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
    • kube-apiserver (/metrics)
apiserver_envelope_encryption_kms_operations_latency_seconds
Загальна тривалість роботи KMS зі статусом коду помилки gRPC.
  • ALPHA
  • Histogram
  • grpc_status_codemethod_nameprovider_name
    • kube-apiserver (/metrics)
apiserver_externaljwt_fetch_keys_data_timestamp
Мітка часу Unix у секундах останнього успішного значення data_timestamp FetchKeys, повернутого зовнішнім підписувачем
  • ALPHA
  • Gauge
    • kube-apiserver (/metrics)
apiserver_externaljwt_fetch_keys_request_total
Загальна кількість спроб синхронізації підтримуваних JWK
  • ALPHA
  • Counter
  • code
    • kube-apiserver (/metrics)
apiserver_externaljwt_fetch_keys_success_timestamp
Unix Timestamp у секундах останнього успішного запиту FetchKeys
  • ALPHA
  • Gauge
    • kube-apiserver (/metrics)
apiserver_externaljwt_request_duration_seconds
Тривалість та час запиту на виклики до external-jwt-signer
  • ALPHA
  • Histogram
  • codemethod
    • kube-apiserver (/metrics)
apiserver_externaljwt_sign_request_total
Загальна кількість спроб підписати JWT
  • ALPHA
  • Counter
  • code
    • kube-apiserver (/metrics)
apiserver_flowcontrol_current_inqueue_seats
Кількість місць у чергах підсистеми API Priority and Fairness, що перебувають на розгляді в даний момент
  • ALPHA
  • Gauge
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_current_limit_seats
Поточна похідна кількість місць виконання, доступних для кожного рівня пріоритету
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_current_r
R(час останньої зміни)
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_demand_seats
Спостереження, в кінці кожної наносекунди, за (кількістю місць, які може використати кожен рівень пріоритету) / (номінальна кількість місць для цього рівня)
  • ALPHA
  • TimingRatioHistogram
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_demand_seats_average
Середньозважене за часом значення demand_seats за останній період коригування
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_demand_seats_high_watermark
Найвищий показник, за останній період коригування, для demand_seats
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_demand_seats_smoothed
Згладжені вимоги до місць
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_demand_seats_stdev
Середньозважене за часом стандартне відхилення, за останній період коригування, demand_seats
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_dispatch_r
R(час останньої диспетчеризації)
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_epoch_advance_total
Кількість разів, коли лічильник прогресу набору черг стрибнув назад
  • ALPHA
  • Counter
  • priority_levelsuccess
    • kube-apiserver (/metrics)
apiserver_flowcontrol_latest_s
S(останній відправлений запит)
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_lower_limit_seats
Налаштовано нижню межу кількості місць виконання, доступних для кожного рівня пріоритету
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_next_discounted_s_bounds
min і max, за чергою, для S (найстаріша заявка в черзі) — оціночне значення незавершеної роботи
  • ALPHA
  • Gauge
  • boundpriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_next_s_bounds
min і max, за чергами, для S (найстаріша заявка в черзі)
  • ALPHA
  • Gauge
  • boundpriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_priority_level_request_utilization
Спостереження наприкінці кожної наносекунди кількості запитів (у частках від відповідного ліміту), що очікують або перебувають на будь-якій стадії виконання (але тільки на початковій стадії для WATCH)
  • ALPHA
  • TimingRatioHistogram
  • phasepriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_priority_level_seat_utilization
Спостереження наприкінці кожної наносекунди за використанням місць на будь-якій стадії виконання (але тільки на початковій стадії для WATCH)
  • ALPHA
  • TimingRatioHistogram
  • priority_level
  • phase:executing
    • kube-apiserver (/metrics)
apiserver_flowcontrol_read_vs_write_current_requests
Спостереження наприкінці кожної наносекунди за кількістю запитів (у частках від відповідного ліміту), які очікують на виконання або перебувають на стадії виконання
  • ALPHA
  • TimingRatioHistogram
  • phaserequest_kind
    • kube-apiserver (/metrics)
apiserver_flowcontrol_request_concurrency_in_use
Паралельність (кількість місць), яку займають поточні запити, що виконуються (початкова стадія для WATCH, будь-яка інша стадія) у підсистемі API Priority and Fairness
  • ALPHA
  • Gauge
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
  • 1.31.0
apiserver_flowcontrol_request_concurrency_limit
Номінальна кількість місць виконання, налаштована для кожного рівня пріоритету
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
  • 1.30.0
apiserver_flowcontrol_request_dispatch_no_accommodation_total
Кількість випадків, коли спроба диспетчеризації призвела до відмови у розміщенні через відсутність вільних місць
  • ALPHA
  • Counter
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_request_execution_seconds
Тривалість початкового (для WATCH) або будь-якого (для не-WATCH) етапу виконання запиту в підсистемі API Priority and Fairness
  • ALPHA
  • Histogram
  • flow_schemapriority_leveltype
    • kube-apiserver (/metrics)
apiserver_flowcontrol_request_queue_length_after_enqueue
Довжина черги в підсистемі API Priority and Fairness, яку бачить кожен запит після того, як його поставлено в чергу
  • ALPHA
  • Histogram
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_seat_fair_frac
Справедлива частка паралелізму сервера для виділення кожному рівню пріоритету, який може його використовувати
  • ALPHA
  • Gauge
    • kube-apiserver (/metrics)
apiserver_flowcontrol_target_seats
Цілі розподілу місць
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_upper_limit_seats
Налаштована верхня межа кількості місць виконання, доступних для кожного рівня пріоритету
  • ALPHA
  • Gauge
  • priority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_watch_count_samples
Кількість спостерігачів для запитів, що змінюються, в API Priority and Fairness
  • ALPHA
  • Histogram
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_flowcontrol_work_estimated_seats
Кількість розрахункових місць (максимум початкових і кінцевих місць), повʼязаних із запитами в API Priority and Fairness
  • ALPHA
  • Histogram
  • flow_schemapriority_level
    • kube-apiserver (/metrics)
apiserver_init_events_total
Лічильник подій init, оброблених у watch кеші, з розбивкою за типами ресурсів.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_kube_aggregator_x509_insecure_sha1_total
Підраховує кількість запитів до серверів з незахищеними SHA1-підписами в обслуговуючому сертифікаті АБО кількість збоїв зʼєднання через незахищені SHA1-підписи (або/або, залежно від середовища виконання)
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_kube_aggregator_x509_missing_san_total
Підраховує кількість запитів до серверів, у яких відсутнє розширення SAN в обслуговуючому сертифікаті, АБО кількість збоїв зʼєднання через відсутність x509 сертифіката, у якому відсутнє розширення SAN (або, залежно від середовища виконання)
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_mutating_admission_policy_check_duration_seconds
Затримка допуску мутації для окремих проявів мутації в секундах, позначена політикою та звʼязком.
  • ALPHA
  • Histogram
  • error_typepolicypolicy_binding
    • kube-apiserver (/metrics)
apiserver_mutating_admission_policy_check_total
Перевірка загальної політики допуску мутацій, позначена політикою та додатково ідентифікована звʼязком.
  • ALPHA
  • Counter
  • error_typepolicypolicy_binding
    • kube-apiserver (/metrics)
apiserver_nodeport_repair_port_errors_total
Кількість помилок, виявлених на портах циклом виправлення, з розбивкою за типом помилки: leak, repair, full, outOfRange, duplicate, unknown
  • ALPHA
  • Counter
  • type
    • kube-apiserver (/metrics)
apiserver_nodeport_repair_reconcile_errors_total
Кількість невдалих спроб узгодження в циклі узгодження відновлення nodeport
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_peer_discovery_sync_errors_total
Загальна кількість помилок, що виникли під час синхронізації інформації про відкриття з peer kube-apiserver
  • ALPHA
  • Counter
  • type
    • kube-apiserver (/metrics)
apiserver_peer_proxy_errors_total
Загальна кількість помилок, що виникли під час проксирування запитів до peer kube-apiserver
  • ALPHA
  • Counter
  • groupresourcetypeversion
    • kube-apiserver (/metrics)
apiserver_request_aborts_total
Кількість запитів, які apiserver перервав, можливо, через таймаут, для кожної групи, версії, дієслова, ресурсу, субресурсу та області дії
  • ALPHA
  • Counter
  • groupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_request_body_size_bytes
Розмір тіла запиту Apiserver в байтах з розбивкою за ресурсами та дієсловами.
  • ALPHA
  • Histogram
  • groupresourceverb
    • kube-apiserver (/metrics)
apiserver_request_filter_duration_seconds
Розподіл затримки фільтрації запитів у секундах для кожного типу фільтрів
  • ALPHA
  • Histogram
  • filter
    • kube-apiserver (/metrics)
apiserver_request_post_timeout_total
Відстежує активність обробників запитів після того, як повʼязані з ними запити були вичерпані apiserverʼом
  • ALPHA
  • Counter
  • sourcestatus
    • kube-apiserver (/metrics)
apiserver_request_sli_duration_seconds
Розподіл затримок відповіді (не враховуючи тривалості вебхука та часу очікування в черзі пріоритету і справедливості) в секундах для кожного дієслова, групи, версії, ресурсу, субресурсу, області дії та компонента.
  • ALPHA
  • Histogram
  • componentgroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_request_slo_duration_seconds
Розподіл затримок відповіді (не враховуючи тривалості вебхука та часу очікування в черзі пріоритету і справедливості) в секундах для кожного дієслова, групи, версії, ресурсу, субресурсу, області дії та компонента.
  • ALPHA
  • Histogram
  • componentgroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
  • 1.27.0
apiserver_request_terminations_total
Кількість запитів, які apiserver припинив з метою самозахисту.
  • ALPHA
  • Counter
  • codecomponentgroupresourcescopesubresourceverbversion
    • kube-apiserver (/metrics)
apiserver_request_timestamp_comparison_time
Час, витрачений на порівняння старих і нових обʼєктів у запитах UPDATE або PATCH
  • ALPHA
  • Histogram
  • code_path
    • kube-apiserver (/metrics)
apiserver_rerouted_request_total
Загальна кількість запитів, які були перенаправлені на рівноправний kube apiserver через те, що локальний apiserver не зміг їх обслужити, розбитих за 'group', 'version' та 'resource', що вказує на GVR запиту. Якщо всі три порожні (""), запит є запитом на відкриття.`
  • ALPHA
  • Counter
  • codegroupresourceversion
    • kube-apiserver (/metrics)
apiserver_resource_objects
Кількість збережених обʼєктів на момент останньої перевірки, розділених за видами. У разі помилки під час вилучення значення буде -1.
  • ALPHA
  • Gauge
  • groupresource
    • kube-apiserver (/metrics)
apiserver_resource_size_estimate_bytes
Орієнтовний розмір обʼєктів, що зберігаються в базі даних. Орієнтовний розмір базується на сумі останніх спостережуваних розмірів серіалізованих обʼєктів. У разі помилки під час вилучення значення буде -1.
  • ALPHA
  • Gauge
  • groupresource
    • kube-apiserver (/metrics)
apiserver_selfrequest_total
Лічильник самозвернень apiserver, розбитий для кожного дієслова, ресурсу API та субресурсу.
  • ALPHA
  • Counter
  • groupresourcesubresourceverb
    • kube-apiserver (/metrics)
apiserver_storage_consistency_checks_total
Лічильник стану перевірок узгодженості між etcd та кешем спостереження
  • ALPHA
  • Counter
  • groupresourcestatus
    • kube-apiserver (/metrics)
apiserver_storage_data_key_generation_duration_seconds
Затримки в секундах операцій генерації ключів шифрування даних (DEK).
  • ALPHA
  • Histogram
    • kube-apiserver (/metrics)
apiserver_storage_data_key_generation_failures_total
Загальна кількість невдалих операцій генерації ключів шифрування даних (DEK).
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_storage_db_total_size_in_bytes
Загальний розмір файлу бази даних, фізично виділений в байтах.
  • ALPHA
  • Gauge
  • endpoint
    • kube-apiserver (/metrics)
  • 1.28.0
apiserver_storage_decode_errors_total
Кількість збережених помилок декодування обʼєктів з розподілом за типами обʼєктів
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_storage_envelope_transformation_cache_misses_total
Загальна кількість пропусків кешу при доступі до ключа дешифрування (KEK).
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_storage_events_received_total
Кількість отриманих подій etcd з розбивкою за типами.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_storage_list_evaluated_objects_total
Кількість протестованих обʼєктів під час обслуговування LIST-запиту зі сховища
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_storage_list_fetched_objects_total
Кількість обʼєктів, прочитаних зі сховища під час обслуговування LIST-запиту
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_storage_list_returned_objects_total
Кількість обʼєктів, що повертаються на запит LIST зі сховища
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_storage_list_total
Кількість запитів LIST, виконаних зі сховища
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_storage_transformation_duration_seconds
Затримки в секундах операцій перетворення значень.
  • ALPHA
  • Histogram
  • transformation_typetransformer_prefix
    • kube-apiserver (/metrics)
apiserver_storage_transformation_operations_total
Загальна кількість перетворень. Успішне перетворення матиме статус "OK", а у випадку невдалого перетворення — інший рядок статусу. Поля status, resource і transformation_type можна використовувати для сповіщень. Наприклад, ви можете відстежувати збої в шифруванні/розшифруванні за допомогою типу перетворення (наприклад, from_storage для розшифрування і to_storage для шифрування). Крім того, ці поля можна використовувати, щоб переконатися, що до кожного ресурсу застосовуються правильні перетворення.
  • ALPHA
  • Counter
  • resourcestatustransformation_typetransformer_prefix
    • kube-apiserver (/metrics)
apiserver_stream_translator_requests_total
Загальна кількість запитів, які були оброблені проксі StreamTranslatorProxy, що обробляє поток RemoteCommand/V5
  • ALPHA
  • Counter
  • code
    • kube-apiserver (/metrics)
apiserver_stream_tunnel_requests_total
Загальна кількість запитів, які були оброблені проксі StreamTunnelProxy, що обробляє поток PortForward/V2
  • ALPHA
  • Counter
  • code
    • kube-apiserver (/metrics)
apiserver_terminated_watchers_total
Лічильник спостерігачів закрито через відсутність реакції за типом ресурсу.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_tls_handshake_errors_total
Кількість запитів, відхилених з помилкою 'TLS handshake error from'
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_validation_declarative_validation_panics_total
Кількість випадків паніки в декларативній валідації, з розбивкою за ідентифікатором валідації.
  • ALPHA
  • Counter
  • validation_identifier
    • kube-apiserver (/metrics)
apiserver_validation_declarative_validation_parity_discrepancies_total
Кількість розбіжностей між декларативною та рукописною валідацією, з розбивкою за ідентифікатором валідації.
  • ALPHA
  • Counter
  • validation_identifier
    • kube-apiserver (/metrics)
apiserver_watch_cache_consistent_read_total
Лічильник послідовних читань з кешу.
  • ALPHA
  • Counter
  • fallbackgroupresourcesuccess
    • kube-apiserver (/metrics)
apiserver_watch_cache_events_dispatched_total
Лічильник подій, відправлених у кеш watch, розбитий за типами ресурсів.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_watch_cache_events_received_total
Лічильник подій, отриманих у кеші watch, розбитий за типом ресурсу.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_watch_cache_initializations_total
Лічильник ініціалізацій кешу watch, розбитий за типами ресурсів.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
apiserver_watch_cache_read_wait_seconds
Гістограма часу, витраченого на очікування оновлення кешу watch.
  • ALPHA
  • Histogram
  • groupresource
    • kube-apiserver (/metrics)
apiserver_watch_cache_resource_version
Поточна версія ресурсу кешу спостереження з розбивкою за типом ресурсу.
  • ALPHA
  • Gauge
  • groupresource
    • kube-apiserver (/metrics)
apiserver_watch_events_sizes
Перегляд розподілу розміру події в байтах
  • ALPHA
  • Histogram
  • groupresourceversion
    • kube-apiserver (/metrics)
apiserver_watch_events_total
Кількість подій, надісланих клієнтам watch
  • ALPHA
  • Counter
  • groupresourceversion
    • kube-apiserver (/metrics)
apiserver_webhooks_x509_insecure_sha1_total
Підраховує кількість запитів до серверів з незахищеними SHA1-підписами в обслуговуючому сертифікаті АБО кількість збоїв зʼєднання через незахищені SHA1-підписи (або/або, залежно від середовища виконання)
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
apiserver_webhooks_x509_missing_san_total
Підраховує кількість запитів до серверів, у яких відсутнє розширення SAN в обслуговуючому сертифікаті, АБО кількість збоїв зʼєднання через відсутність x509 сертифіката, у якому відсутнє розширення SAN (або/або, залежно від середовища виконання)
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
attach_detach_controller_attachdetach_controller_forced_detaches
Кількість разів, коли контролер A/D виконував примусове відʼєднання
  • ALPHA
  • Counter
  • reason
    • kube-controller-manager (/metrics)
attachdetach_controller_total_volumes
Кількість томів в A/D контролері
  • ALPHA
  • Custom
  • plugin_namestate
    • kube-controller-manager (/metrics)
authenticated_user_requests
Лічильник автентифікованих запитів, розбитий за іменами користувачів.
  • ALPHA
  • Counter
  • username
    • kube-apiserver (/metrics)
authentication_attempts
Лічильник автентифікованих спроб.
  • ALPHA
  • Counter
  • result
    • kube-apiserver (/metrics)
authentication_duration_seconds
Тривалість автентифікації в секундах з розбивкою за результатами.
  • ALPHA
  • Histogram
  • result
    • kube-apiserver (/metrics)
authentication_token_cache_active_fetch_count
  • ALPHA
  • Gauge
  • status
    • kube-apiserver (/metrics)
authentication_token_cache_fetch_total
  • ALPHA
  • Counter
  • status
    • kube-apiserver (/metrics)
authentication_token_cache_request_duration_seconds
  • ALPHA
  • Histogram
  • status
    • kube-apiserver (/metrics)
authentication_token_cache_request_total
  • ALPHA
  • Counter
  • status
    • kube-apiserver (/metrics)
authorization_attempts_total
Лічильник спроб авторизації з розбивкою за результатом. Це може бути "allowed", "denied", "no-opinion" або "error".
  • ALPHA
  • Counter
  • result
    • kube-apiserver (/metrics)
authorization_duration_seconds
Тривалість авторизації в секундах з розбивкою за результатами.
  • ALPHA
  • Histogram
  • result
    • kube-apiserver (/metrics)
cloud_provider_webhook_request_duration_seconds
Затримка запиту в секундах. З розбивкою по коду статусу.
  • ALPHA
  • Histogram
  • codewebhook
    • cloud-controller-manager (/metrics)
cloud_provider_webhook_request_total
Кількість HTTP-запитів, розділених за кодом статусу.
  • ALPHA
  • Counter
  • codewebhook
    • cloud-controller-manager (/metrics)
clustertrustbundle_publisher_sync_duration_seconds
Час, необхідний для синхронізації кластерного пакета довіри.
  • ALPHA
  • Histogram
  • code
    • kube-controller-manager (/metrics)
clustertrustbundle_publisher_sync_total
Кількість синхронізацій, що відбулися у видавцеві кластерних пакетів довіри.
  • ALPHA
  • Counter
  • code
    • kube-controller-manager (/metrics)
container_swap_limit_bytes
Поточний обсяг ліміту свопу контейнера в байтах. Повідомляється тільки на системах, що не є Windows.
  • ALPHA
  • Custom
  • containerpodnamespace
    • kubelet (/metrics/resource)
container_swap_usage_bytes
Поточний обсяг використання свопу контейнера у байтах. Відображається лише на системах, відмінних від Windows
  • ALPHA
  • Custom
  • containerpodnamespace
    • kubelet (/metrics/resource)
csi_operations_seconds
Тривалість роботи інтерфейсу Container Storage Interface з кодом помилки gRPC усього
  • ALPHA
  • Histogram
  • driver_namegrpc_status_codemethod_namemigrated
    • csi-controller (/metrics)
daemonset_controller_stale_sync_skips_total
Загальна кількість синхронізацій DaemonSet, пропущених через застарілий кеш спостереження.
  • ALPHA
  • Counter
  • groupresource
    • kube-controller-manager (/metrics)
device_taint_eviction_controller_pod_deletion_duration_seconds
Затримка, у секундах, між моментом активації ефекту позначення пристрою позначкою taint і видаленням Pod за допомогою контролера DeviceTaintEvictionController.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
device_taint_eviction_controller_pod_deletions_total
Загальна кількість Podʼів, видалених DeviceTaintEvictionController з початку роботи.
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
dra_grpc_operations_duration_seconds
Тривалість у секундах операцій DRA gRPC
  • ALPHA
  • Histogram
  • driver_namegrpc_status_codemethod_name
    • kubelet (/metrics)
dra_operations_duration_seconds
Гістограма затримки в секундах для тривалості обробки всіх ResourceClaims, на які посилається pod, коли pod запускається або зупиняється. Ідентифікується за назвою операції (PrepareResources або UnprepareResources) і відокремлюється за успішністю операції. Кількість невдалих операцій надається через загальний підрахунок гістограми.
  • ALPHA
  • Histogram
  • is_erroroperation_name
    • kubelet (/metrics)
dra_resource_claims_in_use
Кількість ResourceClaims, які наразі використовуються на вузлі, за назвою драйвера (значення мітки driver_name) та для всіх драйверів (спеціальне значення <any> для driver_name). Зверніть увагу, що сума всіх підрахунків за драйверами не є загальною кількістю використовуваних ResourceClaims, оскільки один і той самий ResourceClaim може використовувати пристрої з різних драйверів. Замість цього використовуйте підрахунок для <any> driver_name.
  • ALPHA
  • Custom
  • driver_name
    • kubelet (/metrics)
endpoint_slice_controller_changes
Кількість змін EndpointSlice
  • ALPHA
  • Counter
  • operation
    • kube-controller-manager (/metrics)
endpoint_slice_controller_desired_endpoint_slices
Кількість EndpointSlices, які могли б існувати при ідеальному розподілі точок доступу
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
endpoint_slice_controller_endpoints_added_per_sync
Кількість точок доступу, доданих під час кожної синхронізації Service
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_controller_endpoints_desired
Кількість бажаних точок доступу
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
endpoint_slice_controller_endpoints_removed_per_sync
Кількість видалених точок доступу під час кожної синхронізації Service
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_controller_endpointslices_changed_per_sync
Кількість EndpointSlices, змінених під час кожної синхронізації Service
  • ALPHA
  • Histogram
  • topologytraffic_distribution
    • kube-controller-manager (/metrics)
endpoint_slice_controller_num_endpoint_slices
Кілкість EndpointSlices
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
endpoint_slice_controller_services_count_by_traffic_distribution
Кількість Services, що використовують певний trafficDistribution
  • ALPHA
  • Gauge
  • traffic_distribution
    • kube-controller-manager (/metrics)
endpoint_slice_controller_syncs
Кількість синхронізацій EndpointSlice
  • ALPHA
  • Counter
  • result
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_addresses_skipped_per_sync
Кількість адрес, пропущених під час кожної синхронізації точок доступу через те, що вони недійсні або перевищують MaxEndpointsPerSubset
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_changes
Кількість змін EndpointSlice
  • ALPHA
  • Counter
  • operation
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_desired_endpoint_slices
Кількість EndpointSlices, які могли б існувати при ідеальному розподілі точок доступу
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_endpoints_added_per_sync
Кількість точок доступу, доданих під час кожної синхронізації Endpoints
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_endpoints_desired
Кількість бажаних точок доступу
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_endpoints_removed_per_sync
Кількість видалених точок доступу під час кожної синхронізації Endpoints
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_endpoints_sync_duration
Тривалість syncEndpoints() у секундах
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_endpoints_updated_per_sync
Кількість точок доступу, оновлених під час кожної синхронізації Endpoints
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
endpoint_slice_mirroring_controller_num_endpoint_slices
Кількість EndpointSlices
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
ephemeral_volume_controller_create_failures_total
Кількість запитів на створення PersistentVolumeClaim
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
ephemeral_volume_controller_create_total
Кількість запитів на створення PersistentVolumeClaim
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
etcd_bookmark_counts
Кількість закладок etcd (подій, що сповіщають про хід виконання) з розподілом за типами.
  • ALPHA
  • Gauge
  • groupresource
    • kube-apiserver (/metrics)
etcd_lease_object_counts
Кількість обʼєктів, закріплених за одним lease etcd.
  • ALPHA
  • Histogram
    • kube-apiserver (/metrics)
etcd_request_duration_seconds
Затримка запиту etcd в секундах для кожної операції та типу обʼєкта.
  • ALPHA
  • Histogram
  • groupoperationresource
    • kube-apiserver (/metrics)
etcd_request_errors_total
Etcd підраховує кількість невдалих запитів для кожної операції та типу обʼєкта.
  • ALPHA
  • Counter
  • groupoperationresource
    • kube-apiserver (/metrics)
etcd_requests_total
Підрахунок запитів etcd здійснюється для кожної операції та типу обʼєкта.
  • ALPHA
  • Counter
  • groupoperationresource
    • kube-apiserver (/metrics)
etcd_version_info
Версія сервера etcd
  • ALPHA
  • Gauge
  • binary_version
    • etcd-version-monitor (/metrics)
field_validation_request_duration_seconds
Розподіл затримки відповіді в секундах для кожного значення валідації поля
  • ALPHA
  • Histogram
  • field_validation
    • kube-apiserver (/metrics)
force_cleaned_failed_volume_operation_errors_total
Кількість томів, які не пройшли примусове очищення після реконструкції, не пройшли примусового очищення під час запуску kubelet.
  • ALPHA
  • Counter
    • kubelet (/metrics)
force_cleaned_failed_volume_operations_total
Кількість томів, які були примусово очищені після невдалої реконструкції під час запуску kubelet. Сюди входять як успішні, так і невдалі очищення.
  • ALPHA
  • Counter
    • kubelet (/metrics)
garbagecollector_controller_resources_sync_error_total
Кількість помилок синхронізації ресурсів збирача сміття
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
horizontal_pod_autoscaler_controller_desired_replicas
Поточна бажана кількість реплік для обʼєктів HPA.
  • ALPHA
  • Gauge
  • hpa_namenamespace
    • kube-controller-manager (/metrics)
horizontal_pod_autoscaler_controller_metric_computation_duration_seconds
Час (у секундах), який контролер HPA витрачає на обчислення однієї метрики. Мітка 'action' має бути або 'scale_down', або 'scale_up', або 'none'. Мітка 'error' повинна мати значення 'spec', 'internal' або 'none'. Мітка 'metric_type' відповідає HPA.spec.metrics[*].type
  • ALPHA
  • Histogram
  • actionerrormetric_type
    • kube-controller-manager (/metrics)
horizontal_pod_autoscaler_controller_metric_computation_total
Кількість обчислень метрики. Мітка 'action' має бути або 'scale_down', або 'scale_up', або 'none'. Також мітка 'error' повинна мати значення 'spec', 'internal' або 'none'. Мітка 'metric_type' відповідає HPA.spec.metrics[*].type
  • ALPHA
  • Counter
  • actionerrormetric_type
    • kube-controller-manager (/metrics)
horizontal_pod_autoscaler_controller_num_horizontal_pod_autoscalers
Поточна кількість контрольованих обʼєктів HPA.
  • ALPHA
  • Gauge
    • kube-controller-manager (/metrics)
horizontal_pod_autoscaler_controller_reconciliation_duration_seconds
Час (у секундах), який потрібен контролеру HPA для одноразового узгодження. Мітка 'action' має бути або 'scale_down', або 'scale_up', або 'none'. Також мітка 'error' має бути або 'spec', або 'internal', або 'none'. Зауважте, що якщо під час звірки виникають і специфічні, і внутрішні помилки, то в мітці `error` відображається перша з них.
  • ALPHA
  • Histogram
  • actionerror
    • kube-controller-manager (/metrics)
horizontal_pod_autoscaler_controller_reconciliations_total
Кількість коригувань контролера HPA. Мітка 'action' має бути або 'scale_down', або 'scale_up', або 'none'. Також мітка 'error' має бути або 'spec', або 'internal', або 'none'. Зверніть увагу, що якщо під час узгодження виникають як специфічні, так і внутрішні помилки, то в мітці `error` відображається перша з них.
  • ALPHA
  • Counter
  • actionerror
    • kube-controller-manager (/metrics)
informer_processing_latency_seconds
Час, витрачений на обробку подій після вилучення з черги.
  • ALPHA
  • Histogram
  • groupnameresourceversion
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
informer_queued_items
Кількість елементів, які наразі знаходяться в черзі FIFO.
  • ALPHA
  • Gauge
  • groupnameresourceversion
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
job_controller_job_finished_indexes_total
`Кількість готових індексів. Можливі значення для мітки статусу: "successed", "failed". Можливі значення для мітки backoffLimit: "perIndex" та "global"`.
  • ALPHA
  • Counter
  • backoffLimitstatus
    • kube-controller-manager (/metrics)
job_controller_job_pods_creation_total
`Кількість Podʼів, створених контролером Job, позначених причиною створення Podʼа. Ця метрика також розрізняє Podʼи, створені з використанням різних налаштувань PodReplacementPolicy. Можливі значення мітки "reason": "new", "recreate_terminating_or_failed", "recreate_failed", "recreate_failed". Можливі значення мітки "status": "succeeded", "failed".`
  • ALPHA
  • Counter
  • reasonstatus
    • kube-controller-manager (/metrics)
job_controller_jobs_by_external_controller_total
Кількість Job, якими керує зовнішній контролер
  • ALPHA
  • Counter
  • controller_name
    • kube-controller-manager (/metrics)
job_controller_pod_failures_handled_by_failure_policy_total
`Кількість збійних Podʼів, оброблених політикою збоїв, відносно дії політики збоїв, застосованої на основі відповідного правила. Можливі значення мітки дії відповідають можливим значенням дії правила політики відмов, а саме: "FailJob", "Ignore" та "Count".`
  • ALPHA
  • Counter
  • action
    • kube-controller-manager (/metrics)
job_controller_stale_sync_skips_total
Загальна кількість синхронізацій Job, пропущених через застарілий кеш спостереження.
  • ALPHA
  • Counter
  • groupresource
    • kube-controller-manager (/metrics)
job_controller_terminated_pods_tracking_finalizer_total
`Кількість завершених Podʼів (phase=Failed|Successed), які мають завершувач batch.kubernetes.io/job-tracking, Мітка події може бути "add" або "delete".`
  • ALPHA
  • Counter
  • event
    • kube-controller-manager (/metrics)
kube_apiserver_clusterip_allocator_allocated_ips
Показник, що вимірює кількість виділених IP-адрес для Services
  • ALPHA
  • Gauge
  • cidr
    • kube-apiserver (/metrics)
kube_apiserver_clusterip_allocator_allocation_duration_seconds
Тривалість у секундах для виділення кластерного IP за допомогою ServiceCIDR
  • ALPHA
  • Histogram
  • cidr
    • kube-apiserver (/metrics)
kube_apiserver_clusterip_allocator_allocation_errors_total
Кількість помилок при виділенні кластерних IP-адрес
  • ALPHA
  • Counter
  • cidrscope
    • kube-apiserver (/metrics)
kube_apiserver_clusterip_allocator_allocation_total
Кількість розподілених кластерних IP-адрес
  • ALPHA
  • Counter
  • cidrscope
    • kube-apiserver (/metrics)
kube_apiserver_clusterip_allocator_available_ips
Показник, що вимірює кількість доступних IP-адрес для Services
  • ALPHA
  • Gauge
  • cidr
    • kube-apiserver (/metrics)
kube_apiserver_nodeport_allocator_allocated_ports
Вимірювання кількості виділених NodePorts для Service
  • ALPHA
  • Gauge
    • kube-apiserver (/metrics)
kube_apiserver_nodeport_allocator_allocation_errors_total
Кількість помилок при спробі надання NodePort
  • ALPHA
  • Counter
  • scope
    • kube-apiserver (/metrics)
kube_apiserver_nodeport_allocator_allocation_total
Кількість виділених NodePorts
  • ALPHA
  • Counter
  • scope
    • kube-apiserver (/metrics)
kube_apiserver_nodeport_allocator_available_ports
Вимірювання кількості доступних NodePorts для Services
  • ALPHA
  • Gauge
    • kube-apiserver (/metrics)
kube_apiserver_pod_logs_backend_tls_failure_total
Загальна кількість запитів до Podʼів/логів, які завершилися невдало через перевірку TLS сервером kubelet
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
kube_apiserver_pod_logs_insecure_backend_total
Загальна кількість запитів до Podʼів/логів за типом використання: enforce_tls, skip_tls_allowed, skip_tls_denied
  • ALPHA
  • Counter
  • usage
    • kube-apiserver (/metrics)
kube_apiserver_pod_logs_pods_logs_backend_tls_failure_total
Загальна кількість запитів до Podʼів/логів, які завершилися невдало через перевірку TLS сервера kubelet
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
  • 1.27.0
kube_apiserver_pod_logs_pods_logs_insecure_backend_total
Загальна кількість запитів до Podʼів/логів за типом використання: enforce_tls, skip_tls_allowed, skip_tls_denied
  • ALPHA
  • Counter
  • usage
    • kube-apiserver (/metrics)
  • 1.27.0
kubelet_active_pods
Кількість Podʼів, які kubelet вважає активними і які розглядаються при прийнятті нових Podʼів. статичне значення істинне, якщо Pod не від apiserver'а.
  • ALPHA
  • Gauge
  • static
    • kubelet (/metrics)
kubelet_admission_rejections_total
Кумулятивна кількість відмов у прийнятті pod від Kubelet.
  • ALPHA
  • Counter
  • reason
    • kubelet (/metrics)
kubelet_certificate_manager_client_expiration_renew_errors
Лічильник помилок поновлення сертифікатів.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_certificate_manager_client_ttl_seconds
Показник TTL (час життя) клієнтського сертифіката Kubelet. Значення в секундах до закінчення терміну дії сертифіката (відʼємне, якщо термін дії вже закінчився). Якщо клієнтський сертифікат недійсний або невикористаний, значення буде +INF.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_certificate_manager_server_rotation_seconds
Гістограма кількості секунд, які проіснував попередній сертифікат перед ротацією.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_certificate_manager_server_ttl_seconds
Показник найкоротшого TTL (time-to-live) сертифікату обслуговування Kubelet. Значення в секундах до закінчення терміну дії сертифіката (відʼємне, якщо термін дії вже закінчився). Якщо обслуговуючий сертифікат недійсний або невикористаний, значення буде +INF.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_cgroup_manager_duration_seconds
Тривалість у секундах для операцій cgroup manager. Розбито за методами.
  • ALPHA
  • Histogram
  • operation_type
    • kubelet (/metrics)
kubelet_cgroup_version
версія cgroup на хостах.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_container_aligned_compute_resources_count
Сумарна кількість вирівняних обчислювальних ресурсів, виділених контейнерам за типом вирівнювання.
  • ALPHA
  • Counter
  • boundaryscope
    • kubelet (/metrics)
kubelet_container_aligned_compute_resources_failure_count
Кумулятивна кількість невдалих спроб розподілити виділені обчислювальні ресурси між контейнерами за типом виділення.
  • ALPHA
  • Counter
  • boundaryscope
    • kubelet (/metrics)
kubelet_container_log_filesystem_used_bytes
Байти, що використовуються логами контейнера у файловій системі.
  • ALPHA
  • Custom
  • uidnamespacepodcontainer
    • kubelet (/metrics)
kubelet_container_requested_resizes_total
Кількість запитів на зміну розміру, підрахована на рівні контейнера. Різні ресурси в одному контейнері підраховуються окремо. Мітка 'requirement' (вимога) відноситься до 'memory' (пам'ять) або 'limits' (обмеження); мітка 'operation' (операція) може бути 'add' (додати), 'remove' (видалити), 'increase' (збільшити) або 'decrease' (зменшити).
  • ALPHA
  • Counter
  • operationrequirementresource
    • kubelet (/metrics)
kubelet_containers_per_pod_count
Кількість контейнерів на один Pod.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_cpu_manager_allocation_per_numa
Кількість CPU, виділених на одному вузлі NUMA
  • ALPHA
  • Gauge
  • numa_node
    • kubelet (/metrics)
kubelet_cpu_manager_exclusive_cpu_allocation_count
Загальна кількість процесорів, виділених виключно контейнерам, що працюють на цьому вузлі
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_cpu_manager_pinning_errors_total
Кількість розподілів ядер процесора, які потребували pinning, зазнали невдачі.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_cpu_manager_pinning_requests_total
Кількість розподілів ядер процесора, які потребували pinning.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_cpu_manager_shared_pool_size_millicores
Розмір спільного пулу процесорів для негарантованих QoS podʼів, у міліядрах процесора.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_credential_provider_config_info
Інформація про останню застосовану конфігурацію постачальника облікових даних із хешем як міткою
  • ALPHA
  • Custom
  • hash
    • kubelet (/metrics)
kubelet_credential_provider_plugin_duration
Тривалість виконання в секундах для втулка постачальника облікових даних
  • ALPHA
  • Histogram
  • plugin_name
    • kubelet (/metrics)
kubelet_credential_provider_plugin_errors_total
Кількість помилок від втулка постачальника облікових даних
  • ALPHA
  • Counter
  • plugin_name
    • kubelet (/metrics)
kubelet_cri_losing_support
версія Kubernetes, у якій поточна реалізація CRI втратить підтримку, якщо не буде оновлена.
  • ALPHA
  • Gauge
  • version
    • kubelet (/metrics)
kubelet_desired_pods
Кількість Podʼів, які kubelet має запустити. static має значення true, якщо pod не від apiserverʼа.
  • ALPHA
  • Gauge
  • static
    • kubelet (/metrics)
kubelet_device_plugin_alloc_duration_seconds
Тривалість у секундах обслуговування запиту на виділення втулка пристрою. Розбито за назвою ресурсу.
  • ALPHA
  • Histogram
  • resource_name
    • kubelet (/metrics)
kubelet_device_plugin_registration_total
Загальна кількість реєстрацій втулків для пристроїв. Розбито за назвою ресурсу.
  • ALPHA
  • Counter
  • resource_name
    • kubelet (/metrics)
kubelet_evented_pleg_connection_error_count
Кількість помилок, що виникли під час встановлення потокового зʼєднання з середовищем виконання CRI.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_evented_pleg_connection_latency_seconds
Затримка потокового зʼєднання з процесом виконання CRI, вимірюється в секундах.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_evented_pleg_connection_success_count
Кількість разів, коли потоковий клієнт отримував події CRI.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_eviction_stats_age_seconds
Час між збором статистики та виселенням Pod на основі цієї статистики за сигналом про виселення
  • ALPHA
  • Histogram
  • eviction_signal
    • kubelet (/metrics)
kubelet_evictions
Сумарна кількість виселень Podʼів за сигналом про виселення
  • ALPHA
  • Counter
  • eviction_signal
    • kubelet (/metrics)
kubelet_graceful_shutdown_end_time_seconds
Останній час заврешення належного припинення роботи програмного забезпечення в секундах unix
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_graceful_shutdown_start_time_seconds
Останній час запуску належного припинення роботи програмного забезпечення в секундах unix
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_http_inflight_requests
Кількість запитів http під час польоту
  • ALPHA
  • Gauge
  • long_runningmethodpathserver_type
    • kubelet (/metrics)
kubelet_http_requests_duration_seconds
Тривалість обслуговування http-запитів у секундах
  • ALPHA
  • Histogram
  • long_runningmethodpathserver_type
    • kubelet (/metrics)
kubelet_http_requests_total
Кількість http запитів, отриманих з моменту запуску сервера
  • ALPHA
  • Counter
  • long_runningmethodpathserver_type
    • kubelet (/metrics)
kubelet_image_garbage_collected_total
Загальна кількість образів, зібраних системою збирання сміття kubelet, незалежно від використання диска або віку образів.
  • ALPHA
  • Counter
  • reason
    • kubelet (/metrics)
kubelet_image_manager_ensure_image_requests_total
Кількість запитів ensure-image, оброблених kubelet.
  • ALPHA
  • Counter
  • present_locallypull_policypull_required
    • kubelet (/metrics)
kubelet_image_pull_duration_seconds
Тривалість у секундах для отримання образу.
  • ALPHA
  • Histogram
  • image_size_in_bytes
    • kubelet (/metrics)
kubelet_imagemanager_image_mustpull_checks_total
КЛічильник кількості разів, коли kubelet перевіряв, чи потрібно повторно перевірити облікові дані для доступу до образу.
  • ALPHA
  • Counter
  • result
    • kubelet (/metrics)
kubelet_imagemanager_inmemory_pulledrecords_usage_percent
Використання кешу в памʼяті ImagePulledRecords у відсотках.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_imagemanager_inmemory_pullintents_usage_percent
Використання кешу в памʼяті ImagePullIntents у відсотках.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_imagemanager_ondisk_pulledrecords
Кількість ImagePulledRecords, збережених на диску.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_imagemanager_ondisk_pullintents
Кількість ImagePullIntents, збережених на диску.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_lifecycle_handler_http_fallbacks_total
The number of times lifecycle handlers successfully fell back to http from https.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_managed_ephemeral_containers
Поточна кількість ефемерних контейнерів у Podʼах, якими керує цей kubelet.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_memory_manager_pinning_errors_total
Кількість розподілів сторінок памʼяті, які потребували закріплення, що не вдалося.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_memory_manager_pinning_requests_total
Кількість розподілів сторінок памʼяті, які потребували закріплення.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_metrics_provider
Провайдер метрик, який використовується kubelet для збору статистики контейнерів. Значення можуть бути 'cadvisor' та 'cri'
  • ALPHA
  • Gauge
  • provider
    • kubelet (/metrics)
kubelet_mirror_pods
Кількість дзеркальних Podʼів, які спробує створити kubelet (по одному на кожен допустимий статичний Pod)
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_node_name
Імʼя вузла. Кількість завжди дорівнює 1.
  • ALPHA
  • Gauge
  • node
    • kubelet (/metrics)
kubelet_node_startup_duration_seconds
Тривалість у секундах запуску вузла в цілому.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_node_startup_post_registration_duration_seconds
Тривалість у секундах запуску вузла після реєстрації.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_node_startup_pre_kubelet_duration_seconds
Тривалість у секундах запуску вузла до запуску kubelet.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_node_startup_pre_registration_duration_seconds
Тривалість у секундах запуску вузла перед реєстрацією.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_node_startup_registration_duration_seconds
Тривалість у секундах запуску вузла під час реєстрації.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_orphan_pod_cleaned_volumes
Загальна кількість осиротілих Pod, чиї томи були очищені під час останнього періодичного обстеження.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_orphan_pod_cleaned_volumes_errors
Кількість осиротілих Pod, чиї томи не вдалося очистити під час останнього періодичного обстеження.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_orphaned_runtime_pods_total
Кількість Podʼів, які були виявлені в середовищі виконання контейнерів, які невідомі для pod worker. Це зазвичай вказує на те, що kubelet був перезапущений під час примусового видалення Pod в API або в локальній конфігурації, що є незвичним.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_pleg_discard_events
Кількість подій відхилення в PLEG (Pod Lifecycle Event Generator).
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_pleg_last_seen_seconds
Позначка часу в секундах, коли PLEG востаннє був активний.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_pleg_relist_duration_seconds
Тривалість у секундах для повторного переліку Podʼів в PLEG.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_pleg_relist_interval_seconds
Інтервал у секундах між повторними переліками в PLEG.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_pod_deferred_accepted_resizes_total
Кумулятивна кількість змін розміру, які були прийняті після відстрочки.
  • ALPHA
  • Counter
  • retry_trigger
    • kubelet (/metrics)
kubelet_pod_in_progress_resizes
Кількість поточних змін розміру для podʼів.
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_pod_infeasible_resizes_total
Кількість неможливих змін розміру для podʼів.
  • ALPHA
  • Counter
  • reason_detail
    • kubelet (/metrics)
kubelet_pod_pending_resizes
Кількість очікуючих змін розміру для podʼів.
  • ALPHA
  • Gauge
  • reason
    • kubelet (/metrics)
kubelet_pod_resize_duration_milliseconds
Тривалість у мілісекундах для активації зміни розміру podʼа
  • ALPHA
  • Histogram
  • success
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_errors_get
Кількість запитів до точки доступу PodResource Get, які повернули помилку. Розбито за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_errors_get_allocatable
Кількість запитів до точки доступу PodResource GetAllocatableResources, які повернули помилку. Розбито за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_errors_list
Кількість запитів до точки доступу PodResource List, які повернули помилку. Розбито за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_requests_get
Кількість запитів до точки доступу PodResource Get, розбита за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_requests_get_allocatable
Кількість запитів до точки доступу PodResource GetAllocatableResources, розбита за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_requests_list
Кількість запитів до точки доступу PodResource List, розбита за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_resources_endpoint_requests_total
Загальна кількість запитів до точки доступу PodResource, розбита за версіями API сервера.
  • ALPHA
  • Counter
  • server_api_version
    • kubelet (/metrics)
kubelet_pod_start_duration_seconds
Тривалість у секундах від першого виявлення kubelet'ом Podʼа до початку його запуску.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_pod_start_sli_duration_seconds
Тривалість у секундах для запуску Pod, за виключенням часу на завантаження образів та виконання init-контейнерів, виміряна з моменту позначки часу створення Pod до того, як всі його контейнери будуть відзначені як запущені та доступні для спостереження через watch.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_pod_start_total_duration_seconds
Тривалість у секундах для запуску Pod з моменту створення, включаючи час на завантаження образів та виконання init-контейнерів, виміряна з позначки часу створення Pod до того моменту, коли всі його контейнери будуть відзначені як запущені та доступні для спостережені через watch.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_pod_status_sync_duration_seconds
Тривалість у секундах синхронізації оновлення статусу Pod. Вимірює час від виявлення зміни статусу Pod до успішного оновлення API для цього Pod, навіть якщо відбулося кілька проміжних змін статусу Pod.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_pod_worker_duration_seconds
Тривалість у секундах синхронізації одного Pod, розбита за операціями: create, update або sync.
  • ALPHA
  • Histogram
  • operation_type
    • kubelet (/metrics)
kubelet_pod_worker_start_duration_seconds
Тривалість у секундах від моменту, коли kubelet виявляє Pod до початку запуску виконавця робочого навантаження.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_podcertificate_states
Вектор-показник, що повідомляє про кількість джерел спроєцьованих томів сертифікатів подів, згрупованих за signer_name та state.
  • ALPHA
  • Custom
  • signer_namestate
    • kubelet (/metrics)
kubelet_preemptions
Загальна кількість передчасних випереджень Podʼів за ресурсом випередження.
  • ALPHA
  • Counter
  • preemption_signal
    • kubelet (/metrics)
kubelet_restarted_pods_total
Кількість Podʼів, які були перезапущені через те, що вони були видалені та створені знову з тим самим UID, поки kubelet відстежував їх (звично для статичних Podʼів, надзвичайно рідко для pod API).
  • ALPHA
  • Counter
  • static
    • kubelet (/metrics)
kubelet_run_podsandbox_duration_seconds
Тривалість у секундах операцій run_podsandbox. Розбито за RuntimeClass.Handler.
  • ALPHA
  • Histogram
  • runtime_handler
    • kubelet (/metrics)
kubelet_run_podsandbox_errors_total
Загальна кількість помилок операцій run_podsandbox в розрізі RuntimeClass.Handler.
  • ALPHA
  • Counter
  • runtime_handler
    • kubelet (/metrics)
kubelet_running_containers
Кількість контейнерів, що зараз працюють.
  • ALPHA
  • Gauge
  • container_state
    • kubelet (/metrics)
kubelet_running_pods
Кількість Podʼів, які мають працюючий pod sandbox
  • ALPHA
  • Gauge
    • kubelet (/metrics)
kubelet_runtime_operations_duration_seconds
Тривалість у секундах операцій середовища виконання. Розбито за типом операції.
  • ALPHA
  • Histogram
  • operation_type
    • kubelet (/metrics)
kubelet_runtime_operations_errors_total
Загальна кількість помилок операцій середовища виконання за типом операції.
  • ALPHA
  • Counter
  • operation_type
    • kubelet (/metrics)
kubelet_runtime_operations_total
Загальна кількість операцій середовища виконання за типом операції.
  • ALPHA
  • Counter
  • operation_type
    • kubelet (/metrics)
kubelet_server_expiration_renew_errors
Лічильник помилок оновлення сертифікатів.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_sleep_action_terminated_early_total
Кількість разів, коли обробник сну життєвого циклу був завершений до завершення його роботи.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_started_containers_errors_total
Загальна кількість помилок під час запуску контейнерів.
  • ALPHA
  • Counter
  • codecontainer_type
    • kubelet (/metrics)
kubelet_started_containers_total
Загальна кількість запущених контейнерів.
  • ALPHA
  • Counter
  • container_type
    • kubelet (/metrics)
kubelet_started_host_process_containers_errors_total
Сукупна кількість помилок при запуску контейнерів hostprocess. Ця метрика буде збиратися тільки у Windows.
  • ALPHA
  • Counter
  • codecontainer_type
    • kubelet (/metrics)
kubelet_started_host_process_containers_total
Сукупна кількість запущених контейнерів hostprocess. Ця метрика буде збиратися лише у Windows.
  • ALPHA
  • Counter
  • container_type
    • kubelet (/metrics)
kubelet_started_pods_errors_total
Сукупна кількість помилок під час запуску Podʼів
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_started_pods_total
Сукупна кількість запущених Podʼів
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_started_user_namespaced_pods_errors_total
Кумулятивна кількість помилок під час запуску podʼів з іменами просторів користувачів. Цей показник збирається тільки в Linux.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_started_user_namespaced_pods_total
CКумулятивна кількість запущених podʼів з іменами просторів користувачів. Цей показник збирається тільки в Linux.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_topology_manager_admission_duration_ms
Тривалість у мілісекундах для обслуговування запиту на допуск Podʼа.
  • ALPHA
  • Histogram
    • kubelet (/metrics)
kubelet_topology_manager_admission_errors_total
Кількість відмов запитів допуску, коли не вдалося виділити ресурси.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_topology_manager_admission_requests_total
Кількістьт заявок допуску, для яких потрібне вирівнювання ресурсів.
  • ALPHA
  • Counter
    • kubelet (/metrics)
kubelet_volume_metric_collection_duration_seconds
Тривалість у секундах для розрахунку статистики тому
  • ALPHA
  • Histogram
  • metric_source
    • kubelet (/metrics)
kubelet_volume_stats_available_bytes
Кількість доступних байт в томі
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_volume_stats_capacity_bytes
Місткість тому у байтах
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_volume_stats_health_status_abnormal
Статус справності аномального тому. Значення 1 або 0. 1 — означає, що том н є справним, 0 — говорить про справність тому
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_volume_stats_inodes
Максимальна кількість inode в томі
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_volume_stats_inodes_free
Кількість вільних inode в томі
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_volume_stats_inodes_used
Кількість використаних inode у томі
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_volume_stats_used_bytes
Кількість використаних байт у томі
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
    • kubelet (/metrics)
kubelet_working_pods
Кількість Podʼів, які фактично виконує kubelet, з розбивкою за фазами життєвого циклу, чи є Pod бажаним, осиротілим або тільки для виконання (також осиротілим), а також чи є Pod статичним. Осиротілий Pod був видалений з локальної конфігурації або примусово видалений в API та споживає ресурси, які не є видимими в інших випадках.
  • ALPHA
  • Gauge
  • configlifecyclestatic
    • kubelet (/metrics)
kubeproxy_conntrack_reconciler_deleted_entries_total
Кумулятивні потоки conntrack видалені за допомогою узгоджувача conntrack
  • ALPHA
  • Counter
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_conntrack_reconciler_sync_duration_seconds
ReconcileConntrackFlowsLatency затримка в секундах
  • ALPHA
  • Histogram
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_iptables_ct_state_invalid_dropped_packets_total
пакети, що відкидаються iptables для вирішення проблем з відстеженням
  • ALPHA
  • Custom
    • kube-proxy (/metrics)
kubeproxy_iptables_localhost_nodeports_accepted_packets_total
Кількість пакетів, прийнятих на nodeports інтерфейсу loopback
  • ALPHA
  • Custom
    • kube-proxy (/metrics)
kubeproxy_network_programming_duration_seconds
В Cluster Network Programming Latency затримка в секундах
  • ALPHA
  • Histogram
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_proxy_healthz_total
Сукупний стан справності проксі-сервера HTTP
  • ALPHA
  • Counter
  • code
    • kube-proxy (/metrics)
kubeproxy_proxy_livez_total
Сукупний стан життєздатності проксі-сервера HTTP
  • ALPHA
  • Counter
  • code
    • kube-proxy (/metrics)
kubeproxy_sync_full_proxy_rules_duration_seconds
Затримка SyncProxyRules у секундах для повних повторних синхронізацій
  • ALPHA
  • Histogram
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_partial_proxy_rules_duration_seconds
Затримка SyncProxyRules у секундах для часткових повторних синхронізацій
  • ALPHA
  • Histogram
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_duration_seconds
SyncProxyRules затримка в секундах
  • ALPHA
  • Histogram
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_endpoint_changes_pending
Правила проксі, що очікують на розгляд зміни Endpoint
  • ALPHA
  • Gauge
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_endpoint_changes_total
Кумулятивні проксі-правила зміни Endpoint
  • ALPHA
  • Counter
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_iptables_last
Кількість правил iptables, записаних kube-proxy під час останньої синхронізації
  • ALPHA
  • Gauge
  • ip_familytable
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_iptables_partial_restore_failures_total
Сукупні помилки часткового відновлення iptables проксі-сервера
  • ALPHA
  • Counter
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_iptables_restore_failures_total
Сукупні помилки відновлення iptables проксі-сервера
  • ALPHA
  • Counter
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_iptables_total
Загальна кількість правил iptables, якими володіє kube-proxy
  • ALPHA
  • Gauge
  • ip_familytable
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_last_queued_timestamp_seconds
Останній раз, коли синхронізація правил проксі була поставлена в чергу
  • ALPHA
  • Gauge
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_last_timestamp_seconds
Останній раз, коли правила проксі були успішно синхронізовані
  • ALPHA
  • Gauge
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_nftables_cleanup_failures_total
Накопичені помилки очищення nftables проксі-сервера
  • ALPHA
  • Counter
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_nftables_sync_failures_total
Накопичені збої синхронізації nftables проксі-сервера
  • ALPHA
  • Counter
  • ip_family
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_no_local_endpoints_total
Кількість сервісів з політикою локального трафіку без точок доступу
  • ALPHA
  • Gauge
  • ip_familytraffic_policy
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_service_changes_pending
Правила проксі в очікувані, що змінюють Service
  • ALPHA
  • Gauge
    • kube-proxy (/metrics)
kubeproxy_sync_proxy_rules_service_changes_total
Сукупні правила проксі в очікувані, що змінюють Service
  • ALPHA
  • Counter
    • kube-proxy (/metrics)
leader_election_master_status
Ознака того, чи є система звітності головною для відповідного lease, 0 вказує на резервну копію, 1 — на головну. "name" — це рядок, який використовується для ідентифікації lease. Будь ласка, згрупуйте за назвою.
  • ALPHA
  • Gauge
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
leader_election_slowpath_total
Загальна кількість повільних шляхів, використаних при поновленні leases лідера. 'name' — це рядок, який використовується для ідентифікації lease. Будь ласка, згрупуйте за іменами.
  • ALPHA
  • Counter
  • name
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
node_authorizer_graph_actions_duration_seconds
Гістограма тривалості дій з графом в авторизаторі вузла.
  • ALPHA
  • Histogram
  • operation
    • kube-apiserver (/metrics)
node_collector_unhealthy_nodes_in_zone
Вимірювання кількості не готових вузлів за зонами.
  • ALPHA
  • Gauge
  • zone
    • kube-controller-manager (/metrics)
node_collector_update_all_nodes_health_duration_seconds
Час у секундах, протягом якого NodeController оновлює стан справності усіх вузлів.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
node_collector_update_node_health_duration_seconds
Тривалість у секундах, протягом якої NodeController оновлює стан справності одного вузла.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
node_collector_zone_health
Індикатор, що вимірює відсоток справних вузлів у кожній зоні.
  • ALPHA
  • Gauge
  • zone
    • kube-controller-manager (/metrics)
node_collector_zone_size
Вимірювання кількості зареєстрованих вузлів за зонами.
  • ALPHA
  • Gauge
  • zone
    • kube-controller-manager (/metrics)
node_controller_cloud_provider_taint_removal_delay_seconds
Кількість секунд після створення вузла, коли NodeController видалив позначку хмарного провайдера з одного вузла.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
node_controller_initial_node_sync_delay_seconds
Кількість секунд після створення вузла, коли NodeController завершив початкову синхронізацію одного вузла.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
node_ipam_controller_cidrset_allocation_tries_per_request
Кількість точок доступу, доданих під час кожної синхронізації Service
  • ALPHA
  • Histogram
  • clusterCIDR
    • kube-controller-manager (/metrics)
node_ipam_controller_cidrset_cidrs_allocations_total
Лічильник, що вимірює загальну кількість розподілів CIDR.
  • ALPHA
  • Counter
  • clusterCIDR
    • kube-controller-manager (/metrics)
node_ipam_controller_cidrset_cidrs_releases_total
Лічильник, що вимірює загальну кількість оновлень CIDR.
  • ALPHA
  • Counter
  • clusterCIDR
    • kube-controller-manager (/metrics)
node_ipam_controller_cidrset_usage_cidrs
Індикатор, що вимірює відсоток виділених CIDR.
  • ALPHA
  • Gauge
  • clusterCIDR
    • kube-controller-manager (/metrics)
node_ipam_controller_cirdset_max_cidrs
Максимальна кількість CIDR, яку можна виділити.
  • ALPHA
  • Gauge
  • clusterCIDR
    • kube-controller-manager (/metrics)
node_swap_usage_bytes
Поточне використання свопу вузла у байтах. Відображається лише на системах, відмінних від Windows
  • ALPHA
  • Custom
    • kubelet (/metrics/resource)
plugin_manager_total_plugins
Кількість втулків у Plugin Manager
  • ALPHA
  • Custom
  • socket_pathstate
    • kubelet (/metrics/resource)
pod_gc_collector_force_delete_pod_errors_total
Кількість помилок, що виникли при примусовому видаленні Podʼів з моменту запуску Pod GC Controller.
  • ALPHA
  • Counter
  • namespacereason
    • kube-controller-manager (/metrics)
pod_gc_collector_force_delete_pods_total
Кількість Podʼів, які було примусово видалено з моменту запуску контролера Pod GC Controller.
  • ALPHA
  • Counter
  • namespacereason
    • kube-controller-manager (/metrics)
pod_security_errors_total
Кількість помилок, що перешкоджають нормальній оцінці. Нефатальні помилки можуть призвести до того, що для оцінювання буде використано останній обмежений профіль.
  • ALPHA
  • Counter
  • fatalrequest_operationresourcesubresource
    • kube-apiserver (/metrics)
pod_security_evaluations_total
Кількість оцінок політики, що відбулися, не враховуючи проігнорованих або звільнених від розгляду запитів.
  • ALPHA
  • Counter
  • decisionmodepolicy_levelpolicy_versionrequest_operationresourcesubresource
    • kube-apiserver (/metrics)
pod_security_exemptions_total
Кількість звільнених запитів, не враховуючи ігнорованих або тих, що виходять за межі області застосування.
  • ALPHA
  • Counter
  • request_operationresourcesubresource
    • kube-apiserver (/metrics)
pod_swap_usage_bytes
Поточний обсяг використання підкачки у байтах. Відображається лише на системах, відмінних від Windows
  • ALPHA
  • Custom
  • podnamespace
    • kubelet (/metrics/resource)
prober_probe_duration_seconds
Тривалість у секундах для відповіді проби.
  • ALPHA
  • Histogram
  • containernamespacepodprobe_type
    • kubelet (/metrics/probes)
pv_collector_bound_pv_count
Вимірювач кількості постійного тому, який наразі привʼязаний
  • ALPHA
  • Custom
  • storage_class
    • kube-controller-manager (/metrics)
pv_collector_bound_pvc_count
Вимірювач кількості поточно привʼязаних persistent volume claim
  • ALPHA
  • Custom
  • namespacestorage_classvolume_attributes_class
    • kube-controller-manager (/metrics)
pv_collector_total_pv_count
Вимірювач загальної кількості постійних томів
  • ALPHA
  • Custom
  • plugin_namevolume_mode
    • kube-controller-manager (/metrics)
pv_collector_unbound_pv_count
Вимірювач кількості постійних томів, що зараз не привʼязані
  • ALPHA
  • Custom
  • storage_class
    • kube-controller-manager (/metrics)
pv_collector_unbound_pvc_count
Вимірювач кількості не привʼязаних persistent volume claim
  • ALPHA
  • Custom
  • namespacestorage_classvolume_attributes_class
    • kube-controller-manager (/metrics)
reconstruct_volume_operations_errors_total
Кількість томів, які не вдалося відновити з операційної системи під час запуску kubelet.
  • ALPHA
  • Counter
    • kubelet (/metrics/resource)
reconstruct_volume_operations_total
Кількість томів, які намагалися відновити з операційної системи під час запуску kubelet. Сюди входять як успішні, так і невдалі спроби відновлення.
  • ALPHA
  • Counter
    • kubelet (/metrics)
replicaset_controller_sorting_deletion_age_ratio
Відношення віку вибраних видалених Podʼів до поточного наймолодшого віку Podʼів (на даний момент). Має бути менше ніж 2. Мета цієї метрики — виміряти приблизну ефективність впливу функціоналу LogarithmicScaleDown на сортування (і видалення) Podʼів при зменшенні масштабу набору реплік. При обчисленні та створенні звітів враховуються лише готові Podʼи.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
replicaset_controller_stale_sync_skips_total
Загальна кількість синхронізацій ReplicaSet, пропущених через застарілий кеш спостереження.
  • ALPHA
  • Counter
  • groupresource
    • kube-controller-manager (/metrics)
resourceclaim_controller_creates_total
Кількість запитів на створення ResourceClaims, класифікованих за статусом створення та доступом адміністратора
  • ALPHA
  • Counter
  • admin_accessstatus
    • kube-controller-manager (/metrics)
resourceclaim_controller_resource_claims
Кількість ResourceClaims, класифікованих за статусом виділення, доступом адміністратора та джерелом. Джерелом може бути 'resource_claim_template' (створено на основі шаблону), 'extended_resource' (розширені ресурси) або порожнє (створено користувачем вручну).
  • ALPHA
  • Custom
  • allocatedadmin_accesssource
    • kube-controller-manager (/metrics)
rest_client_dns_resolution_duration_seconds
Затримка DNS-резолвера в секундах. Розбито за хостами.
  • ALPHA
  • Histogram
  • host
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_exec_plugin_call_total
Кількість викликів втулка exec, розділених за типом події, що виникла (no_error, plugin_execution_error, plugin_not_found_error, client_internal_error) та необовʼязковим кодом завершення роботи. Код завершення буде встановлено у 0 тоді і тільки тоді, коли виклик втулка був успішним.
  • ALPHA
  • Counter
  • call_statuscode
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_exec_plugin_certificate_rotation_age
Гістограма кількості секунд, які прожив останній клієнтський сертифікат втулка auth exec до того, як його було ротовано. Якщо клієнтські сертифікати втулка auth exec не використовуються, гістограма не міститиме даних.
  • ALPHA
  • Histogram
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_exec_plugin_policy_call_total
Кількість порівнянь втулка exec з політикою втулків та списком дозволених allowlist (якщо такий є), розділених залежно від того, чи дозволяє політика використання втулка.
  • ALPHA
  • Counter
  • alloweddenied
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_exec_plugin_ttl_seconds
Показник найкоротшого TTL (часу життя) клієнтських сертифікатів, якими керує втулок auth exec. Значення в секундах до закінчення терміну дії сертифіката (відʼємне, якщо термін дії вже закінчився). Якщо втулки auth exec не використовуються або не керують сертифікатами TLS, значення буде +INF.
  • ALPHA
  • Gauge
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_rate_limiter_duration_seconds
Затримка обмежувача швидкості на стороні клієнта в секундах. Розбито за дієсловами та хостами.
  • ALPHA
  • Histogram
  • hostverb
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_request_duration_seconds
Час затримки запиту в секундах. Розбито за дієсловами та хостами.
  • ALPHA
  • Histogram
  • hostverb
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_request_retries_total
Кількість повторних спроб запиту, з розподілом за кодом статусу, дієсловом та хостом.
  • ALPHA
  • Counter
  • codehostverb
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_request_size_bytes
Розмір запиту в байтах. Розбито за дієсловом та хостом.
  • ALPHA
  • Histogram
  • hostverb
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_requests_total
Кількість HTTP-запитів, розділених за кодом статусу, методом та хостом.
  • ALPHA
  • Counter
  • codehostmethod
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_response_size_bytes
Розмір відповіді в байтах. Розбито за дієсловом та хостом.
  • ALPHA
  • Histogram
  • hostverb
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_transport_cache_entries
Кількість транспортних записів у внутрішньому кеші.
  • ALPHA
  • Gauge
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
rest_client_transport_create_calls_total
Кількість викликів для отримання нового транспорту, розділена за результатом операції hit: отримано з кешу, miss: створено та додано до кешу, uncacheable: створено та не кешовано
  • ALPHA
  • Counter
  • result
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
retroactive_storageclass_errors_total
Загальна кількість невдалих ретроактивних присвоєнь StorageClass до persistent volume claim
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
retroactive_storageclass_total
Загальна кількість ретроактивних присвоєнь StorageClass для persistent volume claim
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
root_ca_cert_publisher_sync_duration_seconds
Кількість синхронізацій просторів імен, що відбулися у видавця сертифікатів root ca.
  • ALPHA
  • Histogram
  • code
    • kube-controller-manager (/metrics)
root_ca_cert_publisher_sync_total
Кількість синхронізацій просторів імен, що відбулися у видавця сертифікатів root ca.
  • ALPHA
  • Counter
  • code
    • kube-controller-manager (/metrics)
route_controller_route_sync_total
Метрика, що рахує кількість разів, коли маршрути були синхронізовані з провайдером хмари.
  • ALPHA
  • Counter
    • cloud-controller-manager (/metrics)
scheduler_async_api_call_execution_duration_seconds
Тривалість у секундах виконання виклику API в async-диспетчері.
  • ALPHA
  • Histogram
  • call_typeresult
    • kube-scheduler (/metrics)
scheduler_async_api_call_execution_total
Загальна кількість викликів API, виконаних async-диспетчером.
  • ALPHA
  • Counter
  • call_typeresult
    • kube-scheduler (/metrics)
scheduler_batch_attempts_total
Кількість результатів при спробі використання пакетної обробки.
  • ALPHA
  • Counter
  • profileresult
    • kube-scheduler (/metrics)
scheduler_batch_cache_flushed_total
Кількість очищень кешу за причинами.
  • ALPHA
  • Counter
  • profilereason
    • kube-scheduler (/metrics)
scheduler_cache_size
Кількість вузлів, Podʼів та передбачуваних (звʼязаних) Podʼів у кеші планувальника.
  • ALPHA
  • Gauge
  • type
    • kube-scheduler (/metrics)
scheduler_event_handling_duration_seconds
Затримка обробки подій у секундах.
  • ALPHA
  • Histogram
  • event
    • kube-scheduler (/metrics)
scheduler_get_node_hint_duration_seconds
Затримка для отримання підказки про вузол.
  • ALPHA
  • Histogram
  • hintedprofile
    • kube-scheduler (/metrics)
scheduler_goroutines
Кількість запущених підпрограм, розділених за роботою, яку вони виконують, наприклад, звʼязуванням.
  • ALPHA
  • Gauge
  • operation
    • kube-scheduler (/metrics)
scheduler_inflight_events
Кількість подій, які наразі відстежуються в черзі планування.
  • ALPHA
  • Gauge
  • event
    • kube-scheduler (/metrics)
scheduler_pending_async_api_calls
Кількість викликів API, які наразі очікують у черзі async.
  • ALPHA
  • Gauge
  • call_type
    • kube-scheduler (/metrics)
scheduler_permit_wait_duration_seconds
Тривалість очікування на отримання дозволу.
  • ALPHA
  • Histogram
  • result
    • kube-scheduler (/metrics)
scheduler_plugin_evaluation_total
Кількість спроб запланувати Podʼи для кожного втулка і точки розширення (доступно тільки в PreFilter, Filter, PreScore і Score).
  • ALPHA
  • Counter
  • extension_pointpluginprofile
    • kube-scheduler (/metrics)
scheduler_plugin_execution_duration_seconds
Тривалість запуску втулка в певній точці розширення.
  • ALPHA
  • Histogram
  • extension_pointpluginstatus
    • kube-scheduler (/metrics)
scheduler_pod_scheduled_after_flush_total
Кількість подів, які були успішно заплановані після того, як вони були видалені з unschedulablePods через тайм-аут. Ця метрика допомагає виявляти потенційні проблеми з конфігурацією черги або обробкою подій.
  • ALPHA
  • Counter
    • kube-scheduler (/metrics)
scheduler_podgroup_schedule_attempts_total
Кількість спроб запланувати групу подів, за результатом. 'unschedulable' означає, що групу подів не вдалося запланувати, тоді як 'error' означає внутрішню проблему планувальника.
  • ALPHA
  • Counter
  • profileresult
    • kube-scheduler (/metrics)
scheduler_podgroup_scheduling_algorithm_duration_seconds
Затримка алгоритму планування групи подів у секундах
  • ALPHA
  • Histogram
    • kube-scheduler (/metrics)
scheduler_podgroup_scheduling_attempt_duration_seconds
Затримка спроби планування групи подів у секундах (алгоритм планування + привʼязка)
  • ALPHA
  • Histogram
  • profileresult
    • kube-scheduler (/metrics)
scheduler_preemption_goroutines_duration_seconds
Тривалість у секундах для запуску goroutines для витіснення.
  • ALPHA
  • Histogram
  • result
    • kube-scheduler (/metrics)
scheduler_preemption_goroutines_execution_total
Кількість виконаних процедур витіснення.
  • ALPHA
  • Counter
  • result
    • kube-scheduler (/metrics)
scheduler_queueing_hint_execution_duration_seconds
Тривалість запуску функції підказки черги втулка.
  • ALPHA
  • Histogram
  • eventhintplugin
    • kube-scheduler (/metrics)
scheduler_resourceclaim_creates_total
Кількість запитів на створення ResourceClaims у планувальнику
  • ALPHA
  • Counter
  • status
    • kube-scheduler (/metrics)
scheduler_scheduling_algorithm_duration_seconds
Затримка алгоритму планування в секундах
  • ALPHA
  • Histogram
    • kube-scheduler (/metrics)
scheduler_store_schedule_results_duration_seconds
Затримка для отримання відмови.
  • ALPHA
  • Histogram
  • profile
    • kube-scheduler (/metrics)
scheduler_unschedulable_pods
Кількість незапланованих Podʼів, розбитих за назвою втулка. Pod збільшує показник для всіх втулків, які спричинили його незапланованість, тому ця метрика має сенс лише у розбивці за втулками.
  • ALPHA
  • Gauge
  • pluginprofile
    • kube-scheduler (/metrics)
scheduler_volume_binder_cache_requests_total
Загальна кількість запитів кешу привʼязування томів
  • ALPHA
  • Counter
  • operation
    • kube-scheduler (/metrics)
scheduler_volume_scheduling_stage_error_total
Кількість помилок на етапі планування томів
  • ALPHA
  • Counter
  • operation
    • kube-scheduler (/metrics)
scrape_error
1, якщо виникла помилка при отриманні метрик контейнера, 0 в іншому випадку
  • ALPHA
  • Custom
    • kubelet (/metrics/resource)
  • 1.29.0
selinux_warning_controller_selinux_volume_conflict
Конфлікт між двома Podʼами, що використовують один і той самий том
  • ALPHA
  • Custom
  • propertypod1_namespacepod1_namepod1_valuepod2_namespacepod2_namepod2_value
    • kube-controller-manager (/metrics)
service_controller_loadbalancer_sync_total
Метрика, що підраховує кількість разів, коли був налаштований будь-який балансувальник навантаження, як наслідок зміни сервісу/вузла на кластері
  • ALPHA
  • Counter
    • cloud-controller-manager (/metrics)
service_controller_nodesync_error_total
Метрика, яка підраховує кількість разів, коли будь-який балансувальник навантаження був налаштований і помилявся, як наслідок зміни вузлів у кластері
  • ALPHA
  • Counter
    • cloud-controller-manager (/metrics)
service_controller_nodesync_latency_seconds
Метрика, що вимірює затримку синхронізації вузлів, яка оновлює хости балансувальника навантаження при оновленні вузлів кластера.
  • ALPHA
  • Histogram
    • cloud-controller-manager (/metrics)
service_controller_update_loadbalancer_host_latency_seconds
Метрика, що вимірює затримку оновлення кожного з хостів балансувальника навантаження.
  • ALPHA
  • Histogram
    • cloud-controller-manager (/metrics)
serviceaccount_invalid_legacy_auto_token_uses_total
Використання сукупних недійсних автоматично згенерованих застарілих токенів
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
serviceaccount_legacy_auto_token_uses_total
Використання сукупних автоматично згенерованих застарілих токенів
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
serviceaccount_legacy_manual_token_uses_total
Використання сукупних вручну створених застарілих токенів
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
serviceaccount_legacy_tokens_total
Використані токени застарілих службових облікових записів
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
serviceaccount_stale_tokens_total
Використані токени службових облікових записів з простроченим терміном придатності
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
serviceaccount_valid_tokens_total
Використання дійсних токенів проєцьованих службових облікових записів
  • ALPHA
  • Counter
    • kube-apiserver (/metrics)
statefulset_controller_stale_sync_skips_total
Загальна кількість пропущених синхронізацій StatefulSet через застарілий кеш спостереження.
  • ALPHA
  • Counter
  • groupresource
    • kube-controller-manager (/metrics)
statefulset_controller_statefulset_max_unavailable
Максимальна допустима кількість недоступних подів під час поступового оновлення StatefulSet
  • ALPHA
  • Gauge
  • pod_management_policystatefulset_namestatefulset_namespace
    • kube-controller-manager (/metrics)
statefulset_controller_statefulset_unavailable_replicas
Поточна кількість недоступних подів у StatefulSet
  • ALPHA
  • Gauge
  • pod_management_policystatefulset_namestatefulset_namespace
    • kube-controller-manager (/metrics)
storage_count_attachable_volumes_in_use
Підрахунок кількості використовуваних томів
  • ALPHA
  • Custom
  • nodevolume_plugin
    • kube-controller-manager (/metrics/resource)
storage_operation_duration_seconds
Тривалість операції зберігання
  • ALPHA
  • Histogram
  • migratedoperation_namestatusvolume_plugin
    • kubelet (/metrics/resource)
taint_eviction_controller_pod_deletion_duration_seconds
Затримка, в секундах, між моментом активації ефекту заплямування (taint) для Pod і його видаленням через TaintEvictionController.
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
taint_eviction_controller_pod_deletions_total
Загальна кількість Podʼів, видалених TaintEvictionController з моменту його запуску.
  • ALPHA
  • Counter
    • kube-controller-manager (/metrics)
ttl_after_finished_controller_job_deletion_duration_seconds
Час, необхідний для видалення завдання (job) з моменту, коли воно стало доступним для видалення
  • ALPHA
  • Histogram
    • kube-controller-manager (/metrics)
version_info
Надає інформацію про сумісність версії компонента. Мітка компонента — це назва компонента, зазвичай kube, але вона має значення для aggregated-apiservers.
  • ALPHA
  • Gauge
  • binarycomponentemulationmin_compat
    • cloud-controller-manager (/metrics)
    • kube-apiserver (/metrics)
    • kube-controller-manager (/metrics)
    • kube-proxy (/metrics)
    • kube-scheduler (/metrics)
    • kubelet (/metrics)
volume_manager_selinux_container_errors_total
Кількість помилок, коли kubelet не може обчислити контекст SELinux для контейнера. Kubelet не зможе запустити такий Pod і спробує ще раз, тому значення цієї метрики може не відповідати дійсній кількості контейнерів.
  • ALPHA
  • Gauge
  • access_mode
    • kubelet (/metrics)
volume_manager_selinux_container_warnings_total
Кількість помилок, коли kubelet не може обчислити контекст SELinux для контейнера, які ігноруються. Вони стануть справжніми помилками, коли функцію SELinuxMountReadWriteOncePod буде розширено на всі режими доступу до томів.
  • ALPHA
  • Gauge
  • access_mode
    • kubelet (/metrics)
volume_manager_selinux_pod_context_mismatch_errors_total
Кількість помилок, коли Pod визначає різні контексти SELinux для своїх контейнерів, які використовують однаковий обʼєм. Kubelet не зможе запустити такий Pod і спробує ще раз, тому значення цієї метрики може не відповідати дійсній кількості Podʼів.
  • ALPHA
  • Gauge
  • access_mode
    • kubelet (/metrics)
volume_manager_selinux_pod_context_mismatch_warnings_total
Кількість помилок, коли Pod визначає різні контексти SELinux для своїх контейнерів, які використовують той самий том. Це ще не помилки, але вони стануть справжніми помилками, коли можливість SELinuxMountReadWriteOncePod буде розширено на всі режими доступу до тома.
  • ALPHA
  • Gauge
  • access_mode
    • kubelet (/metrics)
volume_manager_selinux_volume_context_mismatch_errors_total
Кількість помилок, коли Pod використовує том, який вже змонтовано з іншим контекстом SELinux, ніж потрібен Pod. Kubelet не зможе запустити такий Pod і повторити спробу, тому значення цієї метрики може не відповідати дійсній кількості Podʼів.
  • ALPHA
  • Gauge
  • access_modevolume_plugin
    • kubelet (/metrics)
volume_manager_selinux_volume_context_mismatch_warnings_total
Кількість помилок, коли Pod використовує том, який вже змонтовано з іншим контекстом SELinux, ніж потрібен Pod. Це ще не помилки, але вони стануть справжніми помилками, коли функцію SELinuxMountReadWriteOncePod буде розширено на всі режими доступу до томів.
  • ALPHA
  • Gauge
  • access_modevolume_plugin
    • kubelet (/metrics)
volume_manager_selinux_volumes_admitted_total
Кількість томів, контекст SELinux яких був нормальним і які буде змонтовано за допомогою параметра контексту mount -o.
  • ALPHA
  • Gauge
  • access_modevolume_plugin
    • kubelet (/metrics)
volume_manager_total_volumes
Кількість томів у Volume Manager
  • ALPHA
  • Custom
  • plugin_namestate
    • kubelet (/metrics)
volume_operation_total_errors
Всього помилок в роботі з томом
  • ALPHA
  • Counter
  • operation_nameplugin_name
    • kube-controller-manager (/metrics)
volume_operation_total_seconds
Тривалість операції зберігання від початку до кінця в секундах
  • ALPHA
  • Histogram
  • operation_nameplugin_name
    • kubelet (/metrics)
watch_cache_capacity
Загальний обсяг кешу watch, розбитий за типами ресурсів.
  • ALPHA
  • Gauge
  • groupresource
    • kube-apiserver (/metrics)
watch_cache_capacity_decrease_total
Загальна кількість подій зменшення ємності кешу watch, з розбивкою за типами ресурсів.
  • ALPHA
  • Counter
  • groupresource
    • kube-apiserver (/metrics)
watch_cache_capacity_increase_total
Загальна кількість подій збільшення ємності кешу watch, з розбивкою за типами ресурсів.
  • ALPHA
  • Counter
  • name
    • kube-apiserver (/metrics)