【腾讯云原生】TKE 原地升级解决方案

摘自 Kubernetes 实践指南

需求与背景

Kubernetes 默认不支持原地升级,使用腾讯云容器服务也一样,也没有集成相关插件来支持,可以安装开源的 openkruise 来实现,本文介绍如何在腾讯云容器服务上利用 openkruise 让工作负载进行原地升级。

原地升级的好处

原地升级的主要好处是,更新更快,并且可以避免更新后底层资源不足导致一直 Pending:

  • 不需要重建 Pod,对于 EKS 来说,都不需要重建虚拟机。
  • 原地升级实际就是替换容器镜像,重启下容器,对于 EKS 来说,可以避免 Pod 重建后底层没资源调度的情况。
  • 不需要重新拉取整个镜像,只需要拉取有变化的 layer 即可。

操作步骤

安装 openkruise

helm repo add openkruise https://openkruise.github.io/charts/
helm repo update
helm install kruise openkruise/kruise

参考 官方安装文档

创建支持原地升级的工作负载

OpenKruise 中有以下几种工作负载支持原地升级:

  • CloneSet
  • Advanced StatefulSet
  • Advanced DaemonSet
  • SidecarSet

更多原地升级详细文档参考 官方文档

以下用 Advanced StatefulSet 进行演示,准备 sts.yaml

apiVersion: apps.kruise.io/v1beta1
kind: StatefulSet
metadata:
  name: sample
spec:
  replicas: 3
  serviceName: fake-service
  selector:
    matchLabels:
      app: sample
  template:
    metadata:
      labels:
        app: sample
    spec:
      readinessGates:
      # A new condition that ensures the pod remains at NotReady state while the in-place update is happening
      - conditionType: InPlaceUpdateReady
      containers:
      - name: main
        image: nginx:alpine
  podManagementPolicy: Parallel # allow parallel updates, works together with maxUnavailable
  updateStrategy:
    type: RollingUpdate
    rollingUpdate:
      # Do in-place update if possible, currently only image update is supported for in-place update
      podUpdatePolicy: InPlaceIfPossible
      # Allow parallel updates with max number of unavailable instances equals to 2
      maxUnavailable: 2

部署到集群:

$ kubectl apply -f sts.yaml
statefulset.apps.kruise.io/sample created

检查 pod 是否正常拉起:

$ kubectl get pod
NAME       READY   STATUS    RESTARTS   AGE
sample-0   1/1     Running   0          16s
sample-1   1/1     Running   0          16s
sample-2   1/1     Running   0          16s

更新镜像

修改 yaml 中的 image 为 nginx:latest,然后再 apply:

$ kubectl apply -f sts.yaml
statefulset.apps.kruise.io/sample configured

观察 pod:

$ kubectl get pod
NAME       READY   STATUS    RESTARTS   AGE
sample-0   1/1     Running   1          2m47s
sample-1   1/1     Running   1          2m47s
sample-2   1/1     Running   1          2m47s

可以看到,pod 中的容器只是重启了下,并没重建 pod,至此,原地升级验证成功。

本站文章资源均来源自网络,除非特别声明,否则均不代表站方观点,并仅供查阅,不作为任何参考依据!
如有侵权请及时跟我们联系,本站将及时删除!
如遇版权问题,请查看 本站版权声明
THE END
分享
二维码
海报
【腾讯云原生】TKE 原地升级解决方案
Kubernetes 默认不支持原地升级,使用腾讯云容器服务也一样,也没有集成相关插件来支持,可以安装开源的 openkruise 来实现,本文介绍如何在腾讯云...
<<上一篇
下一篇>>