• 文档
  • 控制台
  • 登录
  • 立即注册
    目前不支持用户自主注册,如需注册账号,请联系400-080-1100
容器服务CKS用户指南
最近更新时间:

5 常见问题

1. 集群的管理规模和控制节点的数量有关系吗?

集群管理规模是指当前集群支持管理的最大节点数。集群管理规模在集群创建后不支持调整,请在创建时慎重选择。针对不同的集群规模,控制节点的规格不同,但数量不受管理规模的影响。

当前集群会配置至少三个控制节点,在单个控制节点发生故障后集群可以继续使用,不影响业务功能。

2. 集群可用但节点状态为“不可用”,如何定位处理?

当集群可用而集群中部分节点状态为“不可用”时,请参照如下排查思路解决问题。

• 排查项一:节点负载过高。

• 排查项二:弹性云服务器是否删除或故障。

• 排查项三:弹性云服务器能否登录。

• 排查项四:安全组是否被修改。

• 排查项五:检查安全组规则中是否包含 Master 和 Node 互通的安全组策略。

• 排查项六:检查磁盘是否异常。

• 排查项七:内部组件是否正常。

• 排查项八:DNS 地址配置错误。

• 排查项九:检查节点中的 vdb 盘是否被删除。

• 排查项十:排查 Docker 服务是否正常。

3. 实例调度失败导致工作负载异常,如何定位处理?

由于实例调度失败导致工作负载状态异常时,请参照如下排查思路解决问题。

• 排查项一:集群内是否无可用节点。

• 排查项二:节点资源(CPU、内存等)是否充足。

• 排查项三:检查工作负载的亲和性配置。

• 排查项四:挂载的存储卷与节点是否处于同一分区。

4. 重新启动容器失败导致工作负载异常,如何定位处理?

由于重新启动容器失败导致工作负载状态异常时,请参照如下排查思路解决问题。

• 排查项一:(退出码:0)容器中无持续运行的进程。

• 排查项二:(退出码:137)健康检查执行失败。

• 排查项三:用户自身业务 BUG。

• 排查项四:达到容器资源上限。

• 排查项五:容器所在磁盘空间不足。

• 排查项六:工作负载的容器规格设置较小导致。

• 排查项七:同一 pod 中 container 端口冲突导致。

• 排查项八:容器启动命令配置有误导致。

• 排查项九:JAVA 探针的版本选择 latest 导致。

5. 如何删除处于终止状态的命名空间?

尝试删除 Kubernetes 命名空间后,长时间停留在终止状态。可以尝试删除命名空间的 finalizers。该选项将会快速清除处于终止状态的命名空间,但可能会导致属于该命名空间的资源留在集群中,因为无法自动删除它们。在 finalizers 数组为空并且状态为终止之后,Kubernetes 将删除命名空间。

6. 如何设置 CKS 集群中的 VPC 网段和子网网段?

VPC 中的子网网段一旦创建,便无法更改。创建虚拟私有云时,请预留一定的 VPC 网段和子网网段资源,避免后续无法扩容。

子网网段可在“创建虚拟私有云”页面的“子网配置 > 子网网段”中进行设置。在设置选项下可查看到“可用 IP 数”。容器网段掩码如果设置不合适,会导致集群实际可用的节点较少。

7. 域名解析失败,如何定位处理?

• 排查项一:检查是否已安装 coredns 插件。

• 排查项二:检查 coredns 实例是否已到达性能瓶颈。


意见反馈

文档内容是否对您有帮助?

如您有其他疑问,您也可以通过在线客服来与我们联系探讨 在线客服

联系我们
回到顶部