K8s（13）题目回答

张

张建站

2026/6/12 0:55:17

10分钟阅读

1、200 个节点20 个是 GPU 节点如何部署 GPU exporter我会使用 DaemonSet 的方式部署 GPU exporter并通过标签把 Pod 精确调度到 GPU 节点上。首先给 GPU 节点打上统一的 label比如 gputrue然后在 DaemonSet 中使用 nodeSelector 或 nodeAffinity 指定只调度到这些节点。如果 GPU 节点存在 taint还需要配置对应的 tolerations。同时会依赖 NVIDIA Device Plugin 来管理 GPU 资源确保 exporter 能正确识别显卡。这样做可以保证每个 GPU 节点只运行一个采集器不会影响普通业务节点。2、Node 变成 NotReady完整排查思路是什么我会从下往上分层排查。第一步是用 kubectl describe node 查看节点事件。第二步检查 kubelet 状态确认是否正常运行。第三步检查容器运行时比如 containerd 是否异常。第四步检查节点资源CPU、内存、磁盘是否耗尽尤其是磁盘 inode 和 overlay 挂载。第五步检查网络组件比如 kube-proxy 和 CNI 插件是否正常工作。第六步查看系统负载和内核日志。常见原因包括 kubelet 崩溃、磁盘满、OOM、网络中断等。3、K8s 有几种探针Pod 频繁重启应该调整哪一类Kubernetes 有三种探针livenessProbe 用于判断容器是否存活readinessProbe 用于控制是否接收流量startupProbe 用于保护启动较慢的应用。如果 Pod 频繁重启通常应该调整 livenessProbe 的参数比如 initialDelaySeconds、periodSeconds 和 failureThreshold。对于启动时间较长的应用一定要配合 startupProbe 使用否则会被 livenessProbe 反复判定为不健康导致重启。4、一个 Pod 有多个容器如何进入指定容器可以使用 kubectl exec 命令并指定容器名。命令格式是 kubectl exec -it pod名称 -c 容器名 -- /bin/bash。如果不指定 -c默认只会进入第一个容器。如果容器里没有 bash可以用 /bin/sh。5、Service 和 Pod 靠什么标识绑定kube-proxy 如何转发流量Service 是通过 label selector 和 Pod 绑定的。Service 会选择符合标签的 Pod并把它们写入 Endpoints 或 EndpointSlice。kube-proxy 负责监听这些变化并更新节点上的转发规则。常见的模式有 iptables 和 IPVSiptables 是默认模式IPVS 更适合大规模集群性能和负载均衡能力更强。6、如何检查 Service 和 Pod 是否正常绑定可以通过 kubectl get endpoints 查看 Service 是否有对应的 Pod IP。也可以用 kubectl describe svc 查看 selector 是否正确匹配。如果 Endpoints 为空通常是 Pod 标签不匹配或者 Pod 本身不是 Ready 状态。7、hostPath 和 emptyDir 的使用场景是什么emptyDir 适合临时数据存储比如缓存、临时文件或者同一个 Pod 内多个容器之间共享数据。hostPath 适合需要访问节点本地资源的场景比如日志采集、监控 Agent、DaemonSet。在生产环境中hostPath 要谨慎使用因为它会直接依赖节点存在安全风险和可移植性问题。8、K8s 存储类型有哪些生产环境用什么Kubernetes 支持多种存储类型包括 emptyDir、hostPath、NFS、Ceph、云厂商块存储等。生产环境通常使用 PV 和 PVC 配合 StorageClass 使用。公有云上一般使用云盘或云厂商 CSI 插件私有云常用 Ceph RBD 或 CephFS。9、只想分批重启部分 Pod比如 20 个怎么做如果是 Deployment可以直接使用 rollout restart 触发滚动重启。也可以通过调整副本数分批重启比如先缩容再扩容。更规范的做法是在 Deployment 的 strategy 中配置 rollingUpdate通过 maxSurge 和 maxUnavailable 控制每次重启的数量确保业务不中断。10、集群 CNI 用哪一款Terway 有几种模式生产环境中常用的 CNI 包括 Calico、Flannel 和 Cilium。Calico 功能全面适合大多数场景Cilium 基于 eBPF性能更高。Terway 主要有三种工作模式ENI 直通模式、共享 ENI 模式和虚拟交换机模式。在阿里云生产环境中ENI 直通模式是最推荐的。11、Pod Pending提示内存不足和 taint如何排查和解决首先用 kubectl describe pod 查看具体调度失败原因。如果是 Insufficient memory说明 Pod 的 requests 超过了节点可用资源可以降低 requests 或扩容节点。如果是 node has taint说明节点被标记了 NoSchedule可以给 Pod 配置对应的 toleration或者去掉节点的 taint。同时可以结合节点亲和性和污点机制让 Pod 调度到合适的节点上。12、不删除 Pod如何临时把 Pod 从 Service 中摘除最直接的方法是修改 Pod 的 label让 Service 的 selector 不再匹配该 Pod。也可以临时修改 readinessProbe让它返回失败这样 Pod 会被标记为未就绪并从 Endpoints 中移除。还可以调整 Service 的 selector临时把流量切走。这些方法都不会真正删除 Pod只是让它暂时不接收流量适合用于调试和问题排查。13、requests 和 limits 的作用只设置 limits 会怎样requests 决定调度时的资源分配limits 限制容器运行时的最大资源使用。如果只设置 limits 而不设置 requestsKubernetes 会默认把 requests 设为和 limits 一样大。这会导致调度器认为 Pod 需要更多资源可能造成调度失败同时也增加了节点资源争抢的风险。生产环境中一定要同时设置 requests 和 limits。14、etcd 备份和恢复流程误删 Namespace 能恢复吗etcd 备份使用 etcdctl snapshot save 命令生成快照文件。恢复时需要先停止集群然后用 etcdctl snapshot restore 恢复数据再重新启动 etcd 和 apiserver。如果误删了某个 Namespace可以通过 etcd 快照恢复到删除前的状态但 etcd 恢复是集群级别的不能只恢复单个 Namespace。恢复过程中需要停机并且要提前做好测试验证生产环境建议结合 Velero 做应用级备份。

【课程设计/毕业设计】基于springboot框架的校园传统文化交流系统基于springboot+android的校园文化艺术展示app的设计与实现【附源码、数据库、万字文档】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…...

2026/6/12 0:51:54 阅读更多 →

深入解析JavaScript弹窗管理

在Web开发中，管理弹窗是常见但有时让人头疼的任务。尤其是当我们试图在不同的域之间操作弹窗时，常常会遇到一些意想不到的挑战。今天，我们将深入探讨如何正确地打开和关闭弹窗，特别是当涉及到跨域问题时。弹窗的基本操作首先，让我们回顾一下在单一域名下打开和关闭弹窗…...

2026/6/12 0:50:56 阅读更多 →

声呐技术实战解析：从核心方程到海洋信道建模

1. 声呐技术基础：从定义到实战价值第一次接触声呐技术时，很多人会被各种专业术语吓到。其实声呐的原理和我们日常生活中的回声定位非常相似——就像你在山谷里大喊一声，通过回声来判断山壁的距离和方位。只不过声呐把这个原理搬到了水下&am…...

2026/6/12 0:44:52 阅读更多 →

RAG 召回质量治理：用 Go 构建可调试的切片、检索与重排链路

RAG 召回质量治理：用 Go 构建可调试的切片、检索与重排链路一、检索结果看似很多，答案却总是不准：RAG 落地的第一道坑很多团队做企业知识库问答时，第一版 RAG 通常很快就能跑起来。文档丢进向量库，用户问题转成 Embed…...

2026/6/10 17:33:39 阅读更多 →

从欧姆定律到分压原理：工程师必备的电路分析与设计指南

1. 从欧姆定律到分压原理：一个工程师的视角上一篇文章我们聊透了欧姆定律，它是我们手里那把打开电路世界的万能钥匙。今天，咱们就拿着这把钥匙，去打开一扇更具体、更常用的大门——分压原理。很多刚入行的朋友可能会觉得&#xff…...

2026/6/9 16:14:13 阅读更多 →

遗传算法工程实战：选择算子、交叉变异与早熟诊断

1. 这不是教科书里的遗传算法，而是我亲手调了37次参数后写下的实战笔记“遗传算法”这四个字，一说出来就容易让人联想到生物课上画满染色体的黑板、堆满希腊字母的论文公式，或者某本厚得能当板砖用的《进化计算导论》。但现实里，我…...

2026/6/9 16:14:12 阅读更多 →

STM32F103C8T6智能小车主控板AD工程文件（含已打样验证的原理图与PCB）

本文还有配套的精品资源，点击获取简介：提供一套完整可用的STM32F103C8T6核心板Altium Designer工程，包含经过实际打样和功能测试的原理图（.SchDoc）与PCB文件（.PcbDoc），支持直接投…...

2026/6/10 21:50:35 阅读更多 →

更多精彩文章