KubeOVN 面试题

35 道题

分类: Kubernetes
子分类: cni
题目数: 35 道

已阅读 0 / 35 题

1 KubeOVN 的核心架构由哪些组件组成？

答案：

KubeOVN 基于 OVN（Open Virtual Network）和 OVS（Open vSwitch）实现，核心组件包括 ovn-central、ovs-ovn、kube-ovn-controller 和 kube-ovn-cni。

ovn-central：部署为 Deployment 或 StatefulSet，包含 OVN 的三大中心组件：
- OVN NB（Northbound）数据库：存储网络逻辑拓扑（VPC、Subnet、ACL、路由策略等网络配置意图）
- OVN SB（Southbound）数据库：存储物理网络状态（Chassis、Port Binding、MAC 表等实际运行状态）
- ovsdb-server：管理 NB/SB 数据库的读写访问
- ovn-northd：将 NB 中的逻辑网络配置转换为 SB 中的物理流表指令
ovs-ovn：运行在每个节点上的 DaemonSet，包含：
- ovs-vswitchd：实际的 OpenFlow 流表执行引擎，负责数据包处理
- ovsdb-server：管理 Open_vSwitch 本地数据库
- ovn-controller：连接 OVN SB 数据库，将 SB 中的流表指令下发到 ovs-vswitchd
kube-ovn-controller：Kubernetes 与 OVN 之间的胶水层，Watch Pod/Service/Node 等资源变化，同步到 OVN NB 数据库
kube-ovn-cni：标准 CNI 插件实现，接收 kubelet 调用后配置容器网络接口

组件	职责	部署方式
ovn-central	OVN NB/SB 数据库 + northd 转换引擎	Deployment/StatefulSet
ovs-ovn	ovs-vswitchd + ovn-controller	DaemonSet（每节点）
kube-ovn-controller	K8s 资源到 OVN 的同步	Deployment
kube-ovn-cni	CNI 插件入口	DaemonSet（每节点）

2 KubeOVN 的 Subnet 和 VPC 模型是如何设计的？

答案：

KubeOVN 引入了 VPC 和 Subnet 两级抽象，实现了多租户虚拟网络的能力。

Subnet：

对应一个逻辑交换机（Logical Switch），定义 CIDR、网关、ACL 规则
使用 CRD（kubeovn.io/v1 Subnet）定义，支持自动或手动 IP 分配

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: subnet-web
spec:
  cidrBlock: "10.200.1.0/24"
  gateway: "10.200.1.1"
  private: false           # 允许其他 Subnet 访问
  natOutgoing: true        # 出站 SNAT
  nameservers:
  - "10.96.0.10"
  default: false
  vpc: "vpc-production"    # 所属 VPC

VPC（Virtual Private Cloud）：

对应一个逻辑路由器（Logical Router），关联多个 Subnet
每个 VPC 内的 Subnet 之间通过逻辑路由器直接路由
不同 VPC 之间的流量默认隔离，可通过 VPC Peering 打通

apiVersion: kubeovn.io/v1
kind: Vpc
metadata:
  name: vpc-production
spec:
  nameservers:
  - "10.96.0.10"
  enableExternal: true  # 启用外部网关

默认资源：

KubeOVN 安装后自动创建 default VPC 和 join Subnet
未指定 VPC/Subnet 的 Pod 自动加入默认 Subnet

3 KubeOVN 的分布式网关和集中式网关有什么区别？

答案：

KubeOVN 支持两种网关模式：分布式网关（Distributed Gateway）和集中式网关（Centralized Gateway），用于控制 Pod 对外部网络的访问路径。

分布式网关（默认）：

每个节点都作为其本地 Pod 的出站网关，Pod 访问外部网络时直接从所在节点转发
由 ovn-controller 在每个节点上配置本地路由和 NAT 规则
优势：出站流量均匀分布到所有节点，无单点瓶颈
适合场景：大规模集群出口流量负载均衡

集中式网关：

指定特定节点作为所有 Pod 的统一出站网关
Pod 访问外部网络的流量需要通过隧道或路由转发到指定的网关节点
优势：出口 IP 固定，适合外部服务的白名单场景

# Subnet 配置集中式网关
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: subnet-gateway
spec:
  cidrBlock: "10.200.2.0/24"
  gateway: "10.200.2.1"
  gatewayNode: "node-1,node-2"  # 指定网关节点（HA）
  excludeIps:
  - "10.200.2.1..10.200.2.10"   # 保留给网关使用的 IP 范围

选型对比：

维度	分布式网关	集中式网关
吞吐能力	集群所有节点合计	仅网关节点
出口 IP	多个节点 IP	固定 IP
单点故障	无	需要 HA 配置
延迟	本地转发	增加一跳
配置难度	简单	需要规划网关节点

4 KubeOVN 如何实现 Pod 固定 IP？

答案：

KubeOVN 通过 CRD 和 Annotation 机制实现 Pod 级别的固定 IP 地址分配。

通过 Annotation 分配固定 IP：

apiVersion: v1
kind: Pod
metadata:
  name: fixed-ip-pod
  annotations:
    ovn.kubernetes.io/ip_address: "10.200.1.100"   # 指定 IP
    ovn.kubernetes.io/mac_address: "00:00:00:00:00:01"  # 可选，指定 MAC
    ovn.kubernetes.io/subnet: "subnet-web"         # 指定 Subnet
spec:
  containers:
  - name: nginx
    image: nginx

通过 IP Pool 预留：

apiVersion: kubeovn.io/v1
kind: IP
metadata:
  name: fixed-ip-001
spec:
  subnet: "subnet-web"
  ipAddress: "10.200.1.100"
  podType: "Deployment"
  podName: "web-server"

Vip CRD 预分配：

apiVersion: kubeovn.io/v1
kind: Vip
metadata:
  name: db-vip
spec:
  subnet: "subnet-db"
  ip: "10.200.3.10"

实现原理：

kube-ovn-controller Watch Pod 创建事件，提取 Annotation 中的 IP 要求
在 OVN NB 数据库中预留对应的 Logical Switch Port 地址
Pod 删除后 IP 释放回池，固定 IP 模式下 IP 在 Pod 重建后不变

5 KubeOVN 的 QoS 功能如何配置？

答案：

KubeOVN 通过 QoS CRD 提供 Pod 级别的网络服务质量控制，基于 OVS 的 QoS 队列机制实现。

QoS CRD 定义：

apiVersion: kubeovn.io/v1
kind: QoSPolicy
metadata:
  name: qos-100m
spec:
  egressRate: 100        # 出站带宽上限 (Mbps)
  ingressRate: 200       # 入站带宽上限 (Mbps)
  priority: 10           # QoS 优先级，数值越小优先级越高

将 QoS 绑定到 Pod：

apiVersion: v1
kind: Pod
metadata:
  name: qos-pod
  annotations:
    ovn.kubernetes.io/qos_policy: "qos-100m"
spec:
  containers:
  - name: busybox
    image: busybox

QoS 实现机制：

OVS 在每个节点上为设置了 QoS 的 Pod 接口创建队列规则
使用 Linux TC（Traffic Control）的 HTB（Hierarchy Token Bucket，层次令牌桶）算法
egress 限制在 Pod 的 veth 出方向，ingress 限制在 br-int 网桥入方向

带宽限制粒度：

QoS 设置	实现方式	精度保证
10Mbps	HTB 单队列	±5%
100Mbps	HTB 多队列	±3%
1Gbps+	HTB + QoS Map	±2%

6 KubeOVN 如何实现 NetworkPolicy（ACL）？

答案：

KubeOVN 将 Kubernetes NetworkPolicy 转换为 OVN ACL（Access Control List）规则，在 OVS 流表层面执行。

转换流程：

kube-ovn-controller Watch NetworkPolicy 资源变化
解析 Ingress/Egress 规则中的 PodSelector、NamespaceSelector、IPBlock
转换为 OVN ACL 规则写入 OVN NB 数据库
ovn-northd 将 ACL 转换为 OVS OpenFlow 流表条目
ovs-vswitchd 执行流表匹配和动作

默认 ACL 行为：

KubeOVN 默认不启用 NetworkPolicy 隔离
设置 Subnet 的 enableLb 为 true 时，自动添加默认拒绝规则
ACL 规则按照 OVN 优先级（0-32767）执行，小数值优先级更高（0 最高，32767 最低）

自定义 ACL 示例（KubeOVN CRD）：

apiVersion: kubeovn.io/v1
kind: ACL
metadata:
  name: deny-ssh
spec:
  subject: "subnet-web"
  direction: "ingress"
  priority: 100
  match: "ip4 && tcp && tcp.dst==22"
  action: "drop"
  # action: "allow" | "drop" | "reject"

性能考量：

OVS 流表使用 L2/L3/L4 多级匹配，比 iptables 链式遍历效率更高
大规模 ACL 规则（1000+）时 OVS 的流表缓存（Megaflow）能保持高效的匹配性能

7 KubeOVN 的 Underlay 和 Overlay 模式分别是什么？

答案：

KubeOVN 支持 Overlay 和 Underlay 两种网络模式，满足不同的网络基础设施需求。

Overlay 模式（默认）：

Pod 使用逻辑网络（VXLAN/Geneve）封装，与物理网络解耦
跨节点 Pod 流量通过 OVS 封装的 VXLAN 隧道传输
不依赖底层网络基础设施的配置

# 启用 Overlay
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: overlay-subnet
spec:
  cidrBlock: "10.200.0.0/16"
  vpc: "default"

Underlay 模式（直通模式）：

Pod 直接使用物理网络 IP 地址，不经过隧道封装
创建 Subnet 时指定物理网络的 VLAN ID，OVS 将流量桥接到物理接口
Pod 与外部网络直接通信，延迟最低

# 启用 Underlay
apiVersion: kubeovn.io/v1
kind: ProviderNetwork
metadata:
  name: underlay-phys
spec:
  defaultInterface: eth1
  providerNetworks:
  - name: phys-net-1
    exchangeLinkName: true
    vlan: 100
    bridgeName: br-phys1
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: underlay-subnet
annotations:
  ovn.kubernetes.io/provider_network: "underlay-phys"
spec:
  cidrBlock: "192.168.100.0/24"
  gateway: "192.168.100.1"
  vpc: "default"

模式对比：

维度	Overlay	Underlay
IP 地址	独立逻辑网络	物理网络 IP
隧道封装	VXLAN/Geneve	无封装
性能损耗	~5-10%	接近线速
网络依赖	仅需节点间 UDP 连通	需要 VLAN 支持
MAC 地址	虚拟 MAC	物理 MAC
适用场景	多租户、混合云	高性能计算、裸金属

8 KubeOVN 如何实现多集群网络互联（OVN IC）？

答案：

KubeOVN 支持 OVN IC（Interconnection），实现跨 Kubernetes 集群的 Pod 直接通信。

OVN IC 架构：

每个集群独立运行 KubeOVN，部署 OVN IC Gateway（Interconnection 网关节点，不是 Transit Switch）
Transit Switch 是 IC Gateway 内部子组件，用于连接不同集群的逻辑路由器
使用 AZ（Availability Zone） 跨集群路由的中转抽象

部署配置：

# 每个集群配置自己的 Transit 网络
apiVersion: kubeovn.io/v1
kind: Vpc
metadata:
  name: interconn
spec:
  enableExternal: true
  staticRoutes:
  - cidr: "10.201.0.0/16"       # 对端集群 Pod CIDR
    nextHopIP: "192.168.1.100"  # 对端集群的 IC 网关 IP
    policy: "policyDst"

跨集群通信流程：

Pod-A (集群1: 10.200.1.2) → OVS br-int → 集群1 IC 网关
  → Transit Switch → 物理网络 → 集群2 IC 网关
  → OVS br-int → Pod-B (集群2: 10.201.2.3)

优势：

Pod IP 跨集群保持路由可达
无需额外组件（如 ClusterMesh 或 Submariner）
支持跨集群的 NetworkPolicy

9 KubeOVN 如何处理 Service 的流量？

答案：

KubeOVN 通过 OVN 的逻辑路由器实现 Service 的流量分发，不依赖 kube-proxy。

Service 处理机制：

kube-ovn-controller Watch Service 和 EndpointSlice 变化
在 OVN 逻辑路由器上配置负载均衡规则（Load Balancer）
每个节点上的 OVS 直接执行 LB 转发，避免 iptables 规则

负载均衡类型：

apiVersion: v1
kind: Service
metadata:
  annotations:
    ovn.kubernetes.io/service_lb: "true"          # 启用 OVN LB
    ovn.kubernetes.io/service_lb_algorithm: "random" # 可选: random / source_ip
spec:
  type: NodePort
  ports:
  - port: 80
    targetPort: 8080

NodePort 处理：

OVN 在 br-int 网桥上配置 NAT 规则，将 NodePort 流量直接转发到后端 Pod
支持 Local 和 Cluster 两种 ExternalTrafficPolicy
无需经过 iptables DNAT 链

与 kube-proxy 的兼容性：

KubeOVN 可以完全替代 kube-proxy
在安装时设置 kubeProxyReplacement: true
如果集群中仍有 kube-proxy 运行，KubeOVN 的 LB 优先处理

10 KubeOVN 的 EIP 和 SNAT 网关功能是如何实现的？

答案：

KubeOVN 提供 EIP（弹性公网 IP）和 SNAT（源地址转换）网关功能，控制 Pod 对外部网络的访问。

EIP（弹性公网 IP）：

为特定 Pod 分配固定的外部可访问 IP 地址
流量从 Pod 发出时，外部看到的是 EIP 而非 Pod IP

apiVersion: kubeovn.io/v1
kind: IptablesEIP
metadata:
  name: web-eip
spec:
  ip: "203.0.113.100"  # 外部可见的 EIP
  nat: "web-nat"       # 关联的 NAT 规则

SNAT 网关：

使特定 Subnet 中的 Pod 可以通过指定节点访问外部网络
自动为出站流量做 SNAT，Pod 不需要特殊配置

apiVersion: kubeovn.io/v1
kind: IptablesFIPRule
metadata:
  name: subnet-snat
spec:
  eip: "203.0.113.200"
  internalIp: "10.200.1.0/24"  # Subnet CIDR

流量路径：

Pod → OVS br-int → EIP 网关节点 → SNAT → 外部网络
                                         ↓
                                   外部看到 EIP: 203.0.113.100

适用场景：

数据库白名单：应用 Pod 通过固定外部 IP 访问托管数据库
合规审计：特定业务流量需要经过审计出口
混合云场景：部分流量需经过固定的公网出口

11 KubeOVN 的 VPC 多租户网络如何实现？

答案：

KubeOVN 通过 VPC CRD 实现租户级别的网络隔离，每个 VPC 拥有独立的路由器和地址空间。

VPC 隔离机制：

每个 VPC 对应一个独立的 OVN 逻辑路由器
VPC 内的 Subnet 连接到对应的逻辑路由器
不同 VPC 之间默认隔离，流量无法互通
每个 VPC 可自定义 CIDR 范围，支持地址重叠

多租户示例：

apiVersion: kubeovn.io/v1
kind: Vpc
metadata:
  name: tenant-a
spec:
  nameservers:
  - "10.96.0.10"
  enableExternal: true
apiVersion: kubeovn.io/v1
kind: Vpc
metadata:
  name: tenant-b
spec:
  nameservers:
  - "10.96.0.10"
  enableExternal: true
# 两个 VPC 可以有完全相同的 CIDR
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: tenant-a-subnet
spec:
  cidrBlock: "10.200.0.0/24"
  vpc: "tenant-a"
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: tenant-b-subnet
spec:
  cidrBlock: "10.200.0.0/24"  # 与 tenant-a 相同的 CIDR
  vpc: "tenant-b"

VPC Peering：

通过 VpcPeering CRD 打通两个 VPC 之间的路由
受安全策略控制，可限制互通范围

apiVersion: kubeovn.io/v1
kind: VpcPeering
metadata:
  name: tenant-a-to-tenant-b
spec:
  sourceVpc: "tenant-a"
  destVpc: "tenant-b"
  enable: true

12 KubeOVN 如何与 Cilium/Calico 共存（CNI Chaining）？

答案：

KubeOVN 支持 CNI Chaining 模式，与 Cilium、Calico 等 CNI 插件共存，各处理不同层级的功能。

Chaining 模式原理：

KubeOVN 作为主 CNI 处理 Pod 的网络连接和 IPAM
其他 CNI 作为辅助网络层，叠加网络策略、安全功能
通过 Multus CNI 或 CNI Chain 机制实现

与 Calico Chaining：

# Calico 配置
apiVersion: projectcalico.org/v3
kind: FelixConfiguration
metadata:
  name: default
spec:
  interfacePrefix: kube-ovn  # 监控 KubeOVN 接口
# KubeOVN 配置
networking:
  type: "chaining"
  chaining: "calico"

与 Cilium Chaining：

# Cilium 配置
cni:
  chainingMode: "generic-veth"
  customCniConf: "/etc/cni/net.d/00-kube-ovn.conflist"

适用场景：

同时需要 KubeOVN 的多租户 VPC 能力和 Cilium 的 eBPF 策略
渐进式迁移：从 Calico 迁移到 KubeOVN 时保持部分节点使用原 CNI

13 KubeOVN 的日志和故障排查工具有哪些？

答案：

KubeOVN 提供多个层级的日志和排查工具，覆盖控制面和数据面。

日志系统：

组件	日志位置	关键日志内容
kube-ovn-controller	kubectl logs deployment/kube-ovn-controller	Subnet/VPC 变更、IP 分配、ACL 同步
ovn-central	kubectl logs deployment/ovn-central	NB/SB 数据库操作、northd 转换
ovs-ovn	kubectl logs daemonset/ovs-ovn -c openvswitch	OVS 连接、流表下发
kube-ovn-cni	kubectl logs daemonset/kube-ovn-cni	CNI 插件调用

排查命令：

# 查看 OVN 逻辑拓扑
kubectl ko nbctl lr-list                          # 逻辑路由器列表
kubectl ko nbctl ls-list                          # 逻辑交换机列表
kubectl ko nbctl show                             # 完整拓扑视图

# 查看流表
kubectl ko sbctl dump-flows br-int                # OVS 流表转储
kubectl ko sbctl lflow-list                       # 逻辑流表

# 查看端点和地址绑定
kubectl ko nbctl lsp-list <logical-switch>        # 逻辑交换机端口
kubectl ko sbctl lsp-bindings                     # 端口绑定状态

# Pod 网络检查
kubectl ko trace <pod-name> <dst-ip>              # 网络路径追踪
kubectl ko tcpdump <pod-name>                     # Pod 侧抓包

# 子网状态检查
kubectl get subnet -o wide                        # 子网状态
kubectl describe subnet <subnet-name>             # 子网详情

14 KubeOVN 如何实现 Pod 的静态路由配置？

答案：

KubeOVN 支持通过 VPC CRD 的 staticRoutes 字段为 Pod 添加自定义静态路由。

Subnet 级别静态路由：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: subnet-routed
spec:
  cidrBlock: "10.200.10.0/24"
  gateway: "10.200.10.1"
  routes:
  - destination: "172.16.0.0/16"
    nextHopIP: "10.200.10.254"
    policy: "policyDst"

VPC 级别路由：

apiVersion: kubeovn.io/v1
kind: Vpc
metadata:
  name: vpc-routed
spec:
  staticRoutes:
  - cidr: "172.16.0.0/12"
    nextHopIP: "10.200.0.254"
    policy: "policyDst"
  - cidr: "0.0.0.0/0"
    nextHopIP: "10.200.0.1"     # 默认路由
    policy: "policyDst"

路由策略类型：

policyDst：基于目标地址匹配，标准路由方式
policySrc：基于源 IP 匹配，策略路由
policyDefault：默认路由

实现原理：

静态路由配置写入 OVN 逻辑路由器
ovn-northd 转换为 OVS 流表中的匹配转发规则
路由下一跳可以是 Pod IP、外部 IP 或 VPC 网关

15 KubeOVN 如何支持 IPv6 和双栈？

答案：

KubeOVN 完整支持 IPv6 单栈和 IPv4/IPv6 双栈网络。

IPv6 单栈配置：

# 安装时启用 IPv6
helm install kube-ovn ...
  --set networking.IP_VERSION="ipv6"
  --set networking.CIDR="fd00::/48"
  --set networking.GATEWAY="fd00::1"

双栈子网配置：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: dual-stack-subnet
spec:
  cidrBlock: "10.200.1.0/24,fd00:10:200:1::/64"
  gateway: "10.200.1.1,fd00:10:200:1::1"
  enableIPv6RA: true  # 启用 IPv6 路由通告

双栈 Pod 示例：

apiVersion: v1
kind: Pod
metadata:
  name: dual-stack-pod
  annotations:
    ovn.kubernetes.io/ip_address: "10.200.1.100,fd00:10:200:1::100"
    ovn.kubernetes.io/mac_address: "00:00:00:00:00:01"
spec:
  containers:
  - name: nginx
    image: nginx

IPv6 能力：

Pod/Service 原生 IPv6 寻址
IPv6 路由通告（RA）
IPv6 ACL 安全策略
IPv6 NAT（通过 EIP/SNAT 网关）

16 KubeOVN 的 OVS 流表工作流程是怎样的？

答案：

KubeOVN 的数据包处理在 OVS 流表层面分为多级管道，每级完成不同的处理。

流表管道设计：

流表编号	名称	功能
0	Ingress	初始分类，匹配入站包
10	VLAN	VLAN 标签处理
20	MAC	MAC 地址学习
30	IP	IP 路由查找
40	ACL	安全策略匹配
50	QoS	QoS 限速处理
60	NAT	NAT 转换

出站数据路径：

Pod veth → OVS br-int → 表0 分类 → 表20 MAC 学习
  → 表30 路由查找 → 表40 ACL 检查 → 表50 QoS
  → 表60 NAT → VXLAN 封装 → 物理网卡

入站数据路径：

物理网卡 → VXLAN 解封装 → OVS br-int
  → 表0 → 表10 VLAN → 表20 MAC
  → 表40 ACL → 表50 QoS → Pod veth

OVS Megaflow 缓存：

OVS 将多级流表匹配结果缓存为 Megaflow 条目
后续匹配同模式的包直接使用缓存结果
避免每次数据包都遍历所有流表，提升转发性能

17 KubeOVN 的安装和部署方式有哪些？

答案：

KubeOVN 支持 Helm、Kubectl apply 和 KubeArmor 等多种安装方式。

Helm 安装（推荐）：

helm repo add kubeovn https://kubeovn.github.io/kube-ovn/
helm upgrade --install kube-ovn kubeovn/kube-ovn \
  --namespace kube-system \
  --set networking.IP_VERSION="ipv4" \
  --set networking.CIDR="10.200.0.0/16" \
  --set networking.GATEWAY="10.200.0.1" \
  --set networking.EXCLUDE_IPS="10.200.0.1..10.200.0.10"

快速部署脚本：

kubectl apply -f https://raw.githubusercontent.com/kubeovn/kube-ovn/master/yamls/quickstart.yaml

生产环境配置参数：

参数	推荐值	说明
networking.CIDR	10.200.0.0/16	Pod 地址池
networking.EXCLUDE_IPS	预留网关和中间 IP	避免 IP 冲突
networking.DEFAULT_PROVIDER	provider-net	默认 ProviderNetwork
HA.enabled	true	ovn-central HA 模式
HA.VIP	10.10.0.100	ovn-central VIP

升级注意事项：

ovn-central 升级采用滚动更新，保证 NB/SB 数据库不丢失
ovs-ovn DaemonSet 单节点升级，先 drain 再升级
KubeOVN 版本与 OVN/OVS 版本对应关系需要提前确认

18 KubeOVN 如何处理性能问题和大规模集群场景？

答案：

KubeOVN 在大规模集群中有特定的性能优化策略和配置参数。

控制面优化：

1. ovn-central 性能调优：

# ovn-central 配置
spec:
  replicas: 3
  resources:
    limits:
      memory: 8Gi           # NB/SB 数据库内存占用随集群规模增长
  env:
  - name: N_MTD                # northd 线程数
    value: "4"
  - name: OVN_DB_NB_MAX_BACK   # NB 数据库后端数
    value: "10000"

2. kube-ovn-controller 并发配置：

# 增加控制器并发数
env:
- name: WORKER_NUM
  value: "10"

数据面优化：

3. OVS 性能配置：

# 每个节点上的 OVS 配置
ovs:
  init:
    dpdk: false              # 非 DPDK 模式
    mlock: true              # 锁定内存，防止交换
    hw-offload: false        # 硬件卸载（需要支持 OVS-TC）

4. VXLAN 与 Geneve 对比：

封装协议	包头大小	性能	扩展功能
VXLAN	50 bytes	较高	基本隧道
Geneve	可变（50-74 bytes）	略低于 VXLAN	支持元数据和扩展 TLV

5. 大规模集群 CPU 和内存基线（参考）：

集群规模	ovn-central	ovs-ovn（每节点）	kube-ovn-controller
50 节点	4C 8G	2C 4G	2C 4G
200 节点	8C 16G	2C 4G	4C 8G
500 节点	16C 32G	4C 8G	8C 16G

19 KubeOVN 如何实现 Pod 的 DNS 解析？

答案：

KubeOVN 在 Subnet 级别配置 DNS 解析策略，通过 OVN 逻辑路由器上的 NAT 规则处理 Pod 的 DNS 请求。

Subnet DNS 配置：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: subnet-dns
spec:
  cidrBlock: "10.200.1.0/24"
  nameservers:
  - "10.96.0.10"       # CoreDNS Service IP
  - "8.8.8.8"           # 外部 DNS 备用
  dnsSuffix:
  - "cluster.local"
  - "example.com"

DNS 流量处理：

KubeOVN 自动在 Subnet 的 DHCP Options 中配置 DNS 服务器地址
Pod 启动时通过 DHCP 或 resolv.conf 注入获取 DNS 配置
DNS 查询请求通过 OVN 逻辑路由器的 NAT 规则转发到 DNS 服务器

排查 DNS 问题：

# 检查 Pod 内 DNS 配置
kubectl exec <pod-name> -- cat /etc/resolv.conf

# 使用 kube-ovn 的 DNS 追踪
kubectl ko trace <pod-name> 10.96.0.10 --proto udp --dport 53

# 检查 OVN DNS NAT 规则
kubectl ko nbctl lr-nat-list <logical-router>

20 KubeOVN 如何处理 Pod 的流量镜像和网络监控？

答案：

KubeOVN 支持通过 OVS 的流量镜像（Mirror）功能实现网络流量监控，无需在 Pod 侧部署 Agent。

流量镜像配置：

apiVersion: kubeovn.io/v1
kind: Mirror
metadata:
  name: mirror-pod
spec:
  selector:
    matchLabels:
      app: monitored-app
  destination:
    ip: "10.200.0.100"     # 监控分析系统 IP
    port: 4789              # 目标端口
    protocol: "vxlan"       # 封装协议
  direction: "both"         # both / ingress / egress

实现机制：

在 OVS br-int 网桥上为目标 Pod 的接口设置 Mirror 规则
流量复制后通过 VXLAN 隧道发送到监控分析系统
镜像过程零侵入，不影响原始流量路径

与 Hubble / tcpdump 的对比：

维度	OVS Mirror	Hubble（Cilium）	tcpdump（Pod 内）
部署方式	KubeOVN 配置	eBPF 自动捕获	Pod 内手动执行
性能损耗	低（内核级复制）	极低（eBPF）	中（用户态抓包）
目标 Pod	无需注入 sidecar	无需注入	需要 exec 进入
持久化存储	可配置	Hubble Relay	本地临时

21 KubeOVN 的安全性设计包括哪些方面？

答案：

KubeOVN 从网络隔离、访问控制、流量加密和审计四个维度提供安全机制。

网络隔离：

VPC 级别隔离：每个 VPC 拥有独立路由和地址空间
Subnet 级别隔离：通过 private 字段控制 Subnet 是否允许跨 Subnet 访问
安全组：支持绑定 ACL 规则到 Subnet 或 Pod

访问控制：

apiVersion: kubeovn.io/v1
kind: SecurityGroup
metadata:
  name: sg-web
spec:
  ingressRules:
  - ipProtocol: TCP
    portRangeMin: 443
    portRangeMax: 443
    remoteIpPrefix: "0.0.0.0/0"
  - ipProtocol: TCP
    portRangeMin: 22
    portRangeMax: 22
    remoteIpPrefix: "10.0.0.0/8"
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: subnet-web
spec:
  cidrBlock: "10.200.1.0/24"
  acl:
  - priority: 100
    direction: "ingress"
    match: "ip4 && tcp && tcp.dst==443"
    action: "allow"

流量审计：

Subnet 级别日志配置，记录 ACL 命中日志（accept/drop 事件）
日志通过 OVS sFlow 或 netflow 协议输出到外部日志分析系统

22 KubeOVN 的 DPDK 加速模式如何工作？

答案：

KubeOVN 支持 DPDK（Data Plane Development Kit）模式，通过用户态数据平面绕过内核协议栈，提升网络吞吐量。

DPDK 模式原理：

OVS 的数据面从内核态 ovs-vswitchd 切换到用户态 dpdkvhostuser 或 vhost-user
网卡通过 UIO（Userspace I/O）或 VFIO 直接映射到用户空间
Pod 的 veth 接口替换为 vhost-user 接口，数据包从 Pod 直接到用户态 OVS

配置方法：

# 安装时启用 DPDK
ovs:
  init:
    dpdk: true
    dpdkTunnel: true
    hugepages: "2M"        # 需要 2MB 大页内存
    dpdkEalArgs: "-l 0-3"  # CPU core 绑定
    dpdkMemory: "1024"     # 大页内存大小 (MB)

性能对比：

模式	延迟（P99）	吞吐量	CPU 使用率
标准 OVS	50-100μs	10Gbps	60-80%
DPDK OVS	10-20μs	40Gbps	30-50%

使用前提：

需要支持 DPDK 的网卡（Intel XL710 / Mellanox CX5 以上）
需要配置大页内存（HugePages）
需要启用的物理网卡支持多队列（RSS）

23 KubeOVN 如何处理 Pod 的 MTU 配置？

答案：

KubeOVN 自动处理 Pod 接口的 MTU 配置，支持全局默认设置和 Subnet 级别自定义。

MTU 计算：

Overlay 模式（VXLAN）：Pod MTU = 物理网卡 MTU - 50 字节
Overlay 模式（Geneve）：Pod MTU = 物理网卡 MTU - 50~74 字节（可变）
Underlay 模式：Pod MTU = 物理网卡 MTU（不会因封装减少）

全局 MTU 配置：

# Helm values.yaml
networking:
  mtu: 1450  # 物理网卡 MTU 1500 时的 Overlay 默认值

Subnet 级别 MTU：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: jumbo-subnet
spec:
  cidrBlock: "10.200.2.0/24"
  mtu: 8950  # Jumbo Frame 支持

MTU 故障排查：

# 检查 Pod 接口 MTU
kubectl exec <pod> -- ip link show eth0

# 检查节点 OVS 接口 MTU
kubectl ko exec ovs-ovn-xxxx -- ip link show br-int

# 测试 MTU 问题（禁止分片）
kubectl exec <pod> -- ping -M do -s 1472 <target-ip>

24 KubeOVN 如何与负载均衡器（MetalLB）集成？

答案：

KubeOVN 与 MetalLB 等负载均衡器集成，为 LoadBalancer Service 提供外部 IP 地址。

集成方式：

1. MetalLB + KubeOVN：

apiVersion: v1
kind: Service
metadata:
  name: web
  annotations:
    metallb.universe.tf/address-pool: production-pool
    ovn.kubernetes.io/service_lb: "true"  # KubeOVN LB 卸载
spec:
  type: LoadBalancer
  ports:
  - port: 80
    targetPort: 8080

2. 通过 KubeOVN 的 EIP 机制实现外部 IP：

apiVersion: kubeovn.io/v1
kind: IptablesEIP
metadata:
  name: svc-eip
spec:
  ip: "203.0.113.50"
  nat: "svc-nat"
apiVersion: v1
kind: Service
metadata:
  name: web
  annotations:
    ovn.kubernetes.io/eip: "203.0.113.50"

流量路径（MetalLB + KubeOVN）：

外部请求 → MetalLB VIP → 节点 NodePort → OVS br-int → 后端 Pod

适用场景：

裸金属环境：KubeOVN 提供 Pod 网络，MetalLB 提供外部 LB IP
私有云：结合 KubeOVN 多租户网络和 MetalLB IP 池管理
混合负载：同时使用 KubeOVN NAT 网关和 MetalLB BGP 模式

25 KubeOVN 的 Subnet 级别网络隔离如何实现？

答案：

KubeOVN 通过 private 和 natOutgoing 字段控制 Subnet 的网络隔离行为。

Subnet 隔离策略：

# 完全隔离的 Subnet（不与任何 Subnet 互通）
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: isolated-subnet
spec:
  cidrBlock: "10.200.3.0/24"
  private: true              # 禁止其他 Subnet 访问
  allowSubnets:
  - "10.200.0.0/16"         # 仅允许特定 Subnet 的 Pod 访问
# 允许出站但禁止入站的 Subnet
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: protected-subnet
spec:
  cidrBlock: "10.200.4.0/24"
  private: false             # 其他 Subnet 可以访问
  natOutgoing: true           # 出站 SNAT
  egressAcl:                  # 出站限制
  - action: "allow"
    priority: 100
    match: "ip4 && tcp && tcp.dst==443"
  - action: "drop"
    priority: 99
    match: "ip4 && tcp"

隔离层级：

策略组合	VPC 隔离	Subnet 隔离	外部访问
private=true	完全隔离	禁止互通	NAT Outgoing
private=false	不隔离	允许互通	直接路由
private=true + allowSubnets	部分隔离	仅允许白名单	NAT Outgoing
natOutgoing=true	隔离出站	按 private 配置	统一 SNAT 出口

26 KubeOVN 如何通过 OVN 实现多播支持？

答案：

KubeOVN 利用 OVN 的多播支持能力，在逻辑交换机层面实现组播转发。

EnableMulticast 配置：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: multicast-subnet
spec:
  cidrBlock: "10.200.5.0/24"
  enableMulticast: true  # 启用多播
  igmp: true             # IGMP 窥探
  multicastQuerier: true # 多播查询器

多播实现：

OVS 通过 IGMP 窥探（IGMP Snooping）学习组成员关系
组播流量仅在加入了组的 Pod 之间转发
跨节点组播流量通过 VXLAN 隧道中的多播组传递

应用场景：

实时音视频分发（WebRTC、RTSP）
股票行情、实时数据广播
服务发现和集群状态同步

27 KubeOVN 与 Flannel 的核心差异是什么？

答案：

KubeOVN 和 Flannel 是两种不同设计理念的 CNI 方案，Flannel 追求极简，KubeOVN 追求功能的全面性。

对比维度	KubeOVN	Flannel
数据面	OVS + OpenFlow 流表	Linux 路由 + VXLAN
控制面	OVN NB/SB 数据库	etcd（通过 kube-controller-manager）
网络功能	VPC、Subnet、ACL、QoS、NAT	基础 Pod 互联
NetworkPolicy	原生支持（OVN ACL）	不支持原生 K8s NetworkPolicy，需额外安装 Calico 或其他 CNI
多租户	完整 VPC 多租户	不支持
IPAM	支持固定 IP、随机、IP 池	简单 IP 分配
网关	分布式/集中式/EIP/SNAT	无
性能开销	较高（OVS 流表处理）	低
复杂度	复杂	极简
适合场景	中大型集群、多租户、复杂网络	小型集群、快速搭建

选型建议：

选择 KubeOVN：需要 VLAN 隔离、VPC 多租户、ACL 策略、固定 IP
选择 Flannel：快速原型、小规模集群（<50 节点）、不需要复杂网络功能

28 KubeOVN 如何处理 Pod 重启后的 IP 持久化？

答案：

KubeOVN 通过 OVN 的 Logical Switch Port（LSP）和 Port Binding 机制实现 Pod 重启后 IP 的持久化。

IP 持久化机制：

Pod 创建时，CNI 插件在 OVN NB 中创建 LSP，分配 IP
Pod 删除时，LSP 不立即删除，保留一段时间（默认 100 秒，用户可调）
Pod 重建时，CNI 插件复用之前的 LSP 和 IP

配置参数：

# kube-ovn-controller 配置
spec:
  env:
  - name: POD_DELETE_TIMEOUT
    value: "600"  # Pod 删除后的 IP 保留时间（秒）

强制保留 IP：

apiVersion: v1
kind: Pod
metadata:
  name: persistent-ip-pod
  annotations:
    ovn.kubernetes.io/ip_pool: "10.200.1.100"  # IP 池
    ovn.kubernetes.io/pod_replicas: "1"         # 限制副本数
    ovn.kubernetes.io/ip_policy: "always"        # IP 策略：always/release

IP 回收流程：

Pod 删除 → kube-ovn-controller 启动计时器 (POD_DELETE_TIMEOUT)
  → Pod 重建 → 复用 IP 和 LSP
  → 超时未重建 → 释放 IP，删除 LSP

29 KubeOVN 的 ovn-central 高可用是如何实现的？

答案：

KubeOVN 的 ovn-central 组件通过多个副本和数据库同步实现高可用。

HA 架构：

ovn-central 部署为 StatefulSet，默认 3 副本
NB 和 SB 数据库使用 OVN 自带的 RAFT 一致性协议进行数据同步
客户端（ovn-controller、kube-ovn-controller）通过 VIP 或 Service 访问主节点

配置方式：

# Helm 配置
HA:
  enabled: true
  replicas: 3
  vip: "10.10.0.100"   # ovn-central VIP
# ovn-central StatefulSet 配置
env:
- name: OVN_RAFT_PORT
  value: "6643"
- name: OVN_ELECTION_TIMER
  value: "2000"  # 选举超时（ms）

故障切换流程：

主节点宕机 → RAFT 重新选举（~2-5秒）
  → 新主节点接管 → ovn-northd 继续转换
  → ovn-controller 自动连接新主节点
  → 集群网络不受影响

数据持久化：

NB/SB 数据库持久存储在 PVC 中
节点重建时从 PVC 恢复数据
日志 WAL（Write-Ahead Log，预写日志）确保持久化一致性

30 KubeOVN 的 ACL 日志审计如何配置？

答案：

KubeOVN 支持在 ACL 规则中配置日志记录，实现网络策略的审计功能。

ACL 日志配置：

apiVersion: kubeovn.io/v1
kind: ACL
metadata:
  name: audit-acl
spec:
  subject: "subnet-web"
  direction: "ingress"
  priority: 100
  match: "ip4 && tcp && tcp.dst==443"
  action: "allow"
  log: true                       # 启用日志
  logRate: "100/sec"              # 日志采样率
  logLevel: "info"                # 日志级别

Subnet 级别日志审计：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: subnet-audited
spec:
  cidrBlock: "10.200.1.0/24"
  log: true                   # 启用所有 ACL 规则的日志
  logRate: "50/sec"
  acl:
  - priority: 50
    match: "ip4"
    action: "drop"
    log: true

日志输出：

ACL 日志通过 OVS 的 syslog 输出到节点 syslog
格式：ACL_MATCH: allown | dropped src=10.200.1.2 dst=203.0.113.5 proto=tcp/443
可通过 Fluentd/Vector 等日志收集工具汇聚到中心化日志系统

日志分析字段：

timestamp=<时间戳>  src=<源 IP 和端口>
dst=<目标 IP 和端口>  action=<allow/drop/redirect>
direction=<ingress/egress>  rule_id=<匹配的 ACL ID>

31 KubeOVN 与传统 OVS/OVN 的关系是什么？

答案：

KubeOVN 是基于 OVN/OVS 的 Kubernetes CNI 实现，在标准 OVN/OVS 的基础上进行了大量 Kubernetes 适配。

关系说明：

KubeOVN 使用 OVN 作为控制面，OVS 作为数据面
OVN 提供了逻辑路由、逻辑交换、ACL、NAT 等网络抽象
KubeOVN 在 OVN 之上增加了 Kubernetes 资源同步、CRD、IPAM 等功能

KubeOVN 在 OVN/OVS 之上添加的层：

层次	技术	功能
Kubernetes 适配层	kube-ovn-controller	Watch K8s 资源，同步到 OVN
CRD 定义层	KubeOVN CRDs	Subnet、VPC、QoS、ACL、EIP 等
控制面	OVN（NB/SB/northd）	逻辑网络拓扑和流表转换
数据面	OVS（vswitchd）	流表执行和数据包转发

与传统 OVS 部署的差异：

传统 OVS 需要手动配置网桥、端口和流表
KubeOVN 自动完成 OVS 配置，与 Pod 生命周期关联
KubeOVN 增加了 Kubernetes 原生的 CRD 管理接口

32 KubeOVN 如何实现 Pod 的流量限速和整形？

答案：

KubeOVN 通过 QoS CRD 和 OVS 队列机制实现细粒度的 Pod 流量控制。

流量整形配置：

apiVersion: kubeovn.io/v1
kind: QoSPolicy
metadata:
  name: qos-detailed
spec:
  egressRate: 100            # 出站带宽 (Mbps)
  ingressRate: 200           # 入站带宽 (Mbps)
  burstSize: 1000            # 突发流量 (KB)
  priority: 10               # 优先级（**用户习惯 0-100，无硬上限**）
  latency: 50                # 目标延迟 (ms)

绑定到多个 Pod：

apiVersion: v1
kind: Pod
metadata:
  name: limited-pod
  annotations:
    ovn.kubernetes.io/qos_policy: "qos-detailed"
spec:
  containers:
  - name: app
    image: app:latest
# 通过 Label Selector 批量绑定
apiVersion: kubeovn.io/v1
kind: QoSPolicyBinding
metadata:
  name: batch-qos
spec:
  qosPolicy: "qos-detailed"
  selector:
    matchLabels:
      app: data-pipeline

实现层级：

一层：OVS QOS 规则，在 ovs-vswitchd 层面实现
二层：Linux TC（Traffic Control），补充 OVS 无法覆盖的整形场景
适用于：多租户带宽限制、不同业务类型的差异化 QoS 保障

33 KubeOVN 的 ProviderNetwork 是如何工作的？

答案：

ProviderNetwork 是 KubeOVN 的物理网络抽象层，用于管理节点物理网卡与 KubeOVN 网络的映射关系。

ProviderNetwork 配置：

apiVersion: kubeovn.io/v1
kind: ProviderNetwork
metadata:
  name: phys-net
spec:
  defaultInterface: eth1
  providerNetworks:
  - name: phys-net-1
    exchangeLinkName: true
    vlan: 100                    # 可选 VLAN ID
    bridgeName: br-phys1         # 创建的 OVS 网桥名称
    linkType: "provider"         # 链路类型
  nodeSelector:
    matchLabels:
      network-card: "fast"       # 只在指定节点上创建

工作原理：

kube-ovn-controller 根据 ProviderNetwork 配置协调每个节点上的物理接口
在节点上创建 OVS 网桥（br-phys1），将物理网卡接入网桥
Underlay Subnet 可以引用 ProviderNetwork，实现 Pod 直连物理网络

多网卡绑定：

apiVersion: kubeovn.io/v1
kind: ProviderNetwork
metadata:
  name: multi-nic
spec:
  defaultInterface: eth1
  providerNetworks:
  - name: storage-net
    vlan: 200
    bridgeName: br-storage
  - name: data-net
    vlan: 300
    bridgeName: br-data

34 KubeOVN 的 IPAM 机制是如何设计的多级地址池？

答案：

KubeOVN 的多级 IPAM 机制支持全局池、Subnet 池和固定 IP 三级管理。

三级地址池模型：

1. 全局池（Cluster）：

# 安装时配置全局 CIDR
networking:
  CIDR: "10.200.0.0/16"
  JOIN_CIDR: "10.100.0.0/16"  # **Overlay 内部通信网络**（节点间 OVN Tunnel，非物理网络）
  EXCLUDE_IPS: "10.200.0.1..10.200.0.10"

2. Subnet 池（租户/应用）：

apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
  name: web-subnet
spec:
  cidrBlock: "10.200.1.0/24"
  excludeIps:
  - "10.200.1.1..10.200.1.10"  # 预留
  - "10.200.1.200..10.200.1.254"  # 预留

3. 固定 IP（单个 Pod/工作负载）：

apiVersion: v1
kind: Pod
metadata:
  annotations:
    ovn.kubernetes.io/ip_address: "10.200.1.100"
    ovn.kubernetes.io/ip_pool: "10.200.1.100,10.200.1.101"

IP 分配策略：

随机分配：默认模式，从 Subnet 可用 IP 池中随机选择
固定 IP 池：通过 ip_pool annotation 指定可用 IP 列表
StatefulSet：自动按序号分配（web-0 → .100, web-1 → .101）
VIP 预留：通过 Vip CRD 预占 IP 但不创建 Pod

35 KubeOVN 在裸金属环境中的最佳实践是什么？

答案：

裸金属环境中部署 KubeOVN 需要针对物理网络特性和性能需求进行优化。

网络模式选择：

# Underlay 直通模式（推荐裸金属）
routingMode: "native"
networking:
  type: "underlay"
  DEFAULT_PROVIDER: "phys-net"
apiVersion: kubeovn.io/v1
kind: ProviderNetwork
metadata:
  name: phys-net
spec:
  defaultInterface: bond0      # 使用 Bond 网卡
  providerNetworks:
  - name: phys-net-1
    exchangeLinkName: true
    bridgeName: br-phys
    linkType: "provider"

性能优化：

# Jumbo Frame 支持
networking:
  mtu: 8950                    # 物理网卡 MTU 9000

# OVS 多队列
ovs:
  init:
    dpdk: false
    hw-offload: true           # OVS-TC 硬件卸载
    n-handler-threads: 4       # 处理线程数
    n-revalidator-threads: 4   # 验证线程数

高可用配置：

ovn-central 3 副本 StatefulSet + 反亲和性确保跨节点分布
OVS 网桥 Bond 主备模式（active-backup）保证物理链路冗余
BGP 路由双活配置，确保单节点故障网络不中断

性能基线（裸金属 25Gbps 网卡）：

场景	吞吐量	延迟 P99
Pod-Pod（同节点）	线速	< 10μs
Pod-Pod（跨节点，直连）	23 Gbps	50μs
Pod-Service	22 Gbps	60μs
Pod-外部（NAT）	20 Gbps	80μs