網易首頁 > 網易號 > 正文申請入駐

Kubernetes把IP地址當消耗品用

2026-03-25 12:41:12　來源: 全棧遛狗員

北京舉報

分享至

2024年云原生技術報告顯示，單個中型K8s集群每天平均銷毀重建Pod超過12000次。這意味著什么？你的應用每小時可能要換3次"門牌號"。

如果每個容器都是一間辦公室，傳統運維思維是給每間辦公室裝固定電話。Kubernetes的做法更極端：它讓辦公室每天搬家，然后告訴你"反正前臺總機找得到人"。這套反直覺的設計，成了云原生時代最被低估的工程決策。

一、從"找房間"到"找服務"：IP地址的貶值運動

傳統虛擬機時代，IP地址是資產。運維會為關鍵服務申請固定IP，寫進防火墻白名單，刻進配置文件的每一個角落。遷移一次服務器，變更流程能跑兩周。

Kubernetes把這個邏輯連根拔起。它給每個Pod分配IP，但明確告訴你：這個地址隨時會失效。Pod崩潰、擴容、節點調度——任何操作都可能讓IP變成歷史。

這不是設計缺陷，是刻意為之的架構選擇。

Google Borg系統的遺產在這里顯現。Borg工程師早在2005年就發現：試圖在動態環境中維護固定地址，成本遠高于接受"地址即臨時標識"。K8s繼承了這個判斷，把穩定性責任從網絡層上移到服務發現層。

結果是一套分層解耦的系統。網絡層只管連通性，服務層管尋址，應用層只管調用服務名。每層只關心自己的鄰居，不用穿透整個棧去猜"那個IP現在是誰在用"。

這種設計在微服務場景下尤其鋒利。一個電商系統可能有300個服務實例在跑，手動維護它們的地址矩陣，相當于在地震帶蓋摩天樓。K8s的做法是：讓地震成為常態，然后設計抗震結構。

二、Service：集群里的"總機小姐"

Service是K8s對"穩定地址"問題的答案。它不指向具體容器，指向一組標簽匹配的Pod。Pod來了，自動加入；Pod走了，自動剔除。

技術實現上，Service通過kube-proxy維護節點上的iptables或IPVS規則。當流量命中Service的ClusterIP，會被負載均衡到后端Pod。對調用方來說，感知不到后端變化——就像打電話給總機，永遠有人接，但接電話的人可能每次都不同。

這里有個容易被忽略的細節：Service的穩定性是相對的。ClusterIP在Service生命周期內不變，但Service本身可以被刪除重建。生產環境中，更可靠的尋址方式是通過DNS——CoreDNS會為每個Service創建A記錄，名字比IP更持久。

DNS記錄 + Service = 雙保險。IP變了？DNS指向沒變。Service重建？名字還在，重新關聯即可。

這套機制的代價是額外的網絡跳數和DNS查詢延遲。但在分布式系統的復雜度面前，這點開銷屬于"可接受的稅"。畢竟，手動維護服務注冊表的隱性成本，往往被嚴重低估。

社區對此有過激烈爭論。2019年Kubernetes網絡特別興趣小組的會議記錄顯示，部分成員主張"有狀態服務應該支持固定IP"，但最終被否決。核心論據是：固定IP會鼓勵錯誤的設計模式，把臨時解決方案變成架構依賴。

三、Ingress與負載均衡：當流量從外部涌入

Service解決集群內部通信，但外部流量怎么進？NodePort是最簡單的答案：在每個節點上開放一個端口，映射到Service。問題在于端口范圍受限（30000-32767），且節點IP暴露在外。

生產環境更常見的選擇是Ingress。它引入第7層路由，基于域名和路徑分發流量。一個Ingress控制器（如Nginx、Traefik）監聽80/443端口，根據規則把請求轉給不同Service。

這相當于在寫字樓門口設了智能前臺。訪客說"找市場部"，前臺查表后引導到A座15層；說"找技術部"，引導到B座8層。同一大門，不同目的地。

Ingress的進化史反映了K8s社區的務實傾向。早期Ingress資源對象功能有限，各家控制器實現差異大。Gateway API作為繼任者，正在標準化流量管理語義，但Ingress的存量部署預計還會存在多年。

云廠商的托管K8s服務通常提供更上層抽象：AWS的ALB Ingress Controller、GCP的GCE Ingress，直接把云負載均衡器掛進集群。用戶配置一個注解，背后自動生成數十個云資源。這是K8s生態的典型模式——核心保持精簡，擴展交給供應商和社區。

四、服務網格：當Sidecar成為標配

Istio、Linkerd等服務網格項目，把服務發現推向了極端。它們在每個Pod里注入Sidecar代理，攔截所有進出流量。服務間不再直接通信，而是通過代理中轉。

這相當于給每間辦公室配了專屬秘書。你想聯系隔壁部門，先告訴你的秘書；秘書查內部通訊錄，找到對方秘書，建立連接。雙方老板只感知到"通話質量"，不感知路由細節。

Sidecar模式的優勢是功能集中：mTLS加密、流量鏡像、熔斷限流、可觀測性，都在代理層統一實現。應用代碼保持干凈，不用關心這些橫切關注點。

代價同樣明顯。資源開銷增加15-30%，延遲增加毫秒級，調試復雜度上升。2023年Istio社區推動的Ambient Mesh架構，試圖用節點級代理替代Sidecar，就是對這個代價的回應。

服務網格的采用曲線很有意思。早期 adopters 是金融、電信等對合規和可觀測性要求極高的行業。普通互聯網公司往往停留在"Service + Ingress夠用"的階段，直到微服務規模突破某個閾值，才被迫升級。

這個閾值沒有統一數字，但有一個信號：當開發者開始抱怨"找不到哪個服務在拖慢整體"，就是網格化的時候了。

五、eBPF：內核里的新戰場

服務網格的性能問題，催生了更激進的解決方案。Cilium等項目用eBPF（extended Berkeley Packet Filter，擴展伯克利包過濾器）把網絡功能下沉到Linux內核，繞過iptables和Sidecar的用戶態開銷。

eBPF允許在內核中安全地執行沙箱程序，無需修改內核源碼或加載內核模塊。Cilium用它實現高性能的網絡策略、負載均衡和可觀測性，同時保持K8s的原生語義兼容。

這相當于把寫字樓的弱電系統全面升級，從模擬電話換成光纖到戶。前臺、秘書、總機這些角色還在，但通信延遲從"人說話的速度"變成"電信號的速度"。

2024年，eBPF在K8s網絡中的滲透率正在快速上升。GKE、EKS等主流托管服務都提供了Cilium作為網絡插件選項。一個值得關注的指標是：Cilium的GitHub star數在2022-2024年間增長了340%，增速超過大多數基礎設施項目。

但eBPF不是銀彈。它需要較新的內核版本（4.19+），調試工具鏈仍在成熟，學習曲線陡峭。對于網絡需求簡單的集群，傳統CNI插件可能仍是更務實的選擇。

六、從"找得到"到"找得快"：DNS的隱性成本

Service和DNS解耦了服務名與IP，但引入了新問題：DNS查詢本身成為瓶頸。CoreDNS默認的緩存策略、ndots配置、搜索域列表，都曾導致生產事故。

一個經典案例：某頭部電商在2022年大促期間，因CoreDNS解析延遲飆升，導致訂單服務超時。根因是Java應用的DNS緩存TTL與K8s Pod生命周期不匹配，頻繁觸發全量解析。

修復方案是分層緩存：應用層緩存、NodeLocal DNSCache、CoreDNS本身緩存，加上合理的TTL調優。這相當于在寫字樓里增設多個問詢處，減少總臺的查詢壓力。

更激進的優化是繞過DNS。部分團隊采用服務網格的xDS協議直接下發端點列表，或讓客戶端直連Service的ClusterIP。這些做法犧牲了部分靈活性，換取延遲確定性。

在K8s網絡優化中，"找得到"和"找得快"是兩個獨立維度。很多團隊只驗證了連通性，沒壓測過解析延遲，直到故障發生才補課。

七、網絡策略：當開放成為默認選項

K8s的網絡設計有一個常被批評的特性：默認全開放。任何Pod可以訪問任何其他Pod，除非顯式配置NetworkPolicy限制。

這與其他系統的"默認拒絕"原則相反。Docker默認隔離容器，VMware NSX默認微分段，K8s選擇信任開發者知道自己在做什么。

安全團隊的應對是策略即代碼：用OPA（Open Policy Agent，開放策略代理）或Kyverno在CI/CD階段審計NetworkPolicy覆蓋，用Cilium的Hubble可視化流量矩陣，用Falco檢測異常連接模式。

2023年Kubernetes安全審計報告指出，73%的生產集群缺乏有效的網絡分段策略。這個數字背后，是"先跑起來再優化"的工程文化，與安全合規要求的持續張力。

一些團隊采用漸進式收緊：先監控所有流量，標記已知合法的連接，再逐步阻斷未標記的流量。這相當于在開放式辦公室里先裝攝像頭，觀察三個月，再決定隔板怎么擺。

八、多集群與混合云：當"一棟樓"變成"一個園區"

單集群的服務發現相對簡單。當業務擴展到多集群、多云、甚至邊緣節點，事情變得復雜。

Submariner、Skupper、Karmada等項目試圖在不同集群間建立扁平網絡，讓Pod跨集群直接通信。這相當于在園區內的多棟寫字樓之間鋪設地下通道，保持"同一地址空間"的幻覺。

更常見的做法是接受集群邊界，用全局負載均衡（GSLB）或服務網格的多集群模式，在應用層處理跨集群路由。犧牲透明性，換取運維獨立性。

Google的Anthos、微軟的Arc、紅帽的ACM，都在推各自的混合云網絡方案。它們的共同點是：不把K8s網絡當作孤立問題，而是與企業現有的SD-WAN、專線、云互聯服務整合。

這個領域的標準仍在演化。Gateway API的多集群擴展、ClusterSetIP提案，都是2024年的活躍話題。對于多數團隊，建議策略是：單集群內用原生機制，跨集群用顯式網關，避免過早追求網絡透明。

九、可觀測性：當流量成為信號

服務發現系統的健康，最終要通過數據驗證。K8s網絡的可觀測性分層展開：CNI插件提供節點級指標，CoreDNS提供解析日志，Service網格提供應用級追蹤，eBPF程序提供內核級事件。

Prometheus + Grafana是事實標準，但網絡指標的解讀有門檻。kube-proxy的同步延遲、conntrack表滿、DNS 5xx錯誤，各自指向不同層面的問題。

Netflix開源的Skuber工具、Pixie的eBPF自動追蹤，都在降低這個門檻。它們的思路是：把網絡數據翻譯成應用開發者能理解的語義，比如"這個API調用的網絡路徑上有幾跳，每跳延遲多少"。

最理想的可觀測性，是讓網絡問題"自解釋"——不是拋出原始指標，而是直接指出"Pod A到Pod B的延遲異常，建議檢查節點X的CPU steal time"。

這要求把網絡、計算、存儲的監控數據打通，目前仍是少數頭部團隊的特權。多數生產環境，網絡故障排查仍依賴tcpdump和kubectl exec的原始組合。

十、設計哲學的回響：為什么K8s敢這么設計

回顧K8s網絡架構的演進，有一條主線清晰可見：把復雜性推到更高抽象層，讓下層保持簡單和快速。

IP不穩定？用Service和DNS封裝。負載均衡不夠靈活？用Ingress和Gateway擴展。安全策略復雜？用NetworkPolicy和CNI插件外掛。性能瓶頸？用eBPF下沉到內核。

這種分層不是偶然，是Google十年Borg運營經驗的結晶。Borg工程師在2015年的論文中寫道："我們學到的最重要一課，是避免在基礎設施中嵌入業務邏輯。"K8s的網絡設計忠實地執行了這個原則。

對比同時代的Docker Swarm或Mesos，K8s的默認選擇往往更"極端"：更動態、更無狀態、更依賴外部系統。這些選擇在早期增加了采用門檻，但在大規模場景下展現出韌性。

2024年的K8s網絡生態，正在經歷從"能用"到"好用"的轉型。Gateway API成熟、eBPF普及、服務網格簡化，都是這個轉型的標志。但核心設計哲學沒有變：IP是消耗品，服務是契約，網絡是平臺而非產品。

對于正在評估技術棧的團隊，一個實用的判斷標準是：你的應用能否接受"每天換12000次地址"而不出錯？如果答案是否定的，需要檢查的不只是網絡配置，可能是整個架構的耦合度。

一位在K8s早期就參與社區建設的工程師，去年在KubeCon的演講末尾說：「我們花了八年時間，才讓大多數人相信動態IP不是問題。現在的問題是，下一代開發者會不會以為這是唯一的方式？」

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Arm破天荒自研芯片，黃仁勛發聲明站臺，Meta是第一個客戶

DeepTech深科技 2026-03-25 13:44:29
1 跟貼 1
瑞識科技實現二維可尋址VCSEL芯片量產，已落地車載激光雷達與智能機器人｜最前線

36氪 2026-03-25 12:26:26
0 跟貼 0

Arm下場造芯：首推AGI CPU直供Meta，萬億算力市場的“越頂傳球”

鈦媒體APP 2026-03-25 14:04:07
0 跟貼 0

龍蝦史上最大更新，亂成一鍋粥了

智東西 2026-03-24 23:50:27
18 跟貼 18
AI主權的底層戰爭：全同態加密正在成為新基礎設施

36氪 2026-02-28 17:20:13
0 跟貼 0

張雪峰走了，他的9家公司怎么辦？——IP型公司的組織陷阱

鈦媒體APP 2026-03-25 14:57:17
1 跟貼 1

小鵬汽車重大業務調整

新浪財經 2026-03-24 14:21:23
2 跟貼 2
我在微信免費養「龍蝦」，玩到上癮，這組CP太強了

機器之心Pro 2026-03-25 12:10:49
0 跟貼 0

程序員花2小時搭了個Notion插件

Ping值焦慮 2026-03-25 14:52:55
0 跟貼 0
智能體互聯網連接智能的新范式與中國聯通的創新實踐

通信世界 2026-03-24 15:09:35
0 跟貼 0
3月25日（報道時間），河南。孩子想到馬路對面找爸爸，一路"疾跑"奔向馬路對面險釀悲劇，媽媽擔心孩子

中安在線 2026-03-25 11:55:16
411 跟貼 411
中國貨占六成，美委員會急眼

觀察者網 2026-03-24 09:37:05
1 跟貼 1
大模型API的大眾點評來了：7×24小時實測，毫秒級延遲智能路由

量子位 2026-02-02 11:48:44
2 跟貼 2
這款經典游戲IP，與瀏陽開啟跨界聯動

瀟湘晨報 2026-03-25 18:23:23
0 跟貼 0
中國首個“特朗普金卡”申請者曝光！“中國路由器之王”？

深度報 2026-03-24 21:51:20
2 跟貼 2
2026最新五大常用無線智能家居協議全面對比，跟著選不出錯

新文年華 2026-03-24 14:59:13
0 跟貼 0
高鐵站臺能否全面禁煙？12306回應

中國新聞周刊 2026-03-24 20:43:03
11976 跟貼 11976
不同靈巧手，終于可以共用「一套大腦」了

機器之心Pro 2026-03-06 14:40:41
0 跟貼 0
柴桑大姐就如許姚夫婦一道堅實的防火墻，為許姚夫婦遮風擋雨

春風自如 2026-03-23 08:37:00
0 跟貼 0
世界模型開始做減法？LeCun團隊和清華團隊給出兩種思路

機器之心Pro 2026-03-24 17:32:11
0 跟貼 0
“霍爾木茲決戰”，不打了

中國新聞周刊 2026-03-25 18:43:08
532 跟貼 532
星哥帶你玩飛牛NAS-21：私人游戲中心GameServerManager一鍵部署教程

星哥說事 2026-03-24 23:38:41
1 跟貼 1
德總統稱"對美信任已然喪失" 得到法國軍方強烈共鳴

紅星新聞 2026-03-25 13:54:18
256 跟貼 256
劉強東的“龍蝦天團”來了！首次開源通用基礎大模型

智東西 2026-03-24 23:50:27
0 跟貼 0
“上海實體交通卡，為啥退不了？”73歲老伯來滬遭遇引發質疑，記者調查：確實難

新民晚報 2026-03-25 18:45:33
1 跟貼 1
性能真的不重要了嗎？Jeff Dean給出反常答案

新智元 2025-12-28 17:20:51
0 跟貼 0
理想MEGA智駕時撞樹報廢，4S店：用戶未及時接管，車輛無質量問題

澎湃新聞 2026-03-24 15:18:28
101 跟貼 101
「你是專家」竟成AI幻覺毒藥？新論文一巴掌揭穿提示詞最大騙局

新智元 2026-03-23 20:57:06
0 跟貼 0
中科院、港中文等提出HiFi-Inpaint：重塑Inpainting生成范式！

機器之心Pro 2026-03-23 12:02:18
0 跟貼 0
NASA月球南極基建方案出爐，放棄繞月空間站計劃

DeepTech深科技 2026-03-25 19:59:55
0 跟貼 0
患者的住院檢查報告竟是偽造的，中山五院致歉，珠海市衛健局：全面排查醫療機構外送檢查報告

極目新聞 2026-03-25 17:53:18
0 跟貼 0
暫停21天后，中遠海運集運恢復遠東至阿聯酋、沙特、卡塔爾等中東地區新訂艙業務

澎湃新聞 2026-03-25 16:30:31
0 跟貼 0
殺瘋了！又一款D加密大作遭知名黑客破解

游民星空 2026-03-25 11:46:17
1 跟貼 1
歐爾班拒絕同意歐盟向烏提供900億歐元貸款，美方回應

環球網資訊 2026-03-25 11:26:19
120 跟貼 120
國際油價24日顯著上漲

每日經濟新聞 2026-03-25 05:27:04
364 跟貼 364
Anthropic沖塔ASI自進化，要做全球操作系統！Claude OS一刀砍向6.4萬億帝國

新智元 2026-03-25 19:40:39
0 跟貼 0
港交所回應"前高管巴曙松被帶走調查"

澎湃新聞 2026-03-25 18:08:27
59 跟貼 59
Sora沒了，但Seedance還不能躺平

鈦媒體APP 2026-03-25 18:37:08
0 跟貼 0
AI Agent狂潮中的金融新范式：AI漲樂養了一只“金融小龍蝦”，正破解投資最難一公里

鈦媒體APP 2026-03-25 17:03:07
0 跟貼 0
黃天鵝剛剛聲明，公布檢測結果

南方都市報 2026-03-25 16:00:41
83 跟貼 83

47票贊成、53票反對！限制特朗普戰爭權力的議案再遭否決，民主黨議員：美國士兵正在犧牲，國會卻在隱瞞

全棧遛狗員

白天跟需求對線，晚上在小區遛狗。

29文章數 0關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

時尚

本地

家居

公開課

來永泰同安赴一場春天的約會

家居要聞

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Kubernetes把IP地址當消耗品用

一、從"找房間"到"找服務"：IP地址的貶值運動

二、Service：集群里的"總機小姐"

三、Ingress與負載均衡：當流量從外部涌入

四、服務網格：當Sidecar成為標配

五、eBPF：內核里的新戰場

六、從"找得到"到"找得快"：DNS的隱性成本

七、網絡策略：當開放成為默認選項

八、多集群與混合云：當"一棟樓"變成"一個園區"

九、可觀測性：當流量成為信號

十、設計哲學的回響：為什么K8s敢這么設計

紅極一時卻草草收場，Sora宣布正式關停

伊朗放話愿意與"主和派"萬斯談 特朗普表態

伊朗放話愿意與"主和派"萬斯談 特朗普表態

35歲替補門將，憑什么入選英格蘭隊？

張雪峰經搶救無效不幸去世 年僅41歲

管濤:中東局勢如何影響人民幣匯率走勢?

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態度原創

轉頭就暈的耳石癥，能開車上班嗎？

今年春天最時髦的穿法：長外套+長裙、長針織+長褲，太高級了！

來永泰同安 赴一場春天的約會

輕奢堇天府 小資情調

伊朗放話愿意與"主和派"萬斯談特朗普表態

伊朗放話愿意與"主和派"萬斯談特朗普表態

張雪峰經搶救無效不幸去世年僅41歲

來永泰同安赴一場春天的約會

輕奢堇天府小資情調