偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

深度剖析:Dubbo使用Nacos注冊中心的坑

開發(fā)
本文主要梳理了Dubbo使用Nacos注冊中心的坑,同時也講述了,出現(xiàn)問題時,如何一步一步排查。

問題描述

前幾年我在做微服務部件升級時,將Dubbo的注冊中心從Zookeeper切換到Nacos。切換的原因是有2點:

  • Zookeeper保障了CP,面對大量服務上下線時,吞吐量和響應有瓶頸。Nacos保障了AP,目前微服務的場景下,業(yè)界建議優(yōu)先保障AP,這樣有較好的吞吐量和較快的響應。
  • 本著能少用部件就少用,盡量減少故障點的原則。Nacos既可以做注冊中心也可以做配置中心,所以二合一,只采用一個部件。

切換完之后,奇怪的事情發(fā)生了,出現(xiàn)2個現(xiàn)象:

  • 有些微服務啟動很慢很慢,甚至長達15分鐘的時間都無法成功啟動,一直在打印大量的nacos請求日志。但是有些微服務啟動又較快。
  • 通過VisualVM查看JVM的線程情況,發(fā)現(xiàn)有的微服務居然高達4000左右的線程數(shù)。但是沒切換之前只有幾百的線程數(shù)。啟動了大量的線程,導致CPU飆升不少,同時服務啟動也慢。

通過現(xiàn)象開始排查

出現(xiàn)這種問題時,剛開始有點抓瞎,但是我們只能從常規(guī)的手段一點點排查,急不來。通過表面的現(xiàn)象,我們來逐步分析。

現(xiàn)象一:微服務啟動很慢很慢,一直在打印大量的nacos請求日志。日志如下:

現(xiàn)象二:JVM的線程數(shù)高達4000左右。線程情況如下:

基于以上現(xiàn)象,我們只能初步判斷是nacos的問題(當然結論不是nacos的問題)。

我們先來猜測:可能由于某種原因,產生了大量的nacos線程,每個線程又在不停的發(fā)送http請求。

那接下來繼續(xù)分析Nacos。

分析Nacos

1.回顧Nacos原理

我們知道Nacos客戶端注冊和訂閱服務流程大概如下:

所以,一般nacos-client有4個重要線程:

  • 定時從nacos-server拉取服務的線程
  • 維持心跳的線程
  • 監(jiān)聽服務變更的線程
  • 推送本服務變更信息的線程

2.分析Nacos

根據(jù)以上線程的名稱和原理流程圖,我們可以在nacos源碼里找到對應的位置,代碼如下:

翻看每個線程里執(zhí)行的任務,確實能找到他們都在向nacos-server發(fā)送對應的的http的api請求:

既然找到了創(chuàng)建線程和發(fā)起http調用的原因,那就繼續(xù)查看是哪里調用的init方法。

此時會自然想到dubbo了,因為dubbo采用nacos作為注冊中心,自然要依賴nacos-client創(chuàng)建出nacos注冊中心相關的類,然后從nacos注冊中心類中獲取到微服務的元數(shù)據(jù)信息。

Dubbo登場

在翻看Dubbo源碼之前,先回顧下Dubbo是怎樣基于 引用配置文件 或者 引用配置注解創(chuàng)建Proxy的,大致流程如下:

ReferenceAnnotationBeanPostProcessor#doGetInjectedBean

?

ReferenceAnnotationBeanPostProcessor#buildReferenceBeanIfAbsent

?

ReferenceBeanBuilder#build

?

ReferenceBean#afterPropertiesSet

?

ReferenceConfig#init

至此完成了referenceProxy的創(chuàng)建。

重點看ReferenceConfig#init方法,方法里有一行代碼:ref = createProxy(map);,順著這行代碼往里走,如下:

RegistryProtocol#refer

?

AbstractRegistryFactory#getRegistry

重點來了,重點來了,重點來了,核心代碼和注釋見下圖。

總之是:因為在上面ReferenceConfig#init方法里引入了timestamp參數(shù),同時又因為NacosRegistryFactory又自己實現(xiàn)了一套createRegistryCacheKey方法,這個方法里沒有截掉timestamp參數(shù),所有就會導致從緩存里取不到注冊中心信息,所有就會不停的去創(chuàng)建,從而又創(chuàng)建了更多的線程,從而發(fā)送了很多http請求。

再次查看ReferenceConfig#init方法的源碼,確實是加入了timestamp參數(shù):

至此問題的原因已經找到了,接下來就是如何解決了。

解決方法

解決方法也很簡單,就是在Dubbo的NacosRegistryFactory類里面截掉timestamp參數(shù)。

遺憾的是,我當時發(fā)現(xiàn)了這個問題時,打算給Dubbo官方發(fā)issue的,發(fā)現(xiàn)已經有網友搶先一步發(fā)了issue,并且已經合并到2.7.9分支里了。

以下是解決方法的代碼截圖:

兩個版本處理URL的結果如下:

2.7.8版本:
nacos://10.20.1.13:8848,10.20.1.14:8848,10.20.1.15:8848/org.apache.dubbo.registry.RegistryService?application=ehome-cloud&application.version=1.0&dubbo=2.0.2&interface=org.apache.dubbo.registry.RegistryService&namespace=dev-jzj&owner=ehome-cloud-owner&pid=21335&qos.enable=false&release=2.7.8×tamp=1712545856489

2.7.9版本:
nacos://10.20.1.13:8848,10.20.1.14:8848,10.20.1.15:8848/org.apache.dubbo.registry.RegistryService?namespace=dev-jzj

這個問題是在dubbo的2.7.8版本出現(xiàn)的,最后通過將2.7.9的修復class替換了2.7.8的NacosRegistryFactoryclass類,然后重新打了dubbo依賴包,問題得以解決。

有朋友會問:為啥不是引用2.7.9呢?因為我擔心2.7.9有其他問題,所以做個class替換,然后繼續(xù)用2.7.8是個較好的方式。

總結

本文主要梳理了Dubbo使用Nacos注冊中心的坑,同時也講述了,出現(xiàn)問題時,如何一步一步排查。透過現(xiàn)象結合源碼,逐步找到問題的真相。

當然在排查之前,就需要對Dubbo和Nacos有一定的了解。所以各位朋友,在平時還是要多積累,多深入原理,這樣遇到問題才能順利解決。

責任編輯:趙寧寧 來源: 不焦躁程序員
相關推薦

2021-08-04 11:54:25

Nacos注冊中心設計

2023-03-01 08:15:10

NginxNacos

2023-10-30 09:35:01

注冊中心微服務

2023-01-30 22:43:39

DubboZooKeeper

2022-02-10 20:09:24

Dubbo源碼Provider

2022-08-30 22:12:19

Nacos組件服務注冊

2023-02-26 00:00:00

2020-06-29 07:58:18

ZooKeeperConsul 注冊中心

2023-07-18 08:28:58

注冊中心下線Nacos

2023-06-13 08:25:14

注冊中心Nacos上線

2023-09-12 07:10:13

Nacos架構

2010-03-02 09:42:42

Android平臺

2010-09-25 15:21:29

2023-04-26 08:19:48

Nacos高可用開發(fā)

2023-01-05 07:55:59

Zookeeper服務注冊

2009-09-01 16:14:11

C#泛型

2024-08-06 09:08:59

2022-04-27 20:02:22

Dubbo注冊中心開發(fā)

2025-05-08 09:31:06

2021-08-02 07:35:19

Nacos配置中心namespace
點贊
收藏

51CTO技術棧公眾號