-
Notifications
You must be signed in to change notification settings - Fork 58
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Astraea 測試用硬體 #130
Comments
這個數字看起來不錯,接下來可否跑kafka performance? |
另外硬體規格可否寫完整一點?可以直接抄廠商給的規格單就好,謝謝 |
@chia7712 |
可否試試看其他工具?多比較一下 |
看了一下這篇 https://www.pcworld.com/article/399100/crucial-p2-nmve-ssd-review.html/amp 這顆在大量資料連續寫入(文中以48GB為示範)下似乎不太行,現在可能有兩個方向可以嘗試:
@wycccccc 你覺得呢? |
不過你測試大量寫入卻沒遇到問題,或許矛頭又指向kafka在io上的行為不適合這顆硬碟? 這可能要追蹤一下 |
要不要用用看 https://blog.cloud-mercato.com/dd-is-not-a-benchmarking-tool/ TL;DR:
|
@garyparrot 你有空協助測試嗎?現在的首要目標是確定除了Kafka的寫入行為以外,是否還有其他方式可以造成寫入速度劇降 |
這篇文章中提到的狀況確實與現在遇到的十分類似 我再去試一下 |
測試使用 可以斷定確實是硬碟問題(kafka獨特的效能問題沒有了),從第一張圖中可以看出,中間的機器速率歸為了0。整個測試過程中,disk的寫入速率上下劇烈跳動,並多次達到0.與kafka遇到的情況十分相像。
在之前有做過一些壓縮方面的測試,似乎沒有受到這方面的影響,我認為可以先繼續在這方面測試。 |
這個調整會導致每秒寫入的資料量下降嗎?如果每秒寫入的資料量沒有下降的話,那為何可以改善@@ |
從performance tool上觀察沒有下降。外加1Kib的record.size 情況也還比較不錯,偶爾會出現該問題(大概一次測試20min內會出現一到兩次短暫的歸零)。(只經過少量測試) |
@wycccccc 你可以分享多一點 |
這是我的測試指令 這篇裡面有一些不同的測試方式 |
六個平行跑都針對同一個檔案,這是故意的嗎?如果針對不同檔案也會出現歸零的狀況嗎 |
抱歉我沒有講清楚,每張圖中從左到右分別是234號機器,檔案路徑一樣但其實是三台各自的機器。 |
我剛剛試了一下,會得到一樣的結果 細節可以有空再追,現在看來塞太快會撞到這顆爛硬碟的上限,我們先預設啟用壓縮( |
我試著建立另外一個指令 第一次跑
特別注意: 第二次跑上面的執行完成後我又立刻下了一次同樣的指令,然後這次得到不太一樣的結果。
這次 感覺上好像只要操到一個程度 SSD 的效能就不行了,跟上面那篇文章的內容很類似 |
傷心,這是我的錯,太相信美光這個牌子,沒先做好功課 我開一個議題討論一下更換硬碟的事情 #228 |
@ chinghongfang 等硬碟換完後 (#228),麻煩更新一下硬體資訊,謝謝 |
@garyparrot @qoo332001 要麻煩你們研究一下 intel 12gen是否能在ubuntu server上運行順利?可以先google一下看看有沒有災情 |
我嘗試跑去翻 Ubuntu Forum 的文章,發現他們有 Hardware compatability 的分享文章,不過最後回報記錄都差不多是 2020 年的事情,沒有參考價值。 下面是其他論壇內的搜尋結果
不過 Kafka 對 CPU 似乎沒有那麼敏感,感覺關鍵還是在 Disk 和 IO 上。 |
@garyparrot 感謝驗證,那我們就接著這個規格往下買
yep,這是你們之後balancer要考慮的一種情境(平衡硬碟空間使用率)。另外在應用有一種是網路傳的是壓縮資料、硬碟存的是解壓縮資料(例如consumer端不支援解壓縮),這時候網路頻寬用一些但硬碟頻寬反而吃很重。 |
新硬體測試這次新到了 5 台設備,看起來規格和先前的那臺水冷很類似。 硬碟測試
每臺的 SSD測試結果
Kakfa IO 測試這裡建立 5 個 Brokers,在每個 Broker 上開 performance tool。
|
@garyparrot 那個截圖y軸的數字好像被遮住了,可以直接講一下數字嗎? |
最上面是900MB, 依序 100 MB 遞減下去 |
好的,感謝~ |
iperf進行網路測試 (TP-Link TL-SX1008) 兩兩依序單向打資料: [ ID] Interval Transfer Bandwidth
[ 1] 0.0-10.0 sec 10.9 GBytes 9.38 Gbits/sec
所有排列組合都是10.9GBytest Transfer, 9.38Gbits/sec bandwidth。 六台同時打資料: [ ID] Interval Transfer Bandwidth
[ 4] 0.0-10.0 sec 10.9 GBytes 9.40 Gbits/sec
[ ID] Interval Transfer Bandwidth
[ 4] 0.0-10.0 sec 11.0 GBytes 9.41 Gbits/sec
[ ID] Interval Transfer Bandwidth
[ 4] 0.0-10.0 sec 11.0 GBytes 9.41 Gbits/sec
[ ID] Interval Transfer Bandwidth
[ 4] 0.0-10.0 sec 10.9 GBytes 9.40 Gbits/sec
[ ID] Interval Transfer Bandwidth
[ 4] 0.0-10.0 sec 10.9 GBytes 9.40 Gbits/sec
[ ID] Interval Transfer Bandwidth
[ 4] 0.0-10.0 sec 10.9 GBytes 9.38 Gbits/sec 註:風扇的聲音有點大聲 |
@harryteng9527 感謝測試,麻煩把新的硬體更新到此議題的描述喔 |
@harryteng9527 下禮拜三更新完硬體後麻煩更新一下描述喔 |
@harryteng9527 是否方便將描述中的內容依照項目分開?也就是 partitioner, balancer and consumer |
@chinghongfang @garyparrot @qoo332001 @harryteng9527 麻煩將你們最後的討論結果更新到此議題上,然後我們就可以關閉這個題目了 |
@harryteng9527 感謝,看來網路的部分是沒什麼問題,接下來就是要驗證硬碟的部分 |
硬碟驗證這邊提供 assignor 與 partitioner 叢集的硬碟寫入效能 測試指令
AssignorAssignor 叢集由下列電腦組成:
這邊列出各個電腦的 Disk 的寫入速率、溫度 小台的 12 代 IntelGrafana Snapshot 連結:SSD - 小台 12 代 大台的 12 代 Intel此台規格與 Partitioner 的 12 代 Intel 相同 Grafana Snapshot 連結:SSD - 大台 12 代 11 代 IntelGrafana Snapshot 連結:SSD - 11 Intel 13 代 Intel13 代 Intel 的磁碟寫入速率偏低 Grafana Snapshot 連結:SSD - 13 Intel PartitionerGrafana Snapshot 連結:SSD - Partitioner |
@harryteng9527 感謝整理,做得很好。不過想請問 partitioner 那個圖片實在新的機器上測試的嗎?還是舊的設備 |
舊的設備 目前測試都沒有更換 SSD 到其他台電腦,都是測試原本就插在上面的 SSD |
另外小台12代的右圖的速度震盪的很嚴重,也是溫度的問題嗎?可否升級作業系統讓我們可以看一下溫度變化 |
這就不確定了,目前只有先把每類電腦的 SSD 都測試一次
請問全部都要升級嗎? 還是先升級一台看看就好 |
一台就好 另外新設備的部分,可否多確認幾台看看是否都有效能低落的問題 |
小台12代我看了一下主機板的介紹,內建的散熱片只有一塊,另一顆ssd是放在背板,這應該是由於主機板是小塊的後果 當時那個小台的intel 12 代買來給你們測試的嗎?還是我自己家裡要用的換過去給你們的? |
小台的 intel 12 代原本是學長家裡用的 當時 partitioner 的 11 代電腦跟學長交換小台 12 代 intel |
測試指令
重灌小台 Intel 12 代電腦之後測試 fio,發現有一顆硬碟溫度下降的時候,Disk 的寫入速度也跟著下降 |
應該是說是系統讓寫入下降然後溫度才降了下來 |
好吧,那這是我的錯,當時我自己用的時候沒有想到你們會有這個需求 |
這是使用另一個 fio 指令測試的結果 指令如下:
以下為 Assignor 叢集的 Disk 寫入速率的圖表 12 代 Intel - 小台電腦12 代 Intel - 大台電腦11 代 Intel13 代 Intel |
@chinghongfang @garyparrot @qoo332001 @harryteng9527 麻煩協助描述中的硬體規格,然後就要關閉此議題了 |
硬體規格:
Consumer
Balancer
Partitioner
NETGEAR <-10Gibit-> (01~06)
NETGEAR <-10Gibit-> (07~12)
TP-LINK <-10Gibit-> (15~20)
測試結果:
iperf進行網路測試 (舊 switch)
兩兩依序單向打資料:
(i->j)
所有排列組合都是11.0GBytest Transfer, 9.41Gbits/sec bandwidth。
五台同時打資料:
(1->2->3->4->5->1)
iperf進行網路測試 (新 switch)
兩兩依序單向打資料:
(i->j)
所有排列組合都是11.0GBytest Transfer, 9.41Gbits/sec bandwidth。
五台同時打資料:
(1->2->3->4->5->1)
Astraea performance tool
配置:
1: zookeeper, performance tool
2: kafka broker
3: kafka broker
4: kafka broker
5: kafka broker
record.size=1024, producers 5, consumers 10, partitions 100
The text was updated successfully, but these errors were encountered: