<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>HPC &#8211; richliu&#039;s blog</title>
	<atom:link href="https://blog.richliu.com/tag/hpc/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.richliu.com</link>
	<description>Linux, 工作, 生活, 家人</description>
	<lastBuildDate>Tue, 28 Jun 2022 06:46:10 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.6.2</generator>
	<item>
		<title>Multi-socket is doomed</title>
		<link>https://blog.richliu.com/2022/06/28/4679/multi-socket-is-doomed/</link>
					<comments>https://blog.richliu.com/2022/06/28/4679/multi-socket-is-doomed/#respond</comments>
		
		<dc:creator><![CDATA[richliu]]></dc:creator>
		<pubDate>Tue, 28 Jun 2022 06:45:21 +0000</pubDate>
				<category><![CDATA[Computer/Technical]]></category>
		<category><![CDATA[ARM]]></category>
		<category><![CDATA[amazon]]></category>
		<category><![CDATA[Ampere]]></category>
		<category><![CDATA[arm]]></category>
		<category><![CDATA[HPC]]></category>
		<guid isPermaLink="false">https://blog.richliu.com/?p=4679</guid>

					<description><![CDATA[<p>Brendan Gregg 在 2021 年的演講提到的 Multi-socket is doomed 他的理 [&#8230;]</p>
<p>The post <a rel="nofollow" href="https://blog.richliu.com/2022/06/28/4679/multi-socket-is-doomed/">Multi-socket is doomed</a> appeared first on <a rel="nofollow" href="https://blog.richliu.com">richliu&#039;s blog</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<p> Brendan Gregg 在 <a href="https://www.usenix.org/system/files/lisa21_slides_gregg_computing.pdf" target="_blank" rel="noreferrer noopener">2021 年的演講</a>提到的 Multi-socket is doomed <br />他的理由是如果在 cloud 上擴展 CPU ，可以再加開 instance 就好，沒有必要一定要讓該機器的 CPU 數變多，因為跨 CPU 的存取的工程非常浩大，而且會有很多問題產生<br /><br />今天我們就看到有人就這樣幹了</p>



<span id="more-4679"></span>



<figure class="wp-block-image size-full"><img fetchpriority="high" decoding="async" width="1544" height="836" src="https://blog.richliu.com/wp-content/uploads/2022/06/image-6.png" alt="" class="wp-image-4682" srcset="https://blog.richliu.com/wp-content/uploads/2022/06/image-6.png 1544w, https://blog.richliu.com/wp-content/uploads/2022/06/image-6-600x325.png 600w, https://blog.richliu.com/wp-content/uploads/2022/06/image-6-768x416.png 768w, https://blog.richliu.com/wp-content/uploads/2022/06/image-6-1536x832.png 1536w" sizes="(max-width: 1544px) 100vw, 1544px" /><figcaption>下圖就是一個 CPU 內部架構的示意圖，在大型 CPU 內，通常 CPU 會分成幾塊存取 DRAM 以提高效率，像是這圖上就會分成四塊，如果程式在每一塊內的 CPU 內上執行，通常會優先配給那一塊存取速度較快的 DRAM 區域，但是還是免不了要跨 socket 去存取另外一邊的 DRAM 內容，這時候 Latency 就會非常高，即使是在同一顆 CPU 內，不同 numa node 相互存取的效能也會比相同 numa node 稍低一點<br /><br />除了一般應用程式存取以外，還有一個叫 cache coherence （快取一致性）的機制也會影響效能，例如在 Node 0 的 CPU 要寫一個值到記憶體，它必需要通知所有的 CPU 你要將你的 cache 內的資料清空，以保持存取該記憶體的資料一致性，這個雖然頻寬佔用不高，但是總是一筆額外的傳輸開銷，尤其是要出 CPU 那就更快了。</figcaption></figure>



<figure class="wp-block-image size-full"><img decoding="async" width="499" height="244" src="https://blog.richliu.com/wp-content/uploads/2022/06/image-5.png" alt="" class="wp-image-4681"/></figure>



<p>而且我們現在單核心的 CPU core 數已經夠高了，沒有必要一定要搞 multi-socket system <br /><br />像 Ampere AltraMax 已經到達 128 核心<br />Amazon Graviton 3 也有 64 核心</p>



<figure class="wp-block-image size-full"><img decoding="async" width="1028" height="570" src="https://blog.richliu.com/wp-content/uploads/2022/06/image-7.png" alt="" class="wp-image-4683" srcset="https://blog.richliu.com/wp-content/uploads/2022/06/image-7.png 1028w, https://blog.richliu.com/wp-content/uploads/2022/06/image-7-600x333.png 600w, https://blog.richliu.com/wp-content/uploads/2022/06/image-7-768x426.png 768w" sizes="(max-width: 1028px) 100vw, 1028px" /></figure>



<p>當然 Amazon 並沒有展示出他們的系統，但是他們圖上提到一件事<br /><br />這是一個 3 核心的系統，當然一般都是用 CCIX 接起來，應該會是二的倍數，像是 2 顆或是 4 顆<br />但是 Amazon 的系統是用 Nitro Card 接起來，</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1008" height="524" src="https://blog.richliu.com/wp-content/uploads/2022/06/image-8.png" alt="" class="wp-image-4684" srcset="https://blog.richliu.com/wp-content/uploads/2022/06/image-8.png 1008w, https://blog.richliu.com/wp-content/uploads/2022/06/image-8-600x312.png 600w, https://blog.richliu.com/wp-content/uploads/2022/06/image-8-768x399.png 768w" sizes="(max-width: 1008px) 100vw, 1008px" /></figure>



<p>Nitro Card 是一塊多功能 DPU Card ，負責資料傳輸加解密等等，看資料似乎也負責管理 edge VM 系統，還有當作 storage 系統<br /></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1026" height="533" src="https://blog.richliu.com/wp-content/uploads/2022/06/image-9.png" alt="" class="wp-image-4685" srcset="https://blog.richliu.com/wp-content/uploads/2022/06/image-9.png 1026w, https://blog.richliu.com/wp-content/uploads/2022/06/image-9-600x312.png 600w, https://blog.richliu.com/wp-content/uploads/2022/06/image-9-768x399.png 768w" sizes="(max-width: 1026px) 100vw, 1026px" /></figure>



<p>沒有想到 Amazon 衝的這麼快，真的就丟掉 multi-socket 架構，這個應該是整個系統都為了加速 Cloud native system 而生，軟體 CPU 跟不上的用硬體去推<br />也完全符合 Brendan Gregg 所說的情境<br /><br />而像 Ampere 下一代的 CPU 更多核，那又更密集了，也符合 Brendan Gregg 的預測<br /><br />未來 data center 可能就會走半板單 CPU 的架構吧，學 Amazon 的 triple-cores 不現實，一般真要搞 2U 4 systems 還是可以做到的，也比較相容工業標準<br /><br />Ref. <br /><a href="https://www.servethehome.com/amazon-aws-graviton3-hits-ga-with-3-sockets-per-motherboard-designs-tri-socket-arm/" target="_blank" rel="noopener">AWS Graviton3 Hits GA with 3 Sockets Per Motherboard Designs</a><br /><a href="https://www.servethehome.com/aws-nitro-the-big-cloud-dpu-deployment-detailed/" target="_blank" rel="noopener">AWS Nitro the Big Cloud DPU Deployment Detailed</a><br /></p>
<p>The post <a rel="nofollow" href="https://blog.richliu.com/2022/06/28/4679/multi-socket-is-doomed/">Multi-socket is doomed</a> appeared first on <a rel="nofollow" href="https://blog.richliu.com">richliu&#039;s blog</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://blog.richliu.com/2022/06/28/4679/multi-socket-is-doomed/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
