許多應用程序擁有更為復雜的讀取模式(幾乎是隨機地,特別是當cache hit不可預測的時候),並且沒有有效地利用帶寬。典型的這類應用程序就是業務處理軟件,即使擁有如亂序執行(out of order execution)這樣的cpu特性,也會受內存延遲的限製。這樣cpu必須得等到運算所需數據被除數裝載完成才能執行指令(無論這些數據來自cpu cache還是主內存係統)。當前低段係統的內存延遲大約是120-150ns,而cpu速度則達到了3ghz以上,一次單獨的內存請求可能會浪費200-300次cpu循環。即使在緩存命中率(cache hit rate)達到99%的情況下,cpu也可能會花50%的時間來等待內存請求的結束- 比如因為內存延遲的緣故。
你可以看到opteron整合的內存控製器,它的延遲,與芯片組支持雙通道ddr內存控製器的延遲相比來說,是要低很多的。英特爾也按照計劃的那樣在處理器內部整合內存控製器,這樣導致北橋芯片將變得不那麽重要。但改變了處理器訪問主存的方式,有助於提高帶寬、降低內存延時和提升處理器性 |