国产91精品一区二区麻豆网站-国产91精品高跟丝袜在线-国产91精品不卡在线-国产91激情对白露脸全程-在线国产区-在线观着免费观看国产黄

首頁 > 汽車資訊 > 汽車資訊 > 如何從處理器和加速器內核中榨取最大性能?

如何從處理器和加速器內核中榨取最大性能?

發布時間:2024-06-02 16:31:47來源: 15210273549

利用緩存增強低成本、上一代或中端的 SoC。

 

一些設計團隊在創建片上系統(SoC)設備時,有幸能夠使用最新和最先進的技術節點,并且擁有相對不受限制的預算來從可信的第三方供應商那里獲取知識產權(IP)模塊。然而,許多工程師并沒有這么幸運。對于每一個“不惜一切代價”的項目,都有一千個“在有限預算下盡你所能”的對應項目。

一種從成本較低、早期代、中檔處理器和加速器核心中擠出最大性能的方法是,明智地應用緩存。

 

削減成本

圖1展示了一個典型的成本意識SoC場景的簡化示例。盡管SoC可能由許多IP組成,但這里為了清晰起見,只展示了三個。

 

圖 1

SoC內部IP之間連接的主要技術是網絡片上(NoC)互連IP。這可以被看作是一個跨越整個設備的IP。圖1中展示的例子可以假定為一個非緩存一致性場景。在這種情況下,任何一致性需求將由軟件處理。

假設SoC的時鐘運行在1GHz。假設一個基于精簡指令集計算機(RISC)架構的中央處理單元(CPU)運行一個典型指令將消耗一個時鐘周期。然而,訪問外部DRAM內存可能需要100到200個處理器時鐘周期(為了本文的目的,我們將這個平均為150個周期)。這意味著,如果CPU沒有一級(L1)緩存,并且通過NoC和DDR內存控制器直接連接到DRAM,那么每個指令將消耗150個處理器時鐘周期,導致CPU利用率僅為1/150 = 0.67%。

這就是為什么CPU以及一些加速器和其他IP使用緩存內存來提高處理器利用率和應用程序性能。緩存概念基于的基本原理是局部性原則。這個觀點是,在任何給定時間,只有一小部分主內存被使用,而且那個空間中的位置被多次訪問。主要是由于循環、嵌套循環和子程序,指令及其相關數據經歷時間、空間和順序局部性。這意味著,一旦一塊指令和數據從主內存復制到IP的緩存中,IP通常會反復訪問它們。

當今高端CPU IP通常至少有一個一級(L1)和二級(L2)緩存,它們通常還有一個三級(L3)緩存。此外,一些加速器IP,如圖形處理單元(GPU)通常有自己的內部緩存。然而,這些最新一代的高端IP的價格通常比上一代中檔產品高出5倍到10倍。因此,正如圖1所示,一個注重成本的SoC中的CPU可能只配備了一個L1緩存。

更深入地考慮CPU及其L1緩存。當CPU在其緩存中請求某物時,結果被稱為緩存命中。由于L1緩存通常以與處理器核心相同的速度運行,因此緩存命中將在單個處理器時鐘周期內處理。相比之下,如果請求的數據不在緩存中,結果稱為緩存未命中,將需要訪問主內存,這將消耗150個處理器時鐘周期。

現在考慮運行1,000,000條指令。如果緩存足夠大以包含整個程序,那么這將只消耗1,000,000個時鐘周期,從而實現100%的CPU效率。

不幸的是,中檔CPU中的L1緩存通常只有16KB到64KB的大小。如果我們假設95%的緩存命中率,那么我們的1,000,000條指令中的950,000條將需要一個處理器時鐘周期。其余的50,000條指令每條將消耗150個時鐘周期。因此,這種情況下的CPU效率可以計算為1,000,000/((950,000 * 1) + (50,000 * 150)) = ~12%。

 

提升性能

提高注重成本SoC性能的一種成本效益高的方式是添加緩存IP。例如,Arteris的CodaCache是一個可配置的、獨立的非一致性緩存IP。每個CodaCache實例可以高達8MB,并且可以在同一個SoC中實例化多個副本,如圖2所示。

 

圖2

本文的目的并不是建議每個IP都應該配備一個CodaCache。圖2僅旨在提供潛在CodaCache部署的示例。

如果一個CodaCache實例與一個IP關聯,它被稱為專用緩存(DC)。或者,如果一個CodaCache實例與一個DDR內存控制器關聯,它被稱為末級緩存(LLC)。DC將加速與其關聯的IP的性能,而LLC將增強整個SoC的性能。

作為我們可能期望的性能提升類型的一個示例,考慮圖2中顯示的CPU。讓我們假設與這個IP關聯的CodaCache DC實例以處理器速度的一半運行,并且對這個緩存的任何訪問消耗20個處理器時鐘周期。如果我們還假設這個DC有95%的緩存命中率,那么對于1,000,000條指令——我們的整體CPU+L1+DC效率可以計算為1,000,000/((950,000 * 1) + (47,500 * 20) + (2,500 * 150)) = ~44%。這是一個~273%的性能提升!

 

結論

過去,嵌入式程序員喜歡挑戰,盡可能從時鐘速度低、內存資源有限的小處理器中擠出最高性能。事實上,計算機雜志通常會向讀者提出挑戰,例如:“誰能在處理器Y上使用最少的時鐘周期和最小的內存量執行任務X?”

今天,許多SoC開發者喜歡挑戰,盡可能從他們的設計中擠出最高性能,特別是如果他們被限制使用性能較低的中檔IP。部署CodaCache IP作為專用和末級緩存,為工程師提供了一種負擔得起的方式來提升他們注重成本的SoC的性能

汽車資訊更多>>

2024年舟山市定海區衛生健康系統招聘編外人員公告 2024年寧波鄞州區錢湖醫院招聘編外人員公告 2024年貴陽清鎮市第一人民醫院醫共體暗流分院招聘合同制專業技術人員簡章 2024 年南海區第七人民醫院招聘事業單位 聘用制(編制)工作人員公告(第二批)(16人) A+級市場變天,AION RT A+王者現身! 悅達起亞銷量飆升,1-7月累計達13.2萬輛,增長66.5% 帥出新高度!猛士917高地雄獅版與M800星際成都車展驚艷亮相! 直降至高2.3萬元!2025款起亞K5增配上市,13.98萬元起售! 上汽俞經民:講MG一定要講英語,MG5是A級轎跑課代表 16.58萬元起,2025款漢開啟全面進化,加速沖擊合資燃油車 13.98萬元起售,配置增加,2025款起亞K5還香嗎? 重磅新品齊發,華為在線上演“王者歸來” 2024年亳州譙城區大學生鄉村醫生專項計劃招聘公告 2024年亳州市蒙城縣大學生鄉村醫生專項計劃招聘公告 2024年馬鞍山花山區“鄉編村用”招聘事業編制人員公告 2024年馬鞍山和縣“鄉編村用”專項招聘事業單位人員公告 2024年馬鞍山博望區“鄉編村用”招聘鄉鎮事業編制人員公告 2024年合肥市志遠教育集團校園招聘公告 2024年蕪湖徽文中學2025屆校園招聘簡章 2024年皖西學院藝朝藝夕教育科技集團2025屆校園招聘公告 2024年亳州市風華高級中學有限公司招聘簡章 預售20.98萬起/比亞迪唐DM同級,星途瑤光 C-DM四驅版9月26日上市 售26.88萬,座椅2+2+2布局,2.0T+8AT+四驅,第五代勝達香不香? 800V快充+高階智駕,0息0首付,限時17.99萬元起,小鵬G6 售價19.99萬起,車長超5米,配2.0T+7DCT,這款中型車帶勁不? 車長超5米,220馬力+7DCT,惠后22.39萬,這款合資B級車帶勁不? 配雙層隔音玻璃,油耗6.41L,限時12.78萬元,這款中型車適合家用 252馬力+四驅,配L2級輔助駕駛,惠后20.48萬,家用看這款中型SUV 2.0T+8AT+適時四驅,惠后16.88萬,家用可以看這款中型SUV 10萬級側滑門SUV,軸距2820mm,配置豐富,續航500km,適合家用
主站蜘蛛池模板: 色综合久久久久久888 | 五月天天色 | 四虎国产精品永久地址99 | 精品在线免费播放 | 毛片网站网址 | 四虎影永久地址www 四虎影永久在线高清免费 四虎影永久在线观看精品 四虎影永久在线观看网址 四虎影院.com | 免费福利视频网站 | 国产精品久久久香蕉 | 国产精品所毛片视频 | 亚洲日本一区二区三区高清在线 | 最近手机中文字幕无吗 | 中文字幕日韩一区二区三区不 | a级黄色网 | 成人国产一区 | 手机在线成人 | 亚洲日韩视频免费观看 | 视频二区肥岳精品推荐 | 中国16一17sexx性hd| 国产精品久久久久久久久鸭 | 美国毛片在线 | 亚洲国产一区在线二区三区 | 182午夜视频 | 伊人久久成人爱综合网 | 老司机福利在线播放 | 香蕉网站99视频丝瓜视频 | 黄色美女在线观看 | 午夜久久久久久久 | 亚洲高清一区二区三区四区 | 4huh34四虎最新久 | 国产日韩欧美不卡www | 亚洲欧美久久精品1区2区 | 日韩中文字幕在线免费观看 | 国产成人在线精品 | 女人18毛片a级毛片一区二区 | 国产视频首页 | 精品国产污污免费网站 | 国产亚洲精品精品国产亚洲综合 | 色系视频在线观看免费观看 | 香蕉小视频在线观看 | 一级毛片看看 | 4hu四虎永久地址 |