異構多核實現十倍嵌入式內存性能的三種方法從理論上講,異構多核設備可以配備針對給定用例可投入使用的,針對任何類型的操作進行了優化的計算塊。用于視頻處理的GPU,用于對象識別的神經網絡處理器,用于運行OS的CPU等。與同類同類處理器相比,不同的適用內核為SoC提供了更大的靈活性,從而在更大的工作負載范圍內提供了更高的性能和更低的功耗。 但是,當開始考慮基于邊緣的AI,計算機視覺等應用程序的需求時,事實是,I / O和內存的限制與原始處理性能一樣,甚至更多。 以下是嵌入式存儲器體系結構為滿足下一代異構多核處理器需求而不斷發展的三種方法。 1、內核專用SRAM 如果您查看許多此類嵌入式處理器,它們過去一直都使用SRAM。現在,對于每個特定的單元,我們都有本地SRAM,可從DRAM獲取數據,將其存儲在本地并進行處理,然后發送回最終輸出。 特定于內核的SRAM具有兩個優勢,首先是由于不必將臨時數據寫回到片外DRAM而獲得的存儲性能提升。 該架構還具有降低功耗的額外優勢,因為非常低電壓的SRAM塊位于SoC中相應邏輯IP的附近或附近。 2、增加系統內存 如今,嵌入式處理器具有多達4 MB至8 MB的系統內存。該系統內存不專用于任何一個特定的內核,可以在CPU,GPU和加速器等元素之間共享。 與專用SRAM相似,共享更多系統內存的主要好處是更少的DRAM訪問。例如,傳統的視頻編碼序列如下所示: DRAM->視頻編碼器-> DRAM->附加計算-> DRAM 增加的系統緩存可實現以下目的: DRAM->視頻編碼器->系統內存->附加計算-> DRAM 如前所述,區別在于單獨的內核不必連續從片外DRAM獲取數據,因為大的系統內存消除了對該中間步驟的需要。 3、增加緩存大小 最后,隨著更新的處理技術使更大容量的存儲器更便宜,緩存大小將不可避免地增加。在異構SoC上找到的用于CPU,GPU,DSP和其他核心體系結構的更大的緩存也會減輕DRAM流量。 |