国产主播一区二区三区在线观看|国产乱码精品一区二区三区四川人|A片V一区二区三区有声|国产精品自在线午夜精华播放|日本无码一区二区三区不卡免费|樱桃视频在线直播观看免费|欧美成人一区二区三区不卡视频

<strong id="hrs50"></strong>

<span id="hrs50"><listing id="hrs50"></listing></span>

<span id="hrs50"></span>

搜索

學(xué)術(shù)刊物生活雜志 SCI期刊文秘服務(wù) 出版社登錄/注冊(cè) 購(gòu)物車(chē)(0) 400-838-9662

首頁(yè) > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電子信息科學(xué)綜合 > 計(jì)算機(jī)工程與科學(xué) > 3D-MMA:基于3D集成電路的矩陣乘加速結(jié)構(gòu) 【正文】

3D-MMA:基于3D集成電路的矩陣乘加速結(jié)構(gòu)

王吉軍; 郝子宇; 李宏亮江南計(jì)算技術(shù)研究所; 江蘇無(wú)錫214083

3d集成電路
矩陣乘
分塊算法
性能模型

摘要：脈動(dòng)陣列結(jié)構(gòu)規(guī)整、吞吐量大,適合矩陣乘算法,廣泛用于設(shè)計(jì)高性能卷積、矩陣乘加速結(jié)構(gòu)。在深亞微米工藝下,通過(guò)增大陣列規(guī)模來(lái)提升芯片計(jì)算性能,會(huì)導(dǎo)致頻率下降、功耗劇增等問(wèn)題。因此,結(jié)合3D集成電路技術(shù),提出了一種將平面脈動(dòng)陣列結(jié)構(gòu)映射到3D集成電路上的雙精度浮點(diǎn)矩陣乘加速結(jié)構(gòu)3D-MMA。首先,設(shè)計(jì)了針對(duì)該結(jié)構(gòu)的分塊映射調(diào)度算法,提升矩陣乘計(jì)算效率;其次,提出了基于3D-MMA的加速系統(tǒng),構(gòu)建了3D-MMA的性能模型,并對(duì)其設(shè)計(jì)空間進(jìn)行探索;最后,評(píng)估了該結(jié)構(gòu)實(shí)現(xiàn)代價(jià),并同已有先進(jìn)加速器進(jìn)行對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,訪存帶寬為160 GB/s時(shí),采用4層16×16脈動(dòng)陣列的堆疊結(jié)構(gòu)時(shí),3D-MMA計(jì)算峰值性能達(dá)3 TFLOPS,效率達(dá)99%,且實(shí)現(xiàn)代價(jià)小于二維實(shí)現(xiàn)。在相同工藝下,同線(xiàn)性陣列加速器及K40 GPU相比,3D-MMA的性能是后者的1.36及1.92倍,而面積遠(yuǎn)小于后者。探索了3D集成電路在高性能矩陣乘加速器設(shè)計(jì)中的優(yōu)勢(shì),對(duì)未來(lái)進(jìn)一步提升高性能計(jì)算平臺(tái)性能具有一定的參考價(jià)值。

注：因版權(quán)方要求，不能公開(kāi)全文，如需全文，請(qǐng)咨詢(xún)雜志社

投稿咨詢(xún) 文秘咨詢(xún)

計(jì)算機(jī)工程與科學(xué)

預(yù)計(jì)1-3個(gè)月 預(yù)計(jì)審稿周期
0.79 影響因子
計(jì)算機(jī) 快捷分類(lèi)
月刊出版周期

主管單位：國(guó)防科技大學(xué);主辦單位：國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院

我們提供的服務(wù)

在線(xiàn)客服

一對(duì)一咨詢(xún)服務(wù)、簡(jiǎn)單快捷、省時(shí)省力

了解更多 >

快遞配送

直郵到家、實(shí)時(shí)跟蹤、更安全更省心

了解更多 >

雜志訂閱

去除中間環(huán)節(jié)享受低價(jià)，物流進(jìn)度實(shí)時(shí)通知

了解更多 >

雜志推薦

正版雜志，匹配度高、性?xún)r(jià)比高、成功率高

了解更多 >

相關(guān)期刊

服務(wù)流程: 確定期刊支付定金完成服務(wù) 支付尾款在線(xiàn)咨詢(xún)