5月22日,芯片性能提升的一小步往往能帶來產業發展的一大步。在人工智能/機器學習(AI/ML)和高帶寬數據加速應用需求日益增長的今天,Achronix半導體公司推出FPGA系列產品Speedster7t來滿足這一快速增長的市場需求。
Achronix半導體公司是一家私有的、采用無晶圓廠模式的半導體公司,總部位于美國加利福尼亞州圣克拉拉市,同時提供高性能FPGA和嵌入式FPGA(EFPGA)解決方案。Achronix在美國、歐洲和中國都設有銷售辦公室和代表處,在印度班加羅爾設有一間研發和設計辦公室。
AI/ML的應用場景快速發展演進,對芯片的算力、安全性等提出更高要求。據AchronixSemiconductor總裁兼首席執行官RobertBlake介紹,全新Speedster7t系列產品專為機器學習市場和高帶寬網絡應用而進行了優化,它的創新架構和ACE軟件工具為要求更高性能和更短設計周期的設計提供了全新范式。同時Speedster7t器件采用臺積電(TSMC)的7nmFinFET工藝制造,專為接收來自多個高速來源的大量數據而設計。
關于Speedster7t相比之前產品在算力提升方面的情況,RobertBlake向TechWeb介紹,“在SerDes高速接口方面,之前的數據速率是10Gbit/s,現在最高可達112Gbit/s,提升了10倍之多。在計算能力方面,現在的每一個MLP(機器學習處理器)和以前用的每一個DSP相比,算力提升了5倍,另外MLP的尺寸做得更小,如果同時考慮尺寸和算力,總體計算能力也是原來的10倍以上。”
此外,在Speedster7t的AI適用場景方面,RobertBlake則向TechWeb表示“在AI領域中有很多新的算法,以前是CNN(卷積神經網絡)做圖像處理,現在有RNN(RecursiveNeuralNetwork,遞歸神經網絡)做語音處理,還有Transformer算法等等,所有新的這些算法都沒有傳統的架構可以去處理,我們覺得都很適合在FPGA里處理。”
RobertBlake稱:“具體到FPGA在AI領域的應用則非常廣泛,包括圖像處理、語音處理、數據加速、網絡加速、加密等等。未來有很多應用是要去處理非結構化的文字信息,用GPU、CPU來處理的效率和結果都不會有FPGA更高效、更準確。”
據介紹,Achronix將在第三季度發布很多高性能應用案例,來介紹其如何幫助客戶去提升速度、性能。
具體的,Speedster7tFPGA系列產品是專為高帶寬應用進行設計,具有一個革命性的全新二維片上網絡(2DNoC),以及一個高密度全新機器學習處理器(MLP)模塊陣列。通過將FPGA的可編程性與ASIC的布線結構和計算引擎完美地結合在一起,Speedster7t系列產品創造了一類全新的“FPGA+”技術。
在開發Speedster7t系列FPGA的產品過程中,Achronix的工程團隊完全重新構想了整個FPGA架構,以平衡片上處理、互連和外部輸入輸出接口(I/O),以實現數據密集型應用吞吐量的最大化,這些應用場景可見于那些基于邊緣和基于服務器的AI/ML應用、網絡處理和存儲。
Speedster7tFPGA的核心是其全新機器學習處理器(MLP)中大規模的可編程計算單元平行陣列,它們可提供業界最高的、基于FPGA的計算密度。MLP是高度可配置的、計算密集型的單元模塊,可支持4到24位的整點格式和高效的浮點模式,包括對TensorFlow的16位格式的支持,以及可使每個MLP的計算引擎加倍的增壓塊浮點格式的直接支持。
MLP與嵌入式存儲器模塊緊密相鄰,通過消除傳統設計中與FPGA布線相關的延遲,來確保以750MHz的最高性能將數據傳送到MLP。這種高密度計算和高性能數據傳輸的結合使得處理器邏輯陣列能夠提供基于FPGA的最高可用計算能力以每秒萬億次運算數量為單位(TOPS,Tera-OperationsPerSecond)。
除了算力提升外,存儲器帶寬也得到了擴展。Speedster7t器件是唯一支持GDDR6存儲器的FPGA,該類存儲器是具有最高帶寬的外部存儲器件。每個GDDR6存儲控制器都能夠支持512Gbps的帶寬,Speedster7t器件中有多達8個GDDR6控制器,可以支持4Tbps的GDDR6累加帶寬。
據介紹,Speedster7tFPGA器件的大小范圍為從363K至2.6M的6輸入查找表(LUT)。支持所有Achronix產品的ACE設計工具現已可提供,可支持包括SpeedcoreeFPGA和SpeedchipFPGA多晶粒封裝芯片(Chiplet)。第一批用于評估的器件和開發板將于2019年第四季度提供。
關鍵詞:
責任編輯:Rex_08