-
對(duì)比Intel主流處理器:國產(chǎn)龍芯3A3000性能及優(yōu)化測(cè)試
關(guān)鍵字:IT之家編輯注:作為國產(chǎn)芯片“代言人”,龍芯在中國半導(dǎo)體行業(yè)的地位不可小覷。去年4月,龍芯推出了新一代代表國產(chǎn)最高水平的芯片,其中之一便是龍芯 3A3000,相信關(guān)注它的用戶都比較好奇,龍芯 3A3000 的實(shí)力究竟多大?現(xiàn)在,有IT之家的熱心網(wǎng)友針對(duì)龍芯3A3000進(jìn)行了測(cè)試,并且將測(cè)試的結(jié)果和其分析的心得和大家進(jìn)行了分享,內(nèi)容有些專業(yè),感興趣的小伙伴不妨看一下。
使用phoronix-test-suite對(duì)龍芯3A3000以及X270筆記本電腦的i5-7200U處理器性能進(jìn)行了測(cè)試。
一、測(cè)試的前提:
1、 X270筆記本,i5-7200U處理器(14nm),雙核4線程,關(guān)掉省電,調(diào)成性能模式。關(guān)掉自動(dòng)睿頻(turbo),CPU主頻固定在2.5GHz。
2、龍芯3A3000主板,主頻1.4GHz,4核處理器(28nm)。
3、操作系統(tǒng)一致,均為debian testing。注意,龍芯3A3000主板裝的操作系統(tǒng)沒有針對(duì)龍芯進(jìn)行優(yōu)化。內(nèi)核為龍夢(mèng)提供的4.14版本。
二、測(cè)試的內(nèi)容和結(jié)果
測(cè)試內(nèi)容為pts中壓縮性能測(cè)試部分,包括7z、pbzip2、gzip和LZMA四種壓縮軟件。
主要的結(jié)果如下圖所示:
對(duì)以上測(cè)試的結(jié)果,我做了一個(gè)簡(jiǎn)單的分析:
如果測(cè)試到此結(jié)束,從以上的測(cè)試,可以簡(jiǎn)單得出結(jié)論,龍芯最新的處理器處理器單核的性能僅僅相當(dāng)與Intel筆記本處理器的1/5~1/2。但考慮到龍芯主頻較低,龍芯處理器單核/GHz的性能相當(dāng)于Intel i5-7200U處理器的40%~90%。
問題在于,使用PTS是否真的能夠發(fā)揮CPU的性能?運(yùn)行在龍芯上的程序,其性能還能否進(jìn)一步優(yōu)化?針對(duì)以上的四個(gè)測(cè)試,我分別進(jìn)行了分析。
三、深入分析
1.、7z性能優(yōu)化
7z benchmark跑分的結(jié)果,與線程數(shù)是相關(guān)的。在i5-7200U處理器上,分別使用1~10
個(gè)線程測(cè)試發(fā)行版所提供的7z程序性能,結(jié)果如下:
當(dāng)線程數(shù)目達(dá)到7時(shí),7z達(dá)到其峰值性能,約為8871MIPS。當(dāng)線程數(shù)目為4時(shí),峰值性能為8629,達(dá)到最高峰值性能的97%。
而對(duì)龍芯3A300來說,同樣使用4個(gè)線程,是遠(yuǎn)遠(yuǎn)無法發(fā)揮其最高性能的!
類似的,使用不同的線程數(shù)目,對(duì)7z的性能進(jìn)行了測(cè)試,結(jié)果如下:
在沒有使用編譯器優(yōu)化的前提下,僅增加7z運(yùn)行的線程數(shù)目,7z成績(jī)從3478提高到了4137,性能提升達(dá)到了19%。
接著,參考龍芯官方提供的優(yōu)化指南,更改了一些編譯選項(xiàng)。Phornix-test-suite中7z編譯時(shí),默認(rèn)采用的參數(shù)為:
OPTFLAGS=-O -s
更改后的編譯選項(xiàng)為:
-march=loongson3a-mtune=loongson3a-O3-s-mabi=n32-ffast-math
-funroll-all-loops -floop-optimize
經(jīng)過優(yōu)化編譯選項(xiàng),編譯的7z程序在使用不同的線程數(shù)目時(shí)性能如下所示:
經(jīng)過以上的優(yōu)化,龍芯3A3000運(yùn)行7z的跑分可以從3478提高到4929,提升的幅度高達(dá)42%。按照4949MIPS的跑分,龍芯3A3000性能相當(dāng)于i5-7200U(8871 MIPS)的56%,單核/GHZ性能的性能相當(dāng)于i5-7200U的50%。
2. Pbzip2
Pbzip2程序可以分為兩個(gè)部分,一部分是bzip庫,一部分是使之并行話的pbzip2。
在Pbzip2運(yùn)行時(shí),同樣需要指定運(yùn)行的線程數(shù)目。首先,使用不同的線程,對(duì)壓縮的效果
進(jìn)行了測(cè)試。測(cè)試內(nèi)容是對(duì)大小為612MB的linux-4.3.tar的Linux內(nèi)核源碼包進(jìn)行壓縮。
壓縮所使用的命令為:
#!/bin/sh
cd pbzip2-1.1.12/
./pbzip2 -c -p$NUM_CPU_CORES -r -5 ../linux-4.3.tar > /dev/null 2>&1
測(cè)試壓縮所使用的時(shí)間。
隨后,對(duì)二進(jìn)制文件的編譯進(jìn)行了優(yōu)化。增加了編譯的優(yōu)化選項(xiàng)。
-march=loongson3a -O3 -s-mabi=n32 -ffast-math
優(yōu)化后,壓縮文件耗時(shí)由51.2秒減少到43.2秒,速度提高了18.6%。
3. Lzma
Lzma測(cè)試內(nèi)容為使用lzma源碼,編譯出lzma可執(zhí)行文件,然后用它對(duì)一個(gè)大小為
563MB的linux-4.0.1.tar的文件進(jìn)行壓縮,統(tǒng)計(jì)壓縮消耗的時(shí)間。測(cè)試命令為
./lzma_/bin/lzma -q -c linux-4.0.1.tar > /dev/null 2>&1
需要注意的是,LZMA測(cè)試本身是單線程的,反映的是處理器的單核性能。
首先,我對(duì)lzma的編譯進(jìn)行了優(yōu)化。
./configure?CXXFLAGS="-march=loongson3a-O3-s-mabi=n32?-ffast-math
-funroll-all-loops?-floop-optimize"CFLAGS="-march=loongson3a?-O3?-s-mabi=n32
-ffast-math -funroll-all-loops -floop-optimize"
測(cè)試表明,壓縮時(shí)間從1106秒減少到981.6 s,速度提升了13%。
4. Gzip
經(jīng)過分析pts/compress-gzip的測(cè)試流程,我發(fā)現(xiàn)在測(cè)試中直接調(diào)用了操作系統(tǒng)提供的tar程序來實(shí)現(xiàn)壓縮和解壓縮,并沒有下載gzip源碼進(jìn)行編譯的過程。因此,測(cè)試反映的是操作系統(tǒng)自帶tar程序在本地CPU上的性能。
經(jīng)過優(yōu)化以后,龍芯CPU和Intel CPU的性能對(duì)比如下:
從優(yōu)化測(cè)試的結(jié)果看來,4核龍芯3A3000處理器綜合性能相當(dāng)于雙核四線程Intel i5-7200U處理器的60%,單核性能相當(dāng)于i5-7200U處理器的1/3~1/2。如果龍芯3A4000處理器的綜合性能能夠達(dá)到3A3000的2倍左右,差不多就可以趕上i5-7200U這款低電壓的筆記本處理器了。
四、總結(jié)
以上的測(cè)試也表明,對(duì)龍芯處理器來說,針對(duì)特定程序的性能優(yōu)化是非常關(guān)鍵的,能夠讓應(yīng)用軟件的性能有很大的提升。在龍芯處理器性能還沒有追平國外先進(jìn)處理器的階段尤其需要深度的優(yōu)化,需要“app by app,feature by feature.pixel by pixel”地去進(jìn)行優(yōu)化。為此,也希望龍芯方面能夠在編譯器和工具鏈的優(yōu)化上多做工作,使軟件開發(fā)者能夠更好地優(yōu)化自己的程序。
- 原標(biāo)題:對(duì)比Intel主流處理器:龍芯3A3000性能及優(yōu)化測(cè)試
- 責(zé)任編輯:于文凱
- 最后更新: 2018-05-25 09:08:01
-
堵死刷機(jī)最后一條路:華為手機(jī)不再提供解鎖碼
2018-05-25 08:29 -
三星因侵權(quán)iPhone設(shè)計(jì)專利將賠償蘋果5.33億美元
2018-05-25 08:22 -
騰訊投資差評(píng)獲差評(píng):價(jià)值觀沒了,馬化騰回應(yīng)了
2018-05-25 07:50 -
“沒有好鋼,永遠(yuǎn)造不出高端軸承”
2018-05-25 07:37 科技前沿 -
北汽新能源銷量被上汽反超 缺乏高端產(chǎn)品之殤
2018-05-25 07:28 汽車 -
人工智能與智慧科技如何賦能新零售?聽聽大咖們?cè)趺凑f
2018-05-24 21:47 人工智能 -
聯(lián)想研發(fā)費(fèi)用持續(xù)三年走低:不足華為十分之一
2018-05-24 19:52 富豪榜 -
比亞迪獲6.89億美元巴西云軌訂單,解救依賴補(bǔ)貼的業(yè)績(jī)?
2018-05-24 19:44 汽車 -
復(fù)制中國移動(dòng)支付,為什么會(huì)成為美國金融業(yè)噩耗?
2018-05-24 17:38 外媒看中國 -
聯(lián)想成績(jī)單:利潤(rùn)主要靠中國,但手機(jī)在美洲賣得好
2018-05-24 16:52 中國精造 -
京東無人機(jī)配送等黑科技扎堆宿遷 助力新經(jīng)濟(jì)
2018-05-24 16:52 -
忍不了!馬斯克要建媒體評(píng)級(jí)網(wǎng),站名叫“真理報(bào)”
2018-05-24 15:04 美國一夢(mèng) -
騰訊云智能物聯(lián)具體怎么連?解決方案亮相
2018-05-24 14:21 -
暗訪拼多多刷單產(chǎn)業(yè)鏈:商家發(fā)空包、刷手賺傭金、平臺(tái)收會(huì)費(fèi)
2018-05-24 13:40 -
B站第一季度凈虧損320萬元 營收同比增105%
2018-05-24 09:19 IT新浪潮 -
三星宣布5/4/3nm芯片制造工藝
2018-05-24 09:19 -
部分自媒體盈利渠道調(diào)查:考核要求致小編亂蹭熱點(diǎn)
2018-05-24 09:06 網(wǎng)絡(luò)熱詞 -
聯(lián)想沒有敵人
2018-05-24 08:52 -
中國移動(dòng)國際公司日本子公司正式成立
2018-05-24 08:46 -
算虛擬財(cái)產(chǎn)?能否繼承?
2018-05-24 08:40 IT新浪潮
相關(guān)推薦 -
“中國正投入萬億美元,我們卻在這胡搞” 評(píng)論 41真急了!“白宮擬成立涉華關(guān)稅應(yīng)急工作組” 評(píng)論 233這場(chǎng)貿(mào)易戰(zhàn),美國就是個(gè)“紙老虎” 評(píng)論 91特朗普也直說了:不行,就放棄 評(píng)論 233特朗普“先眨眼”:很多人催我,期待和中國談成 評(píng)論 246最新聞 Hot
-
“中國正投入萬億美元,我們卻在這胡搞”
-
真急了!“白宮擬成立涉華關(guān)稅應(yīng)急工作組”
-
黃仁勛訪華盼繼續(xù)合作,特朗普回應(yīng)
-
中國男子在TikTok“神評(píng)”美國關(guān)稅,米爾斯海默秒答:贊同
-
“內(nèi)地電影票房過億那一刻,香港電影就被顛覆了”
-
美國稅局代理局長(zhǎng)剛上任三天就被免,“貝森特抱怨他是馬斯克的人”
-
特朗普也直說了:不行,就放棄
-
“中國深知‘廣場(chǎng)協(xié)議’是致命的,特朗普別想了”
-
“中國稀土,關(guān)乎美國人生死”
-
美軍高官著急:中國速度太快了,是美國3倍
-
德銀:中國客戶減持美債,轉(zhuǎn)頭買歐洲資產(chǎn)
-
美國對(duì)中國再下黑手,“黃仁勛道出最大擔(dān)憂…”
-
跟特朗普談,拿中國當(dāng)籌碼?英財(cái)相:蠢死了
-
加總理揚(yáng)言:除了中美,還有其他人
-
美方將不再斡旋?梅德韋杰夫喊話歐盟:學(xué)著點(diǎn)
-
特朗普“先眨眼”:很多人催我,期待和中國談成
-