测试的鲲鹏服务器是96核2numa节点,内存测试用的是Imbench里面的stream。

6eacbf8e52f552861d4d52360a03a348.png

优化说明,bios和绑核优化后性能提升明显,编译参数优化后性能提升不明显可以根据情况是否进行编译优化

1、Bios修改:

458f9a91fcfa64fe777f9264626257bb.png

进入bios,在Advanced中进入Memory Config界面,修改Custom Refresh Rate为64ms

2、脚本绑核:

进入到lmbench3/bin路径,执行绑核测试(以64核2个numa节点为例)

numactl -C 0-31 -m 0 ./stream -v1 -P 64 -N 5 -W 5 -M 64M &

numactl -C 32-63 -m 1 ./stream -v1 -P 64 -N 5 -W 5 -M 64M &

3、修改Makefile文件:

进入到lmbench3/src/路径,修改Makefile文件第114、115和139行,将O修改成O2,使用O2编译可使性能优化。

#cd Lmbench-3.0-a9/src/

#vim Makefile

c11fa7a231b4781c90d53677888966f1.png

优化结果截图

以16进程为例

优化前:

f8a915e39ac4d55f20c393a5af5d71d4.png

Bios内存优化后:

3641aeefde3b80280fd5266d23b6e69b.png

Bios CPU关闭预取:

c1b7271c8d7b85b9f97a4ce384bbbdba.png

进程绑核:

4832816b9fb896bb699697a671bfcf5f.png

优化编译参数

132925016725076e75777e1c051a01c3.png

优化编译参数后进程绑核

a3b3baec7aa7b5508311e67b21ccc75c.png

不同进程数的不同数据显示

a519eb845d5496a4222271fe932b5a29.png