sve2作为neon的继任者,为了学习sve2,有必要先看一下neon
现实状况
alu和datapath位宽一般是机器字长,但是数据处理指令处理数据长度小于机器字长,sisd浪费了位宽和计算资源。
加速原理
使用simd,充分利用硬件,并行计算多条数据,获得成倍提升
sve2作为neon的继任者,为了学习sve2,有必要先看一下neon
alu和datapath位宽一般是机器字长,但是数据处理指令处理数据长度小于机器字长,sisd浪费了位宽和计算资源。
使用simd,充分利用硬件,并行计算多条数据,获得成倍提升