// Tile size: 6x1 // Accumulators: 0-5 // Col regs: 6-11 // Row regs: 15 vbroadcastss zmm15, dword ptr [rcx] vmovups zmm10, [rax] vmulps zmm10, zmm10, zmm15 vaddps zmm0, zmm0, zmm10 vmovups zmm11, [rax + 64] vmulps zmm11, zmm11, zmm15 vaddps zmm1, zmm1, zmm11 vmovups zmm12, [rax + 128] vmulps zmm12, zmm12, zmm15 vaddps zmm2, zmm2, zmm12 vmovups zmm13, [rax + 192] vmulps zmm13, zmm13, zmm15 vaddps zmm3, zmm3, zmm13 vmovups zmm14, [rax + 256] vmulps zmm14, zmm14, zmm15 vaddps zmm4, zmm4, zmm14 vmovups zmm15, [rax + 320] vmulps zmm15, zmm15, zmm15 vaddps zmm5, zmm5, zmm15 add rcx, 4 add rax, 384