// Tile size: 10x1 // Accumulators: 0-9 // Col regs: 10-19 // Row regs: 20 vbroadcastss zmm20, dword ptr [rcx] vmovaps zmm10, [rax + 0] vmovaps zmm11, [rax + 64] vmovaps zmm12, [rax + 128] vmovaps zmm13, [rax + 192] vmovaps zmm14, [rax + 256] vfmadd231ps zmm0, zmm10, zmm20 vfmadd231ps zmm1, zmm11, zmm20 vfmadd231ps zmm2, zmm12, zmm20 vfmadd231ps zmm3, zmm13, zmm20 vfmadd231ps zmm4, zmm14, zmm20 vmovaps zmm15, [rax + 320] vmovaps zmm16, [rax + 384] vmovaps zmm17, [rax + 448] vmovaps zmm18, [rax + 512] vmovaps zmm19, [rax + 576] vfmadd231ps zmm5, zmm10, zmm20 vfmadd231ps zmm6, zmm11, zmm20 vfmadd231ps zmm7, zmm12, zmm20 vfmadd231ps zmm8, zmm13, zmm20 vfmadd231ps zmm9, zmm14, zmm20 add rcx, 4 add rax, 320