// Tile size: 8x1 // Accumulators: 0-7 // Col regs: 8-14 // Row regs: 15 vbroadcastss zmm17, dword ptr [rcx] vfmadd231ps zmm0, zmm17, [rax + 0] vfmadd231ps zmm1, zmm17, [rax + 64] vfmadd231ps zmm2, zmm17, [rax + 128] vfmadd231ps zmm3, zmm17, [rax + 192] vfmadd231ps zmm4, zmm17, [rax + 256] vfmadd231ps zmm5, zmm17, [rax + 320] vfmadd231ps zmm6, zmm17, [rax + 384] vfmadd231ps zmm7, zmm17, [rax + 448] vbroadcastss zmm16, dword ptr [rcx + 4] vfmadd231ps zmm0, zmm16, [rax + 0 + 512] vfmadd231ps zmm1, zmm16, [rax + 64 + 512] vfmadd231ps zmm2, zmm16, [rax + 128 + 512] vfmadd231ps zmm3, zmm16, [rax + 192 + 512] vfmadd231ps zmm4, zmm16, [rax + 256 + 512] vfmadd231ps zmm5, zmm16, [rax + 320 + 512] vfmadd231ps zmm6, zmm16, [rax + 384 + 512] vfmadd231ps zmm7, zmm16, [rax + 448 + 512] add rcx, 8 add rax, 1024