.data .p2align 5 mask_ff: .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff .word 0xff mask_f: .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf .word 0xf mask_3: .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .word 0x03 .text .global PQCLEAN_NTRUHPS4096821_AVX2_poly_mod_3_Phi_n .global _PQCLEAN_NTRUHPS4096821_AVX2_poly_mod_3_Phi_n PQCLEAN_NTRUHPS4096821_AVX2_poly_mod_3_Phi_n: _PQCLEAN_NTRUHPS4096821_AVX2_poly_mod_3_Phi_n: vmovdqa 1632(%rdi), %ymm0 vpermq $1, %ymm0, %ymm0 vpslld $17, %ymm0, %ymm0 vpsrld $16, %ymm0, %ymm1 vpor %ymm0, %ymm1, %ymm0 vbroadcastss %xmm0, %ymm0 vpaddw 0(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 0(%rdi) vpaddw 32(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 32(%rdi) vpaddw 64(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 64(%rdi) vpaddw 96(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 96(%rdi) vpaddw 128(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 128(%rdi) vpaddw 160(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 160(%rdi) vpaddw 192(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 192(%rdi) vpaddw 224(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 224(%rdi) vpaddw 256(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 256(%rdi) vpaddw 288(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 288(%rdi) vpaddw 320(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 320(%rdi) vpaddw 352(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 352(%rdi) vpaddw 384(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 384(%rdi) vpaddw 416(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 416(%rdi) vpaddw 448(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 448(%rdi) vpaddw 480(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 480(%rdi) vpaddw 512(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 512(%rdi) vpaddw 544(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 544(%rdi) vpaddw 576(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 576(%rdi) vpaddw 608(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 608(%rdi) vpaddw 640(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 640(%rdi) vpaddw 672(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 672(%rdi) vpaddw 704(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 704(%rdi) vpaddw 736(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 736(%rdi) vpaddw 768(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 768(%rdi) vpaddw 800(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 800(%rdi) vpaddw 832(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 832(%rdi) vpaddw 864(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 864(%rdi) vpaddw 896(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 896(%rdi) vpaddw 928(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 928(%rdi) vpaddw 960(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 960(%rdi) vpaddw 992(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 992(%rdi) vpaddw 1024(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1024(%rdi) vpaddw 1056(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1056(%rdi) vpaddw 1088(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1088(%rdi) vpaddw 1120(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1120(%rdi) vpaddw 1152(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1152(%rdi) vpaddw 1184(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1184(%rdi) vpaddw 1216(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1216(%rdi) vpaddw 1248(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1248(%rdi) vpaddw 1280(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1280(%rdi) vpaddw 1312(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1312(%rdi) vpaddw 1344(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1344(%rdi) vpaddw 1376(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1376(%rdi) vpaddw 1408(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1408(%rdi) vpaddw 1440(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1440(%rdi) vpaddw 1472(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1472(%rdi) vpaddw 1504(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1504(%rdi) vpaddw 1536(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1536(%rdi) vpaddw 1568(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1568(%rdi) vpaddw 1600(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1600(%rdi) vpaddw 1632(%rdi), %ymm0, %ymm1 vpsrlw $8, %ymm1, %ymm2 vpand mask_ff(%rip), %ymm1, %ymm1 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_f(%rip), %ymm2, %ymm1 vpsrlw $4, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpand mask_3(%rip), %ymm2, %ymm1 vpsrlw $2, %ymm2, %ymm2 vpaddw %ymm2, %ymm1, %ymm2 vpsubw mask_3(%rip), %ymm2, %ymm14 vpsraw $15, %ymm14, %ymm15 vpandn %ymm14, %ymm15, %ymm1 vpand %ymm15, %ymm2, %ymm14 vpxor %ymm14, %ymm1, %ymm2 vmovdqa %ymm2, 1632(%rdi) movw $0, 1642(%rdi) movw $0, 1644(%rdi) movw $0, 1646(%rdi) movw $0, 1648(%rdi) movw $0, 1650(%rdi) movw $0, 1652(%rdi) movw $0, 1654(%rdi) movw $0, 1656(%rdi) movw $0, 1658(%rdi) movw $0, 1660(%rdi) movw $0, 1662(%rdi) ret