/* Copyright (c) 2017 Evan Nemerson * * Permission is hereby granted, free of charge, to any person * obtaining a copy of this software and associated documentation * files (the "Software"), to deal in the Software without * restriction, including without limitation the rights to use, copy, * modify, merge, publish, distribute, sublicense, and/or sell copies * of the Software, and to permit persons to whom the Software is * furnished to do so, subject to the following conditions: * * The above copyright notice and this permission notice shall be * included in all copies or substantial portions of the Software. * * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE * SOFTWARE. */ #define SIMDE_TESTS_CURRENT_ISAX sse4_2 #include #include static int test_simde_mm_cmpestrs_8(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; int la; simde__m128i b; int lb; int r; } test_vec[8] = { { simde_mm_set_epi8(INT8_C(-105), INT8_C(-116), INT8_C( -45), INT8_C(-102), INT8_C( -3), INT8_C( 92), INT8_C( -99), INT8_C( 100), INT8_C( 30), INT8_C(-115), INT8_C( 82), INT8_C( 84), INT8_C(-106), INT8_C( 66), INT8_C(-107), INT8_C( 116)), 0 , simde_mm_set_epi8(INT8_C( -89), INT8_C( 65), INT8_C( 68), INT8_C( -29), INT8_C(-101), INT8_C( 113), INT8_C( -11), INT8_C( 53), INT8_C( -5), INT8_C( -76), INT8_C( 28), INT8_C(-120), INT8_C( 64), INT8_C( 43), INT8_C(-127), INT8_C( -44)), 2 , 1 }, { simde_mm_set_epi8(INT8_C( 103), INT8_C( 89), INT8_C( 106), INT8_C( -90), INT8_C( 18), INT8_C( 23), INT8_C( 117), INT8_C( 6), INT8_C( -91), INT8_C( -40), INT8_C( 108), INT8_C(-127), INT8_C( -29), INT8_C( -39), INT8_C( 49), INT8_C( -85)), 5 , simde_mm_set_epi8(INT8_C(-104), INT8_C( 100), INT8_C( -73), INT8_C( -23), INT8_C( -48), INT8_C( 87), INT8_C(-118), INT8_C( 66), INT8_C( -75), INT8_C( 35), INT8_C( -1), INT8_C( 111), INT8_C( -30), INT8_C( -6), INT8_C( 10), INT8_C( 91)), 10 , 1 }, { simde_mm_set_epi8(INT8_C( 84), INT8_C( 21), INT8_C( 91), INT8_C( -41), INT8_C( 25), INT8_C( -24), INT8_C( 93), INT8_C(-124), INT8_C( -97), INT8_C( -88), INT8_C( 113), INT8_C( 85), INT8_C( 42), INT8_C( -93), INT8_C( -37), INT8_C( -18)), 8 , simde_mm_set_epi8(INT8_C( 117), INT8_C( -42), INT8_C(-112), INT8_C( -67), INT8_C( -7), INT8_C( -85), INT8_C( -4), INT8_C( 125), INT8_C(-127), INT8_C( -75), INT8_C(-125), INT8_C( 109), INT8_C( 50), INT8_C( -16), INT8_C( 22), INT8_C( 86)), 12 , 1 }, { simde_mm_set_epi8(INT8_C( 109), INT8_C( 78), INT8_C( 15), INT8_C( 113), INT8_C(-118), INT8_C( -55), INT8_C(-119), INT8_C( -4), INT8_C( 29), INT8_C( 32), INT8_C(-107), INT8_C(-117), INT8_C( 79), INT8_C( 29), INT8_C( 126), INT8_C( -75)), 16 , simde_mm_set_epi8(INT8_C( -7), INT8_C( 48), INT8_C( 112), INT8_C( -3), INT8_C( 35), INT8_C( -21), INT8_C( -53), INT8_C(-114), INT8_C( -78), INT8_C( -5), INT8_C( -11), INT8_C( 91), INT8_C( 53), INT8_C( -34), INT8_C( -19), INT8_C( 11)), 8 , 0 }, { simde_mm_set_epi8(INT8_C( 39), INT8_C( 98), INT8_C( -40), INT8_C( -94), INT8_C( -37), INT8_C( -39), INT8_C( -6), INT8_C( -18), INT8_C( -44), INT8_C( 119), INT8_C( -96), INT8_C( 81), INT8_C(-117), INT8_C(-126), INT8_C( 94), INT8_C( -52)), 0 , simde_mm_set_epi8(INT8_C( 52), INT8_C( -46), INT8_C( -6), INT8_C( -85), INT8_C( 63), INT8_C( 85), INT8_C( -29), INT8_C( -39), INT8_C( -42), INT8_C( 92), INT8_C( -15), INT8_C( -6), INT8_C( -75), INT8_C( -86), INT8_C( -68), INT8_C( 108)), 3 , 1 }, { simde_mm_set_epi8(INT8_C( 60), INT8_C( -84), INT8_C( 55), INT8_C( 82), INT8_C( -32), INT8_C( -86), INT8_C( -19), INT8_C( 6), INT8_C( -73), INT8_C( -96), INT8_C( 56), INT8_C(-116), INT8_C( 40), INT8_C( -91), INT8_C( -58), INT8_C( -53)), 5 , simde_mm_set_epi8(INT8_C(-125), INT8_C(-121), INT8_C( 94), INT8_C( -81), INT8_C( 51), INT8_C( -18), INT8_C( 57), INT8_C( 114), INT8_C( 65), INT8_C( 21), INT8_C( 1), INT8_C( 122), INT8_C( -29), INT8_C( -17), INT8_C( 114), INT8_C( 17)), 6 , 1 }, { simde_mm_set_epi8(INT8_C( 7), INT8_C(-112), INT8_C(-109), INT8_C( 25), INT8_C( 65), INT8_C( 3), INT8_C( 18), INT8_C( -17), INT8_C(-117), INT8_C( -64), INT8_C( 123), INT8_C( 112), INT8_C( -54), INT8_C( -32), INT8_C( -28), INT8_C( -54)), 2 , simde_mm_set_epi8(INT8_C( 20), INT8_C( -94), INT8_C( -95), INT8_C( -11), INT8_C( -10), INT8_C( 45), INT8_C( -14), INT8_C(-103), INT8_C(-109), INT8_C(-101), INT8_C( 112), INT8_C( -4), INT8_C( 62), INT8_C(-110), INT8_C( 100), INT8_C( 78)), 14 , 1 }, { simde_mm_set_epi8(INT8_C( 94), INT8_C( -96), INT8_C( -41), INT8_C(-127), INT8_C( 109), INT8_C( -92), INT8_C( 60), INT8_C( 85), INT8_C( -80), INT8_C( -69), INT8_C( -10), INT8_C( 113), INT8_C( -86), INT8_C( 12), INT8_C( -11), INT8_C( 93)), 0 , simde_mm_set_epi8(INT8_C( -1), INT8_C( -87), INT8_C( -78), INT8_C( 26), INT8_C( 30), INT8_C( 110), INT8_C( -36), INT8_C( 70), INT8_C(-126), INT8_C( -29), INT8_C( -65), INT8_C( -41), INT8_C( -71), INT8_C( 1), INT8_C( 121), INT8_C(-119)), 10 , 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpestrs(test_vec[i].a, test_vec[i].la, test_vec[i].b, test_vec[i].lb, 0); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpestrs_16(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; int la; simde__m128i b; int lb; int r; } test_vec[8] = { { simde_mm_set_epi16(INT16_C(-26740), INT16_C(-11366), INT16_C( -676), INT16_C(-25244), INT16_C( 7821), INT16_C( 21076), INT16_C(-27070), INT16_C(-27276)), 6 , simde_mm_set_epi16(INT16_C(-22719), INT16_C( 17635), INT16_C(-25743), INT16_C( -2763), INT16_C( -1100), INT16_C( 7304), INT16_C( 16427), INT16_C(-32300)), 7 , 1 }, { simde_mm_set_epi16(INT16_C( 26457), INT16_C( 27302), INT16_C( 4631), INT16_C( 29958), INT16_C(-23080), INT16_C( 27777), INT16_C( -7207), INT16_C( 12715)), 5 , simde_mm_set_epi16(INT16_C(-26524), INT16_C(-18455), INT16_C(-12201), INT16_C(-30142), INT16_C(-19165), INT16_C( -145), INT16_C( -7430), INT16_C( 2651)), 7 , 1 }, { simde_mm_set_epi16(INT16_C( 21525), INT16_C( 23511), INT16_C( 6632), INT16_C( 23940), INT16_C(-24664), INT16_C( 29013), INT16_C( 10915), INT16_C( -9234)), 5 , simde_mm_set_epi16(INT16_C( 30166), INT16_C(-28483), INT16_C( -1621), INT16_C( -899), INT16_C(-32331), INT16_C(-31891), INT16_C( 13040), INT16_C( 5718)), 6 , 1 }, { simde_mm_set_epi16(INT16_C( 27982), INT16_C( 3953), INT16_C(-30007), INT16_C(-30212), INT16_C( 7456), INT16_C(-27253), INT16_C( 20253), INT16_C( 32437)), 7 , simde_mm_set_epi16(INT16_C( -1744), INT16_C( 28925), INT16_C( 9195), INT16_C(-13426), INT16_C(-19717), INT16_C( -2725), INT16_C( 13790), INT16_C( -4853)), 5 , 1 }, { simde_mm_set_epi16(INT16_C( 10082), INT16_C(-10078), INT16_C( -9255), INT16_C( -1298), INT16_C(-11145), INT16_C(-24495), INT16_C(-29822), INT16_C( 24268)), 2 , simde_mm_set_epi16(INT16_C( 13522), INT16_C( -1365), INT16_C( 16213), INT16_C( -7207), INT16_C(-10660), INT16_C( -3590), INT16_C(-19030), INT16_C(-17300)), 7 , 1 }, { simde_mm_set_epi16(INT16_C( 15532), INT16_C( 14162), INT16_C( -8022), INT16_C( -4858), INT16_C(-18528), INT16_C( 14476), INT16_C( 10405), INT16_C(-14645)), 7 , simde_mm_set_epi16(INT16_C(-31865), INT16_C( 24239), INT16_C( 13294), INT16_C( 14706), INT16_C( 16661), INT16_C( 378), INT16_C( -7185), INT16_C( 29201)), 4 , 1 }, { simde_mm_set_epi16(INT16_C( 1936), INT16_C(-27879), INT16_C( 16643), INT16_C( 4847), INT16_C(-29760), INT16_C( 31600), INT16_C(-13600), INT16_C( -6966)), 7 , simde_mm_set_epi16(INT16_C( 5282), INT16_C(-24075), INT16_C( -2515), INT16_C( -3431), INT16_C(-27749), INT16_C( 28924), INT16_C( 16018), INT16_C( 25678)), 0 , 1 }, { simde_mm_set_epi16(INT16_C( 24224), INT16_C(-10367), INT16_C( 28068), INT16_C( 15445), INT16_C(-20293), INT16_C( -2447), INT16_C(-22004), INT16_C( -2723)), 7 , simde_mm_set_epi16(INT16_C( -87), INT16_C(-19942), INT16_C( 7790), INT16_C( -9146), INT16_C(-32029), INT16_C(-16425), INT16_C(-18175), INT16_C( 31113)), 2 , 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpestrs(test_vec[i].a, test_vec[i].la, test_vec[i].b, test_vec[i].lb, 1); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpestrz_8(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; int la; simde__m128i b; int lb; int r; } test_vec[8] = { { simde_mm_set_epi8(INT8_C( 91), INT8_C( 17), INT8_C( -35), INT8_C( -83), INT8_C( 65), INT8_C( -69), INT8_C( -33), INT8_C( -2), INT8_C( -59), INT8_C( -56), INT8_C( -20), INT8_C(-124), INT8_C( -68), INT8_C( -33), INT8_C( -98), INT8_C( 119)), 9 , simde_mm_set_epi8(INT8_C( -24), INT8_C( 33), INT8_C( 95), INT8_C( 8), INT8_C( 67), INT8_C( -46), INT8_C( 123), INT8_C( -89), INT8_C( -36), INT8_C( 19), INT8_C( -12), INT8_C( 108), INT8_C( 70), INT8_C( -86), INT8_C( 125), INT8_C( 63)), 9 , 1 }, { simde_mm_set_epi8(INT8_C( 31), INT8_C( -36), INT8_C( 70), INT8_C( -37), INT8_C( 120), INT8_C( 70), INT8_C( 10), INT8_C( 73), INT8_C( 94), INT8_C( -22), INT8_C( 117), INT8_C(-123), INT8_C( -97), INT8_C( -97), INT8_C( 94), INT8_C( -19)), 15 , simde_mm_set_epi8(INT8_C(-111), INT8_C( 66), INT8_C( -59), INT8_C( 54), INT8_C( 102), INT8_C(-108), INT8_C(-128), INT8_C(-104), INT8_C( 81), INT8_C( 46), INT8_C(-110), INT8_C( 86), INT8_C( 82), INT8_C( 23), INT8_C( -59), INT8_C( 19)), 1 , 1 }, { simde_mm_set_epi8(INT8_C( 100), INT8_C( 86), INT8_C( 40), INT8_C( -10), INT8_C( -78), INT8_C( 38), INT8_C( 31), INT8_C( 81), INT8_C(-107), INT8_C( 114), INT8_C( 112), INT8_C( 93), INT8_C(-101), INT8_C( 10), INT8_C( 0), INT8_C(-128)), 6 , simde_mm_set_epi8(INT8_C( -95), INT8_C( 81), INT8_C( -72), INT8_C( -74), INT8_C( -66), INT8_C(-106), INT8_C( 76), INT8_C( -42), INT8_C(-123), INT8_C( -44), INT8_C(-103), INT8_C( 44), INT8_C( -40), INT8_C( 125), INT8_C( -32), INT8_C(-115)), 6 , 1 }, { simde_mm_set_epi8(INT8_C( 40), INT8_C( -63), INT8_C( 76), INT8_C( 45), INT8_C(-113), INT8_C( -94), INT8_C( -5), INT8_C( -14), INT8_C( -18), INT8_C( 63), INT8_C( -52), INT8_C( -78), INT8_C(-108), INT8_C( 41), INT8_C( 7), INT8_C( 43)), 0 , simde_mm_set_epi8(INT8_C( -66), INT8_C( 82), INT8_C( 59), INT8_C( 48), INT8_C( 110), INT8_C( 49), INT8_C( 62), INT8_C( -91), INT8_C( -57), INT8_C( 18), INT8_C( 30), INT8_C( 38), INT8_C( -3), INT8_C( -35), INT8_C( -6), INT8_C( -54)), 1 , 1 }, { simde_mm_set_epi8(INT8_C( 76), INT8_C( 37), INT8_C( -49), INT8_C( -67), INT8_C( 68), INT8_C(-123), INT8_C( 61), INT8_C( -77), INT8_C( 82), INT8_C( 19), INT8_C( 13), INT8_C( -91), INT8_C( -17), INT8_C( 115), INT8_C( -42), INT8_C(-127)), 7 , simde_mm_set_epi8(INT8_C( -99), INT8_C( -9), INT8_C( -89), INT8_C( 91), INT8_C(-125), INT8_C( -63), INT8_C( 83), INT8_C( 47), INT8_C( 61), INT8_C(-124), INT8_C( -87), INT8_C( -5), INT8_C( 94), INT8_C( -25), INT8_C( -16), INT8_C( -76)), 6 , 1 }, { simde_mm_set_epi8(INT8_C( -34), INT8_C( -22), INT8_C( -14), INT8_C( -6), INT8_C( -18), INT8_C( 91), INT8_C( -8), INT8_C( 121), INT8_C( 119), INT8_C( 123), INT8_C( 80), INT8_C( 126), INT8_C( -31), INT8_C( -48), INT8_C( 62), INT8_C( -34)), 11 , simde_mm_set_epi8(INT8_C( 31), INT8_C( -81), INT8_C( -83), INT8_C( 83), INT8_C( -41), INT8_C( 100), INT8_C( 3), INT8_C(-110), INT8_C( 111), INT8_C(-115), INT8_C( -38), INT8_C( 116), INT8_C( 30), INT8_C( 34), INT8_C( 109), INT8_C( 42)), 0 , 1 }, { simde_mm_set_epi8(INT8_C( -33), INT8_C(-111), INT8_C( -19), INT8_C(-122), INT8_C( -36), INT8_C( -20), INT8_C( 35), INT8_C( 47), INT8_C(-115), INT8_C( -67), INT8_C( 0), INT8_C( -15), INT8_C( -72), INT8_C( -50), INT8_C( -50), INT8_C( -72)), 8 , simde_mm_set_epi8(INT8_C(-110), INT8_C(-118), INT8_C( 33), INT8_C( 44), INT8_C( 69), INT8_C( -27), INT8_C( -37), INT8_C( -9), INT8_C( 64), INT8_C( -92), INT8_C( 60), INT8_C( 108), INT8_C( 106), INT8_C( 83), INT8_C( -30), INT8_C( 83)), 2 , 1 }, { simde_mm_set_epi8(INT8_C( 77), INT8_C(-108), INT8_C( 64), INT8_C( 98), INT8_C( -64), INT8_C( 49), INT8_C( -82), INT8_C( 37), INT8_C( 71), INT8_C( 88), INT8_C(-109), INT8_C( -84), INT8_C( 109), INT8_C( -36), INT8_C( -4), INT8_C( -89)), 3 , simde_mm_set_epi8(INT8_C( -71), INT8_C( -17), INT8_C( -84), INT8_C( 102), INT8_C( 127), INT8_C( 91), INT8_C( -22), INT8_C( 87), INT8_C( 2), INT8_C(-127), INT8_C( -31), INT8_C(-119), INT8_C( 31), INT8_C( -5), INT8_C( 114), INT8_C( -61)), 6 , 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpestrz(test_vec[i].a, test_vec[i].la, test_vec[i].b, test_vec[i].lb, 0); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpestrz_16(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; int la; simde__m128i b; int lb; int r; } test_vec[8] = { { simde_mm_set_epi16(INT16_C( 23313), INT16_C( -8787), INT16_C( 16827), INT16_C( -8194), INT16_C(-14904), INT16_C( -4988), INT16_C(-17185), INT16_C(-24969)), 8 , simde_mm_set_epi16(INT16_C( -6111), INT16_C( 24328), INT16_C( 17362), INT16_C( 31655), INT16_C( -9197), INT16_C( -2964), INT16_C( 18090), INT16_C( 32063)), 5 , 1 }, { simde_mm_set_epi16(INT16_C( 8156), INT16_C( 18139), INT16_C( 30790), INT16_C( 2633), INT16_C( 24298), INT16_C( 30085), INT16_C(-24673), INT16_C( 24301)), 0 , simde_mm_set_epi16(INT16_C(-28350), INT16_C(-15050), INT16_C( 26260), INT16_C(-32616), INT16_C( 20782), INT16_C(-28074), INT16_C( 21015), INT16_C(-15085)), 2 , 1 }, { simde_mm_set_epi16(INT16_C( 25686), INT16_C( 10486), INT16_C(-19930), INT16_C( 8017), INT16_C(-27278), INT16_C( 28765), INT16_C(-25846), INT16_C( 128)), 8 , simde_mm_set_epi16(INT16_C(-24239), INT16_C(-18250), INT16_C(-16746), INT16_C( 19670), INT16_C(-31276), INT16_C(-26324), INT16_C(-10115), INT16_C( -8051)), 1 , 1 }, { simde_mm_set_epi16(INT16_C( 10433), INT16_C( 19501), INT16_C(-28766), INT16_C( -1038), INT16_C( -4545), INT16_C(-13134), INT16_C(-27607), INT16_C( 1835)), 4 , simde_mm_set_epi16(INT16_C(-16814), INT16_C( 15152), INT16_C( 28209), INT16_C( 16037), INT16_C(-14574), INT16_C( 7718), INT16_C( -547), INT16_C( -1334)), 3 , 1 }, { simde_mm_set_epi16(INT16_C( 19493), INT16_C(-12355), INT16_C( 17541), INT16_C( 15795), INT16_C( 21011), INT16_C( 3493), INT16_C( -4237), INT16_C(-10623)), 2 , simde_mm_set_epi16(INT16_C(-25097), INT16_C(-22693), INT16_C(-31807), INT16_C( 21295), INT16_C( 15748), INT16_C(-22021), INT16_C( 24295), INT16_C( -3916)), 3 , 1 }, { simde_mm_set_epi16(INT16_C( -8470), INT16_C( -3334), INT16_C( -4517), INT16_C( -1927), INT16_C( 30587), INT16_C( 20606), INT16_C( -7728), INT16_C( 16094)), 2 , simde_mm_set_epi16(INT16_C( 8111), INT16_C(-21165), INT16_C(-10396), INT16_C( 914), INT16_C( 28557), INT16_C( -9612), INT16_C( 7714), INT16_C( 27946)), 5 , 1 }, { simde_mm_set_epi16(INT16_C( -8303), INT16_C( -4730), INT16_C( -8980), INT16_C( 9007), INT16_C(-29251), INT16_C( 241), INT16_C(-18226), INT16_C(-12616)), 0 , simde_mm_set_epi16(INT16_C(-28022), INT16_C( 8492), INT16_C( 17893), INT16_C( -9225), INT16_C( 16548), INT16_C( 15468), INT16_C( 27219), INT16_C( -7597)), 4 , 1 }, { simde_mm_set_epi16(INT16_C( 19860), INT16_C( 16482), INT16_C(-16335), INT16_C(-20955), INT16_C( 18264), INT16_C(-27732), INT16_C( 28124), INT16_C( -857)), 1 , simde_mm_set_epi16(INT16_C(-17937), INT16_C(-21402), INT16_C( 32603), INT16_C( -5545), INT16_C( 641), INT16_C( -7799), INT16_C( 8187), INT16_C( 29379)), 0 , 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpestrz(test_vec[i].a, test_vec[i].la, test_vec[i].b, test_vec[i].lb, 1); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpgt_epi64(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; simde__m128i b; simde__m128i r; } test_vec[8] = { { simde_mm_set_epi64x(INT64_C(-2149331112921330677), INT64_C( 3189038460188560982)), simde_mm_set_epi64x(INT64_C( -996047549682722220), INT64_C(-3995545326609437904)), simde_mm_set_epi64x( INT64_C(0), ~INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C( 3213898448913237846), INT64_C( 9188286366666087308)), simde_mm_set_epi64x(INT64_C( 2918885787365950970), INT64_C( 6780053140456787494)), simde_mm_set_epi64x(~INT64_C(0), ~INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C(-6480415937191367948), INT64_C( 6434069133602920016)), simde_mm_set_epi64x(INT64_C( 8054577307931165184), INT64_C( 2226222084862743618)), simde_mm_set_epi64x( INT64_C(0), ~INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C(-6197561420805751907), INT64_C( 4778870285233423339)), simde_mm_set_epi64x(INT64_C( 1839658993612937599), INT64_C( -902367911293731861)), simde_mm_set_epi64x( INT64_C(0), ~INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C( 5091127324004768664), INT64_C(-2002251908801446460)), simde_mm_set_epi64x(INT64_C(-9056506211008935561), INT64_C(-6487933609077704174)), simde_mm_set_epi64x(~INT64_C(0), ~INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C(-4743149223868910453), INT64_C(-4137271544350199785)), simde_mm_set_epi64x(INT64_C( 4762909370147937560), INT64_C( 6560801355595049799)), simde_mm_set_epi64x( INT64_C(0), INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C( 913044205052582612), INT64_C(-2362244502684338485)), simde_mm_set_epi64x(INT64_C( -603710511502052754), INT64_C(-3179203207537477667)), simde_mm_set_epi64x(~INT64_C(0), ~INT64_C(0)) }, { simde_mm_set_epi64x(INT64_C( 6753725813089147170), INT64_C( 7031124288307654085)), simde_mm_set_epi64x(INT64_C( 5046765831366456160), INT64_C( 6981054579474564569)), simde_mm_set_epi64x(~INT64_C(0), ~INT64_C(0)) } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { simde__m128i r = simde_mm_cmpgt_epi64(test_vec[i].a, test_vec[i].b); simde_assert_m128i_i64(r, ==, test_vec[i].r); } return 0; } static int test_simde_mm_cmpistrs_8(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; simde__m128i b; int r; } test_vec[] = { { simde_mm_set_epi8(INT8_C( 25), INT8_C( 54), INT8_C( -66), INT8_C( -16), INT8_C( 66), INT8_C(-116), INT8_C( -35), INT8_C( 78), INT8_C( 107), INT8_C( 11), INT8_C(-110), INT8_C( 90), INT8_C( -2), INT8_C(-109), INT8_C( -34), INT8_C( 53)), simde_mm_set_epi8(INT8_C( -86), INT8_C(-125), INT8_C( -30), INT8_C( 1), INT8_C( 69), INT8_C( -79), INT8_C( -16), INT8_C( 34), INT8_C( 73), INT8_C( 71), INT8_C( -50), INT8_C( -27), INT8_C( -56), INT8_C(-106), INT8_C( -90), INT8_C( 104)), 0 }, { simde_mm_set_epi8(INT8_C(0), INT8_C( -93), INT8_C( -2), INT8_C( -97), INT8_C(-117), INT8_C( -46), INT8_C(-107), INT8_C(-101), INT8_C(-104), INT8_C( -97), INT8_C(-123), INT8_C( -15), INT8_C( 101), INT8_C( 123), INT8_C(-123), INT8_C( -2)), simde_mm_set_epi8(INT8_C( -6), INT8_C( 9), INT8_C( 43), INT8_C(-128), INT8_C( -64), INT8_C( 71), INT8_C( -48), INT8_C( 11), INT8_C( 61), INT8_C( -61), INT8_C( 55), INT8_C(-108), INT8_C( 95), INT8_C( -26), INT8_C( -76), INT8_C( 92)), 1 }, { simde_mm_set_epi8(INT8_C( 74), INT8_C(0), INT8_C( 48), INT8_C( 106), INT8_C( -25), INT8_C( 49), INT8_C( -66), INT8_C( 38), INT8_C( -18), INT8_C(-127), INT8_C( 20), INT8_C( -68), INT8_C( 117), INT8_C(-114), INT8_C( 113), INT8_C( -43)), simde_mm_set_epi8(INT8_C( 19), INT8_C( 27), INT8_C( 69), INT8_C( 3), INT8_C( 75), INT8_C( -73), INT8_C( 19), INT8_C( -16), INT8_C( -20), INT8_C( -75), INT8_C( -47), INT8_C( -90), INT8_C(-126), INT8_C( 82), INT8_C( -85), INT8_C( 65)), 1 }, { simde_mm_set_epi8(INT8_C( -36), INT8_C(-128), INT8_C( 0), INT8_C( -37), INT8_C(-116), INT8_C( 107), INT8_C( -26), INT8_C(-121), INT8_C( -65), INT8_C( 100), INT8_C( 78), INT8_C( 8), INT8_C(-100), INT8_C( -73), INT8_C( -59), INT8_C( -67)), simde_mm_set_epi8(INT8_C(-124), INT8_C( -83), INT8_C( -63), INT8_C( -32), INT8_C( 28), INT8_C( 100), INT8_C( 27), INT8_C( 38), INT8_C( -55), INT8_C( 20), INT8_C( -89), INT8_C( -37), INT8_C( 91), INT8_C( 56), INT8_C( -14), INT8_C( -98)), 1 }, { simde_mm_set_epi8(INT8_C(-111), INT8_C( -83), INT8_C( 125), INT8_C( 0), INT8_C( 53), INT8_C( 48), INT8_C( -61), INT8_C( -87), INT8_C( 65), INT8_C( 121), INT8_C( 71), INT8_C( 10), INT8_C( 118), INT8_C( -63), INT8_C( -96), INT8_C( 9)), simde_mm_set_epi8(INT8_C( -41), INT8_C( -1), INT8_C( -57), INT8_C( 113), INT8_C( 101), INT8_C( 39), INT8_C( 86), INT8_C( 5), INT8_C( 19), INT8_C( -8), INT8_C( 110), INT8_C( 44), INT8_C(-100), INT8_C( -52), INT8_C(-126), INT8_C( -3)), 1 }, { simde_mm_set_epi8(INT8_C( -18), INT8_C( 10), INT8_C( 22), INT8_C( -30), INT8_C( 0), INT8_C( 75), INT8_C( 26), INT8_C( 106), INT8_C( -59), INT8_C(-112), INT8_C( 62), INT8_C( 5), INT8_C( -4), INT8_C( -40), INT8_C( 68), INT8_C( 77)), simde_mm_set_epi8(INT8_C( -23), INT8_C( 71), INT8_C( 21), INT8_C(-100), INT8_C( 36), INT8_C( -96), INT8_C( -10), INT8_C( 20), INT8_C( -22), INT8_C( 110), INT8_C( 98), INT8_C( 67), INT8_C( 12), INT8_C( -74), INT8_C( -50), INT8_C( 32)), 1 }, { simde_mm_set_epi8(INT8_C( 106), INT8_C( -84), INT8_C( 30), INT8_C( 79), INT8_C( 124), INT8_C( 0), INT8_C( -53), INT8_C( -99), INT8_C( -15), INT8_C( 108), INT8_C( -91), INT8_C( 4), INT8_C( 21), INT8_C( 48), INT8_C( 29), INT8_C( -55)), simde_mm_set_epi8(INT8_C( 100), INT8_C( 100), INT8_C( 71), INT8_C( 90), INT8_C( -52), INT8_C( 119), INT8_C( -64), INT8_C(-104), INT8_C( 16), INT8_C( -98), INT8_C( 37), INT8_C( -2), INT8_C( -6), INT8_C( -12), INT8_C( 117), INT8_C( 87)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(0), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(10), INT8_C(0), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(10), INT8_C(-117), INT8_C( 0), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(10), INT8_C(-117), INT8_C( 102), INT8_C( 0), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(10), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( 0), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(20), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( 0), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(50), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( 0), INT8_C( 112), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(60), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 0), INT8_C( 116), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(70), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 0), INT8_C( 39)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 }, { simde_mm_set_epi8(INT8_C( -55), INT8_C( 16), INT8_C( -12), INT8_C(-128), INT8_C( -68), INT8_C( 111), INT8_C(80), INT8_C(-117), INT8_C( 102), INT8_C( -52), INT8_C( -52), INT8_C( -25), INT8_C( -6), INT8_C( 112), INT8_C( 116), INT8_C( 0)), simde_mm_set_epi8(INT8_C( 29), INT8_C( -72), INT8_C( 47), INT8_C( 93), INT8_C( -90), INT8_C( 115), INT8_C( 36), INT8_C( -93), INT8_C( 106), INT8_C( -6), INT8_C( -91), INT8_C( 34), INT8_C( -44), INT8_C( -69), INT8_C( 123), INT8_C( 51)), 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpistrs(test_vec[i].a, test_vec[i].b, 0); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpistrs_16(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; simde__m128i b; int r; } test_vec[] = { { simde_mm_set_epi16(INT16_C( 6454), INT16_C(-16656), INT16_C( 17036), INT16_C( -8882), INT16_C( 27403), INT16_C(-28070), INT16_C( -365), INT16_C( -8651)), simde_mm_set_epi16(INT16_C(-21885), INT16_C( -7679), INT16_C( 17841), INT16_C( -4062), INT16_C( 18759), INT16_C(-12571), INT16_C(-14186), INT16_C(-22936)), 0 }, { simde_mm_set_epi16(INT16_C(0), INT16_C( -353), INT16_C(-29742), INT16_C(-27237), INT16_C(-26465), INT16_C(-31247), INT16_C( 25979), INT16_C(-31234)), simde_mm_set_epi16(INT16_C( -1527), INT16_C( 11136), INT16_C(-16313), INT16_C(-12277), INT16_C( 15811), INT16_C( 14228), INT16_C( 24550), INT16_C(-19364)), 1 }, { simde_mm_set_epi16(INT16_C( 19077), INT16_C( 0), INT16_C( -6351), INT16_C(-16858), INT16_C( -4479), INT16_C( 5308), INT16_C( 30094), INT16_C( 29141)), simde_mm_set_epi16(INT16_C( 4891), INT16_C( 17667), INT16_C( 19383), INT16_C( 5104), INT16_C( -4939), INT16_C(-11866), INT16_C(-32174), INT16_C(-21695)), 1 }, { simde_mm_set_epi16(INT16_C( -9088), INT16_C( -7717), INT16_C(0), INT16_C( -6521), INT16_C(-16540), INT16_C( 19976), INT16_C(-25417), INT16_C(-14915)), simde_mm_set_epi16(INT16_C(-31571), INT16_C(-15904), INT16_C( 7268), INT16_C( 6950), INT16_C(-14060), INT16_C(-22565), INT16_C( 23352), INT16_C( -3426)), 1 }, { simde_mm_set_epi16(INT16_C(-28243), INT16_C( 32023), INT16_C( 13616), INT16_C(0), INT16_C( 16761), INT16_C( 18186), INT16_C( 30401), INT16_C(-24567)), simde_mm_set_epi16(INT16_C(-10241), INT16_C(-14479), INT16_C( 25895), INT16_C( 22021), INT16_C( 5112), INT16_C( 28204), INT16_C(-25396), INT16_C(-32003)), 1 }, { simde_mm_set_epi16(INT16_C( -4608), INT16_C( 5858), INT16_C(-12725), INT16_C( 6762), INT16_C(0), INT16_C( 15877), INT16_C( -808), INT16_C( 17485)), simde_mm_set_epi16(INT16_C( -5817), INT16_C( 5532), INT16_C( 9376), INT16_C( -2540), INT16_C( -5522), INT16_C( 25155), INT16_C( 3254), INT16_C(-12768)), 1 }, { simde_mm_set_epi16(INT16_C( 27308), INT16_C( 7759), INT16_C( 31856), INT16_C(-13411), INT16_C( -3732), INT16_C(0), INT16_C( 5424), INT16_C( 7625)), simde_mm_set_epi16(INT16_C( 25700), INT16_C( 18266), INT16_C(-13193), INT16_C(-16232), INT16_C( 4254), INT16_C( 9726), INT16_C( -1292), INT16_C( 30039)), 1 }, { simde_mm_set_epi16(INT16_C(-14064), INT16_C( -2944), INT16_C(-17297), INT16_C(-26741), INT16_C( 26316), INT16_C(-13081), INT16_C( 0), INT16_C( 29735)), simde_mm_set_epi16(INT16_C( 7608), INT16_C( 12125), INT16_C(-22925), INT16_C( 9379), INT16_C( 27386), INT16_C(-23262), INT16_C(-11077), INT16_C( 31539)), 1 }, { simde_mm_set_epi16(INT16_C(-14064), INT16_C( -2944), INT16_C(-17297), INT16_C(-26741), INT16_C( 26316), INT16_C(-13081), INT16_C( 70), INT16_C( 0)), simde_mm_set_epi16(INT16_C( 7608), INT16_C( 12125), INT16_C(-22925), INT16_C( 9379), INT16_C( 27386), INT16_C(-23262), INT16_C(-11077), INT16_C( 31539)), 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpistrs(test_vec[i].a, test_vec[i].b, 1); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpistrz_8(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; simde__m128i b; int r; } test_vec[] = { { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 0 }, { simde_mm_set_epi8(INT8_C( -20), INT8_C( -41), INT8_C( -11), INT8_C( 77), INT8_C( 7), INT8_C( -34), INT8_C( 46), INT8_C( -70), INT8_C( 58), INT8_C( 42), INT8_C( 57), INT8_C( 56), INT8_C( 69), INT8_C( -64), INT8_C(-121), INT8_C( 96)), simde_mm_set_epi8(INT8_C( 0), INT8_C( -55), INT8_C( -68), INT8_C( 5), INT8_C( 46), INT8_C( 24), INT8_C(-116), INT8_C( -73), INT8_C( 22), INT8_C( -42), INT8_C( -48), INT8_C( 76), INT8_C( 14), INT8_C( 67), INT8_C( 97), INT8_C(-116)), 1 }, { simde_mm_set_epi8(INT8_C( -50), INT8_C( 57), INT8_C( 48), INT8_C(-101), INT8_C( 3), INT8_C( 113), INT8_C( 104), INT8_C(-118), INT8_C( 74), INT8_C( -93), INT8_C( -56), INT8_C( 86), INT8_C( -14), INT8_C( -37), INT8_C( 55), INT8_C( -55)), simde_mm_set_epi8(INT8_C( 119), INT8_C( 0), INT8_C(-110), INT8_C( 99), INT8_C( 83), INT8_C( -37), INT8_C( -75), INT8_C( -18), INT8_C( 109), INT8_C( -9), INT8_C( 40), INT8_C( 86), INT8_C( -54), INT8_C( -27), INT8_C( -52), INT8_C( 75)), 1 }, { simde_mm_set_epi8(INT8_C(-109), INT8_C( 127), INT8_C( -99), INT8_C( -62), INT8_C( 99), INT8_C(-120), INT8_C( 41), INT8_C(-123), INT8_C( -92), INT8_C( 114), INT8_C( 53), INT8_C( 90), INT8_C( -5), INT8_C( -27), INT8_C( 98), INT8_C( -67)), simde_mm_set_epi8(INT8_C( 80), INT8_C( 26), INT8_C( 0), INT8_C(-117), INT8_C( -50), INT8_C( -38), INT8_C( -56), INT8_C( -22), INT8_C( 51), INT8_C( -76), INT8_C( 55), INT8_C( -49), INT8_C( 57), INT8_C( 60), INT8_C( -63), INT8_C(-107)), 1 }, { simde_mm_set_epi8(INT8_C( 21), INT8_C( 6), INT8_C( 94), INT8_C( 46), INT8_C( 20), INT8_C( -10), INT8_C( -62), INT8_C( -7), INT8_C( 32), INT8_C( -63), INT8_C( 113), INT8_C( -62), INT8_C( 0), INT8_C( 63), INT8_C( 77), INT8_C( -53)), simde_mm_set_epi8(INT8_C( 118), INT8_C( 90), INT8_C( 98), INT8_C(0), INT8_C( -82), INT8_C( 25), INT8_C( -11), INT8_C( 94), INT8_C( 100), INT8_C( 3), INT8_C(-109), INT8_C(-117), INT8_C( -61), INT8_C( 100), INT8_C(-120), INT8_C( -94)), 1 }, { simde_mm_set_epi8(INT8_C( 54), INT8_C( -82), INT8_C( 50), INT8_C( 20), INT8_C( -78), INT8_C( 25), INT8_C( -39), INT8_C( 113), INT8_C( -88), INT8_C( -49), INT8_C(-105), INT8_C( 11), INT8_C( 21), INT8_C( -81), INT8_C( -49), INT8_C( 113)), simde_mm_set_epi8(INT8_C( 7), INT8_C( -95), INT8_C( 34), INT8_C( -90), INT8_C( 0), INT8_C( 98), INT8_C( -10), INT8_C( 55), INT8_C( 125), INT8_C( 77), INT8_C( 23), INT8_C( 95), INT8_C( 75), INT8_C( 43), INT8_C( 52), INT8_C( 72)), 1 }, { simde_mm_set_epi8(INT8_C( -47), INT8_C( 15), INT8_C(-110), INT8_C( -19), INT8_C( -43), INT8_C( -27), INT8_C( 31), INT8_C( -52), INT8_C( 95), INT8_C( -61), INT8_C( 75), INT8_C( 103), INT8_C( -10), INT8_C( 24), INT8_C( 91), INT8_C( -50)), simde_mm_set_epi8(INT8_C(-116), INT8_C(-113), INT8_C( 47), INT8_C( -63), INT8_C( 35), INT8_C( 0), INT8_C( 63), INT8_C( 12), INT8_C( 7), INT8_C( 120), INT8_C( -97), INT8_C( 84), INT8_C( 125), INT8_C( -85), INT8_C(-110), INT8_C( -21)), 1 }, { simde_mm_set_epi8(INT8_C( 98), INT8_C( -51), INT8_C( 74), INT8_C( 114), INT8_C(-123), INT8_C( 80), INT8_C( 99), INT8_C( -50), INT8_C( 52), INT8_C( 86), INT8_C( -10), INT8_C( -16), INT8_C(-121), INT8_C( 99), INT8_C(-115), INT8_C( 124)), simde_mm_set_epi8(INT8_C( -84), INT8_C(-104), INT8_C( 72), INT8_C( -97), INT8_C( 90), INT8_C( -38), INT8_C( 0), INT8_C( -55), INT8_C(-118), INT8_C(-106), INT8_C(-109), INT8_C( 101), INT8_C( 87), INT8_C(-102), INT8_C( -96), INT8_C( -13)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 0), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 0), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( 0), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(0), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 0), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 0), INT8_C( -27), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( 0), INT8_C( 27), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 0), INT8_C(-118)), 1 }, { simde_mm_set_epi8(INT8_C( 1), INT8_C( 77), INT8_C( -64), INT8_C(-123), INT8_C( 49), INT8_C( -50), INT8_C( 60), INT8_C( 57), INT8_C( 64), INT8_C( -70), INT8_C( 56), INT8_C( -69), INT8_C(-103), INT8_C( -41), INT8_C( 82), INT8_C( -55)), simde_mm_set_epi8(INT8_C(-103), INT8_C( -36), INT8_C( -57), INT8_C( -38), INT8_C( 108), INT8_C( -48), INT8_C( -86), INT8_C( 99), INT8_C( 115), INT8_C( -51), INT8_C(-105), INT8_C( 30), INT8_C( 95), INT8_C( -27), INT8_C( 27), INT8_C(0)), 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpistrz(test_vec[i].a, test_vec[i].b, 0); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_cmpistrz_16(SIMDE_MUNIT_TEST_ARGS) { const struct { simde__m128i a; simde__m128i b; int r; } test_vec[] = { { simde_mm_set_epi16(INT16_C( 333), INT16_C(-16251), INT16_C( 12750), INT16_C( 15417), INT16_C( 16570), INT16_C( 14523), INT16_C(-26153), INT16_C( 21193)), simde_mm_set_epi16(INT16_C(-26148), INT16_C(-14374), INT16_C( 27856), INT16_C(-21917), INT16_C( 29645), INT16_C(-26850), INT16_C( 24549), INT16_C( 7050)), 0 }, { simde_mm_set_epi16(INT16_C( -4905), INT16_C( -2739), INT16_C( 2014), INT16_C( 11962), INT16_C( 14890), INT16_C( 14648), INT16_C( 17856), INT16_C(-30880)), simde_mm_set_epi16(INT16_C( 0), INT16_C(-17403), INT16_C( 11800), INT16_C(-29513), INT16_C( 5846), INT16_C(-12212), INT16_C( 3651), INT16_C( 24972)), 1 }, { simde_mm_set_epi16(INT16_C(-12743), INT16_C( 12443), INT16_C( 881), INT16_C( 26762), INT16_C( 19107), INT16_C(-14250), INT16_C( -3365), INT16_C( 14281)), simde_mm_set_epi16(INT16_C( 30693), INT16_C(0), INT16_C( 21467), INT16_C(-18962), INT16_C( 28151), INT16_C( 10326), INT16_C(-13595), INT16_C(-13237)), 1 }, { simde_mm_set_epi16(INT16_C(-27777), INT16_C(-25150), INT16_C( 25480), INT16_C( 10629), INT16_C(-23438), INT16_C( 13658), INT16_C( -1051), INT16_C( 25277)), simde_mm_set_epi16(INT16_C( 20506), INT16_C( 31627), INT16_C(0), INT16_C(-14102), INT16_C( 13236), INT16_C( 14287), INT16_C( 14652), INT16_C(-15979)), 1 }, { simde_mm_set_epi16(INT16_C( 5382), INT16_C( 24110), INT16_C( 5366), INT16_C(-15623), INT16_C( 8385), INT16_C( 29122), INT16_C( 63), INT16_C( 19915)), simde_mm_set_epi16(INT16_C( 30208), INT16_C( 25244), INT16_C(-20967), INT16_C( 0), INT16_C( 25603), INT16_C(-27765), INT16_C(-15516), INT16_C(-30558)), 1 }, { simde_mm_set_epi16(INT16_C( 13998), INT16_C( 12820), INT16_C(-19943), INT16_C( -9871), INT16_C(-22321), INT16_C(-26869), INT16_C( 5551), INT16_C(-12431)), simde_mm_set_epi16(INT16_C( 1953), INT16_C( 8870), INT16_C( -1694), INT16_C( -2505), INT16_C( 0), INT16_C( 5983), INT16_C( 19243), INT16_C( 13384)), 1 }, { simde_mm_set_epi16(INT16_C(-12017), INT16_C(-27923), INT16_C(-10779), INT16_C( 8140), INT16_C( 24515), INT16_C( 19303), INT16_C( -2536), INT16_C( 23502)), simde_mm_set_epi16(INT16_C(-29553), INT16_C( 12225), INT16_C( 9080), INT16_C( 16140), INT16_C( 1912), INT16_C(0), INT16_C( 32171), INT16_C(-27925)), 1 }, { simde_mm_set_epi16(INT16_C( 25293), INT16_C( 19058), INT16_C(-31408), INT16_C( 25550), INT16_C( 13398), INT16_C( -2320), INT16_C(-30877), INT16_C(-29316)), simde_mm_set_epi16(INT16_C(-21352), INT16_C( 18591), INT16_C( 23258), INT16_C(-24887), INT16_C(-30058), INT16_C(-27803), INT16_C( 0), INT16_C(-24333)), 1 }, { simde_mm_set_epi16(INT16_C( 25293), INT16_C( 19058), INT16_C(-31408), INT16_C( 25550), INT16_C( 13398), INT16_C( -2320), INT16_C(-30877), INT16_C(-29316)), simde_mm_set_epi16(INT16_C(-21352), INT16_C( 18591), INT16_C( 23258), INT16_C(-24887), INT16_C(-30058), INT16_C(-27803), INT16_C( 870), INT16_C(0)), 1 } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) { int r = simde_mm_cmpistrz(test_vec[i].a, test_vec[i].b, 1); simde_assert_equal_i(r, test_vec[i].r); } return 0; } static int test_simde_mm_crc32_u8 (SIMDE_MUNIT_TEST_ARGS) { static const struct { uint32_t crc; uint8_t v; uint32_t r; } test_vec[] = { { UINT32_C(3488119326), UINT8_C(233), UINT32_C( 661382116) }, { UINT32_C(4181338815), UINT8_C(106), UINT32_C(3873165213) }, { UINT32_C(3611029619), UINT8_C(190), UINT32_C(2087866855) }, { UINT32_C(3633137044), UINT8_C(206), UINT32_C( 975142830) }, { UINT32_C(3701195429), UINT8_C( 59), UINT32_C(1041029362) }, { UINT32_C(1574265292), UINT8_C( 54), UINT32_C(2563871276) }, { UINT32_C( 464550963), UINT8_C( 75), UINT32_C(4217027774) }, { UINT32_C(3547716249), UINT8_C(211), UINT32_C( 709509214) } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])) ; i++) { uint32_t crc = test_vec[i].crc; uint8_t v = test_vec[i].v; uint32_t r = simde_mm_crc32_u8(crc, v); simde_assert_equal_u32(r, test_vec[i].r); } return 0; } static int test_simde_mm_crc32_u16 (SIMDE_MUNIT_TEST_ARGS) { static const struct { uint32_t crc; uint16_t v; uint32_t r; } test_vec[] = { { UINT32_C( 728173782), UINT16_C(58051), UINT32_C( 765801584) }, { UINT32_C(2531395991), UINT16_C(57124), UINT32_C(2048446530) }, { UINT32_C( 297646163), UINT16_C( 4793), UINT32_C( 145203338) }, { UINT32_C(4018813906), UINT16_C( 4093), UINT32_C(1871435995) }, { UINT32_C(1176812284), UINT16_C(48677), UINT32_C(1916618632) }, { UINT32_C(1019935701), UINT16_C(36390), UINT32_C( 873790012) }, { UINT32_C( 26721567), UINT16_C(47956), UINT32_C(1883589466) }, { UINT32_C(2658379744), UINT16_C(11705), UINT32_C(2809192825) } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])) ; i++) { uint32_t crc = test_vec[i].crc; uint16_t v = test_vec[i].v; uint32_t r = simde_mm_crc32_u16(crc, v); simde_assert_equal_u32(r, test_vec[i].r); } return 0; } static int test_simde_mm_crc32_u32 (SIMDE_MUNIT_TEST_ARGS) { static const struct { uint32_t crc; uint32_t v; uint32_t r; } test_vec[] = { { UINT32_C(2436525653), UINT32_C(2335302948), UINT32_C(3283443050) }, { UINT32_C(1145760123), UINT32_C(3888075817), UINT32_C(1275307424) }, { UINT32_C(1404614118), UINT32_C(1676357820), UINT32_C(2140092727) }, { UINT32_C( 546365338), UINT32_C(2107344167), UINT32_C(3150313630) }, { UINT32_C( 386848243), UINT32_C( 899891386), UINT32_C(3310319573) }, { UINT32_C(1383787817), UINT32_C( 674838849), UINT32_C(4185068584) }, { UINT32_C(2877026799), UINT32_C(3155060257), UINT32_C(1654064964) }, { UINT32_C(1826397765), UINT32_C( 401176356), UINT32_C(1688688127) } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])) ; i++) { uint32_t crc = test_vec[i].crc; uint32_t v = test_vec[i].v; uint32_t r = simde_mm_crc32_u32(crc, v); simde_assert_equal_u32(r, test_vec[i].r); } return 0; } static int test_simde_mm_crc32_u64 (SIMDE_MUNIT_TEST_ARGS) { static const struct { uint64_t crc; uint64_t v; uint64_t r; } test_vec[] = { { UINT64_C(10964460371209988374), UINT64_C(14849487482734297659), UINT64_C( 2530609228) }, { UINT64_C(14906864906438122131), UINT64_C(10579630055528908036), UINT64_C( 2336937406) }, { UINT64_C( 8450238593151902479), UINT64_C(14846135117717324041), UINT64_C( 2389161291) }, { UINT64_C(15754071801993691947), UINT64_C(17187741549636385145), UINT64_C( 2628533589) }, { UINT64_C(17686444891285660866), UINT64_C(12477846746303524896), UINT64_C( 1813528429) }, { UINT64_C( 3308212454223314746), UINT64_C( 1686784245036627611), UINT64_C( 721365030) }, { UINT64_C( 157211343182889549), UINT64_C(14854147642213948918), UINT64_C( 1805070678) }, { UINT64_C( 7018798198485263495), UINT64_C( 9253000792826939901), UINT64_C( 1576406668) } }; for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])) ; i++) { uint64_t crc = test_vec[i].crc; uint64_t v = test_vec[i].v; uint64_t r = simde_mm_crc32_u64(crc, v); simde_assert_equal_u64(r, test_vec[i].r); } return 0; } SIMDE_TEST_FUNC_LIST_BEGIN SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpestrs_8) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpestrs_16) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpestrz_8) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpestrz_16) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpgt_epi64) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpistrs_8) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpistrs_16) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpistrz_8) SIMDE_TEST_FUNC_LIST_ENTRY(mm_cmpistrz_16) SIMDE_TEST_FUNC_LIST_ENTRY(mm_crc32_u8) SIMDE_TEST_FUNC_LIST_ENTRY(mm_crc32_u16) SIMDE_TEST_FUNC_LIST_ENTRY(mm_crc32_u32) SIMDE_TEST_FUNC_LIST_ENTRY(mm_crc32_u64) SIMDE_TEST_FUNC_LIST_END #include