Skip to content

add SSSE3 prep_bilin

François Cartegnie requested to merge fcartegnie/dav1d:prep_bilin into master
mct_bilinear_w4_0_8bpc_c: 187.0
mct_bilinear_w4_0_8bpc_ssse3: 17.6
mct_bilinear_w4_h_8bpc_c: 254.1
mct_bilinear_w4_h_8bpc_ssse3: 18.7
mct_bilinear_w4_hv_8bpc_c: 351.7
mct_bilinear_w4_hv_8bpc_ssse3: 30.3
mct_bilinear_w4_v_8bpc_c: 298.7
mct_bilinear_w4_v_8bpc_ssse3: 22.9
mct_bilinear_w8_0_8bpc_c: 475.9
mct_bilinear_w8_0_8bpc_ssse3: 27.9
mct_bilinear_w8_h_8bpc_c: 561.2
mct_bilinear_w8_h_8bpc_ssse3: 31.4
mct_bilinear_w8_hv_8bpc_c: 785.5
mct_bilinear_w8_hv_8bpc_ssse3: 59.3
mct_bilinear_w8_v_8bpc_c: 611.9
mct_bilinear_w8_v_8bpc_ssse3: 48.7
mct_bilinear_w16_0_8bpc_c: 251.6
mct_bilinear_w16_0_8bpc_ssse3: 75.6
mct_bilinear_w16_h_8bpc_c: 576.7
mct_bilinear_w16_h_8bpc_ssse3: 90.7
mct_bilinear_w16_hv_8bpc_c: 1417.5
mct_bilinear_w16_hv_8bpc_ssse3: 175.8
mct_bilinear_w16_v_8bpc_c: 653.4
mct_bilinear_w16_v_8bpc_ssse3: 90.0
mct_bilinear_w32_0_8bpc_c: 607.2
mct_bilinear_w32_0_8bpc_ssse3: 352.4
mct_bilinear_w32_h_8bpc_c: 1859.9
mct_bilinear_w32_h_8bpc_ssse3: 394.0
mct_bilinear_w32_hv_8bpc_c: 5552.7
mct_bilinear_w32_hv_8bpc_ssse3: 626.3
mct_bilinear_w32_v_8bpc_c: 1985.2
mct_bilinear_w32_v_8bpc_ssse3: 310.9
mct_bilinear_w64_0_8bpc_c: 1300.2
mct_bilinear_w64_0_8bpc_ssse3: 861.9
mct_bilinear_w64_h_8bpc_c: 4205.1
mct_bilinear_w64_h_8bpc_ssse3: 970.3
mct_bilinear_w64_hv_8bpc_c: 13160.2
mct_bilinear_w64_hv_8bpc_ssse3: 1544.2
mct_bilinear_w64_v_8bpc_c: 4380.3
mct_bilinear_w64_v_8bpc_ssse3: 791.3
mct_bilinear_w128_0_8bpc_c: 2674.5
mct_bilinear_w128_0_8bpc_ssse3: 2268.0
mct_bilinear_w128_h_8bpc_c: 9733.3
mct_bilinear_w128_h_8bpc_ssse3: 2404.0
mct_bilinear_w128_hv_8bpc_c: 31408.6
mct_bilinear_w128_hv_8bpc_ssse3: 4259.0
mct_bilinear_w128_v_8bpc_c: 10011.3
mct_bilinear_w128_v_8bpc_ssse3: 2202.8

32 bit

mct_bilinear_w4_0_8bpc_c: 128.9
mct_bilinear_w4_0_8bpc_ssse3: 28.3
mct_bilinear_w4_h_8bpc_c: 217.7
mct_bilinear_w4_h_8bpc_ssse3: 31.4
mct_bilinear_w4_hv_8bpc_c: 402.0
mct_bilinear_w4_hv_8bpc_ssse3: 42.5
mct_bilinear_w4_v_8bpc_c: 232.4
mct_bilinear_w4_v_8bpc_ssse3: 32.9
mct_bilinear_w8_0_8bpc_c: 386.5
mct_bilinear_w8_0_8bpc_ssse3: 40.2
mct_bilinear_w8_h_8bpc_c: 500.4
mct_bilinear_w8_h_8bpc_ssse3: 57.2
mct_bilinear_w8_hv_8bpc_c: 1047.2
mct_bilinear_w8_hv_8bpc_ssse3: 68.1
mct_bilinear_w8_v_8bpc_c: 490.3
mct_bilinear_w8_v_8bpc_ssse3: 53.1
mct_bilinear_w16_0_8bpc_c: 1246.3
mct_bilinear_w16_0_8bpc_ssse3: 90.6
mct_bilinear_w16_h_8bpc_c: 1428.6
mct_bilinear_w16_h_8bpc_ssse3: 105.2
mct_bilinear_w16_hv_8bpc_c: 3143.4
mct_bilinear_w16_hv_8bpc_ssse3: 172.1
mct_bilinear_w16_v_8bpc_c: 1400.4
mct_bilinear_w16_v_8bpc_ssse3: 101.4
mct_bilinear_w32_0_8bpc_c: 5021.7
mct_bilinear_w32_0_8bpc_ssse3: 338.0
mct_bilinear_w32_h_8bpc_c: 6109.5
mct_bilinear_w32_h_8bpc_ssse3: 377.8
mct_bilinear_w32_hv_8bpc_c: 12782.7
mct_bilinear_w32_hv_8bpc_ssse3: 641.9
mct_bilinear_w32_v_8bpc_c: 6007.6
mct_bilinear_w32_v_8bpc_ssse3: 309.2
mct_bilinear_w64_0_8bpc_c: 10515.3
mct_bilinear_w64_0_8bpc_ssse3: 881.7
mct_bilinear_w64_h_8bpc_c: 13361.2
mct_bilinear_w64_h_8bpc_ssse3: 979.3
mct_bilinear_w64_hv_8bpc_c: 29979.2
mct_bilinear_w64_hv_8bpc_ssse3: 1550.9
mct_bilinear_w64_v_8bpc_c: 13335.7
mct_bilinear_w64_v_8bpc_ssse3: 794.0
mct_bilinear_w128_0_8bpc_c: 22702.5
mct_bilinear_w128_0_8bpc_ssse3: 2272.0
mct_bilinear_w128_h_8bpc_c: 30947.2
mct_bilinear_w128_h_8bpc_ssse3: 2488.3
mct_bilinear_w128_hv_8bpc_c: 71520.5
mct_bilinear_w128_hv_8bpc_ssse3: 5261.0
mct_bilinear_w128_v_8bpc_c: 31678.7
mct_bilinear_w128_v_8bpc_ssse3: 3231.7
Edited by François Cartegnie

Merge request reports

Loading