Imported Upstream version 16.11
[deb_dpdk.git] / lib / librte_eal / common / include / arch / x86 / rte_vect.h
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2015 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 #ifndef _RTE_VECT_H_
35 #define _RTE_VECT_H_
36
37 /**
38  * @file
39  *
40  * RTE SSE/AVX related header.
41  */
42
43 #include <stdint.h>
44
45 #if (defined(__ICC) || (__GNUC__ == 4 &&  __GNUC_MINOR__ < 4))
46
47 #ifdef __SSE__
48 #include <xmmintrin.h>
49 #endif
50
51 #ifdef __SSE2__
52 #include <emmintrin.h>
53 #endif
54
55 #ifdef __SSE3__
56 #include <tmmintrin.h>
57 #endif
58
59 #if defined(__SSE4_2__) || defined(__SSE4_1__)
60 #include <smmintrin.h>
61 #endif
62
63 #if defined(__AVX__)
64 #include <immintrin.h>
65 #endif
66
67 #else
68
69 #include <x86intrin.h>
70
71 #endif
72
73 #ifdef __cplusplus
74 extern "C" {
75 #endif
76
77 typedef __m128i xmm_t;
78
79 #define XMM_SIZE        (sizeof(xmm_t))
80 #define XMM_MASK        (XMM_SIZE - 1)
81
82 typedef union rte_xmm {
83         xmm_t    x;
84         uint8_t  u8[XMM_SIZE / sizeof(uint8_t)];
85         uint16_t u16[XMM_SIZE / sizeof(uint16_t)];
86         uint32_t u32[XMM_SIZE / sizeof(uint32_t)];
87         uint64_t u64[XMM_SIZE / sizeof(uint64_t)];
88         double   pd[XMM_SIZE / sizeof(double)];
89 } rte_xmm_t;
90
91 #ifdef __AVX__
92
93 typedef __m256i ymm_t;
94
95 #define YMM_SIZE        (sizeof(ymm_t))
96 #define YMM_MASK        (YMM_SIZE - 1)
97
98 typedef union rte_ymm {
99         ymm_t    y;
100         xmm_t    x[YMM_SIZE / sizeof(xmm_t)];
101         uint8_t  u8[YMM_SIZE / sizeof(uint8_t)];
102         uint16_t u16[YMM_SIZE / sizeof(uint16_t)];
103         uint32_t u32[YMM_SIZE / sizeof(uint32_t)];
104         uint64_t u64[YMM_SIZE / sizeof(uint64_t)];
105         double   pd[YMM_SIZE / sizeof(double)];
106 } rte_ymm_t;
107
108 #endif /* __AVX__ */
109
110 #ifdef RTE_ARCH_I686
111 #define _mm_cvtsi128_si64(a)    \
112 __extension__ ({                \
113         rte_xmm_t m;            \
114         m.x = (a);              \
115         (m.u64[0]);             \
116 })
117 #endif
118
119 /*
120  * Prior to version 12.1 icc doesn't support _mm_set_epi64x.
121  */
122 #if (defined(__ICC) && __ICC < 1210)
123 #define _mm_set_epi64x(a, b)     \
124 __extension__ ({                 \
125         rte_xmm_t m;             \
126         m.u64[0] = b;            \
127         m.u64[1] = a;            \
128         (m.x);                   \
129 })
130 #endif /* (defined(__ICC) && __ICC < 1210) */
131
132 #ifdef __cplusplus
133 }
134 #endif
135
136 #endif /* _RTE_VECT_H_ */