classify: fix typo in AVX-512 find entry
[vpp.git] / src / vnet / classify / vnet_classify.h
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 #ifndef __included_vnet_classify_h__
16 #define __included_vnet_classify_h__
17
18 #include <vnet/vnet.h>
19 #include <vnet/api_errno.h>     /* for API error numbers */
20
21 #include <vppinfra/error.h>
22 #include <vppinfra/hash.h>
23 #include <vppinfra/cache.h>
24 #include <vppinfra/crc32.h>
25 #include <vppinfra/xxhash.h>
26
27 extern vlib_node_registration_t ip4_classify_node;
28 extern vlib_node_registration_t ip6_classify_node;
29
30 #define CLASSIFY_TRACE 0
31
32 /*
33  * Classify table option to process packets
34  *  CLASSIFY_FLAG_USE_CURR_DATA:
35  *   - classify packets starting from VPP node’s current data pointer
36  */
37 typedef enum vnet_classify_flags_t_
38 {
39   CLASSIFY_FLAG_NONE = 0,
40   CLASSIFY_FLAG_USE_CURR_DATA = (1 << 0),
41 } __clib_packed vnet_classify_flags_t;
42
43 /*
44  * Classify session action
45  *  CLASSIFY_ACTION_SET_IP4_FIB_INDEX:
46  *   - Classified IP packets will be looked up
47  *     from the specified ipv4 fib table
48  *  CLASSIFY_ACTION_SET_IP6_FIB_INDEX:
49  *   - Classified IP packets will be looked up
50  *     from the specified ipv6 fib table
51  */
52 typedef enum vnet_classify_action_t_
53 {
54   CLASSIFY_ACTION_NONE = 0,
55   CLASSIFY_ACTION_SET_IP4_FIB_INDEX = 1,
56   CLASSIFY_ACTION_SET_IP6_FIB_INDEX = 2,
57   CLASSIFY_ACTION_SET_METADATA = 3,
58 } __clib_packed vnet_classify_action_t;
59
60 struct _vnet_classify_main;
61 typedef struct _vnet_classify_main vnet_classify_main_t;
62
63 #define foreach_size_in_u32x4                   \
64 _(1)                                            \
65 _(2)                                            \
66 _(3)                                            \
67 _(4)                                            \
68 _(5)
69
70 typedef struct _vnet_classify_entry
71 {
72   /* put into vnet_buffer(b)->l2_classfy.opaque_index */
73   union
74   {
75     struct
76     {
77       u32 opaque_index;
78       /* advance on hit, note it's a signed quantity... */
79       i32 advance;
80     };
81     u64 opaque_count;
82   };
83   /* Hit counter */
84   union
85   {
86     u64 hits;
87     struct _vnet_classify_entry *next_free;
88   };
89   /* last heard time */
90   f64 last_heard;
91
92   /* Really only need 1 bit */
93   u8 flags;
94 #define VNET_CLASSIFY_ENTRY_FREE        (1<<0)
95
96   vnet_classify_action_t action;
97   u16 metadata;
98   /* Graph node next index */
99   u32 next_index;
100
101   /* Must be aligned to a 16-octet boundary */
102   u32x4 key[0];
103 } vnet_classify_entry_t;
104
105 /**
106  * Check there's no padding in the entry. the key lies on a 16 byte boundary.
107  */
108 STATIC_ASSERT_OFFSET_OF (vnet_classify_entry_t, key, 32);
109
110 static inline int
111 vnet_classify_entry_is_free (vnet_classify_entry_t * e)
112 {
113   return e->flags & VNET_CLASSIFY_ENTRY_FREE;
114 }
115
116 static inline int
117 vnet_classify_entry_is_busy (vnet_classify_entry_t * e)
118 {
119   return ((e->flags & VNET_CLASSIFY_ENTRY_FREE) == 0);
120 }
121
122 /* Need these to con the vector allocator */
123 #define _(size)                                                               \
124   typedef struct                                                              \
125   {                                                                           \
126     vnet_classify_entry_t e;                                                  \
127     u32x4 key[size];                                                          \
128   } __clib_packed vnet_classify_entry_##size##_t;
129 foreach_size_in_u32x4;
130 #undef _
131
132 typedef struct
133 {
134   union
135   {
136     struct
137     {
138       u32 offset;
139       u8 linear_search;
140       u8 pad[2];
141       u8 log2_pages;
142     };
143     u64 as_u64;
144   };
145 } vnet_classify_bucket_t;
146
147 typedef struct
148 {
149   CLIB_CACHE_LINE_ALIGN_MARK (cacheline0);
150   /* hash Buckets */
151   vnet_classify_bucket_t *buckets;
152
153   /* Private allocation arena, protected by the writer lock,
154    * where the entries are stored. */
155   void *mheap;
156
157   /* User/client data associated with the table */
158   uword user_ctx;
159
160   u32 nbuckets;
161   u32 log2_nbuckets;
162   u32 entries_per_page;
163   u32 skip_n_vectors;
164   u32 match_n_vectors;
165   u16 load_mask;
166
167   /* Index of next table to try */
168   u32 next_table_index;
169
170   /* packet offsets */
171   i16 current_data_offset;
172   vnet_classify_flags_t current_data_flag;
173   /* Miss next index, return if next_table_index = 0 */
174   u32 miss_next_index;
175
176   /**
177    * All members accessed in the DP above here
178    */
179   CLIB_CACHE_LINE_ALIGN_MARK (cacheline1);
180
181   /* Config parameters */
182   u32 linear_buckets;
183   u32 active_elements;
184   u32 data_offset;
185
186   /* Per-bucket working copies, one per thread */
187   vnet_classify_entry_t **working_copies;
188   int *working_copy_lengths;
189   vnet_classify_bucket_t saved_bucket;
190
191   /* Free entry freelists */
192   vnet_classify_entry_t **freelists;
193
194   /* Writer (only) lock for this table */
195   clib_spinlock_t writer_lock;
196
197   CLIB_CACHE_LINE_ALIGN_MARK (cacheline2);
198   /* Mask to apply after skipping N vectors */
199   union
200   {
201     u32x4 mask[8];
202     u32 mask_u32[32];
203   };
204
205 } vnet_classify_table_t;
206
207 /**
208  * Ensure DP fields don't spill over to cache-line 2
209  */
210 STATIC_ASSERT_OFFSET_OF (vnet_classify_table_t, cacheline1,
211                          CLIB_CACHE_LINE_BYTES);
212
213 /**
214  * The vector size for the classifier
215  *  in the add/del table 'match' is the number of vectors of this size
216  */
217 #define VNET_CLASSIFY_VECTOR_SIZE                                             \
218   sizeof (((vnet_classify_table_t *) 0)->mask[0])
219
220 struct _vnet_classify_main
221 {
222   /* Table pool */
223   vnet_classify_table_t *tables;
224
225   /* Registered next-index, opaque unformat fcns */
226   unformat_function_t **unformat_l2_next_index_fns;
227   unformat_function_t **unformat_ip_next_index_fns;
228   unformat_function_t **unformat_acl_next_index_fns;
229   unformat_function_t **unformat_policer_next_index_fns;
230   unformat_function_t **unformat_opaque_index_fns;
231
232   /* Per-interface filter table.  [0] is used for pcap */
233   u32 *classify_table_index_by_sw_if_index;
234
235   /* convenience variables */
236   vlib_main_t *vlib_main;
237   vnet_main_t *vnet_main;
238 };
239
240 extern vnet_classify_main_t vnet_classify_main;
241
242 u8 *format_classify_table (u8 * s, va_list * args);
243 u8 *format_vnet_classify_table (u8 *s, va_list *args);
244
245 u64 vnet_classify_hash_packet (vnet_classify_table_t * t, u8 * h);
246
247 static_always_inline vnet_classify_table_t *
248 vnet_classify_table_get (u32 table_index)
249 {
250   vnet_classify_main_t *vcm = &vnet_classify_main;
251
252   return (pool_elt_at_index (vcm->tables, table_index));
253 }
254
255 static inline u64
256 vnet_classify_hash_packet_inline (vnet_classify_table_t *t, const u8 *h)
257 {
258   u64 xor_sum;
259   ASSERT (t);
260   h += t->skip_n_vectors * 16;
261
262 #if defined(CLIB_HAVE_VEC512) && defined(CLIB_HAVE_VEC512_MASK_LOAD_STORE)
263   u64x8 xor_sum_x8, *mask = (u64x8 *) t->mask;
264   u16 load_mask = t->load_mask;
265   u64x8u *data = (u64x8u *) h;
266
267   xor_sum_x8 = u64x8_mask_load_zero (data, load_mask) & mask[0];
268
269   if (PREDICT_FALSE (load_mask >> 8))
270     xor_sum_x8 ^= u64x8_mask_load_zero (data + 1, load_mask >> 8) & mask[1];
271
272   xor_sum_x8 ^= u64x8_align_right (xor_sum_x8, xor_sum_x8, 4);
273   xor_sum_x8 ^= u64x8_align_right (xor_sum_x8, xor_sum_x8, 2);
274   xor_sum = xor_sum_x8[0] ^ xor_sum_x8[1];
275 #elif defined(CLIB_HAVE_VEC256) && defined(CLIB_HAVE_VEC256_MASK_LOAD_STORE)
276   u64x4 xor_sum_x4, *mask = (u64x4 *) t->mask;
277   u16 load_mask = t->load_mask;
278   u64x4u *data = (u64x4u *) h;
279
280   xor_sum_x4 = u64x4_mask_load_zero (data, load_mask) & mask[0];
281   xor_sum_x4 ^= u64x4_mask_load_zero (data + 1, load_mask >> 4) & mask[1];
282
283   if (PREDICT_FALSE (load_mask >> 8))
284     xor_sum_x4 ^= u64x4_mask_load_zero (data + 2, load_mask >> 8) & mask[2];
285
286   xor_sum_x4 ^= u64x4_align_right (xor_sum_x4, xor_sum_x4, 2);
287   xor_sum = xor_sum_x4[0] ^ xor_sum_x4[1];
288 #elif defined(CLIB_HAVE_VEC128)
289   u64x2 *mask = (u64x2 *) t->mask;
290   u64x2u *data = (u64x2u *) h;
291   u64x2 xor_sum_x2;
292
293   xor_sum_x2 = data[0] & mask[0];
294
295   switch (t->match_n_vectors)
296     {
297     case 5:
298       xor_sum_x2 ^= data[4] & mask[4];
299       /* FALLTHROUGH */
300     case 4:
301       xor_sum_x2 ^= data[3] & mask[3];
302       /* FALLTHROUGH */
303     case 3:
304       xor_sum_x2 ^= data[2] & mask[2];
305       /* FALLTHROUGH */
306     case 2:
307       xor_sum_x2 ^= data[1] & mask[1];
308       /* FALLTHROUGH */
309     case 1:
310       break;
311     default:
312       abort ();
313     }
314   xor_sum = xor_sum_x2[0] ^ xor_sum_x2[1];
315 #else
316   u64 *data = (u64 *) h;
317   u64 *mask = (u64 *) t->mask;
318
319   xor_sum = (data[0] & mask[0]) ^ (data[1] & mask[1]);
320
321   switch (t->match_n_vectors)
322     {
323     case 5:
324       xor_sum ^= (data[8] & mask[8]) ^ (data[9] & mask[9]);
325       /* FALLTHROUGH */
326     case 4:
327       xor_sum ^= (data[6] & mask[6]) ^ (data[7] & mask[7]);
328       /* FALLTHROUGH */
329     case 3:
330       xor_sum ^= (data[4] & mask[4]) ^ (data[5] & mask[5]);
331       /* FALLTHROUGH */
332     case 2:
333       xor_sum ^= (data[2] & mask[2]) ^ (data[3] & mask[3]);
334       /* FALLTHROUGH */
335     case 1:
336       break;
337
338     default:
339       abort ();
340     }
341 #endif /* CLIB_HAVE_VEC128 */
342
343 #ifdef clib_crc32c_uses_intrinsics
344   return clib_crc32c ((u8 *) & xor_sum, sizeof (xor_sum));
345 #else
346   return clib_xxhash (xor_sum);
347 #endif
348 }
349
350 static inline void
351 vnet_classify_prefetch_bucket (vnet_classify_table_t * t, u64 hash)
352 {
353   u32 bucket_index;
354
355   ASSERT (is_pow2 (t->nbuckets));
356
357   bucket_index = hash & (t->nbuckets - 1);
358
359   clib_prefetch_load (&t->buckets[bucket_index]);
360 }
361
362 static inline vnet_classify_entry_t *
363 vnet_classify_get_entry (vnet_classify_table_t * t, uword offset)
364 {
365   u8 *hp = clib_mem_get_heap_base (t->mheap);
366   u8 *vp = hp + offset;
367
368   return (vnet_classify_entry_t *) vp;
369 }
370
371 static inline uword
372 vnet_classify_get_offset (vnet_classify_table_t * t,
373                           vnet_classify_entry_t * v)
374 {
375   u8 *hp, *vp;
376
377   hp = (u8 *) clib_mem_get_heap_base (t->mheap);
378   vp = (u8 *) v;
379
380   ASSERT ((vp - hp) < 0x100000000ULL);
381   return vp - hp;
382 }
383
384 static inline vnet_classify_entry_t *
385 vnet_classify_entry_at_index (vnet_classify_table_t * t,
386                               vnet_classify_entry_t * e, u32 index)
387 {
388   u8 *eu8;
389
390   eu8 = (u8 *) e;
391
392   eu8 += index * (sizeof (vnet_classify_entry_t) +
393                   (t->match_n_vectors * sizeof (u32x4)));
394
395   return (vnet_classify_entry_t *) eu8;
396 }
397
398 static inline void
399 vnet_classify_prefetch_entry (vnet_classify_table_t * t, u64 hash)
400 {
401   u32 bucket_index;
402   u32 value_index;
403   vnet_classify_bucket_t *b;
404   vnet_classify_entry_t *e;
405
406   bucket_index = hash & (t->nbuckets - 1);
407
408   b = &t->buckets[bucket_index];
409
410   if (b->offset == 0)
411     return;
412
413   hash >>= t->log2_nbuckets;
414
415   e = vnet_classify_get_entry (t, b->offset);
416   value_index = hash & ((1 << b->log2_pages) - 1);
417
418   e = vnet_classify_entry_at_index (t, e, value_index);
419
420   clib_prefetch_load (e);
421 }
422
423 vnet_classify_entry_t *vnet_classify_find_entry (vnet_classify_table_t * t,
424                                                  u8 * h, u64 hash, f64 now);
425
426 static_always_inline int
427 vnet_classify_entry_is_equal (vnet_classify_entry_t *v, const u8 *d, u8 *m,
428                               u32 match_n_vectors, u16 load_mask)
429 {
430 #if defined(CLIB_HAVE_VEC512) && defined(CLIB_HAVE_VEC512_MASK_LOAD_STORE)
431   u64x8 r, *mask = (u64x8 *) m;
432   u64x8u *data = (u64x8u *) d;
433   u64x8 *key = (u64x8 *) v->key;
434
435   r = (u64x8_mask_load_zero (data, load_mask) & mask[0]) ^
436       u64x8_mask_load_zero (key, load_mask);
437   load_mask >>= 8;
438
439   if (PREDICT_FALSE (load_mask))
440     r |= (u64x8_mask_load_zero (data + 1, load_mask) & mask[1]) ^
441          u64x8_mask_load_zero (key + 1, load_mask);
442
443   if (u64x8_is_all_zero (r))
444     return 1;
445
446 #elif defined(CLIB_HAVE_VEC256) && defined(CLIB_HAVE_VEC256_MASK_LOAD_STORE)
447   u64x4 r, *mask = (u64x4 *) m;
448   u64x4u *data = (u64x4u *) d;
449   u64x4 *key = (u64x4 *) v->key;
450
451   r = (u64x4_mask_load_zero (data, load_mask) & mask[0]) ^
452       u64x4_mask_load_zero (key, load_mask);
453   load_mask >>= 4;
454
455   r |= (u64x4_mask_load_zero (data + 1, load_mask) & mask[1]) ^
456        u64x4_mask_load_zero (key + 1, load_mask);
457   load_mask >>= 4;
458
459   if (PREDICT_FALSE (load_mask))
460     r |= (u64x4_mask_load_zero (data + 2, load_mask) & mask[2]) ^
461          u64x4_mask_load_zero (key + 2, load_mask);
462
463   if (u64x4_is_all_zero (r))
464     return 1;
465
466 #elif defined(CLIB_HAVE_VEC128)
467   u64x2u *data = (u64x2 *) d;
468   u64x2 *key = (u64x2 *) v->key;
469   u64x2 *mask = (u64x2 *) m;
470   u64x2 r;
471
472   r = (data[0] & mask[0]) ^ key[0];
473   switch (match_n_vectors)
474     {
475     case 5:
476       r |= (data[4] & mask[4]) ^ key[4];
477       /* fall through */
478     case 4:
479       r |= (data[3] & mask[3]) ^ key[3];
480       /* fall through */
481     case 3:
482       r |= (data[2] & mask[2]) ^ key[2];
483       /* fall through */
484     case 2:
485       r |= (data[1] & mask[1]) ^ key[1];
486       /* fall through */
487     case 1:
488       break;
489     default:
490       abort ();
491     }
492
493   if (u64x2_is_all_zero (r))
494     return 1;
495
496 #else
497   u64 *data = (u64 *) d;
498   u64 *key = (u64 *) v->key;
499   u64 *mask = (u64 *) m;
500   u64 r;
501
502   r = ((data[0] & mask[0]) ^ key[0]) | ((data[1] & mask[1]) ^ key[1]);
503   switch (match_n_vectors)
504     {
505     case 5:
506       r |= ((data[8] & mask[8]) ^ key[8]) | ((data[9] & mask[9]) ^ key[9]);
507       /* fall through */
508     case 4:
509       r |= ((data[6] & mask[6]) ^ key[6]) | ((data[7] & mask[7]) ^ key[7]);
510       /* fall through */
511     case 3:
512       r |= ((data[4] & mask[4]) ^ key[4]) | ((data[5] & mask[5]) ^ key[5]);
513       /* fall through */
514     case 2:
515       r |= ((data[2] & mask[2]) ^ key[2]) | ((data[3] & mask[3]) ^ key[3]);
516       /* fall through */
517     case 1:
518       break;
519     default:
520       abort ();
521     }
522
523   if (r == 0)
524     return 1;
525
526 #endif /* CLIB_HAVE_VEC128 */
527   return 0;
528 }
529
530 static inline vnet_classify_entry_t *
531 vnet_classify_find_entry_inline (vnet_classify_table_t *t, const u8 *h,
532                                  u64 hash, f64 now)
533 {
534   vnet_classify_entry_t *v;
535   vnet_classify_bucket_t *b;
536   u32 bucket_index, limit, pages, match_n_vectors = t->match_n_vectors;
537   u16 load_mask = t->load_mask;
538   u8 *mask = (u8 *) t->mask;
539   int i;
540
541   bucket_index = hash & (t->nbuckets - 1);
542   b = &t->buckets[bucket_index];
543
544   if (b->offset == 0)
545     return 0;
546
547   pages = 1 << b->log2_pages;
548   v = vnet_classify_get_entry (t, b->offset);
549   limit = t->entries_per_page;
550   if (PREDICT_FALSE (b->linear_search))
551     {
552       limit *= pages;
553       v = vnet_classify_entry_at_index (t, v, 0);
554     }
555   else
556     {
557       hash >>= t->log2_nbuckets;
558       v = vnet_classify_entry_at_index (t, v, hash & (pages - 1));
559     }
560
561   h += t->skip_n_vectors * 16;
562
563   for (i = 0; i < limit; i++)
564     {
565       if (vnet_classify_entry_is_equal (v, h, mask, match_n_vectors,
566                                         load_mask))
567         {
568           if (PREDICT_TRUE (now))
569             {
570               v->hits++;
571               v->last_heard = now;
572             }
573           return (v);
574         }
575       v = vnet_classify_entry_at_index (t, v, 1);
576     }
577   return 0;
578 }
579
580 vnet_classify_table_t *vnet_classify_new_table (vnet_classify_main_t *cm,
581                                                 const u8 *mask, u32 nbuckets,
582                                                 u32 memory_size,
583                                                 u32 skip_n_vectors,
584                                                 u32 match_n_vectors);
585
586 int vnet_classify_add_del_session (vnet_classify_main_t *cm, u32 table_index,
587                                    const u8 *match, u32 hit_next_index,
588                                    u32 opaque_index, i32 advance, u8 action,
589                                    u16 metadata, int is_add);
590
591 int vnet_classify_add_del_table (vnet_classify_main_t *cm, const u8 *mask,
592                                  u32 nbuckets, u32 memory_size, u32 skip,
593                                  u32 match, u32 next_table_index,
594                                  u32 miss_next_index, u32 *table_index,
595                                  u8 current_data_flag, i16 current_data_offset,
596                                  int is_add, int del_chain);
597 void vnet_classify_delete_table_index (vnet_classify_main_t *cm,
598                                        u32 table_index, int del_chain);
599
600 unformat_function_t unformat_ip4_mask;
601 unformat_function_t unformat_ip6_mask;
602 unformat_function_t unformat_l3_mask;
603 unformat_function_t unformat_l2_mask;
604 unformat_function_t unformat_classify_mask;
605 unformat_function_t unformat_l2_next_index;
606 unformat_function_t unformat_ip_next_index;
607 unformat_function_t unformat_ip4_match;
608 unformat_function_t unformat_ip6_match;
609 unformat_function_t unformat_l3_match;
610 unformat_function_t unformat_l4_match;
611 unformat_function_t unformat_vlan_tag;
612 unformat_function_t unformat_l2_match;
613 unformat_function_t unformat_classify_match;
614
615 void vnet_classify_register_unformat_ip_next_index_fn
616   (unformat_function_t * fn);
617
618 void vnet_classify_register_unformat_l2_next_index_fn
619   (unformat_function_t * fn);
620
621 void vnet_classify_register_unformat_acl_next_index_fn
622   (unformat_function_t * fn);
623
624 void vnet_classify_register_unformat_policer_next_index_fn
625   (unformat_function_t * fn);
626
627 void vnet_classify_register_unformat_opaque_index_fn (unformat_function_t *
628                                                       fn);
629
630 u32 classify_get_pcap_chain (vnet_classify_main_t * cm, u32 sw_if_index);
631 void classify_set_pcap_chain (vnet_classify_main_t * cm,
632                               u32 sw_if_index, u32 table_index);
633
634 u32 classify_get_trace_chain (void);
635 void classify_set_trace_chain (vnet_classify_main_t * cm, u32 table_index);
636
637 u32 classify_sort_table_chain (vnet_classify_main_t * cm, u32 table_index);
638 u32 classify_lookup_chain (u32 table_index,
639                            u8 * mask, u32 n_skip, u32 n_match);
640
641 #endif /* __included_vnet_classify_h__ */
642
643 /*
644  * fd.io coding-style-patch-verification: ON
645  *
646  * Local Variables:
647  * eval: (c-set-style "gnu")
648  * End:
649  */