VPP-117: Add trace to ip4 and ip6 lookup nodes
[vpp.git] / vnet / vnet / ip / ip6.h
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 /*
16  * ip/ip6.h: ip6 main include file
17  *
18  * Copyright (c) 2008 Eliot Dresselhaus
19  *
20  * Permission is hereby granted, free of charge, to any person obtaining
21  * a copy of this software and associated documentation files (the
22  * "Software"), to deal in the Software without restriction, including
23  * without limitation the rights to use, copy, modify, merge, publish,
24  * distribute, sublicense, and/or sell copies of the Software, and to
25  * permit persons to whom the Software is furnished to do so, subject to
26  * the following conditions:
27  *
28  * The above copyright notice and this permission notice shall be
29  * included in all copies or substantial portions of the Software.
30  *
31  *  THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
32  *  EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
33  *  MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
34  *  NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
35  *  LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
36  *  OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
37  *  WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
38  */
39
40 #ifndef included_ip_ip6_h
41 #define included_ip_ip6_h
42
43 #include <vlib/mc.h>
44 #include <vnet/ip/ip6_packet.h>
45 #include <vnet/ip/ip6_hop_by_hop_packet.h>
46 #include <vnet/ip/lookup.h>
47 #include <stdbool.h>
48 #include <vppinfra/bihash_24_8.h>
49 #include <vppinfra/bihash_template.h>
50
51 /*
52  * Default size of the ip6 fib hash table
53  */
54 #define IP6_FIB_DEFAULT_HASH_NUM_BUCKETS (64 * 1024)
55 #define IP6_FIB_DEFAULT_HASH_MEMORY_SIZE (32<<20)
56
57 typedef struct {
58   ip6_address_t addr;
59   u32 dst_address_length;
60   u32 vrf_index;
61 } ip6_fib_key_t;
62
63 typedef struct {
64   /* Table ID (hash key) for this FIB. */
65   u32 table_id;
66
67   /* Index into FIB vector. */
68   u32 index;
69
70   /* flow hash configuration */
71   u32 flow_hash_config;
72 } ip6_fib_t;
73
74 struct ip6_main_t;
75
76 typedef void (ip6_add_del_route_function_t)
77   (struct ip6_main_t * im,
78    uword opaque,
79    ip6_fib_t * fib,
80    u32 flags,
81    ip6_address_t * address,
82    u32 address_length,
83    void * old_result,
84    void * new_result);
85
86 typedef struct {
87   ip6_add_del_route_function_t * function;
88   uword required_flags;
89   uword function_opaque;
90 } ip6_add_del_route_callback_t;
91
92 typedef void (ip6_add_del_interface_address_function_t)
93   (struct ip6_main_t * im,
94    uword opaque,
95    u32 sw_if_index,
96    ip6_address_t * address,
97    u32 address_length,
98    u32 if_address_index,
99    u32 is_del);
100
101 typedef struct {
102   ip6_add_del_interface_address_function_t * function;
103   uword function_opaque;
104 } ip6_add_del_interface_address_callback_t;
105
106 typedef enum {
107   /* First check access list to either permit or deny this
108      packet based on classification. */
109   IP6_RX_FEATURE_CHECK_ACCESS,
110
111   /* RPF check: verify that source address is reachable via
112      RX interface or via any interface. */
113   IP6_RX_FEATURE_CHECK_SOURCE_REACHABLE_VIA_RX,
114   IP6_RX_FEATURE_CHECK_SOURCE_REACHABLE_VIA_ANY,
115
116   /* IPSec */
117   IP6_RX_FEATURE_IPSEC,
118
119   /* Intercept and decap L2TPv3 packets. */
120   IP6_RX_FEATURE_L2TPV3,
121
122   /* vPath forwarding: won't return to call next feature
123      so any feature needed before vPath forwarding must be prior
124      to this entry */
125   IP6_RX_FEATURE_VPATH,
126
127   /* Must be last: perform forwarding lookup. */
128   IP6_RX_FEATURE_LOOKUP,
129
130   IP6_N_RX_FEATURE,
131 } ip6_rx_feature_type_t;
132
133 typedef struct ip6_main_t {
134   BVT(clib_bihash) ip6_lookup_table;
135
136   ip_lookup_main_t lookup_main;
137
138   /* bitmap / refcounts / vector of mask widths to search */
139   uword * non_empty_dst_address_length_bitmap;
140   u8 * prefix_lengths_in_search_order;
141   i32 dst_address_length_refcounts[129];
142   
143   /* Vector of FIBs. */
144   ip6_fib_t * fibs;
145
146   ip6_address_t fib_masks[129];
147
148   /* Table index indexed by software interface. */
149   u32 * fib_index_by_sw_if_index;
150
151   /* Hash table mapping table id to fib index.
152      ID space is not necessarily dense; index space is dense. */
153   uword * fib_index_by_table_id;
154
155   /* Vector of functions to call when routes are added/deleted. */
156   ip6_add_del_route_callback_t * add_del_route_callbacks;
157
158   /* Hash table mapping interface rewrite adjacency index by sw if index. */
159   uword * interface_route_adj_index_by_sw_if_index;
160
161   /* Functions to call when interface address changes. */
162   ip6_add_del_interface_address_callback_t * add_del_interface_address_callbacks;
163
164   /* Template used to generate IP6 neighbor solicitation packets. */
165   vlib_packet_template_t discover_neighbor_packet_template;
166
167   /* ip6 lookup table config parameters */
168   u32 lookup_table_nbuckets;
169   uword lookup_table_size;
170
171   /* Seed for Jenkins hash used to compute ip6 flow hash. */
172   u32 flow_hash_seed;
173
174   struct {
175     /* TTL to use for host generated packets. */
176     u8 ttl;
177
178     u8 pad[3];
179   } host_config;
180
181   /* HBH processing enabled? */
182   u8 hbh_enabled;
183 } ip6_main_t;
184
185 /* Global ip6 main structure. */
186 extern ip6_main_t ip6_main;
187
188 /* Global ip6 input node.  Errors get attached to ip6 input node. */
189 extern vlib_node_registration_t ip6_input_node;
190 extern vlib_node_registration_t ip6_rewrite_node;
191 extern vlib_node_registration_t ip6_rewrite_local_node;
192 extern vlib_node_registration_t ip6_discover_neighbor_node;
193
194 extern vlib_node_registration_t ip6_icmp_neighbor_discovery_event_node;
195
196 /* ipv6 neighbor discovery - timer/event types */
197 typedef enum {
198   ICMP6_ND_EVENT_INIT,
199 } ip6_icmp_neighbor_discovery_event_type_t;
200
201 typedef union {
202   u32 add_del_swindex;
203   struct {
204     u32 up_down_swindex;
205     u32 fib_index;
206   } up_down_event;
207 } ip6_icmp_neighbor_discovery_event_data_t;
208
209 u32 ip6_fib_lookup (ip6_main_t * im, u32 sw_if_index, ip6_address_t * dst);
210 u32 ip6_fib_lookup_with_table (ip6_main_t * im, u32 fib_index, 
211                                ip6_address_t * dst);
212
213 /**
214  * \brief Get or create an IPv6 fib.
215  *
216  * Get or create an IPv6 fib with the provided fib ID or index.
217  * The fib ID is a possibly-sparse user-defined value while
218  * the fib index defines the position of the fib in the fib vector.
219  *
220  * \param im
221  *      ip6_main pointer.
222  * \param table_index_or_id
223  *      The table index if \c IP6_ROUTE_FLAG_FIB_INDEX bit is set in \p flags.
224  *      Otherwise, when set to \c ~0, an arbitrary and unused fib ID is picked
225  *      and can be retrieved with \c ret->table_id.
226  *      Otherwise, it is the fib ID to be used to retrieve or create the desired fib.
227  * \param flags
228  *      Indicates whether \p table_index_or_id is the fib index or ID.
229  *      When the bit \c IP6_ROUTE_FLAG_FIB_INDEX is set, \p table_index_or_id
230  *      is considered as the fib index, and the fib ID otherwise.
231  * \return A pointer to the retrieved or created fib.
232  *
233  * \remark When getting a fib with the fib index, the fib MUST already exist.
234  */
235 ip6_fib_t * find_ip6_fib_by_table_index_or_id (ip6_main_t * im, 
236                                                u32 table_index_or_id, 
237                                                u32 flags);
238
239 always_inline uword
240 ip6_destination_matches_route (ip6_main_t * im,
241                                ip6_address_t * key,
242                                ip6_address_t * dest,
243                                uword dest_length)
244 {
245   int i;
246   for (i = 0; i < ARRAY_LEN (key->as_uword); i++)
247     {
248       if ((key->as_uword[i] ^ dest->as_uword[i]) & im->fib_masks[dest_length].as_uword[i])
249         return 0;
250     }
251   return 1;
252 }
253
254 always_inline uword
255 ip6_destination_matches_interface (ip6_main_t * im,
256                                    ip6_address_t * key,
257                                    ip_interface_address_t * ia)
258 {
259   ip6_address_t * a = ip_interface_address_get_address (&im->lookup_main, ia);
260   return ip6_destination_matches_route (im, key, a, ia->address_length);
261 }
262
263 /* As above but allows for unaligned destinations (e.g. works right from IP header of packet). */
264 always_inline uword
265 ip6_unaligned_destination_matches_route (ip6_main_t * im,
266                                          ip6_address_t * key,
267                                          ip6_address_t * dest,
268                                          uword dest_length)
269 {
270   int i;
271   for (i = 0; i < ARRAY_LEN (key->as_uword); i++)
272     {
273       if ((clib_mem_unaligned (&key->as_uword[i], uword) ^ dest->as_uword[i]) & im->fib_masks[dest_length].as_uword[i])
274         return 0;
275     }
276   return 1;
277 }
278
279 always_inline void
280 ip6_src_address_for_packet (ip6_main_t * im, vlib_buffer_t * p, ip6_address_t * src, u32 sw_if_index)
281 {
282   ip_lookup_main_t * lm = &im->lookup_main;
283   ip_interface_address_t * ia = ip_interface_address_for_packet (lm, p, sw_if_index);
284   ip6_address_t * a = ip_interface_address_get_address (lm, ia);
285   *src = a[0];
286 }
287
288 always_inline u32
289 ip6_src_lookup_for_packet (ip6_main_t * im, vlib_buffer_t * b, ip6_header_t * i)
290 {
291   if (vnet_buffer (b)->ip.adj_index[VLIB_RX] == ~0)
292     vnet_buffer (b)->ip.adj_index[VLIB_RX]
293       = ip6_fib_lookup (im, vnet_buffer (b)->sw_if_index[VLIB_RX],
294                         &i->src_address);
295   return vnet_buffer (b)->ip.adj_index[VLIB_RX];
296 }
297
298 /* Find interface address which matches destination. */
299 always_inline ip6_address_t *
300 ip6_interface_address_matching_destination (ip6_main_t * im, ip6_address_t * dst, u32 sw_if_index,
301                                             ip_interface_address_t ** result_ia)
302 {
303   ip_lookup_main_t * lm = &im->lookup_main;
304   ip_interface_address_t * ia;
305   ip6_address_t * result = 0;
306
307   foreach_ip_interface_address (lm, ia, sw_if_index, 
308                                 1 /* honor unnumbered */,
309   ({
310     ip6_address_t * a = ip_interface_address_get_address (lm, ia);
311     if (ip6_destination_matches_route (im, dst, a, ia->address_length))
312       {
313         result = a;
314         break;
315       }
316   }));
317   if (result_ia)
318     *result_ia = result ? ia : 0;
319   return result;
320 }
321
322 clib_error_t *
323 ip6_add_del_interface_address (vlib_main_t * vm, u32 sw_if_index,
324                                ip6_address_t * address, u32 address_length,
325                                u32 is_del);
326
327 int ip6_address_compare (ip6_address_t * a1, ip6_address_t * a2);
328
329 /* Add/del a route to the FIB. */
330
331 #define IP6_ROUTE_FLAG_ADD (0 << 0)
332 #define IP6_ROUTE_FLAG_DEL (1 << 0)
333 #define IP6_ROUTE_FLAG_TABLE_ID  (0 << 1)
334 #define IP6_ROUTE_FLAG_FIB_INDEX (1 << 1)
335 #define IP6_ROUTE_FLAG_KEEP_OLD_ADJACENCY (1 << 2)
336 #define IP6_ROUTE_FLAG_NO_REDISTRIBUTE (1 << 3)
337 #define IP6_ROUTE_FLAG_NOT_LAST_IN_GROUP (1 << 4)
338 /* Dynamic route created via neighbor discovery. */
339 #define IP6_ROUTE_FLAG_NEIGHBOR (1 << 5)
340
341 typedef struct {
342   /* IP6_ROUTE_FLAG_* */
343   u32 flags;
344
345   /* Either index of fib or table_id to hash and get fib.
346      IP6_ROUTE_FLAG_FIB_INDEX specifies index; otherwise table_id is assumed. */
347   u32 table_index_or_table_id;
348
349   /* Destination address (prefix) and length. */
350   ip6_address_t dst_address;
351   u32 dst_address_length;
352
353   /* Adjacency to use for this destination. */
354   u32 adj_index;
355
356   /* If specified adjacencies to add and then
357      use for this destination.  add_adj/n_add_adj
358      are override adj_index if specified. */
359   ip_adjacency_t * add_adj;
360   u32 n_add_adj;
361 } ip6_add_del_route_args_t;
362
363 void ip6_add_del_route (ip6_main_t * im, ip6_add_del_route_args_t * args);
364
365 void ip6_add_del_route_next_hop (ip6_main_t * im,
366                                  u32 flags,
367                                  ip6_address_t * dst_address,
368                                  u32 dst_address_length,
369                                  ip6_address_t * next_hop,
370                                  u32 next_hop_sw_if_index,
371                                  u32 next_hop_weight, u32 adj_index,
372                                  u32 explicit_fib_index);
373 u32
374 ip6_get_route (ip6_main_t * im,
375                u32 fib_index_or_table_id,
376                u32 flags,
377                ip6_address_t * address,
378                u32 address_length);
379
380 void
381 ip6_foreach_matching_route (ip6_main_t * im,
382                             u32 table_index_or_table_id,
383                             u32 flags,
384                             ip6_address_t * address,
385                             u32 address_length,
386                             ip6_address_t ** results,
387                             u8 ** result_length);
388
389 void ip6_delete_matching_routes (ip6_main_t * im,
390                                  u32 table_index_or_table_id,
391                                  u32 flags,
392                                  ip6_address_t * address,
393                                  u32 address_length);
394
395 void ip6_maybe_remap_adjacencies (ip6_main_t * im,
396                                   u32 table_index_or_table_id,
397                                   u32 flags);
398
399 void ip6_adjacency_set_interface_route (vnet_main_t * vnm,
400                                         ip_adjacency_t * adj,
401                                         u32 sw_if_index,
402                                         u32 if_address_index);
403
404 u32
405 vnet_ip6_neighbor_glean_add(u32 fib_index, void * next_hop_arg);
406
407 clib_error_t *
408 ip6_probe_neighbor (vlib_main_t * vm, ip6_address_t * dst, u32 sw_if_index);
409
410 clib_error_t *
411 ip6_set_neighbor_limit (u32 neighbor_limit);
412
413 uword
414 ip6_udp_register_listener (vlib_main_t * vm,
415                            u16 dst_port,
416                            u32 next_node_index);
417
418 u16 ip6_tcp_udp_icmp_compute_checksum (vlib_main_t * vm, vlib_buffer_t * p0, ip6_header_t * ip0, int *bogus_lengthp);
419
420 void ip6_register_protocol (u32 protocol, u32 node_index);
421
422 serialize_function_t serialize_vnet_ip6_main, unserialize_vnet_ip6_main;
423
424 int
425 vnet_set_ip6_ethernet_neighbor (vlib_main_t * vm,
426                                 u32 sw_if_index,
427                                 ip6_address_t * a,
428                                 u8 * link_layer_address,
429                                 uword n_bytes_link_layer_address,
430                                 int is_static);
431 int
432 vnet_unset_ip6_ethernet_neighbor (vlib_main_t * vm,
433                                   u32 sw_if_index,
434                                   ip6_address_t * a,
435                                   u8 * link_layer_address,
436                                   uword n_bytes_link_layer_address);
437 void
438 vnet_ip6_fib_init (ip6_main_t * im, u32 fib_index);
439
440 void 
441 ip6_link_local_address_from_ethernet_mac_address (ip6_address_t *ip,
442                                                   u8 *mac);
443
444 void 
445 ip6_ethernet_mac_address_from_link_local_address (u8 *mac, 
446                                                   ip6_address_t *ip);
447
448 int vnet_set_ip6_flow_hash (u32 table_id, u32 flow_hash_config);
449
450 int
451 ip6_neighbor_ra_config(vlib_main_t * vm, u32 sw_if_index, 
452                        u8 surpress, u8 managed, u8 other,
453                        u8 ll_option,  u8 send_unicast,  u8 cease, 
454                        u8 use_lifetime,  u32 lifetime,
455                        u32 initial_count,  u32 initial_interval,  
456                        u32 max_interval,  u32 min_interval,
457                        u8 is_no);
458
459 int
460 ip6_neighbor_ra_prefix(vlib_main_t * vm, u32 sw_if_index,  
461                        ip6_address_t *prefix_addr,  u8 prefix_len,
462                        u8 use_default,  u32 val_lifetime, u32 pref_lifetime,
463                        u8 no_advertise,  u8 off_link, u8 no_autoconfig, u8 no_onlink,
464                        u8 is_no);
465
466
467 clib_error_t *
468 enable_ip6_interface(vlib_main_t * vm,
469                      u32 sw_if_index);
470
471 clib_error_t * 
472 disable_ip6_interface(vlib_main_t * vm,
473                      u32 sw_if_index);
474
475 int
476 ip6_interface_enabled(vlib_main_t * vm,
477                       u32 sw_if_index);
478
479 clib_error_t *
480 set_ip6_link_local_address(vlib_main_t * vm,
481                            u32 sw_if_index,
482                            ip6_address_t *address,
483                            u8 address_length);
484
485 void vnet_register_ip6_neighbor_resolution_event(vnet_main_t * vnm, 
486                                                  void * address_arg,
487                                                  uword node_index,
488                                                  uword type_opaque,
489                                                  uword data);
490
491 int vnet_set_ip6_classify_intfc (vlib_main_t * vm, u32 sw_if_index, 
492                                  u32 table_index);
493 extern vlib_node_registration_t ip6_lookup_node;
494
495 /* Compute flow hash.  We'll use it to select which Sponge to use for this
496    flow.  And other things. */
497 always_inline u32
498 ip6_compute_flow_hash (ip6_header_t * ip, u32 flow_hash_config)
499 {
500     tcp_header_t * tcp = (void *) (ip + 1);
501     u64 a, b, c;
502     u64 t1, t2;
503     uword is_tcp_udp = (ip->protocol == IP_PROTOCOL_TCP
504                         || ip->protocol == IP_PROTOCOL_UDP);
505
506     t1 = (ip->src_address.as_u64[0] ^ ip->src_address.as_u64[1]);
507     t1 = (flow_hash_config & IP_FLOW_HASH_SRC_ADDR) ? t1 : 0;
508     
509     t2 = (ip->dst_address.as_u64[0] ^ ip->dst_address.as_u64[1]);
510     t2 = (flow_hash_config & IP_FLOW_HASH_DST_ADDR) ? t2 : 0;
511     
512     a = (flow_hash_config & IP_FLOW_HASH_REVERSE_SRC_DST) ? t2 : t1;
513     b = (flow_hash_config & IP_FLOW_HASH_REVERSE_SRC_DST) ? t1 : t2;
514     b ^= (flow_hash_config & IP_FLOW_HASH_PROTO) ? ip->protocol : 0;
515
516     t1 = is_tcp_udp ? tcp->ports.src : 0;
517     t2 = is_tcp_udp ? tcp->ports.dst : 0;
518
519     t1 = (flow_hash_config & IP_FLOW_HASH_SRC_PORT) ? t1 : 0;
520     t2 = (flow_hash_config & IP_FLOW_HASH_DST_PORT) ? t2 : 0;
521     
522     c = (flow_hash_config & IP_FLOW_HASH_REVERSE_SRC_DST) ?
523         ((t1<<16) | t2) : ((t2<<16) | t1);
524
525     hash_mix64 (a, b, c);
526     return (u32) c;
527 }
528
529 /*
530  * Hop-by-Hop handling
531  */
532 typedef struct {
533   /* Array of function pointers to HBH option handling routines */
534   int (*options[256])(vlib_buffer_t *b, ip6_header_t *ip, ip6_hop_by_hop_option_t *opt);
535   u8 *(*trace[256])(u8 *s, ip6_hop_by_hop_option_t *opt);
536 } ip6_hop_by_hop_main_t;
537
538 extern ip6_hop_by_hop_main_t ip6_hop_by_hop_main;
539
540 int ip6_hbh_register_option (u8 option,
541                              int options(vlib_buffer_t *b, ip6_header_t *ip, ip6_hop_by_hop_option_t *opt),
542                              u8 *trace(u8 *s, ip6_hop_by_hop_option_t *opt));
543 int ip6_hbh_unregister_option (u8 option);
544
545 /* Flag used by IOAM code. Classifier sets it pop-hop-by-hop checks it */
546 #define OI_DECAP   100
547
548 #endif /* included_ip_ip6_h */