ipip: Multi-point interface
[vpp.git] / src / vnet / adj / adj.c
1 /*
2  * Copyright (c) 2016 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <vnet/adj/adj.h>
17 #include <vnet/adj/adj_internal.h>
18 #include <vnet/adj/adj_glean.h>
19 #include <vnet/adj/adj_midchain.h>
20 #include <vnet/adj/adj_mcast.h>
21 #include <vnet/adj/adj_delegate.h>
22 #include <vnet/fib/fib_node_list.h>
23
24 /* Adjacency packet/byte counters indexed by adjacency index. */
25 vlib_combined_counter_main_t adjacency_counters = {
26     .name = "adjacency",
27     .stat_segment_name = "/net/adjacency",
28 };
29
30 /*
31  * the single adj pool
32  */
33 ip_adjacency_t *adj_pool;
34
35 /**
36  * @brief Global Config for enabling per-adjacency counters.
37  * By default these are disabled.
38  */
39 int adj_per_adj_counters;
40
41 const ip46_address_t ADJ_BCAST_ADDR = {
42     .ip6 = {
43         .as_u64[0] = 0xffffffffffffffff,
44         .as_u64[1] = 0xffffffffffffffff,
45     },
46 };
47
48 /**
49  * Adj flag names
50  */
51 static const char *adj_attr_names[] = ADJ_ATTR_NAMES;
52
53 always_inline void
54 adj_poison (ip_adjacency_t * adj)
55 {
56     if (CLIB_DEBUG > 0)
57     {
58         clib_memset (adj, 0xfe, sizeof (adj[0]));
59     }
60 }
61
62 ip_adjacency_t *
63 adj_alloc (fib_protocol_t proto)
64 {
65     ip_adjacency_t *adj;
66
67     pool_get_aligned(adj_pool, adj, CLIB_CACHE_LINE_BYTES);
68
69     adj_poison(adj);
70
71     /* Make sure certain fields are always initialized. */
72     /* Validate adjacency counters. */
73     vlib_validate_combined_counter(&adjacency_counters,
74                                    adj_get_index(adj));
75     vlib_zero_combined_counter(&adjacency_counters,
76                                adj_get_index(adj));
77     fib_node_init(&adj->ia_node,
78                   FIB_NODE_TYPE_ADJ);
79
80     adj->ia_nh_proto = proto;
81     adj->ia_flags = 0;
82     adj->rewrite_header.sw_if_index = ~0;
83     adj->rewrite_header.flags = 0;
84     adj->lookup_next_index = 0;
85     adj->ia_delegates = NULL;
86
87     /* lest it become a midchain in the future */
88     clib_memset(&adj->sub_type.midchain.next_dpo, 0,
89            sizeof(adj->sub_type.midchain.next_dpo));
90
91     return (adj);
92 }
93
94 static int
95 adj_index_is_special (adj_index_t adj_index)
96 {
97     if (ADJ_INDEX_INVALID == adj_index)
98         return (!0);
99
100     return (0);
101 }
102
103 u8*
104 format_adj_flags (u8 * s, va_list * args)
105 {
106     adj_flags_t af;
107     adj_attr_t at;
108
109     af = va_arg (*args, int);
110
111     if (ADJ_FLAG_NONE == af)
112     {
113         return (format(s, "None"));
114     }
115     FOR_EACH_ADJ_ATTR(at)
116     {
117         if (af & (1 << at))
118         {
119             s = format(s, "%s ", adj_attr_names[at]);
120         }
121     }
122     return (s);
123 }
124
125 /**
126  * @brief Pretty print helper function for formatting specific adjacencies.
127  * @param s - input string to format
128  * @param args - other args passed to format function such as:
129  *                 - vnet_main_t
130  *                 - ip_lookup_main_t
131  *                 - adj_index
132  */
133 u8 *
134 format_ip_adjacency (u8 * s, va_list * args)
135 {
136     format_ip_adjacency_flags_t fiaf;
137     ip_adjacency_t * adj;
138     u32 adj_index;
139
140     adj_index = va_arg (*args, u32);
141     fiaf = va_arg (*args, format_ip_adjacency_flags_t);
142
143     if (!adj_is_valid(adj_index))
144       return format(s, "<invalid adjacency>");
145
146     adj = adj_get(adj_index);
147
148     switch (adj->lookup_next_index)
149     {
150     case IP_LOOKUP_NEXT_REWRITE:
151     case IP_LOOKUP_NEXT_BCAST:
152         s = format (s, "%U", format_adj_nbr, adj_index, 0);
153         break;
154     case IP_LOOKUP_NEXT_ARP:
155         s = format (s, "%U", format_adj_nbr_incomplete, adj_index, 0);
156         break;
157     case IP_LOOKUP_NEXT_GLEAN:
158         s = format (s, "%U", format_adj_glean, adj_index, 0);
159         break;
160     case IP_LOOKUP_NEXT_MIDCHAIN:
161         s = format (s, "%U", format_adj_midchain, adj_index, 2);
162         break;
163     case IP_LOOKUP_NEXT_MCAST:
164         s = format (s, "%U", format_adj_mcast, adj_index, 0);
165         break;
166     case IP_LOOKUP_NEXT_MCAST_MIDCHAIN:
167         s = format (s, "%U", format_adj_mcast_midchain, adj_index, 0);
168         break;
169     case IP_LOOKUP_NEXT_DROP:
170     case IP_LOOKUP_NEXT_PUNT:
171     case IP_LOOKUP_NEXT_LOCAL:
172     case IP_LOOKUP_NEXT_ICMP_ERROR:
173     case IP_LOOKUP_N_NEXT:
174         break;
175     }
176
177     if (fiaf & FORMAT_IP_ADJACENCY_DETAIL)
178     {
179         vlib_counter_t counts;
180
181         vlib_get_combined_counter(&adjacency_counters, adj_index, &counts);
182         s = format (s, "\n   flags:%U", format_adj_flags, adj->ia_flags);
183         s = format (s, "\n   counts:[%Ld:%Ld]", counts.packets, counts.bytes);
184         s = format (s, "\n   locks:%d", adj->ia_node.fn_locks);
185         s = format(s, "\n delegates:");
186         s = adj_delegate_format(s, adj);
187
188         s = format(s, "\n children:");
189         if (fib_node_list_get_size(adj->ia_node.fn_children))
190         {
191             s = format(s, "\n  ");
192             s = fib_node_children_format(adj->ia_node.fn_children, s);
193         }
194     }
195
196     return s;
197 }
198
199 int
200 adj_recursive_loop_detect (adj_index_t ai,
201                            fib_node_index_t **entry_indicies)
202 {
203     ip_adjacency_t * adj;
204
205     adj = adj_get(ai);
206
207     switch (adj->lookup_next_index)
208     {
209     case IP_LOOKUP_NEXT_REWRITE:
210     case IP_LOOKUP_NEXT_ARP:
211     case IP_LOOKUP_NEXT_GLEAN:
212     case IP_LOOKUP_NEXT_MCAST:
213     case IP_LOOKUP_NEXT_BCAST:
214     case IP_LOOKUP_NEXT_DROP:
215     case IP_LOOKUP_NEXT_PUNT:
216     case IP_LOOKUP_NEXT_LOCAL:
217     case IP_LOOKUP_NEXT_ICMP_ERROR:
218     case IP_LOOKUP_N_NEXT:
219         /*
220          * these adjacency types are terminal graph nodes, so there's no
221          * possibility of a loop down here.
222          */
223         break;
224     case IP_LOOKUP_NEXT_MIDCHAIN:
225     case IP_LOOKUP_NEXT_MCAST_MIDCHAIN:
226         return (adj_ndr_midchain_recursive_loop_detect(ai, entry_indicies));
227     }
228
229     return (0);
230 }
231
232 /*
233  * adj_last_lock_gone
234  *
235  * last lock/reference to the adj has gone, we no longer need it.
236  */
237 static void
238 adj_last_lock_gone (ip_adjacency_t *adj)
239 {
240     vlib_main_t * vm = vlib_get_main();
241
242     ASSERT(0 == fib_node_list_get_size(adj->ia_node.fn_children));
243     ADJ_DBG(adj, "last-lock-gone");
244
245     adj_delegate_adj_deleted(adj);
246
247     vlib_worker_thread_barrier_sync (vm);
248
249     switch (adj->lookup_next_index)
250     {
251     case IP_LOOKUP_NEXT_MIDCHAIN:
252         dpo_reset(&adj->sub_type.midchain.next_dpo);
253         /* FALL THROUGH */
254     case IP_LOOKUP_NEXT_ARP:
255     case IP_LOOKUP_NEXT_REWRITE:
256     case IP_LOOKUP_NEXT_BCAST:
257         /*
258          * complete and incomplete nbr adjs
259          */
260         adj_nbr_remove(adj_get_index(adj),
261                        adj->ia_nh_proto,
262                        adj->ia_link,
263                        &adj->sub_type.nbr.next_hop,
264                        adj->rewrite_header.sw_if_index);
265         break;
266     case IP_LOOKUP_NEXT_GLEAN:
267         adj_glean_remove(adj->ia_nh_proto,
268                          adj->rewrite_header.sw_if_index);
269         break;
270     case IP_LOOKUP_NEXT_MCAST:
271     case IP_LOOKUP_NEXT_MCAST_MIDCHAIN:
272         adj_mcast_remove(adj->ia_nh_proto,
273                          adj->rewrite_header.sw_if_index);
274         break;
275     case IP_LOOKUP_NEXT_DROP:
276     case IP_LOOKUP_NEXT_PUNT:
277     case IP_LOOKUP_NEXT_LOCAL:
278     case IP_LOOKUP_NEXT_ICMP_ERROR:
279     case IP_LOOKUP_N_NEXT:
280         /*
281          * type not stored in any DB from which we need to remove it
282          */
283         break;
284     }
285
286     vlib_worker_thread_barrier_release(vm);
287
288     fib_node_deinit(&adj->ia_node);
289     ASSERT(0 == vec_len(adj->ia_delegates));
290     vec_free(adj->ia_delegates);
291     pool_put(adj_pool, adj);
292 }
293
294 u32
295 adj_dpo_get_urpf (const dpo_id_t *dpo)
296 {
297     ip_adjacency_t *adj;
298
299     adj = adj_get(dpo->dpoi_index);
300
301     return (adj->rewrite_header.sw_if_index);
302 }
303
304 void
305 adj_lock (adj_index_t adj_index)
306 {
307     ip_adjacency_t *adj;
308
309     if (adj_index_is_special(adj_index))
310     {
311         return;
312     }
313
314     adj = adj_get(adj_index);
315     ASSERT(adj);
316
317     ADJ_DBG(adj, "lock");
318     fib_node_lock(&adj->ia_node);
319 }
320
321 void
322 adj_unlock (adj_index_t adj_index)
323 {
324     ip_adjacency_t *adj;
325
326     if (adj_index_is_special(adj_index))
327     {
328         return;
329     }
330
331     adj = adj_get(adj_index);
332     ASSERT(adj);
333
334     ADJ_DBG(adj, "unlock");
335     ASSERT(adj);
336
337     fib_node_unlock(&adj->ia_node);
338 }
339
340 u32
341 adj_child_add (adj_index_t adj_index,
342                fib_node_type_t child_type,
343                fib_node_index_t child_index)
344 {
345     ASSERT(ADJ_INDEX_INVALID != adj_index);
346     if (adj_index_is_special(adj_index))
347     {
348         return (~0);
349     }
350
351     return (fib_node_child_add(FIB_NODE_TYPE_ADJ,
352                                adj_index,
353                                child_type,
354                                child_index));
355 }
356
357 void
358 adj_child_remove (adj_index_t adj_index,
359                   u32 sibling_index)
360 {
361     if (adj_index_is_special(adj_index))
362     {
363         return;
364     }
365
366     fib_node_child_remove(FIB_NODE_TYPE_ADJ,
367                           adj_index,
368                           sibling_index);
369 }
370
371 /*
372  * Context for the walk to update the cached feature flags.
373  */
374 typedef struct adj_feature_update_t_
375 {
376     u8 arc;
377     u8 enable;
378 } adj_feature_update_ctx_t;
379
380 static adj_walk_rc_t
381 adj_feature_update_walk_cb (adj_index_t ai,
382                             void *arg)
383 {
384     adj_feature_update_ctx_t *ctx = arg;
385     ip_adjacency_t *adj;
386
387     adj = adj_get(ai);
388
389     /*
390      * this ugly mess matches the feature arc that is changing with affected
391      * adjacencies
392      */
393     if (((ctx->arc == ip6_main.lookup_main.output_feature_arc_index) &&
394          (VNET_LINK_IP6 == adj->ia_link)) ||
395         ((ctx->arc == ip4_main.lookup_main.output_feature_arc_index) &&
396          (VNET_LINK_IP4 == adj->ia_link)) ||
397         ((ctx->arc == mpls_main.output_feature_arc_index) &&
398          (VNET_LINK_MPLS == adj->ia_link)))
399     {
400         if (ctx->enable)
401             adj->rewrite_header.flags |= VNET_REWRITE_HAS_FEATURES;
402         else
403             adj->rewrite_header.flags &= ~VNET_REWRITE_HAS_FEATURES;
404     }
405     return (ADJ_WALK_RC_CONTINUE);
406 }
407
408 static void
409 adj_feature_update (u32 sw_if_index,
410                     u8 arc_index,
411                     u8 is_enable,
412                     void *data)
413 {
414     /*
415      * Walk all the adjacencies on the interface to update the cached
416      * 'has-features' flag
417      */
418     adj_feature_update_ctx_t ctx = {
419         .arc = arc_index,
420         .enable = is_enable,
421     };
422     adj_walk (sw_if_index, adj_feature_update_walk_cb, &ctx);
423 }
424
425 static adj_walk_rc_t
426 adj_mtu_update_walk_cb (adj_index_t ai,
427                         void *arg)
428 {
429     ip_adjacency_t *adj;
430
431     adj = adj_get(ai);
432
433     vnet_rewrite_update_mtu (vnet_get_main(), adj->ia_link,
434                              &adj->rewrite_header);
435
436     return (ADJ_WALK_RC_CONTINUE);
437 }
438
439 static clib_error_t *
440 adj_mtu_update (vnet_main_t * vnm, u32 sw_if_index, u32 flags)
441 {
442   adj_walk (sw_if_index, adj_mtu_update_walk_cb, NULL);
443
444   return (NULL);
445 }
446
447 VNET_SW_INTERFACE_MTU_CHANGE_FUNCTION(adj_mtu_update);
448
449 /**
450  * @brief Walk the Adjacencies on a given interface
451  */
452 void
453 adj_walk (u32 sw_if_index,
454           adj_walk_cb_t cb,
455           void *ctx)
456 {
457     /*
458      * walk all the neighbor adjacencies
459      */
460     fib_protocol_t proto;
461
462     FOR_EACH_FIB_IP_PROTOCOL(proto)
463     {
464         adj_nbr_walk(sw_if_index, proto, cb, ctx);
465         adj_mcast_walk(sw_if_index, proto, cb, ctx);
466     }
467 }
468
469 /**
470  * @brief Return the link type of the adjacency
471  */
472 vnet_link_t
473 adj_get_link_type (adj_index_t ai)
474 {
475     const ip_adjacency_t *adj;
476
477     adj = adj_get(ai);
478
479     return (adj->ia_link);
480 }
481
482 /**
483  * @brief Return the sw interface index of the adjacency.
484  */
485 u32
486 adj_get_sw_if_index (adj_index_t ai)
487 {
488     const ip_adjacency_t *adj;
489
490     adj = adj_get(ai);
491
492     return (adj->rewrite_header.sw_if_index);
493 }
494
495 /**
496  * @brief Return true if the adjacency is 'UP', i.e. can be used for forwarding
497  * 0 is down, !0 is up.
498  */
499 int
500 adj_is_up (adj_index_t ai)
501 {
502     return (adj_bfd_is_up(ai));
503 }
504
505 /**
506  * @brief Return the rewrite string of the adjacency
507  */
508 const u8*
509 adj_get_rewrite (adj_index_t ai)
510 {
511     vnet_rewrite_header_t *rw;
512     ip_adjacency_t *adj;
513
514     adj = adj_get(ai);
515     rw = &adj->rewrite_header;
516
517     ASSERT (rw->data_bytes != 0xfefe);
518
519     return (rw->data - rw->data_bytes);
520 }
521
522 static fib_node_t *
523 adj_get_node (fib_node_index_t index)
524 {
525     ip_adjacency_t *adj;
526
527     adj = adj_get(index);
528
529     return (&adj->ia_node);
530 }
531
532 #define ADJ_FROM_NODE(_node)                                            \
533     ((ip_adjacency_t*)((char*)_node - STRUCT_OFFSET_OF(ip_adjacency_t, ia_node)))
534
535 static void
536 adj_node_last_lock_gone (fib_node_t *node)
537 {
538     adj_last_lock_gone(ADJ_FROM_NODE(node));
539 }
540
541 static fib_node_back_walk_rc_t
542 adj_back_walk_notify (fib_node_t *node,
543                       fib_node_back_walk_ctx_t *ctx)
544 {
545     ip_adjacency_t *adj;
546
547     adj = ADJ_FROM_NODE(node);
548
549     switch (adj->lookup_next_index)
550     {
551     case IP_LOOKUP_NEXT_MIDCHAIN:
552         adj_midchain_delegate_restack(adj_get_index(adj));
553         break;
554     case IP_LOOKUP_NEXT_ARP:
555     case IP_LOOKUP_NEXT_REWRITE:
556     case IP_LOOKUP_NEXT_BCAST:
557     case IP_LOOKUP_NEXT_GLEAN:
558     case IP_LOOKUP_NEXT_MCAST:
559     case IP_LOOKUP_NEXT_MCAST_MIDCHAIN:
560     case IP_LOOKUP_NEXT_DROP:
561     case IP_LOOKUP_NEXT_PUNT:
562     case IP_LOOKUP_NEXT_LOCAL:
563     case IP_LOOKUP_NEXT_ICMP_ERROR:
564     case IP_LOOKUP_N_NEXT:
565         /*
566          * Que pasa. yo soj en el final!
567          */
568         ASSERT(0);
569         break;
570     }
571
572     return (FIB_NODE_BACK_WALK_CONTINUE);
573 }
574
575 /*
576  * Adjacency's graph node virtual function table
577  */
578 static const fib_node_vft_t adj_vft = {
579     .fnv_get = adj_get_node,
580     .fnv_last_lock = adj_node_last_lock_gone,
581     .fnv_back_walk = adj_back_walk_notify,
582 };
583
584 static clib_error_t *
585 adj_module_init (vlib_main_t * vm)
586 {
587     fib_node_register_type(FIB_NODE_TYPE_ADJ, &adj_vft);
588
589     adj_nbr_module_init();
590     adj_glean_module_init();
591     adj_midchain_module_init();
592     adj_mcast_module_init();
593
594     vnet_feature_register(adj_feature_update, NULL);
595
596     return (NULL);
597 }
598
599 VLIB_INIT_FUNCTION (adj_module_init);
600
601 static clib_error_t *
602 adj_show (vlib_main_t * vm,
603           unformat_input_t * input,
604           vlib_cli_command_t * cmd)
605 {
606     adj_index_t ai = ADJ_INDEX_INVALID;
607     u32 sw_if_index = ~0;
608     int summary = 0;
609
610     while (unformat_check_input (input) != UNFORMAT_END_OF_INPUT)
611     {
612         if (unformat (input, "%d", &ai))
613             ;
614         else if (unformat (input, "sum"))
615             summary = 1;
616         else if (unformat (input, "summary"))
617             summary = 1;
618         else if (unformat (input, "%U",
619                            unformat_vnet_sw_interface, vnet_get_main(),
620                            &sw_if_index))
621             ;
622         else
623             break;
624     }
625
626     if (summary)
627     {
628         vlib_cli_output (vm, "Number of adjacencies: %d", pool_elts(adj_pool));
629         vlib_cli_output (vm, "Per-adjacency counters: %s",
630                          (adj_are_counters_enabled() ?
631                           "enabled":
632                           "disabled"));
633     }
634     else
635     {
636         if (ADJ_INDEX_INVALID != ai)
637         {
638             if (pool_is_free_index(adj_pool, ai))
639             {
640                 vlib_cli_output (vm, "adjacency %d invalid", ai);
641                 return 0;
642             }
643
644             vlib_cli_output (vm, "[@%d] %U",
645                              ai,
646                              format_ip_adjacency,  ai,
647                              FORMAT_IP_ADJACENCY_DETAIL);
648         }
649         else
650         {
651             /* *INDENT-OFF* */
652             pool_foreach_index(ai, adj_pool,
653             ({
654                 if (~0 != sw_if_index &&
655                     sw_if_index != adj_get_sw_if_index(ai))
656                 {
657                 }
658                 else
659                 {
660                     vlib_cli_output (vm, "[@%d] %U",
661                                      ai,
662                                      format_ip_adjacency, ai,
663                                      FORMAT_IP_ADJACENCY_NONE);
664                 }
665             }));
666             /* *INDENT-ON* */
667         }
668     }
669     return 0;
670 }
671
672 /*?
673  * Show all adjacencies.
674  * @cliexpar
675  * @cliexstart{sh adj}
676  * [@0]
677  * [@1]  glean: loop0
678  * [@2] ipv4 via 1.0.0.2 loop0: IP4: 00:00:22:aa:bb:cc -> 00:00:11:aa:bb:cc
679  * [@3] mpls via 1.0.0.2 loop0: MPLS: 00:00:22:aa:bb:cc -> 00:00:11:aa:bb:cc
680  * [@4] ipv4 via 1.0.0.3 loop0: IP4: 00:00:22:aa:bb:cc -> 00:00:11:aa:bb:cc
681  * [@5] mpls via 1.0.0.3 loop0: MPLS: 00:00:22:aa:bb:cc -> 00:00:11:aa:bb:cc
682  * @cliexend
683  ?*/
684 VLIB_CLI_COMMAND (adj_show_command, static) = {
685     .path = "show adj",
686     .short_help = "show adj [<adj_index>] [interface] [summary]",
687     .function = adj_show,
688 };
689
690 /**
691  * @brief CLI invoked function to enable/disable per-adj counters
692  */
693 static clib_error_t *
694 adj_cli_counters_set (vlib_main_t * vm,
695                       unformat_input_t * input,
696                       vlib_cli_command_t * cmd)
697 {
698     clib_error_t *error = NULL;
699     int enable = ~0;
700
701     while (unformat_check_input (input) != UNFORMAT_END_OF_INPUT)
702     {
703         if (unformat (input, "enable"))
704             enable = 1;
705         else if (unformat (input, "disable"))
706             enable = 0;
707         else
708             break;
709     }
710
711     if (enable != ~0)
712     {
713         /* user requested something sensible */
714         adj_per_adj_counters = enable;
715     }
716     else
717     {
718         error = clib_error_return (0, "specify 'enable' or 'disable'");
719     }
720
721     return (error);
722 }
723
724 /*?
725  * Enable/disable per-adjacency counters. This is optional because it comes
726  * with a non-negligible performance cost.
727  ?*/
728 VLIB_CLI_COMMAND (adj_cli_counters_set_command, static) = {
729     .path = "adjacency counters",
730     .short_help = "adjacency counters [enable|disable]",
731     .function = adj_cli_counters_set,
732 };