misc: move to new pool_foreach macros
[vpp.git] / src / plugins / lisp / lisp-gpe / lisp_gpe_adjacency.c
1 /*
2  * Copyright (c) 2016 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 /**
16  * @file
17  * @brief Common utility functions for IPv4, IPv6 and L2 LISP-GPE adjacencys.
18  *
19  */
20
21 #include <vnet/dpo/load_balance.h>
22 #include <lisp/lisp-cp/control.h>
23 #include <lisp/lisp-cp/lisp_types.h>
24 #include <lisp/lisp-gpe/lisp_gpe_sub_interface.h>
25 #include <lisp/lisp-gpe/lisp_gpe_adjacency.h>
26 #include <lisp/lisp-gpe/lisp_gpe_tunnel.h>
27 #include <vnet/fib/fib_entry.h>
28 #include <vnet/adj/adj_midchain.h>
29 #include <vnet/udp/udp_inlines.h>
30 #include <vppinfra/bihash_24_8.h>
31 #include <vppinfra/bihash_template.h>
32
33 /**
34  * Memory pool of all adjacencies
35  */
36 static lisp_gpe_adjacency_t *lisp_adj_pool;
37
38 /**
39  * Hash table of all adjacencies. key:{nh, itf}
40  * We never have an all zeros address since the interfaces are multi-access,
41  * therefore there is no ambiguity between a v4 and v6 next-hop, so we don't
42  * need to add the protocol to the key.
43  */
44 static
45 BVT (clib_bihash)
46   lisp_adj_db;
47
48 #define LISP_ADJ_SET_KEY(_key, _itf, _nh)       \
49 {                                               \
50   _key.key[0] = ip_addr_v6((_nh)).as_u64[0];    \
51   _key.key[1] = ip_addr_v6((_nh)).as_u64[1];    \
52   _key.key[2] = (_itf);                         \
53 }
54
55      static index_t lisp_adj_find (const ip_address_t * addr, u32 sw_if_index)
56 {
57   BVT (clib_bihash_kv) kv;
58
59   LISP_ADJ_SET_KEY (kv, sw_if_index, addr);
60
61   if (BV (clib_bihash_search) (&lisp_adj_db, &kv, &kv) < 0)
62     {
63       return (INDEX_INVALID);
64     }
65   else
66     {
67       return (kv.value);
68     }
69 }
70
71 static void
72 lisp_adj_insert (const ip_address_t * addr, u32 sw_if_index, index_t ai)
73 {
74   BVT (clib_bihash_kv) kv;
75
76   LISP_ADJ_SET_KEY (kv, sw_if_index, addr);
77   kv.value = ai;
78
79   BV (clib_bihash_add_del) (&lisp_adj_db, &kv, 1);
80 }
81
82 static void
83 lisp_adj_remove (const ip_address_t * addr, u32 sw_if_index)
84 {
85   BVT (clib_bihash_kv) kv;
86
87   LISP_ADJ_SET_KEY (kv, sw_if_index, addr);
88
89   BV (clib_bihash_add_del) (&lisp_adj_db, &kv, 0);
90 }
91
92 static lisp_gpe_adjacency_t *
93 lisp_gpe_adjacency_get_i (index_t lai)
94 {
95   return (pool_elt_at_index (lisp_adj_pool, lai));
96 }
97
98 fib_forward_chain_type_t
99 lisp_gpe_adj_get_fib_chain_type (const lisp_gpe_adjacency_t * ladj)
100 {
101   switch (ip_addr_version (&ladj->remote_rloc))
102     {
103     case AF_IP4:
104       return (FIB_FORW_CHAIN_TYPE_UNICAST_IP4);
105     case AF_IP6:
106       return (FIB_FORW_CHAIN_TYPE_UNICAST_IP6);
107     default:
108       ASSERT (0);
109       break;
110     }
111   return (FIB_FORW_CHAIN_TYPE_UNICAST_IP4);
112 }
113
114 static void
115 ip46_address_to_ip_address (const ip46_address_t * a, ip_address_t * b)
116 {
117   if (ip46_address_is_ip4 (a))
118     {
119       clib_memset (b, 0, sizeof (*b));
120       ip_address_set (b, &a->ip4, AF_IP4);
121     }
122   else
123     {
124       ip_address_set (b, &a->ip6, AF_IP6);
125     }
126 }
127
128 /**
129  * @brief Stack the tunnel's midchain on the IP forwarding chain of the via
130  */
131 static void
132 lisp_gpe_adj_stack_one (lisp_gpe_adjacency_t * ladj, adj_index_t ai)
133 {
134   const lisp_gpe_tunnel_t *lgt;
135
136   lgt = lisp_gpe_tunnel_get (ladj->tunnel_index);
137
138   adj_nbr_midchain_stack_on_fib_entry (ai,
139                                        lgt->fib_entry_index,
140                                        lisp_gpe_adj_get_fib_chain_type
141                                        (ladj));
142 }
143
144 /**
145  * @brief Call back when restacking all adjacencies on a GRE interface
146  */
147 static adj_walk_rc_t
148 lisp_gpe_adj_walk_cb (adj_index_t ai, void *ctx)
149 {
150   lisp_gpe_adjacency_t *ladj = ctx;
151
152   lisp_gpe_adj_stack_one (ladj, ai);
153
154   return (ADJ_WALK_RC_CONTINUE);
155 }
156
157 static void
158 lisp_gpe_adj_stack (lisp_gpe_adjacency_t * ladj)
159 {
160   fib_protocol_t nh_proto;
161   ip46_address_t nh;
162
163   nh_proto = ip_address_to_46 (&ladj->remote_rloc, &nh);
164
165   /*
166    * walk all the adjacencies on th lisp interface and restack them
167    */
168   adj_nbr_walk_nh (ladj->sw_if_index,
169                    nh_proto, &nh, lisp_gpe_adj_walk_cb, ladj);
170 }
171
172 static lisp_gpe_next_protocol_e
173 lisp_gpe_adj_proto_from_vnet_link_type (vnet_link_t linkt)
174 {
175   switch (linkt)
176     {
177     case VNET_LINK_IP4:
178       return (LISP_GPE_NEXT_PROTO_IP4);
179     case VNET_LINK_IP6:
180       return (LISP_GPE_NEXT_PROTO_IP6);
181     case VNET_LINK_ETHERNET:
182       return (LISP_GPE_NEXT_PROTO_ETHERNET);
183     case VNET_LINK_NSH:
184       return (LISP_GPE_NEXT_PROTO_NSH);
185     default:
186       ASSERT (0);
187     }
188   return (LISP_GPE_NEXT_PROTO_IP4);
189 }
190
191 #define is_v4_packet(_h) ((*(u8*) _h) & 0xF0) == 0x40
192
193 static lisp_afi_e
194 lisp_afi_from_vnet_link_type (vnet_link_t link)
195 {
196   switch (link)
197     {
198     case VNET_LINK_IP4:
199       return LISP_AFI_IP;
200     case VNET_LINK_IP6:
201       return LISP_AFI_IP6;
202     case VNET_LINK_ETHERNET:
203       return LISP_AFI_MAC;
204     default:
205       return LISP_AFI_NO_ADDR;
206     }
207 }
208
209 static void
210 lisp_gpe_increment_stats_counters (lisp_cp_main_t * lcm,
211                                    const ip_adjacency_t * adj,
212                                    vlib_buffer_t * b)
213 {
214   lisp_gpe_main_t *lgm = vnet_lisp_gpe_get_main ();
215   lisp_gpe_adjacency_t *ladj;
216   ip_address_t rloc;
217   index_t lai;
218   u32 si, di;
219   gid_address_t src, dst;
220   uword *feip;
221
222   ip46_address_to_ip_address (&adj->sub_type.nbr.next_hop, &rloc);
223   si = vnet_buffer (b)->sw_if_index[VLIB_TX];
224   lai = lisp_adj_find (&rloc, si);
225   ASSERT (INDEX_INVALID != lai);
226
227   ladj = pool_elt_at_index (lisp_adj_pool, lai);
228
229   u8 *lisp_data = (u8 *) vlib_buffer_get_current (b);
230
231   /* skip IP header */
232   if (is_v4_packet (lisp_data))
233     lisp_data += sizeof (ip4_header_t);
234   else
235     lisp_data += sizeof (ip6_header_t);
236
237   /* skip UDP header */
238   lisp_data += sizeof (udp_header_t);
239   // TODO: skip TCP?
240
241   /* skip LISP GPE header */
242   lisp_data += sizeof (lisp_gpe_header_t);
243
244   i16 saved_current_data = b->current_data;
245   b->current_data = lisp_data - b->data;
246
247   lisp_afi_e afi = lisp_afi_from_vnet_link_type (adj->ia_link);
248   get_src_and_dst_eids_from_buffer (lcm, b, &src, &dst, afi);
249   b->current_data = saved_current_data;
250   di = gid_dictionary_sd_lookup (&lcm->mapping_index_by_gid, &dst, &src);
251   if (PREDICT_FALSE (~0 == di))
252     {
253       clib_warning ("dst mapping not found (%U, %U)", format_gid_address,
254                     &src, format_gid_address, &dst);
255       return;
256     }
257
258   feip = hash_get (lcm->fwd_entry_by_mapping_index, di);
259   if (PREDICT_FALSE (!feip))
260     return;
261
262   lisp_stats_key_t key;
263   clib_memset (&key, 0, sizeof (key));
264   key.fwd_entry_index = feip[0];
265   key.tunnel_index = ladj->tunnel_index;
266
267   uword *p = hash_get_mem (lgm->lisp_stats_index_by_key, &key);
268   ALWAYS_ASSERT (p);
269
270   /* compute payload length starting after GPE */
271   u32 bytes = b->current_length - (lisp_data - b->data - b->current_data);
272   vlib_increment_combined_counter (&lgm->counters, vlib_get_thread_index (),
273                                    p[0], 1, bytes);
274 }
275
276 static void
277 lisp_gpe_fixup (vlib_main_t * vm,
278                 const ip_adjacency_t * adj,
279                 vlib_buffer_t * b, const void *data)
280 {
281   lisp_cp_main_t *lcm = vnet_lisp_cp_get_main ();
282
283   if (lcm->flags & LISP_FLAG_STATS_ENABLED)
284     lisp_gpe_increment_stats_counters (lcm, adj, b);
285
286   /* Fixup the checksum and len fields in the LISP tunnel encap
287    * that was applied at the midchain node */
288   ip_udp_fixup_one (vm, b, is_v4_packet (vlib_buffer_get_current (b)));
289 }
290
291 /**
292  * @brief The LISP-GPE interface registered function to update, i.e.
293  * provide an rewrite string for, an adjacency.
294  */
295 void
296 lisp_gpe_update_adjacency (vnet_main_t * vnm, u32 sw_if_index, adj_index_t ai)
297 {
298   const lisp_gpe_tunnel_t *lgt;
299   lisp_gpe_adjacency_t *ladj;
300   ip_adjacency_t *adj;
301   ip_address_t rloc;
302   vnet_link_t linkt;
303   adj_flags_t af;
304   index_t lai;
305
306   adj = adj_get (ai);
307   ip46_address_to_ip_address (&adj->sub_type.nbr.next_hop, &rloc);
308
309   /*
310    * find an existing or create a new adj
311    */
312   lai = lisp_adj_find (&rloc, sw_if_index);
313
314   ASSERT (INDEX_INVALID != lai);
315
316   ladj = pool_elt_at_index (lisp_adj_pool, lai);
317   lgt = lisp_gpe_tunnel_get (ladj->tunnel_index);
318   linkt = adj_get_link_type (ai);
319   af = ADJ_FLAG_MIDCHAIN_IP_STACK;
320   if (VNET_LINK_ETHERNET == linkt)
321     af |= ADJ_FLAG_MIDCHAIN_NO_COUNT;
322
323   adj_nbr_midchain_update_rewrite
324     (ai, lisp_gpe_fixup, NULL, af,
325      lisp_gpe_tunnel_build_rewrite (lgt, ladj,
326                                     lisp_gpe_adj_proto_from_vnet_link_type
327                                     (linkt)));
328
329   lisp_gpe_adj_stack_one (ladj, ai);
330 }
331
332 u8 *
333 lisp_gpe_build_rewrite (vnet_main_t * vnm,
334                         u32 sw_if_index,
335                         vnet_link_t link_type, const void *dst_address)
336 {
337   ASSERT (0);
338   return (NULL);
339 }
340
341 index_t
342 lisp_gpe_adjacency_find_or_create_and_lock (const locator_pair_t * pair,
343                                             u32 overlay_table_id, u32 vni)
344 {
345   const lisp_gpe_sub_interface_t *l3s;
346   const lisp_gpe_tunnel_t *lgt;
347   lisp_gpe_adjacency_t *ladj;
348   index_t lai, l3si;
349
350   /*
351    * first find the L3 sub-interface that corresponds to the loacl-rloc and vni
352    */
353   l3si = lisp_gpe_sub_interface_find_or_create_and_lock (&pair->lcl_loc,
354                                                          overlay_table_id,
355                                                          vni);
356   l3s = lisp_gpe_sub_interface_get (l3si);
357
358   /*
359    * find an existing or create a new adj
360    */
361   lai = lisp_adj_find (&pair->rmt_loc, l3s->sw_if_index);
362
363   if (INDEX_INVALID == lai)
364     {
365
366       pool_get (lisp_adj_pool, ladj);
367       clib_memset (ladj, 0, sizeof (*ladj));
368       lai = (ladj - lisp_adj_pool);
369
370       ip_address_copy (&ladj->remote_rloc, &pair->rmt_loc);
371       ladj->vni = vni;
372       /* transfer the lock to the adj */
373       ladj->lisp_l3_sub_index = l3si;
374       ladj->sw_if_index = l3s->sw_if_index;
375
376       /* if vni is non-default */
377       if (ladj->vni)
378         ladj->flags = LISP_GPE_FLAGS_I;
379
380       /* work in lisp-gpe not legacy mode */
381       ladj->flags |= LISP_GPE_FLAGS_P;
382
383       /*
384        * find the tunnel that will provide the underlying transport
385        * and hence the rewrite.
386        * The RLOC FIB index is default table - always.
387        */
388       ladj->tunnel_index = lisp_gpe_tunnel_find_or_create_and_lock (pair, 0);
389
390       lgt = lisp_gpe_tunnel_get (ladj->tunnel_index);
391
392       /*
393        * become of child of the RLOC FIB entry so we are updated when
394        * its reachability changes, allowing us to re-stack the midcahins
395        */
396       ladj->fib_entry_child_index = fib_entry_child_add (lgt->fib_entry_index,
397                                                          FIB_NODE_TYPE_LISP_ADJ,
398                                                          lai);
399
400       lisp_adj_insert (&ladj->remote_rloc, ladj->sw_if_index, lai);
401     }
402   else
403     {
404       /* unlock the interface from the find. */
405       lisp_gpe_sub_interface_unlock (l3si);
406       ladj = lisp_gpe_adjacency_get_i (lai);
407     }
408
409   ladj->locks++;
410
411   return (lai);
412 }
413
414 /**
415  * @brief Get a pointer to a tunnel from a pointer to a FIB node
416  */
417 static lisp_gpe_adjacency_t *
418 lisp_gpe_adjacency_from_fib_node (const fib_node_t * node)
419 {
420   return ((lisp_gpe_adjacency_t *)
421           ((char *) node -
422            STRUCT_OFFSET_OF (lisp_gpe_adjacency_t, fib_node)));
423 }
424
425 static void
426 lisp_gpe_adjacency_last_lock_gone (lisp_gpe_adjacency_t * ladj)
427 {
428   const lisp_gpe_tunnel_t *lgt;
429
430   /*
431    * no children so we are not counting locks. no-op.
432    * at least not counting
433    */
434   lisp_adj_remove (&ladj->remote_rloc, ladj->sw_if_index);
435
436   /*
437    * unlock the resources this adj holds
438    */
439   lgt = lisp_gpe_tunnel_get (ladj->tunnel_index);
440
441   fib_entry_child_remove (lgt->fib_entry_index, ladj->fib_entry_child_index);
442
443   lisp_gpe_tunnel_unlock (ladj->tunnel_index);
444   lisp_gpe_sub_interface_unlock (ladj->lisp_l3_sub_index);
445
446   pool_put (lisp_adj_pool, ladj);
447 }
448
449 void
450 lisp_gpe_adjacency_unlock (index_t lai)
451 {
452   lisp_gpe_adjacency_t *ladj;
453
454   ladj = lisp_gpe_adjacency_get_i (lai);
455
456   ladj->locks--;
457
458   if (0 == ladj->locks)
459     {
460       lisp_gpe_adjacency_last_lock_gone (ladj);
461     }
462 }
463
464 const lisp_gpe_adjacency_t *
465 lisp_gpe_adjacency_get (index_t lai)
466 {
467   return (lisp_gpe_adjacency_get_i (lai));
468 }
469
470
471 /**
472  * @brief LISP GPE tunnel back walk
473  *
474  * The FIB entry through which this tunnel resolves has been updated.
475  * re-stack the midchain on the new forwarding.
476  */
477 static fib_node_back_walk_rc_t
478 lisp_gpe_adjacency_back_walk (fib_node_t * node,
479                               fib_node_back_walk_ctx_t * ctx)
480 {
481   lisp_gpe_adj_stack (lisp_gpe_adjacency_from_fib_node (node));
482
483   return (FIB_NODE_BACK_WALK_CONTINUE);
484 }
485
486 static fib_node_t *
487 lisp_gpe_adjacency_get_fib_node (fib_node_index_t index)
488 {
489   lisp_gpe_adjacency_t *ladj;
490
491   ladj = pool_elt_at_index (lisp_adj_pool, index);
492   return (&ladj->fib_node);
493 }
494
495 static void
496 lisp_gpe_adjacency_last_fib_lock_gone (fib_node_t * node)
497 {
498   lisp_gpe_adjacency_last_lock_gone (lisp_gpe_adjacency_from_fib_node (node));
499 }
500
501 const static fib_node_vft_t lisp_gpe_tuennel_vft = {
502   .fnv_get = lisp_gpe_adjacency_get_fib_node,
503   .fnv_back_walk = lisp_gpe_adjacency_back_walk,
504   .fnv_last_lock = lisp_gpe_adjacency_last_fib_lock_gone,
505 };
506
507 u8 *
508 format_lisp_gpe_adjacency (u8 * s, va_list * args)
509 {
510   lisp_gpe_adjacency_t *ladj = va_arg (*args, lisp_gpe_adjacency_t *);
511   lisp_gpe_adjacency_format_flags_t flags =
512     va_arg (*args, lisp_gpe_adjacency_format_flags_t);
513
514   if (flags & LISP_GPE_ADJ_FORMAT_FLAG_DETAIL)
515     {
516       s =
517         format (s, "index %d locks:%d\n", ladj - lisp_adj_pool, ladj->locks);
518     }
519
520   s = format (s, " vni: %d,", ladj->vni);
521   s = format (s, " remote-RLOC: %U,", format_ip_address, &ladj->remote_rloc);
522
523   if (flags & LISP_GPE_ADJ_FORMAT_FLAG_DETAIL)
524     {
525       s = format (s, " %U\n",
526                   format_lisp_gpe_sub_interface,
527                   lisp_gpe_sub_interface_get (ladj->lisp_l3_sub_index));
528       s = format (s, " %U\n",
529                   format_lisp_gpe_tunnel,
530                   lisp_gpe_tunnel_get (ladj->tunnel_index));
531     }
532   else
533     {
534       s = format (s, " LISP L3 sub-interface index: %d,",
535                   ladj->lisp_l3_sub_index);
536       s = format (s, " LISP tunnel index: %d", ladj->tunnel_index);
537     }
538
539
540   return (s);
541 }
542
543 static clib_error_t *
544 lisp_gpe_adjacency_show (vlib_main_t * vm,
545                          unformat_input_t * input, vlib_cli_command_t * cmd)
546 {
547   lisp_gpe_adjacency_t *ladj;
548   index_t index;
549
550   if (pool_elts (lisp_adj_pool) == 0)
551     vlib_cli_output (vm, "No lisp-gpe Adjacencies");
552
553   if (unformat (input, "%d", &index))
554     {
555       ladj = lisp_gpe_adjacency_get_i (index);
556       vlib_cli_output (vm, "%U", format_lisp_gpe_adjacency, ladj,
557                        LISP_GPE_ADJ_FORMAT_FLAG_DETAIL);
558     }
559   else
560     {
561       /* *INDENT-OFF* */
562       pool_foreach (ladj, lisp_adj_pool)
563        {
564         vlib_cli_output (vm, "[%d] %U\n",
565                          ladj - lisp_adj_pool,
566                          format_lisp_gpe_adjacency, ladj,
567                          LISP_GPE_ADJ_FORMAT_FLAG_NONE);
568       }
569       /* *INDENT-ON* */
570     }
571
572   return 0;
573 }
574
575 /* *INDENT-OFF* */
576 VLIB_CLI_COMMAND (show_lisp_gpe_tunnel_command, static) =
577 {
578   .path = "show gpe adjacency",
579   .function = lisp_gpe_adjacency_show,
580 };
581 /* *INDENT-ON* */
582
583 #define LISP_ADJ_NBR_DEFAULT_HASH_NUM_BUCKETS (256)
584 #define LISP_ADJ_NBR_DEFAULT_HASH_MEMORY_SIZE (1<<20)
585
586 static clib_error_t *
587 lisp_gpe_adj_module_init (vlib_main_t * vm)
588 {
589   BV (clib_bihash_init) (&lisp_adj_db,
590                          "Adjacency Neighbour table",
591                          LISP_ADJ_NBR_DEFAULT_HASH_NUM_BUCKETS,
592                          LISP_ADJ_NBR_DEFAULT_HASH_MEMORY_SIZE);
593
594   fib_node_register_type (FIB_NODE_TYPE_LISP_ADJ, &lisp_gpe_tuennel_vft);
595   return (NULL);
596 }
597
598 VLIB_INIT_FUNCTION (lisp_gpe_adj_module_init);
599 /*
600  * fd.io coding-style-patch-verification: ON
601  *
602  * Local Variables:
603  * eval: (c-set-style "gnu")
604  * End:
605  */