fib: supporting inner flow hash on tunnels
[vpp.git] / src / vnet / ipip / ipip.c
1 /*
2  * ipip.c: ipip
3  *
4  * Copyright (c) 2018 Cisco and/or its affiliates.
5  * Licensed under the Apache License, Version 2.0 (the "License");
6  * you may not use this file except in compliance with the License.
7  * You may obtain a copy of the License at:
8  *
9  *     http://www.apache.org/licenses/LICENSE-2.0
10  *
11  * Unless required by applicable law or aipiped to in writing, software
12  * distributed under the License is distributed on an "AS IS" BASIS,
13  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
14  * See the License for the specific language governing permissions and
15  * limitations under the License.
16  */
17
18 #include <stddef.h>
19 #include <vnet/adj/adj_midchain.h>
20 #include <vnet/ipip/ipip.h>
21 #include <vnet/vnet.h>
22 #include <vnet/adj/adj_nbr.h>
23 #include <vnet/adj/adj_midchain.h>
24 #include <vnet/fib/ip4_fib.h>
25 #include <vnet/fib/ip6_fib.h>
26 #include <vnet/ip/format.h>
27 #include <vnet/ipip/ipip.h>
28 #include <vnet/teib/teib.h>
29 #include <vnet/tunnel/tunnel_dp.h>
30
31 ipip_main_t ipip_main;
32
33 /* Packet trace structure */
34 typedef struct
35 {
36   u32 tunnel_id;
37   u32 length;
38   ip46_address_t src;
39   ip46_address_t dst;
40 } ipip_tx_trace_t;
41
42 u8 *
43 format_ipip_tx_trace (u8 * s, va_list * args)
44 {
45   CLIB_UNUSED (vlib_main_t * vm) = va_arg (*args, vlib_main_t *);
46   CLIB_UNUSED (vlib_node_t * node) = va_arg (*args, vlib_node_t *);
47   ipip_tx_trace_t *t = va_arg (*args, ipip_tx_trace_t *);
48
49   s =
50     format (s, "IPIP: tunnel %d len %d src %U dst %U", t->tunnel_id,
51             t->length, format_ip46_address, &t->src, IP46_TYPE_ANY,
52             format_ip46_address, &t->dst, IP46_TYPE_ANY);
53   return s;
54 }
55
56 static u8 *
57 ipip_build_rewrite (vnet_main_t * vnm, u32 sw_if_index,
58                     vnet_link_t link_type, const void *dst_address)
59 {
60   const ip46_address_t *dst;
61   ip4_header_t *ip4;
62   ip6_header_t *ip6;
63   u8 *rewrite = NULL;
64   ipip_tunnel_t *t;
65
66   dst = dst_address;
67   t = ipip_tunnel_db_find_by_sw_if_index (sw_if_index);
68
69   if (!t)
70     /* not one of ours */
71     return (0);
72
73   switch (t->transport)
74     {
75     case IPIP_TRANSPORT_IP4:
76       vec_validate (rewrite, sizeof (*ip4) - 1);
77       ip4 = (ip4_header_t *) rewrite;
78       ip4->ip_version_and_header_length = 0x45;
79       ip4->ttl = 64;
80       /* fixup ip4 header length, protocol and checksum after-the-fact */
81       ip4->src_address.as_u32 = t->tunnel_src.ip4.as_u32;
82       ip4->dst_address.as_u32 = dst->ip4.as_u32;
83       if (!(t->flags & TUNNEL_ENCAP_DECAP_FLAG_ENCAP_COPY_DSCP))
84         ip4_header_set_dscp (ip4, t->dscp);
85       if (t->flags & TUNNEL_ENCAP_DECAP_FLAG_ENCAP_SET_DF)
86         ip4_header_set_df (ip4);
87
88       switch (link_type)
89         {
90         case VNET_LINK_IP6:
91           ip4->protocol = IP_PROTOCOL_IPV6;
92           break;
93         case VNET_LINK_IP4:
94           ip4->protocol = IP_PROTOCOL_IP_IN_IP;
95           break;
96         default:
97           break;
98         }
99       ip4->checksum = ip4_header_checksum (ip4);
100       break;
101
102     case IPIP_TRANSPORT_IP6:
103       vec_validate (rewrite, sizeof (*ip6) - 1);
104       ip6 = (ip6_header_t *) rewrite;
105       ip6->ip_version_traffic_class_and_flow_label =
106         clib_host_to_net_u32 (6 << 28);
107       ip6->hop_limit = 64;
108       /* fixup ip6 header length and protocol after-the-fact */
109       ip6->src_address.as_u64[0] = t->tunnel_src.ip6.as_u64[0];
110       ip6->src_address.as_u64[1] = t->tunnel_src.ip6.as_u64[1];
111       ip6->dst_address.as_u64[0] = dst->ip6.as_u64[0];
112       ip6->dst_address.as_u64[1] = dst->ip6.as_u64[1];
113       if (!(t->flags & TUNNEL_ENCAP_DECAP_FLAG_ENCAP_COPY_DSCP))
114         ip6_set_dscp_network_order (ip6, t->dscp);
115
116       switch (link_type)
117         {
118         case VNET_LINK_IP6:
119           ip6->protocol = IP_PROTOCOL_IPV6;
120           break;
121         case VNET_LINK_IP4:
122           ip6->protocol = IP_PROTOCOL_IP_IN_IP;
123           break;
124         default:
125           break;
126         }
127       break;
128     }
129   return (rewrite);
130 }
131
132 static void
133 ipip64_fixup (vlib_main_t * vm, const ip_adjacency_t * adj, vlib_buffer_t * b,
134               const void *data)
135 {
136   tunnel_encap_decap_flags_t flags;
137   ip4_header_t *ip4;
138
139   flags = pointer_to_uword (data);
140
141   ip4 = vlib_buffer_get_current (b);
142   ip4->length = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b));
143   tunnel_encap_fixup_6o4 (flags, ((ip6_header_t *) (ip4 + 1)), ip4);
144
145   ip4->checksum = ip4_header_checksum (ip4);
146 }
147
148 static void
149 ipip44_fixup (vlib_main_t * vm, const ip_adjacency_t * adj, vlib_buffer_t * b,
150               const void *data)
151 {
152   tunnel_encap_decap_flags_t flags;
153   ip4_header_t *ip4;
154
155   flags = pointer_to_uword (data);
156
157   ip4 = vlib_buffer_get_current (b);
158   ip4->length = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b));
159   tunnel_encap_fixup_4o4 (flags, ip4 + 1, ip4);
160
161   ip4->checksum = ip4_header_checksum (ip4);
162 }
163
164 static void
165 ipip46_fixup (vlib_main_t * vm, const ip_adjacency_t * adj, vlib_buffer_t * b,
166               const void *data)
167 {
168   tunnel_encap_decap_flags_t flags;
169   ip6_header_t *ip6;
170
171   flags = pointer_to_uword (data);
172
173   /* Must set locally originated otherwise we're not allowed to
174      fragment the packet later */
175   b->flags |= VNET_BUFFER_F_LOCALLY_ORIGINATED;
176
177   ip6 = vlib_buffer_get_current (b);
178   ip6->payload_length =
179     clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b) -
180                           sizeof (*ip6));
181   tunnel_encap_fixup_4o6 (flags, ((ip4_header_t *) (ip6 + 1)), ip6);
182 }
183
184 static void
185 ipip66_fixup (vlib_main_t * vm,
186               const ip_adjacency_t * adj, vlib_buffer_t * b, const void *data)
187 {
188   tunnel_encap_decap_flags_t flags;
189   ip6_header_t *ip6;
190
191   flags = pointer_to_uword (data);
192
193   /* Must set locally originated otherwise we're not allowed to
194      fragment the packet later */
195   b->flags |= VNET_BUFFER_F_LOCALLY_ORIGINATED;
196
197   ip6 = vlib_buffer_get_current (b);
198   ip6->payload_length =
199     clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b) -
200                           sizeof (*ip6));
201   tunnel_encap_fixup_6o6 (flags, ip6 + 1, ip6);
202 }
203
204 static void
205 ipip_tunnel_stack (adj_index_t ai)
206 {
207   ip_adjacency_t *adj;
208   ipip_tunnel_t *t;
209   u32 sw_if_index;
210
211   adj = adj_get (ai);
212   sw_if_index = adj->rewrite_header.sw_if_index;
213
214   t = ipip_tunnel_db_find_by_sw_if_index (sw_if_index);
215   if (!t)
216     return;
217
218   if ((vnet_hw_interface_get_flags (vnet_get_main (), t->hw_if_index) &
219        VNET_HW_INTERFACE_FLAG_LINK_UP) == 0)
220     {
221       adj_midchain_delegate_unstack (ai);
222     }
223   else
224     {
225       /* *INDENT-OFF* */
226       fib_prefix_t dst = {
227         .fp_len = t->transport == IPIP_TRANSPORT_IP6 ? 128 : 32,
228         .fp_proto = (t->transport == IPIP_TRANSPORT_IP6 ?
229                      FIB_PROTOCOL_IP6 :
230                      FIB_PROTOCOL_IP4),
231         .fp_addr = t->tunnel_dst
232       };
233       /* *INDENT-ON* */
234
235       adj_midchain_delegate_stack (ai, t->fib_index, &dst);
236     }
237 }
238
239 static adj_walk_rc_t
240 ipip_adj_walk_cb (adj_index_t ai, void *ctx)
241 {
242   ipip_tunnel_stack (ai);
243
244   return (ADJ_WALK_RC_CONTINUE);
245 }
246
247 static void
248 ipip_tunnel_restack (ipip_tunnel_t * gt)
249 {
250   fib_protocol_t proto;
251
252   /*
253    * walk all the adjacencies on th IPIP interface and restack them
254    */
255   FOR_EACH_FIB_IP_PROTOCOL (proto)
256   {
257     adj_nbr_walk (gt->sw_if_index, proto, ipip_adj_walk_cb, NULL);
258   }
259 }
260
261 static adj_midchain_fixup_t
262 ipip_get_fixup (const ipip_tunnel_t * t, vnet_link_t lt, adj_flags_t * aflags)
263 {
264   if (t->transport == IPIP_TRANSPORT_IP6 && lt == VNET_LINK_IP6)
265     return (ipip66_fixup);
266   if (t->transport == IPIP_TRANSPORT_IP6 && lt == VNET_LINK_IP4)
267     return (ipip46_fixup);
268   if (t->transport == IPIP_TRANSPORT_IP4 && lt == VNET_LINK_IP6)
269     return (ipip64_fixup);
270   if (t->transport == IPIP_TRANSPORT_IP4 && lt == VNET_LINK_IP4)
271     {
272       *aflags = *aflags | ADJ_FLAG_MIDCHAIN_FIXUP_IP4O4_HDR;
273       return (ipip44_fixup);
274     }
275
276   ASSERT (0);
277   return (ipip44_fixup);
278 }
279
280 void
281 ipip_update_adj (vnet_main_t * vnm, u32 sw_if_index, adj_index_t ai)
282 {
283   adj_midchain_fixup_t fixup;
284   ipip_tunnel_t *t;
285   adj_flags_t af;
286
287   t = ipip_tunnel_db_find_by_sw_if_index (sw_if_index);
288   if (!t)
289     return;
290
291   if (t->flags & TUNNEL_ENCAP_DECAP_FLAG_ENCAP_INNER_HASH)
292     af = ADJ_FLAG_MIDCHAIN_FIXUP_FLOW_HASH;
293   else
294     af = ADJ_FLAG_MIDCHAIN_IP_STACK;
295
296   if (VNET_LINK_ETHERNET == adj_get_link_type (ai))
297     af |= ADJ_FLAG_MIDCHAIN_NO_COUNT;
298
299   fixup = ipip_get_fixup (t, adj_get_link_type (ai), &af);
300   adj_nbr_midchain_update_rewrite
301     (ai, fixup,
302      uword_to_pointer (t->flags, void *), af,
303      ipip_build_rewrite (vnm, sw_if_index,
304                          adj_get_link_type (ai), &t->tunnel_dst));
305   ipip_tunnel_stack (ai);
306 }
307
308 typedef struct mipip_walk_ctx_t_
309 {
310   const ipip_tunnel_t *t;
311   const teib_entry_t *ne;
312 } mipip_walk_ctx_t;
313
314 static adj_walk_rc_t
315 mipip_mk_complete_walk (adj_index_t ai, void *data)
316 {
317   adj_midchain_fixup_t fixup;
318   mipip_walk_ctx_t *ctx = data;
319   adj_flags_t af;
320
321   af = ADJ_FLAG_NONE;
322   fixup = ipip_get_fixup (ctx->t, adj_get_link_type (ai), &af);
323
324   if (ctx->t->flags & TUNNEL_ENCAP_DECAP_FLAG_ENCAP_INNER_HASH)
325     af = ADJ_FLAG_MIDCHAIN_FIXUP_FLOW_HASH;
326   else
327     af = ADJ_FLAG_MIDCHAIN_IP_STACK;
328
329   adj_nbr_midchain_update_rewrite
330     (ai, fixup,
331      uword_to_pointer (ctx->t->flags, void *),
332      af, ipip_build_rewrite (vnet_get_main (),
333                              ctx->t->sw_if_index,
334                              adj_get_link_type (ai),
335                              &teib_entry_get_nh (ctx->ne)->fp_addr));
336
337   teib_entry_adj_stack (ctx->ne, ai);
338
339   return (ADJ_WALK_RC_CONTINUE);
340 }
341
342 static adj_walk_rc_t
343 mipip_mk_incomplete_walk (adj_index_t ai, void *data)
344 {
345   adj_midchain_fixup_t fixup;
346   ipip_tunnel_t *t = data;
347   adj_flags_t af;
348
349   af = ADJ_FLAG_NONE;
350   fixup = ipip_get_fixup (t, adj_get_link_type (ai), &af);
351
352   adj_nbr_midchain_update_rewrite (ai, fixup, NULL, ADJ_FLAG_NONE, NULL);
353
354   adj_midchain_delegate_unstack (ai);
355
356   return (ADJ_WALK_RC_CONTINUE);
357 }
358
359 void
360 mipip_update_adj (vnet_main_t * vnm, u32 sw_if_index, adj_index_t ai)
361 {
362   ipip_main_t *gm = &ipip_main;
363   adj_midchain_fixup_t fixup;
364   ip_adjacency_t *adj;
365   teib_entry_t *ne;
366   ipip_tunnel_t *t;
367   adj_flags_t af;
368   u32 ti;
369
370   af = ADJ_FLAG_NONE;
371   adj = adj_get (ai);
372   ti = gm->tunnel_index_by_sw_if_index[sw_if_index];
373   t = pool_elt_at_index (gm->tunnels, ti);
374
375   ne = teib_entry_find_46 (sw_if_index,
376                            adj->ia_nh_proto, &adj->sub_type.nbr.next_hop);
377
378   if (NULL == ne)
379     {
380       // no TEIB entry to provide the next-hop
381       fixup = ipip_get_fixup (t, adj_get_link_type (ai), &af);
382       adj_nbr_midchain_update_rewrite
383         (ai, fixup, uword_to_pointer (t->flags, void *), ADJ_FLAG_NONE, NULL);
384       return;
385     }
386
387   mipip_walk_ctx_t ctx = {
388     .t = t,
389     .ne = ne
390   };
391   adj_nbr_walk_nh (sw_if_index,
392                    adj->ia_nh_proto,
393                    &adj->sub_type.nbr.next_hop, mipip_mk_complete_walk, &ctx);
394 }
395
396 static u8 *
397 format_ipip_tunnel_name (u8 * s, va_list * args)
398 {
399   u32 dev_instance = va_arg (*args, u32);
400   ipip_main_t *gm = &ipip_main;
401   ipip_tunnel_t *t;
402
403   if (dev_instance >= vec_len (gm->tunnels))
404     return format (s, "<improperly-referenced>");
405
406   t = pool_elt_at_index (gm->tunnels, dev_instance);
407   return format (s, "ipip%d", t->user_instance);
408 }
409
410 static u8 *
411 format_ipip_device (u8 * s, va_list * args)
412 {
413   u32 dev_instance = va_arg (*args, u32);
414   CLIB_UNUSED (int verbose) = va_arg (*args, int);
415
416   s = format (s, "IPIP tunnel: id %d\n", dev_instance);
417   return s;
418 }
419
420 static clib_error_t *
421 ipip_interface_admin_up_down (vnet_main_t * vnm, u32 hw_if_index, u32 flags)
422 {
423   vnet_hw_interface_t *hi;
424   ipip_tunnel_t *t;
425
426   hi = vnet_get_hw_interface (vnm, hw_if_index);
427
428   t = ipip_tunnel_db_find_by_sw_if_index (hi->sw_if_index);
429   if (!t)
430     return 0;
431
432   if (flags & VNET_SW_INTERFACE_FLAG_ADMIN_UP)
433     vnet_hw_interface_set_flags (vnm, hw_if_index,
434                                  VNET_HW_INTERFACE_FLAG_LINK_UP);
435   else
436     vnet_hw_interface_set_flags (vnm, hw_if_index, 0 /* down */ );
437
438   ipip_tunnel_restack (t);
439
440   return /* no error */ 0;
441 }
442
443 static int
444 ipip_tunnel_desc (u32 sw_if_index,
445                   ip46_address_t * src, ip46_address_t * dst, u8 * is_l2)
446 {
447   ipip_tunnel_t *t;
448
449   t = ipip_tunnel_db_find_by_sw_if_index (sw_if_index);
450   if (!t)
451     return -1;
452
453   *src = t->tunnel_src;
454   *dst = t->tunnel_dst;
455   *is_l2 = 0;
456
457   return (0);
458 }
459
460 /* *INDENT-OFF* */
461 VNET_DEVICE_CLASS(ipip_device_class) = {
462     .name = "IPIP tunnel device",
463     .format_device_name = format_ipip_tunnel_name,
464     .format_device = format_ipip_device,
465     .format_tx_trace = format_ipip_tx_trace,
466     .admin_up_down_function = ipip_interface_admin_up_down,
467     .ip_tun_desc = ipip_tunnel_desc,
468 #ifdef SOON
469     .clear counter = 0;
470 #endif
471 };
472
473 VNET_HW_INTERFACE_CLASS(ipip_hw_interface_class) = {
474     .name = "IPIP",
475     //.format_header = format_ipip_header_with_length,
476     //.unformat_header = unformat_ipip_header,
477     .build_rewrite = ipip_build_rewrite,
478     .update_adjacency = ipip_update_adj,
479     .flags = VNET_HW_INTERFACE_CLASS_FLAG_P2P,
480 };
481
482 VNET_HW_INTERFACE_CLASS(mipip_hw_interface_class) = {
483     .name = "mIPIP",
484     //.format_header = format_ipip_header_with_length,
485     //.unformat_header = unformat_ipip_header,
486     .build_rewrite = ipip_build_rewrite,
487     .update_adjacency = mipip_update_adj,
488     .flags = VNET_HW_INTERFACE_CLASS_FLAG_NBMA,
489 };
490 /* *INDENT-ON* */
491
492 ipip_tunnel_t *
493 ipip_tunnel_db_find (const ipip_tunnel_key_t * key)
494 {
495   ipip_main_t *gm = &ipip_main;
496   uword *p;
497
498   p = hash_get_mem (gm->tunnel_by_key, key);
499   if (!p)
500     return (NULL);
501   return (pool_elt_at_index (gm->tunnels, p[0]));
502 }
503
504 ipip_tunnel_t *
505 ipip_tunnel_db_find_by_sw_if_index (u32 sw_if_index)
506 {
507   ipip_main_t *gm = &ipip_main;
508   if (vec_len (gm->tunnel_index_by_sw_if_index) <= sw_if_index)
509     return NULL;
510   u32 ti = gm->tunnel_index_by_sw_if_index[sw_if_index];
511   if (ti == ~0)
512     return NULL;
513   return pool_elt_at_index (gm->tunnels, ti);
514 }
515
516 void
517 ipip_tunnel_db_add (ipip_tunnel_t * t, const ipip_tunnel_key_t * key)
518 {
519   ipip_main_t *gm = &ipip_main;
520
521   hash_set_mem_alloc (&gm->tunnel_by_key, key, t->dev_instance);
522 }
523
524 void
525 ipip_tunnel_db_remove (ipip_tunnel_t * t, const ipip_tunnel_key_t * key)
526 {
527   ipip_main_t *gm = &ipip_main;
528
529   hash_unset_mem_free (&gm->tunnel_by_key, key);
530 }
531
532 void
533 ipip_mk_key_i (ipip_transport_t transport,
534                ipip_mode_t mode,
535                const ip46_address_t * src,
536                const ip46_address_t * dst,
537                u32 fib_index, ipip_tunnel_key_t * key)
538 {
539   key->transport = transport;
540   key->mode = mode;
541   key->src = *src;
542   key->dst = *dst;
543   key->fib_index = fib_index;
544   key->__pad = 0;;
545 }
546
547 void
548 ipip_mk_key (const ipip_tunnel_t * t, ipip_tunnel_key_t * key)
549 {
550   ipip_mk_key_i (t->transport, t->mode,
551                  &t->tunnel_src, &t->tunnel_dst, t->fib_index, key);
552 }
553
554 static void
555 ipip_teib_mk_key (const ipip_tunnel_t * t,
556                   const teib_entry_t * ne, ipip_tunnel_key_t * key)
557 {
558   const fib_prefix_t *nh;
559
560   nh = teib_entry_get_nh (ne);
561
562   /* construct the key using mode P2P so it can be found in the DP */
563   ipip_mk_key_i (t->transport, IPIP_MODE_P2P,
564                  &t->tunnel_src, &nh->fp_addr,
565                  teib_entry_get_fib_index (ne), key);
566 }
567
568 static void
569 ipip_teib_entry_added (const teib_entry_t * ne)
570 {
571   ipip_main_t *gm = &ipip_main;
572   const ip_address_t *nh;
573   ipip_tunnel_key_t key;
574   ipip_tunnel_t *t;
575   u32 sw_if_index;
576   u32 t_idx;
577
578   sw_if_index = teib_entry_get_sw_if_index (ne);
579   if (vec_len (gm->tunnel_index_by_sw_if_index) < sw_if_index)
580     return;
581
582   t_idx = gm->tunnel_index_by_sw_if_index[sw_if_index];
583
584   if (INDEX_INVALID == t_idx)
585     return;
586
587   t = pool_elt_at_index (gm->tunnels, t_idx);
588
589   ipip_teib_mk_key (t, ne, &key);
590   ipip_tunnel_db_add (t, &key);
591
592   // update the rewrites for each of the adjacencies for this next-hop
593   mipip_walk_ctx_t ctx = {
594     .t = t,
595     .ne = ne
596   };
597   nh = teib_entry_get_peer (ne);
598   adj_nbr_walk_nh (teib_entry_get_sw_if_index (ne),
599                    (AF_IP4 == ip_addr_version (nh) ?
600                     FIB_PROTOCOL_IP4 :
601                     FIB_PROTOCOL_IP6),
602                    &ip_addr_46 (nh), mipip_mk_complete_walk, &ctx);
603 }
604
605 static void
606 ipip_teib_entry_deleted (const teib_entry_t * ne)
607 {
608   ipip_main_t *gm = &ipip_main;
609   const ip_address_t *nh;
610   ipip_tunnel_key_t key;
611   ipip_tunnel_t *t;
612   u32 sw_if_index;
613   u32 t_idx;
614
615   sw_if_index = teib_entry_get_sw_if_index (ne);
616   if (vec_len (gm->tunnel_index_by_sw_if_index) < sw_if_index)
617     return;
618
619   t_idx = gm->tunnel_index_by_sw_if_index[sw_if_index];
620
621   if (INDEX_INVALID == t_idx)
622     return;
623
624   t = pool_elt_at_index (gm->tunnels, t_idx);
625
626   ipip_teib_mk_key (t, ne, &key);
627   ipip_tunnel_db_remove (t, &key);
628
629   nh = teib_entry_get_peer (ne);
630
631   /* make all the adjacencies incomplete */
632   adj_nbr_walk_nh (teib_entry_get_sw_if_index (ne),
633                    (AF_IP4 == ip_addr_version (nh) ?
634                     FIB_PROTOCOL_IP4 :
635                     FIB_PROTOCOL_IP6),
636                    &ip_addr_46 (nh), mipip_mk_incomplete_walk, t);
637 }
638
639 static walk_rc_t
640 ipip_tunnel_delete_teib_walk (index_t nei, void *ctx)
641 {
642   ipip_tunnel_t *t = ctx;
643   ipip_tunnel_key_t key;
644
645   ipip_teib_mk_key (t, teib_entry_get (nei), &key);
646   ipip_tunnel_db_remove (t, &key);
647
648   return (WALK_CONTINUE);
649 }
650
651 static walk_rc_t
652 ipip_tunnel_add_teib_walk (index_t nei, void *ctx)
653 {
654   ipip_tunnel_t *t = ctx;
655   ipip_tunnel_key_t key;
656
657   ipip_teib_mk_key (t, teib_entry_get (nei), &key);
658   ipip_tunnel_db_add (t, &key);
659
660   return (WALK_CONTINUE);
661 }
662
663 int
664 ipip_add_tunnel (ipip_transport_t transport,
665                  u32 instance, ip46_address_t * src, ip46_address_t * dst,
666                  u32 fib_index, tunnel_encap_decap_flags_t flags,
667                  ip_dscp_t dscp, tunnel_mode_t tmode, u32 * sw_if_indexp)
668 {
669   ipip_main_t *gm = &ipip_main;
670   vnet_main_t *vnm = gm->vnet_main;
671   ip4_main_t *im4 = &ip4_main;
672   ip6_main_t *im6 = &ip6_main;
673   ipip_tunnel_t *t;
674   vnet_hw_interface_t *hi;
675   u32 hw_if_index, sw_if_index;
676   ipip_tunnel_key_t key;
677   ipip_mode_t mode;
678
679   if (tmode == TUNNEL_MODE_MP && !ip46_address_is_zero (dst))
680     return (VNET_API_ERROR_INVALID_DST_ADDRESS);
681
682   mode = (tmode == TUNNEL_MODE_P2P ? IPIP_MODE_P2P : IPIP_MODE_P2MP);
683   ipip_mk_key_i (transport, mode, src, dst, fib_index, &key);
684
685   t = ipip_tunnel_db_find (&key);
686   if (t)
687     {
688       if (sw_if_indexp)
689         sw_if_indexp[0] = t->sw_if_index;
690       return VNET_API_ERROR_IF_ALREADY_EXISTS;
691     }
692
693   pool_get_aligned (gm->tunnels, t, CLIB_CACHE_LINE_BYTES);
694   clib_memset (t, 0, sizeof (*t));
695
696   /* Reconcile the real dev_instance and a possible requested instance */
697   u32 t_idx = t - gm->tunnels;  /* tunnel index (or instance) */
698   u32 u_idx = instance;         /* user specified instance */
699   if (u_idx == ~0)
700     u_idx = t_idx;
701   if (hash_get (gm->instance_used, u_idx))
702     {
703       pool_put (gm->tunnels, t);
704       return VNET_API_ERROR_INSTANCE_IN_USE;
705     }
706   hash_set (gm->instance_used, u_idx, 1);
707
708   t->dev_instance = t_idx;      /* actual */
709   t->user_instance = u_idx;     /* name */
710
711   hw_if_index = vnet_register_interface (vnm, ipip_device_class.index, t_idx,
712                                          (mode == IPIP_MODE_P2P ?
713                                           ipip_hw_interface_class.index :
714                                           mipip_hw_interface_class.index),
715                                          t_idx);
716
717   hi = vnet_get_hw_interface (vnm, hw_if_index);
718   sw_if_index = hi->sw_if_index;
719
720   t->mode = mode;
721   t->hw_if_index = hw_if_index;
722   t->fib_index = fib_index;
723   t->sw_if_index = sw_if_index;
724   t->dscp = dscp;
725   t->flags = flags;
726   t->transport = transport;
727
728   vec_validate_init_empty (gm->tunnel_index_by_sw_if_index, sw_if_index, ~0);
729   gm->tunnel_index_by_sw_if_index[sw_if_index] = t_idx;
730
731   if (t->transport == IPIP_TRANSPORT_IP4)
732     {
733       vec_validate (im4->fib_index_by_sw_if_index, sw_if_index);
734       hi->min_packet_bytes = 64 + sizeof (ip4_header_t);
735     }
736   else
737     {
738       vec_validate (im6->fib_index_by_sw_if_index, sw_if_index);
739       hi->min_packet_bytes = 64 + sizeof (ip6_header_t);
740     }
741
742   /* Standard default ipip MTU. */
743   vnet_sw_interface_set_mtu (vnm, sw_if_index, 9000);
744
745   t->tunnel_src = *src;
746   t->tunnel_dst = *dst;
747
748   ipip_tunnel_db_add (t, &key);
749
750   if (t->mode == IPIP_MODE_P2MP)
751     teib_walk_itf (t->sw_if_index, ipip_tunnel_add_teib_walk, t);
752
753   if (sw_if_indexp)
754     *sw_if_indexp = sw_if_index;
755
756   if (t->transport == IPIP_TRANSPORT_IP6 && !gm->ip6_protocol_registered)
757     {
758       ip6_register_protocol (IP_PROTOCOL_IP_IN_IP, ipip6_input_node.index);
759       ip6_register_protocol (IP_PROTOCOL_IPV6, ipip6_input_node.index);
760       gm->ip6_protocol_registered = true;
761     }
762   else if (t->transport == IPIP_TRANSPORT_IP4 && !gm->ip4_protocol_registered)
763     {
764       ip4_register_protocol (IP_PROTOCOL_IP_IN_IP, ipip4_input_node.index);
765       ip4_register_protocol (IP_PROTOCOL_IPV6, ipip4_input_node.index);
766       gm->ip4_protocol_registered = true;
767     }
768   return 0;
769 }
770
771 int
772 ipip_del_tunnel (u32 sw_if_index)
773 {
774   ipip_main_t *gm = &ipip_main;
775   vnet_main_t *vnm = gm->vnet_main;
776   ipip_tunnel_t *t;
777   ipip_tunnel_key_t key;
778
779   t = ipip_tunnel_db_find_by_sw_if_index (sw_if_index);
780   if (t == NULL)
781     return VNET_API_ERROR_NO_SUCH_ENTRY;
782
783   if (t->mode == IPIP_MODE_P2MP)
784     teib_walk_itf (t->sw_if_index, ipip_tunnel_delete_teib_walk, t);
785
786   vnet_sw_interface_set_flags (vnm, sw_if_index, 0 /* down */ );
787   gm->tunnel_index_by_sw_if_index[sw_if_index] = ~0;
788   vnet_delete_hw_interface (vnm, t->hw_if_index);
789   hash_unset (gm->instance_used, t->user_instance);
790
791   ipip_mk_key (t, &key);
792   ipip_tunnel_db_remove (t, &key);
793   pool_put (gm->tunnels, t);
794
795   return 0;
796 }
797
798 const static teib_vft_t ipip_teib_vft = {
799   .nv_added = ipip_teib_entry_added,
800   .nv_deleted = ipip_teib_entry_deleted,
801 };
802
803 static clib_error_t *
804 ipip_init (vlib_main_t * vm)
805 {
806   ipip_main_t *gm = &ipip_main;
807
808   clib_memset (gm, 0, sizeof (gm[0]));
809   gm->vlib_main = vm;
810   gm->vnet_main = vnet_get_main ();
811   gm->tunnel_by_key =
812     hash_create_mem (0, sizeof (ipip_tunnel_key_t), sizeof (uword));
813
814   teib_register (&ipip_teib_vft);
815
816   return 0;
817 }
818
819 VLIB_INIT_FUNCTION (ipip_init);
820
821 /*
822  * fd.io coding-style-patch-verification: ON
823  *
824  * Local Variables:
825  * eval: (c-set-style "gnu")
826  * End:
827  */