Add LISP RTR support
[vpp.git] / vnet / vnet / lisp-gpe / lisp_gpe.c
1 /*
2  * Copyright (c) 2016 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <vnet/lisp-gpe/lisp_gpe.h>
17
18 lisp_gpe_main_t lisp_gpe_main;
19
20 static int
21 lisp_gpe_rewrite (lisp_gpe_tunnel_t * t)
22 {
23   u8 *rw = 0;
24   lisp_gpe_header_t * lisp0;
25   int len;
26
27   if (ip_addr_version(&t->src) == IP4)
28     {
29       ip4_header_t * ip0;
30       ip4_udp_lisp_gpe_header_t * h0;
31       len = sizeof(*h0);
32
33       vec_validate_aligned(rw, len - 1, CLIB_CACHE_LINE_BYTES);
34
35       h0 = (ip4_udp_lisp_gpe_header_t *) rw;
36
37       /* Fixed portion of the (outer) ip4 header */
38       ip0 = &h0->ip4;
39       ip0->ip_version_and_header_length = 0x45;
40       ip0->ttl = 254;
41       ip0->protocol = IP_PROTOCOL_UDP;
42
43       /* we fix up the ip4 header length and checksum after-the-fact */
44       ip_address_copy_addr(&ip0->src_address, &t->src);
45       ip_address_copy_addr(&ip0->dst_address, &t->dst);
46       ip0->checksum = ip4_header_checksum (ip0);
47
48       /* UDP header, randomize src port on something, maybe? */
49       h0->udp.src_port = clib_host_to_net_u16 (4341);
50       h0->udp.dst_port = clib_host_to_net_u16 (UDP_DST_PORT_lisp_gpe);
51
52       /* LISP-gpe header */
53       lisp0 = &h0->lisp;
54     }
55   else
56     {
57       ip6_header_t * ip0;
58       ip6_udp_lisp_gpe_header_t * h0;
59       len = sizeof(*h0);
60
61       vec_validate_aligned(rw, len - 1, CLIB_CACHE_LINE_BYTES);
62
63       h0 = (ip6_udp_lisp_gpe_header_t *) rw;
64
65       /* Fixed portion of the (outer) ip6 header */
66       ip0 = &h0->ip6;
67       ip0->ip_version_traffic_class_and_flow_label =
68           clib_host_to_net_u32 (0x6 << 28);
69       ip0->hop_limit = 254;
70       ip0->protocol = IP_PROTOCOL_UDP;
71
72       /* we fix up the ip6 header length after-the-fact */
73       ip_address_copy_addr(&ip0->src_address, &t->src);
74       ip_address_copy_addr(&ip0->dst_address, &t->dst);
75
76       /* UDP header, randomize src port on something, maybe? */
77       h0->udp.src_port = clib_host_to_net_u16 (4341);
78       h0->udp.dst_port = clib_host_to_net_u16 (UDP_DST_PORT_lisp_gpe);
79
80       /* LISP-gpe header */
81       lisp0 = &h0->lisp;
82     }
83
84   lisp0->flags = t->flags;
85   lisp0->ver_res = t->ver_res;
86   lisp0->res = t->res;
87   lisp0->next_protocol = t->next_protocol;
88   lisp0->iid = clib_host_to_net_u32 (t->vni);
89
90   t->rewrite = rw;
91   return 0;
92 }
93
94 #define foreach_copy_field                      \
95 _(encap_fib_index)                              \
96 _(decap_fib_index)                              \
97 _(decap_next_index)                             \
98 _(vni)
99
100 static u32
101 add_del_ip_tunnel (vnet_lisp_gpe_add_del_fwd_entry_args_t *a,
102                    u32 * tun_index_res)
103 {
104   lisp_gpe_main_t * lgm = &lisp_gpe_main;
105   lisp_gpe_tunnel_t *t = 0;
106   uword * p;
107   int rv;
108   lisp_gpe_tunnel_key_t key;
109
110   /* prepare tunnel key */
111   memset(&key, 0, sizeof(key));
112   ip_prefix_copy(&key.eid, &gid_address_ippref(&a->deid));
113   ip_address_copy(&key.dst_loc, &a->dlocator);
114   key.iid = clib_host_to_net_u32 (a->vni);
115
116   p = mhash_get (&lgm->lisp_gpe_tunnel_by_key, &key);
117
118   if (a->is_add)
119     {
120       /* adding a tunnel: tunnel must not already exist */
121       if (p)
122         return VNET_API_ERROR_INVALID_VALUE;
123
124       if (a->decap_next_index >= LISP_GPE_INPUT_N_NEXT)
125         return VNET_API_ERROR_INVALID_DECAP_NEXT;
126
127       pool_get_aligned (lgm->tunnels, t, CLIB_CACHE_LINE_BYTES);
128       memset (t, 0, sizeof (*t));
129
130       /* copy from arg structure */
131 #define _(x) t->x = a->x;
132       foreach_copy_field;
133 #undef _
134
135       ip_address_copy(&t->src, &a->slocator);
136       ip_address_copy(&t->dst, &a->dlocator);
137
138       t->flags |= LISP_GPE_FLAGS_P;
139       t->next_protocol = ip_prefix_version(&key.eid) == IP4 ?
140           LISP_GPE_NEXT_PROTO_IP4 : LISP_GPE_NEXT_PROTO_IP6;
141
142       rv = lisp_gpe_rewrite (t);
143
144       if (rv)
145         {
146           pool_put(lgm->tunnels, t);
147           return rv;
148         }
149
150       mhash_set(&lgm->lisp_gpe_tunnel_by_key, &key, t - lgm->tunnels, 0);
151
152       /* return tunnel index */
153       if (tun_index_res)
154         tun_index_res[0] = t - lgm->tunnels;
155     }
156   else
157     {
158       /* deleting a tunnel: tunnel must exist */
159       if (!p)
160         {
161           clib_warning("Tunnel for eid %U doesn't exist!", format_gid_address,
162                        &a->deid);
163           return VNET_API_ERROR_NO_SUCH_ENTRY;
164         }
165
166       t = pool_elt_at_index(lgm->tunnels, p[0]);
167
168       mhash_unset(&lgm->lisp_gpe_tunnel_by_key, &key, 0);
169
170       vec_free(t->rewrite);
171       pool_put(lgm->tunnels, t);
172     }
173
174   return 0;
175 }
176
177 static int
178 add_del_negative_fwd_entry (lisp_gpe_main_t * lgm,
179                             vnet_lisp_gpe_add_del_fwd_entry_args_t * a)
180 {
181   ip_adjacency_t adj;
182   /* setup adjacency for eid */
183   memset (&adj, 0, sizeof(adj));
184   adj.n_adj = 1;
185   adj.explicit_fib_index = ~0;
186
187   ip_prefix_t * dpref = &gid_address_ippref(&a->deid);
188   ip_prefix_t * spref = &gid_address_ippref(&a->seid);
189
190   switch (a->action)
191     {
192     case NO_ACTION:
193       /* TODO update timers? */
194     case FORWARD_NATIVE:
195       /* TODO check if route/next-hop for eid exists in fib and add
196        * more specific for the eid with the next-hop found */
197     case SEND_MAP_REQUEST:
198       /* insert tunnel that always sends map-request */
199       adj.rewrite_header.sw_if_index = ~0;
200       adj.lookup_next_index = (u32) (ip_prefix_version(dpref) == IP4) ?
201                                      LGPE_IP4_LOOKUP_NEXT_LISP_CP_LOOKUP:
202                                      LGPE_IP6_LOOKUP_NEXT_LISP_CP_LOOKUP;
203       /* add/delete route for prefix */
204       return ip_sd_fib_add_del_route (lgm, dpref, spref, a->table_id, &adj,
205                                       a->is_add);
206     case DROP:
207       /* for drop fwd entries, just add route, no need to add encap tunnel */
208       adj.lookup_next_index =  (u32) (ip_prefix_version(dpref) == IP4 ?
209               LGPE_IP4_LOOKUP_NEXT_DROP : LGPE_IP6_LOOKUP_NEXT_DROP);
210
211       /* add/delete route for prefix */
212       return ip_sd_fib_add_del_route (lgm, dpref, spref, a->table_id, &adj,
213                                       a->is_add);
214     default:
215       return -1;
216     }
217 }
218
219 int
220 vnet_lisp_gpe_add_del_fwd_entry (vnet_lisp_gpe_add_del_fwd_entry_args_t * a,
221                                  u32 * hw_if_indexp)
222 {
223   lisp_gpe_main_t * lgm = &lisp_gpe_main;
224   ip_adjacency_t adj, * adjp;
225   u32 adj_index, rv, tun_index = ~0;
226   ip_prefix_t * dpref, * spref;
227   uword * lookup_next_index, * lgpe_sw_if_index, * lnip;
228   u8 ip_ver;
229
230   /* treat negative fwd entries separately */
231   if (a->is_negative)
232     return add_del_negative_fwd_entry (lgm, a);
233
234   dpref = &gid_address_ippref(&a->deid);
235   spref = &gid_address_ippref(&a->seid);
236   ip_ver = ip_prefix_version(dpref);
237
238   /* add/del tunnel to tunnels pool and prepares rewrite */
239   rv = add_del_ip_tunnel (a, &tun_index);
240   if (rv)
241     return rv;
242
243   /* setup adjacency for eid */
244   memset (&adj, 0, sizeof(adj));
245   adj.n_adj = 1;
246   adj.explicit_fib_index = ~0;
247
248   if (a->is_add)
249     {
250       /* send packets that hit this adj to lisp-gpe interface output node in
251        * requested vrf. */
252       lnip = ip_ver == IP4 ?
253               lgm->lgpe_ip4_lookup_next_index_by_table_id :
254               lgm->lgpe_ip6_lookup_next_index_by_table_id;
255       lookup_next_index = hash_get(lnip, a->table_id);
256       lgpe_sw_if_index = hash_get(lgm->lisp_gpe_hw_if_index_by_table_id,
257                                   a->table_id);
258
259       /* the assumption is that the interface must've been created before
260        * programming the dp */
261       ASSERT(lookup_next_index != 0);
262       ASSERT(lgpe_sw_if_index != 0);
263
264       adj.lookup_next_index = lookup_next_index[0];
265       adj.rewrite_header.node_index = tun_index;
266       adj.rewrite_header.sw_if_index = lgpe_sw_if_index[0];
267     }
268
269   /* add/delete route for prefix */
270   rv = ip_sd_fib_add_del_route (lgm, dpref, spref, a->table_id, &adj,
271                                 a->is_add);
272
273   /* check that everything worked */
274   if (CLIB_DEBUG && a->is_add)
275     {
276       adj_index = ip_sd_fib_get_route (lgm, dpref, spref, a->table_id);
277       ASSERT(adj_index != 0);
278
279       adjp = ip_get_adjacency ((ip_ver == IP4) ? lgm->lm4 : lgm->lm6,
280                                adj_index);
281
282       ASSERT(adjp != 0);
283       ASSERT(adjp->rewrite_header.node_index == tun_index);
284     }
285
286   return rv;
287 }
288
289 static clib_error_t *
290 lisp_gpe_add_del_fwd_entry_command_fn (vlib_main_t * vm,
291                                        unformat_input_t * input,
292                                        vlib_cli_command_t * cmd)
293 {
294   unformat_input_t _line_input, * line_input = &_line_input;
295   u8 is_add = 1;
296   ip_address_t slocator, dlocator, *slocators = 0, *dlocators = 0;
297   ip_prefix_t * prefp;
298   gid_address_t * eids = 0, eid;
299   clib_error_t * error = 0;
300   u32 i;
301
302   prefp = &gid_address_ippref(&eid);
303
304   /* Get a line of input. */
305   if (! unformat_user (input, unformat_line_input, line_input))
306     return 0;
307
308   while (unformat_check_input (line_input) != UNFORMAT_END_OF_INPUT)
309     {
310       if (unformat (line_input, "del"))
311         is_add = 0;
312       else if (unformat (line_input, "add"))
313         is_add = 1;
314       else if (unformat (line_input, "eid %U slocator %U dlocator %U",
315                          unformat_ip_prefix, prefp,
316                          unformat_ip_address, &slocator,
317                          unformat_ip_address, &dlocator))
318         {
319           vec_add1 (eids, eid);
320           vec_add1 (slocators, slocator);
321           vec_add1 (dlocators, dlocator);
322         }
323       else
324         {
325           error = unformat_parse_error (line_input);
326           goto done;
327         }
328     }
329   unformat_free (line_input);
330
331   if (vec_len (eids) + vec_len (slocators) == 0)
332     {
333       error = clib_error_return (0, "expected ip4/ip6 eids/locators.");
334       goto done;
335     }
336
337   if (vec_len (eids) != vec_len (slocators))
338     {
339       error = clib_error_return (0, "number of eids not equal to that of "
340           "locators.");
341       goto done;
342     }
343
344   for (i = 0; i < vec_len(eids); i++)
345     {
346       vnet_lisp_gpe_add_del_fwd_entry_args_t a;
347       memset (&a, 0, sizeof(a));
348
349       a.is_add = is_add;
350       a.deid = eids[i];
351       a.slocator = slocators[i];
352       a.dlocator = dlocators[i];
353       vnet_lisp_gpe_add_del_fwd_entry (&a, 0);
354     }
355
356  done:
357   vec_free(eids);
358   vec_free(slocators);
359   vec_free(dlocators);
360   return error;
361 }
362
363 VLIB_CLI_COMMAND (lisp_gpe_add_del_fwd_entry_command, static) = {
364   .path = "lisp gpe maptunnel",
365   .short_help = "lisp gpe maptunnel eid <eid> sloc <src-locator> "
366       "dloc <dst-locator> [del]",
367   .function = lisp_gpe_add_del_fwd_entry_command_fn,
368 };
369
370 static u8 *
371 format_decap_next (u8 * s, va_list * args)
372 {
373   u32 next_index = va_arg (*args, u32);
374
375   switch (next_index)
376     {
377     case LISP_GPE_INPUT_NEXT_DROP:
378       return format (s, "drop");
379     case LISP_GPE_INPUT_NEXT_IP4_INPUT:
380       return format (s, "ip4");
381     case LISP_GPE_INPUT_NEXT_IP6_INPUT:
382       return format (s, "ip6");
383     default:
384       return format (s, "unknown %d", next_index);
385     }
386   return s;
387 }
388
389 u8 *
390 format_lisp_gpe_tunnel (u8 * s, va_list * args)
391 {
392   lisp_gpe_tunnel_t * t = va_arg (*args, lisp_gpe_tunnel_t *);
393   lisp_gpe_main_t * lgm = &lisp_gpe_main;
394
395   s = format (s,
396               "[%d] %U (src) %U (dst) fibs: encap %d, decap %d",
397               t - lgm->tunnels,
398               format_ip_address, &t->src,
399               format_ip_address, &t->dst,
400               t->encap_fib_index,
401               t->decap_fib_index);
402
403   s = format (s, " decap next %U\n", format_decap_next, t->decap_next_index);
404   s = format (s, "lisp ver %d ", (t->ver_res>>6));
405
406 #define _(n,v) if (t->flags & v) s = format (s, "%s-bit ", #n);
407   foreach_lisp_gpe_flag_bit;
408 #undef _
409
410   s = format (s, "next_protocol %d ver_res %x res %x\n",
411               t->next_protocol, t->ver_res, t->res);
412
413   s = format (s, "iid %d (0x%x)\n", t->vni, t->vni);
414   return s;
415 }
416
417 static clib_error_t *
418 show_lisp_gpe_tunnel_command_fn (vlib_main_t * vm,
419                                 unformat_input_t * input,
420                                 vlib_cli_command_t * cmd)
421 {
422   lisp_gpe_main_t * lgm = &lisp_gpe_main;
423   lisp_gpe_tunnel_t * t;
424   
425   if (pool_elts (lgm->tunnels) == 0)
426     vlib_cli_output (vm, "No lisp-gpe tunnels configured...");
427
428   pool_foreach (t, lgm->tunnels,
429   ({
430     vlib_cli_output (vm, "%U", format_lisp_gpe_tunnel, t);
431   }));
432   
433   return 0;
434 }
435
436 VLIB_CLI_COMMAND (show_lisp_gpe_tunnel_command, static) = {
437     .path = "show lisp gpe tunnel",
438     .function = show_lisp_gpe_tunnel_command_fn,
439 };
440
441 u8
442 vnet_lisp_gpe_enable_disable_status(void)
443 {
444   lisp_gpe_main_t * lgm = &lisp_gpe_main;
445
446   return lgm->is_en;
447 }
448
449 clib_error_t *
450 vnet_lisp_gpe_enable_disable (vnet_lisp_gpe_enable_disable_args_t * a)
451 {
452   lisp_gpe_main_t * lgm = &lisp_gpe_main;
453   vnet_main_t * vnm = lgm->vnet_main;
454
455   if (a->is_en)
456     {
457       /* add lgpe_ip4_lookup as possible next_node for ip4 lookup */
458       if (lgm->ip4_lookup_next_lgpe_ip4_lookup == ~0)
459         {
460           lgm->ip4_lookup_next_lgpe_ip4_lookup = vlib_node_add_next (
461               vnm->vlib_main, ip4_lookup_node.index,
462               lgpe_ip4_lookup_node.index);
463         }
464       /* add lgpe_ip6_lookup as possible next_node for ip6 lookup */
465       if (lgm->ip6_lookup_next_lgpe_ip6_lookup == ~0)
466         {
467           lgm->ip6_lookup_next_lgpe_ip6_lookup = vlib_node_add_next (
468               vnm->vlib_main, ip6_lookup_node.index,
469               lgpe_ip6_lookup_node.index);
470         }
471       else
472         {
473           /* ask cp to re-add ifaces and defaults */
474         }
475
476       lgm->is_en = 1;
477     }
478   else
479     {
480       CLIB_UNUSED(uword * val);
481       hash_pair_t * p;
482       u32 * table_ids = 0, * table_id;
483       lisp_gpe_tunnel_key_t * tunnels = 0, * tunnel;
484       vnet_lisp_gpe_add_del_fwd_entry_args_t _at, * at = &_at;
485       vnet_lisp_gpe_add_del_iface_args_t _ai, * ai= &_ai;
486
487       /* remove all tunnels */
488       mhash_foreach(tunnel, val, &lgm->lisp_gpe_tunnel_by_key, ({
489         vec_add1(tunnels, tunnel[0]);
490       }));
491
492       vec_foreach(tunnel, tunnels) {
493         memset(at, 0, sizeof(at[0]));
494         at->is_add = 0;
495         gid_address_type(&at->deid) = GID_ADDR_IP_PREFIX;
496         ip_prefix_copy(&gid_address_ippref(&at->deid), &tunnel->eid);
497         ip_address_copy(&at->dlocator, &tunnel->dst_loc);
498         vnet_lisp_gpe_add_del_fwd_entry (at, 0);
499       }
500       vec_free(tunnels);
501
502       /* disable all ifaces */
503       hash_foreach_pair(p, lgm->lisp_gpe_hw_if_index_by_table_id, ({
504         vec_add1(table_ids, p->key);
505       }));
506
507       vec_foreach(table_id, table_ids) {
508         ai->is_add = 0;
509         ai->table_id = table_id[0];
510
511         /* disables interface and removes defaults */
512         vnet_lisp_gpe_add_del_iface(ai, 0);
513       }
514       vec_free(table_ids);
515       lgm->is_en = 0;
516     }
517
518   return 0;
519 }
520
521 static clib_error_t *
522 lisp_gpe_enable_disable_command_fn (vlib_main_t * vm, unformat_input_t * input,
523                                     vlib_cli_command_t * cmd)
524 {
525   unformat_input_t _line_input, * line_input = &_line_input;
526   u8 is_en = 1;
527   vnet_lisp_gpe_enable_disable_args_t _a, * a = &_a;
528
529   /* Get a line of input. */
530   if (! unformat_user (input, unformat_line_input, line_input))
531     return 0;
532
533   while (unformat_check_input (line_input) != UNFORMAT_END_OF_INPUT)
534     {
535       if (unformat (line_input, "enable"))
536         is_en = 1;
537       else if (unformat (line_input, "disable"))
538         is_en = 0;
539       else
540         {
541           return clib_error_return (0, "parse error: '%U'",
542                                    format_unformat_error, line_input);
543         }
544     }
545   a->is_en = is_en;
546   return vnet_lisp_gpe_enable_disable (a);
547 }
548
549 VLIB_CLI_COMMAND (enable_disable_lisp_gpe_command, static) = {
550   .path = "lisp gpe",
551   .short_help = "lisp gpe [enable|disable]",
552   .function = lisp_gpe_enable_disable_command_fn,
553 };
554
555 static clib_error_t *
556 lisp_show_iface_command_fn (vlib_main_t * vm,
557                             unformat_input_t * input,
558                             vlib_cli_command_t * cmd)
559 {
560   lisp_gpe_main_t * lgm = &lisp_gpe_main;
561   hash_pair_t * p;
562
563   vlib_cli_output (vm, "%=10s%=12s", "vrf", "hw_if_index");
564   hash_foreach_pair (p, lgm->lisp_gpe_hw_if_index_by_table_id, ({
565     vlib_cli_output (vm, "%=10d%=10d", p->key, p->value[0]);
566   }));
567   return 0;
568 }
569
570 VLIB_CLI_COMMAND (lisp_show_iface_command) = {
571     .path = "show lisp gpe interface",
572     .short_help = "show lisp gpe interface",
573     .function = lisp_show_iface_command_fn,
574 };
575
576 clib_error_t *
577 lisp_gpe_init (vlib_main_t *vm)
578 {
579   lisp_gpe_main_t * lgm = &lisp_gpe_main;
580   clib_error_t * error = 0;
581
582   if ((error = vlib_call_init_function (vm, ip_main_init)))
583     return error;
584
585   if ((error = vlib_call_init_function (vm, ip4_lookup_init)))
586     return error;
587
588   lgm->vnet_main = vnet_get_main();
589   lgm->vlib_main = vm;
590   lgm->im4 = &ip4_main;
591   lgm->im6 = &ip6_main;
592   lgm->lm4 = &ip4_main.lookup_main;
593   lgm->lm6 = &ip6_main.lookup_main;
594   lgm->ip4_lookup_next_lgpe_ip4_lookup = ~0;
595   lgm->ip6_lookup_next_lgpe_ip6_lookup = ~0;
596
597   mhash_init (&lgm->lisp_gpe_tunnel_by_key, sizeof(uword),
598               sizeof(lisp_gpe_tunnel_key_t));
599
600   udp_register_dst_port (vm, UDP_DST_PORT_lisp_gpe, 
601                          lisp_gpe_ip4_input_node.index, 1 /* is_ip4 */);
602   udp_register_dst_port (vm, UDP_DST_PORT_lisp_gpe6,
603                          lisp_gpe_ip6_input_node.index, 0 /* is_ip4 */);
604   return 0;
605 }
606
607 u8 *
608 format_vnet_lisp_gpe_status (u8 * s, va_list * args)
609 {
610   lisp_gpe_main_t * lgm = &lisp_gpe_main;
611   return format (s, "%s", lgm->is_en ? "enabled" : "disabled");
612 }
613
614 VLIB_INIT_FUNCTION(lisp_gpe_init);