Fix dual loop >= 4. Fix format specified for printing u64 counter.
[vpp.git] / vnet / vnet / map / map.c
1 /*
2  * map.c : MAP support
3  *
4  * Copyright (c) 2015 Cisco and/or its affiliates.
5  * Licensed under the Apache License, Version 2.0 (the "License");
6  * you may not use this file except in compliance with the License.
7  * You may obtain a copy of the License at:
8  *
9  *     http://www.apache.org/licenses/LICENSE-2.0
10  *
11  * Unless required by applicable law or agreed to in writing, software
12  * distributed under the License is distributed on an "AS IS" BASIS,
13  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
14  * See the License for the specific language governing permissions and
15  * limitations under the License.
16  */
17
18 #include "map.h"
19
20 /*
21  * This code supports the following MAP modes:
22  * 
23  * Algorithmic Shared IPv4 address (ea_bits_len > 0):
24  *   ea_bits_len + ip4_prefix > 32
25  *   psid_length > 0, ip6_prefix < 64, ip4_prefix <= 32
26  * Algorithmic Full IPv4 address (ea_bits_len > 0):
27  *   ea_bits_len + ip4_prefix = 32
28  *   psid_length = 0, ip6_prefix < 64, ip4_prefix <= 32
29  * Algorithmic IPv4 prefix (ea_bits_len > 0):
30  *   ea_bits_len + ip4_prefix < 32
31  *   psid_length = 0, ip6_prefix < 64, ip4_prefix <= 32
32  *
33  * Independent Shared IPv4 address (ea_bits_len = 0):
34  *   ip4_prefix = 32
35  *   psid_length > 0
36  *   Rule IPv6 address = 128, Rule PSID Set
37  * Independent Full IPv4 address (ea_bits_len = 0):
38  *   ip4_prefix = 32
39  *   psid_length = 0, ip6_prefix = 128
40  * Independent IPv4 prefix (ea_bits_len = 0):
41  *   ip4_prefix < 32
42  *   psid_length = 0, ip6_prefix = 128
43  *
44  */
45
46 /*
47  * This code supports MAP-T:
48  *
49  * With DMR prefix length equal to 96.
50  *
51  */
52
53
54 i32
55 ip4_get_port (ip4_header_t *ip, map_dir_e dir, u16 buffer_len)
56 {
57   //TODO: use buffer length
58   if (ip->ip_version_and_header_length != 0x45 ||
59       ip4_get_fragment_offset(ip))
60       return -1;
61
62   if (PREDICT_TRUE((ip->protocol == IP_PROTOCOL_TCP) ||
63                    (ip->protocol == IP_PROTOCOL_UDP))) {
64     udp_header_t *udp = (void *)(ip + 1);
65     return (dir == MAP_SENDER) ? udp->src_port : udp->dst_port;
66   } else if (ip->protocol == IP_PROTOCOL_ICMP) {
67     icmp46_header_t *icmp = (void *)(ip + 1);
68     if (icmp->type == ICMP4_echo_request ||
69         icmp->type == ICMP4_echo_reply) {
70       return *((u16 *)(icmp + 1));
71     } else if (clib_net_to_host_u16(ip->length) >= 64) {
72       ip = (ip4_header_t *)(icmp + 2);
73       if (PREDICT_TRUE((ip->protocol == IP_PROTOCOL_TCP) ||
74                        (ip->protocol == IP_PROTOCOL_UDP))) {
75         udp_header_t *udp = (void *)(ip + 1);
76         return (dir == MAP_SENDER) ? udp->dst_port : udp->src_port;
77       } else if (ip->protocol == IP_PROTOCOL_ICMP) {
78         icmp46_header_t *icmp = (void *)(ip + 1);
79         if (icmp->type == ICMP4_echo_request ||
80             icmp->type == ICMP4_echo_reply) {
81           return *((u16 *)(icmp + 1));
82         }
83       }
84     }
85   }
86   return -1;
87 }
88
89 i32
90 ip6_get_port (ip6_header_t *ip6, map_dir_e dir, u16 buffer_len)
91 {
92   u8 l4_protocol;
93   u16 l4_offset;
94   u16 frag_offset;
95   u8 *l4;
96
97   if (ip6_parse(ip6, buffer_len, &l4_protocol, &l4_offset, &frag_offset))
98     return -1;
99
100   //TODO: Use buffer length
101
102   if (frag_offset &&
103       ip6_frag_hdr_offset(((ip6_frag_hdr_t *)u8_ptr_add(ip6, frag_offset))))
104     return -1; //Can't deal with non-first fragment for now
105
106   l4 = u8_ptr_add(ip6, l4_offset);
107   if (l4_protocol == IP_PROTOCOL_TCP ||
108       l4_protocol == IP_PROTOCOL_UDP) {
109     return (dir == MAP_SENDER) ? ((udp_header_t *)(l4))->src_port : ((udp_header_t *)(l4))->dst_port;
110   } else if (l4_protocol == IP_PROTOCOL_ICMP6) {
111     icmp46_header_t *icmp = (icmp46_header_t *)(l4);
112     if (icmp->type == ICMP6_echo_request) {
113       return (dir == MAP_SENDER) ? ((u16*)(icmp))[2] : -1;
114     } else if (icmp->type == ICMP6_echo_reply) {
115       return (dir == MAP_SENDER) ? -1 : ((u16*)(icmp))[2];
116     }
117   }
118   return -1;
119 }
120
121
122 int
123 map_create_domain (ip4_address_t *ip4_prefix,
124                    u8 ip4_prefix_len,
125                    ip6_address_t *ip6_prefix,
126                    u8 ip6_prefix_len,
127                    ip6_address_t *ip6_src,
128                    u8 ip6_src_len,
129                    u8 ea_bits_len,
130                    u8 psid_offset,
131                    u8 psid_length,
132                    u32 *map_domain_index,
133                    u16 mtu,
134                    u8 flags)
135 {
136   map_main_t *mm = &map_main;
137   ip4_main_t *im4 = &ip4_main;
138   ip6_main_t *im6 = &ip6_main;
139   map_domain_t *d;
140   ip_adjacency_t adj;
141   ip4_add_del_route_args_t args4;
142   ip6_add_del_route_args_t args6;
143   u8 suffix_len;
144   uword *p;
145
146   /* EA bits must be within the first 64 bits */
147   if (ea_bits_len > 0 && (ip6_prefix_len + ea_bits_len) > 64)
148     return -1;
149
150   /* Sanity check on the src prefix length */
151   if (flags & MAP_DOMAIN_TRANSLATION) {
152       if (ip6_src_len != 96) {
153           clib_warning("MAP-T only supports ip6_src_len = 96 for now.");
154           return -1;
155       }
156   } else {
157       if (ip6_src_len != 128) {
158           clib_warning("MAP-E requires a BR address, not a prefix (ip6_src_len should be 128).");
159           return -1;
160       }
161   }
162
163   /* Get domain index */
164   pool_get_aligned(mm->domains, d, CLIB_CACHE_LINE_BYTES);
165   memset(d, 0, sizeof (*d));
166   *map_domain_index = d - mm->domains;
167
168   /* Init domain struct */
169   d->ip4_prefix.as_u32 = ip4_prefix->as_u32;
170   d->ip4_prefix_len = ip4_prefix_len;
171   d->ip6_prefix = *ip6_prefix;
172   d->ip6_prefix_len = ip6_prefix_len;
173   d->ip6_src = *ip6_src;
174   d->ip6_src_len = ip6_src_len;
175   d->ea_bits_len = ea_bits_len;
176   d->psid_offset = psid_offset;
177   d->psid_length = psid_length;
178   d->mtu = mtu;
179   d->flags = flags;
180
181   /* How many, and which bits to grab from the IPv4 DA */
182   if (ip4_prefix_len + ea_bits_len < 32) {
183     d->flags |= MAP_DOMAIN_PREFIX;
184     suffix_len = d->suffix_shift = 32 - ip4_prefix_len - ea_bits_len;
185   } else {
186     d->suffix_shift = 0;
187     suffix_len = 32 - ip4_prefix_len;
188   }
189   d->suffix_mask = (1<<suffix_len) - 1;
190
191   d->psid_shift = 16 - psid_length - psid_offset;
192   d->psid_mask = (1 << d->psid_length) - 1;
193   d->ea_shift = 64 - ip6_prefix_len - suffix_len - d->psid_length;
194
195   /* Init IP adjacency */
196   memset(&adj, 0, sizeof(adj));
197   adj.explicit_fib_index = ~0;
198   adj.lookup_next_index = (d->flags & MAP_DOMAIN_TRANSLATION) ? IP_LOOKUP_NEXT_MAP_T : IP_LOOKUP_NEXT_MAP;
199   p = (uword *)&adj.rewrite_data[0];
200   *p = (uword) (*map_domain_index);
201
202   if (ip4_get_route(im4, 0, 0, (u8 *)ip4_prefix, ip4_prefix_len)) {
203     clib_warning("IPv4 route already defined: %U/%d", format_ip4_address, ip4_prefix, ip4_prefix_len);
204     pool_put(mm->domains, d);
205     return -1;
206   }
207     
208   /* Create ip4 adjacency */
209   memset(&args4, 0, sizeof(args4));
210   args4.table_index_or_table_id = 0;
211   args4.flags = IP4_ROUTE_FLAG_ADD;
212   args4.dst_address.as_u32 = ip4_prefix->as_u32;
213   args4.dst_address_length = ip4_prefix_len;
214
215   args4.adj_index = ~0;
216   args4.add_adj = &adj;
217   args4.n_add_adj = 1;
218   ip4_add_del_route(im4, &args4);
219
220   /* Multiple MAP domains may share same source IPv6 TEP */
221   u32 ai = ip6_get_route(im6, 0, 0, ip6_src, ip6_src_len);
222   if (ai > 0) {
223     ip_lookup_main_t *lm6 = &ip6_main.lookup_main;
224     ip_adjacency_t *adj6 = ip_get_adjacency(lm6, ai);
225     if (adj6->lookup_next_index != IP_LOOKUP_NEXT_MAP &&
226         adj6->lookup_next_index != IP_LOOKUP_NEXT_MAP_T) {
227       clib_warning("BR source address already assigned: %U", format_ip6_address, ip6_src);
228       pool_put(mm->domains, d);
229       return -1;
230     }
231     /* Shared source */
232     p = (uword *)&adj6->rewrite_data[0];
233     p[0] = ~0;
234
235     /* Add refcount, so we don't accidentially delete the route underneath someone */
236     p[1]++;
237   } else {
238     /* Create ip6 adjacency. */
239     memset(&args6, 0, sizeof(args6));
240     args6.table_index_or_table_id = 0;
241     args6.flags = IP6_ROUTE_FLAG_ADD;
242     args6.dst_address.as_u64[0] = ip6_src->as_u64[0];
243     args6.dst_address.as_u64[1] = ip6_src->as_u64[1];
244     args6.dst_address_length = ip6_src_len;
245     args6.adj_index = ~0;
246     args6.add_adj = &adj;
247     args6.n_add_adj = 1;
248     ip6_add_del_route(im6, &args6);
249   }
250
251   /* Validate packet/byte counters */
252   map_domain_counter_lock(mm);
253   int i;
254   for (i = 0; i < vec_len(mm->simple_domain_counters); i++) {
255     vlib_validate_simple_counter(&mm->simple_domain_counters[i], *map_domain_index);
256     vlib_zero_simple_counter(&mm->simple_domain_counters[i], *map_domain_index);
257   }
258   for (i = 0; i < vec_len(mm->domain_counters); i++) {
259     vlib_validate_combined_counter(&mm->domain_counters[i], *map_domain_index);
260     vlib_zero_combined_counter(&mm->domain_counters[i], *map_domain_index);
261   }
262   map_domain_counter_unlock(mm);
263
264   return 0;
265 }
266
267 /*
268  * map_delete_domain
269  */
270 int
271 map_delete_domain (u32 map_domain_index)
272 {
273   map_main_t *mm = &map_main;
274   ip4_main_t *im4 = &ip4_main;
275   ip6_main_t *im6 = &ip6_main;
276   map_domain_t *d;
277   ip_adjacency_t adj;
278   ip4_add_del_route_args_t args4;
279   ip6_add_del_route_args_t args6;
280
281   if (pool_is_free_index(mm->domains, map_domain_index)) {
282     clib_warning("MAP domain delete: domain does not exist: %d", map_domain_index);
283     return -1;
284   }
285
286   d = pool_elt_at_index(mm->domains, map_domain_index);
287
288   memset(&adj, 0, sizeof(adj));
289   adj.explicit_fib_index = ~0;
290   adj.lookup_next_index = (d->flags & MAP_DOMAIN_TRANSLATION) ? IP_LOOKUP_NEXT_MAP_T : IP_LOOKUP_NEXT_MAP;
291
292   /* Delete ip4 adjacency */
293   memset(&args4, 0, sizeof(args4));
294   args4.table_index_or_table_id = 0;
295   args4.flags = IP4_ROUTE_FLAG_DEL;
296   args4.dst_address.as_u32 = d->ip4_prefix.as_u32;
297   args4.dst_address_length = d->ip4_prefix_len;
298   args4.adj_index = 0;
299   args4.add_adj = &adj;
300   args4.n_add_adj = 0;
301   ip4_add_del_route(im4, &args4);
302
303   /* Delete ip6 adjacency */
304   u32 ai = ip6_get_route(im6, 0, 0, &d->ip6_src, d->ip6_src_len);
305   if (ai > 0) {
306     ip_lookup_main_t *lm6 = &ip6_main.lookup_main;
307     ip_adjacency_t *adj6 = ip_get_adjacency(lm6, ai);
308
309     uword *p = (uword *)&adj6->rewrite_data[0];
310     /* Delete route when no other domains use this source */
311     if (p[1] == 0) {
312       memset(&args6, 0, sizeof (args6));
313       args6.table_index_or_table_id = 0;
314       args6.flags = IP6_ROUTE_FLAG_DEL;
315       args6.dst_address.as_u64[0] = d->ip6_src.as_u64[0];
316       args6.dst_address.as_u64[1] = d->ip6_src.as_u64[1];
317       args6.dst_address_length = d->ip6_src_len;
318       args6.adj_index = 0;
319       args6.add_adj = &adj;
320       args6.n_add_adj = 0;
321       ip6_add_del_route(im6, &args6);
322     }
323     p[1]--;
324   }
325   /* Deleting rules */
326   if (d->rules)
327     clib_mem_free(d->rules);
328
329   pool_put(mm->domains, d);
330
331   return 0;
332 }
333
334 int
335 map_add_del_psid (u32 map_domain_index, u16 psid, ip6_address_t *tep,
336                   u8 is_add)
337 {
338   map_domain_t *d;
339   map_main_t *mm = &map_main;
340
341   if (pool_is_free_index(mm->domains, map_domain_index)) {
342     clib_warning("MAP rule: domain does not exist: %d", map_domain_index);
343     return -1;
344   }
345   d = pool_elt_at_index(mm->domains, map_domain_index);
346
347   /* Rules are only used in 1:1 independent case */
348   if (d->ea_bits_len > 0)
349     return (-1);
350
351   if (!d->rules) {
352     u32 l = (0x1 << d->psid_length) * sizeof(ip6_address_t);
353     d->rules = clib_mem_alloc_aligned(l, CLIB_CACHE_LINE_BYTES);
354     if (!d->rules) return -1;
355     memset(d->rules, 0, l);
356   }
357
358   if (psid >= (0x1 << d->psid_length)) {
359     clib_warning("MAP rule: PSID outside bounds: %d [%d]", psid, 0x1 << d->psid_length);
360     return -1;
361   }
362
363   if (is_add) {
364     d->rules[psid] = *tep;
365   } else {
366     memset(&d->rules[psid], 0, sizeof(ip6_address_t));
367   }
368   return 0;
369 }
370
371 #ifdef MAP_SKIP_IP6_LOOKUP
372 static void
373 map_pre_resolve (ip4_address_t *ip4, ip6_address_t *ip6)
374 {
375   map_main_t *mm = &map_main;
376   ip4_main_t *im4 = &ip4_main;
377   ip6_main_t *im6 = &ip6_main;
378
379   if (ip6->as_u64[0] != 0 || ip6->as_u64[1] != 0) {
380     mm->adj6_index = ip6_fib_lookup_with_table(im6, 0, ip6);
381     clib_warning("FIB lookup results in: %u", mm->adj6_index);
382   }
383   if (ip4->as_u32 != 0) {
384     mm->adj4_index = ip4_fib_lookup_with_table(im4, 0, ip4, 0);
385     clib_warning("FIB lookup results in: %u", mm->adj4_index);
386   }
387 }
388 #endif
389
390 static clib_error_t *
391 map_security_check_command_fn (vlib_main_t *vm,
392                                unformat_input_t *input,
393                                vlib_cli_command_t *cmd)
394 {
395   unformat_input_t _line_input, *line_input = &_line_input;
396   map_main_t *mm = &map_main;
397   /* Get a line of input. */
398   if (!unformat_user(input, unformat_line_input, line_input))
399     return 0;
400  
401   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
402     if (unformat(line_input, "off"))
403       mm->sec_check = false;
404     else if (unformat(line_input, "on"))
405       mm->sec_check = true;
406     else
407       return clib_error_return(0, "unknown input `%U'",
408                                format_unformat_error, input);
409   }
410   unformat_free(line_input);
411   return 0;
412 }
413
414 static clib_error_t *
415 map_security_check_frag_command_fn (vlib_main_t *vm,
416                                     unformat_input_t *input,
417                                     vlib_cli_command_t *cmd)
418 {
419   unformat_input_t _line_input, *line_input = &_line_input;
420   map_main_t *mm = &map_main;
421   /* Get a line of input. */
422   if (!unformat_user(input, unformat_line_input, line_input))
423     return 0;
424  
425   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
426     if (unformat(line_input, "off"))
427       mm->sec_check_frag = false;
428     else if (unformat(line_input, "on"))
429       mm->sec_check_frag = true;
430     else
431       return clib_error_return(0, "unknown input `%U'",
432                                format_unformat_error, input);
433   }
434   unformat_free(line_input);
435   return 0;
436 }
437
438 static clib_error_t *
439 map_add_domain_command_fn (vlib_main_t *vm,
440                            unformat_input_t *input,
441                            vlib_cli_command_t *cmd)
442 {
443   unformat_input_t _line_input, *line_input = &_line_input;
444   ip4_address_t ip4_prefix;
445   ip6_address_t ip6_prefix;
446   ip6_address_t ip6_src;
447   u32 ip6_prefix_len, ip4_prefix_len, map_domain_index, ip6_src_len;
448   u32 num_m_args = 0;
449   /* Optional arguments */
450   u32 ea_bits_len, psid_offset = 0, psid_length = 0;
451   u32 mtu = 0;
452   u8 flags = 0;
453   ip6_src_len = 128;
454
455   /* Get a line of input. */
456   if (!unformat_user(input, unformat_line_input, line_input))
457     return 0;
458  
459   while (unformat_check_input (line_input) != UNFORMAT_END_OF_INPUT) {
460     if (unformat(line_input, "ip4-pfx %U/%d", unformat_ip4_address, &ip4_prefix, &ip4_prefix_len))
461       num_m_args++;
462     else if (unformat(line_input, "ip6-pfx %U/%d", unformat_ip6_address, &ip6_prefix, &ip6_prefix_len))
463       num_m_args++;
464     else if (unformat(line_input, "ip6-src %U/%d", unformat_ip6_address, &ip6_src, &ip6_src_len))
465       num_m_args++;
466     else if (unformat(line_input, "ip6-src %U", unformat_ip6_address, &ip6_src))
467       num_m_args++;
468     else if (unformat(line_input, "ea-bits-len %d", &ea_bits_len))
469       num_m_args++;
470     else if (unformat(line_input, "psid-offset %d", &psid_offset))
471       num_m_args++;
472     else if (unformat(line_input, "psid-len %d", &psid_length))
473       num_m_args++;
474     else if (unformat(line_input, "mtu %d", &mtu))
475       num_m_args++;
476     else if (unformat(line_input, "map-t"))
477       flags |= MAP_DOMAIN_TRANSLATION;
478     else
479       return clib_error_return(0, "unknown input `%U'",
480                                format_unformat_error, input);
481   }
482   unformat_free(line_input);
483
484   if (num_m_args < 3)
485     return clib_error_return(0, "mandatory argument(s) missing");
486
487   map_create_domain(&ip4_prefix, ip4_prefix_len,
488                     &ip6_prefix, ip6_prefix_len, &ip6_src, ip6_src_len,
489                     ea_bits_len, psid_offset, psid_length, &map_domain_index,
490                     mtu, flags);
491
492   return 0;
493 }
494
495 static clib_error_t *
496 map_del_domain_command_fn (vlib_main_t *vm,
497                            unformat_input_t *input,
498                            vlib_cli_command_t *cmd)
499 {
500   unformat_input_t _line_input, *line_input = &_line_input;
501   u32 num_m_args = 0;
502   u32 map_domain_index;
503
504   /* Get a line of input. */
505   if (! unformat_user(input, unformat_line_input, line_input))
506     return 0;
507  
508   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
509     if (unformat(line_input, "index %d", &map_domain_index))
510       num_m_args++;
511     else
512       return clib_error_return(0, "unknown input `%U'",
513                                 format_unformat_error, input);
514   }
515   unformat_free(line_input);
516
517   if (num_m_args != 1)
518     return clib_error_return(0, "mandatory argument(s) missing");
519
520   map_delete_domain(map_domain_index);
521
522   return 0;
523 }
524
525 static clib_error_t *
526 map_add_rule_command_fn (vlib_main_t *vm,
527                          unformat_input_t *input,
528                          vlib_cli_command_t *cmd)
529 {
530   unformat_input_t _line_input, *line_input = &_line_input;
531   ip6_address_t tep;
532   u32 num_m_args = 0;
533   u32 psid, map_domain_index;
534     
535   /* Get a line of input. */
536   if (! unformat_user(input, unformat_line_input, line_input))
537     return 0;
538
539   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
540     if (unformat(line_input, "index %d", &map_domain_index))
541       num_m_args++;
542     else if (unformat(line_input, "psid %d", &psid))
543       num_m_args++;
544     else if (unformat(line_input, "ip6-dst %U", unformat_ip6_address, &tep))
545       num_m_args++;
546     else
547       return clib_error_return(0, "unknown input `%U'",
548                                format_unformat_error, input);
549   }
550   unformat_free(line_input);
551
552   if (num_m_args != 3)
553     return clib_error_return(0, "mandatory argument(s) missing");
554
555   if (map_add_del_psid(map_domain_index, psid, &tep, 1) != 0) {
556     return clib_error_return(0, "Failing to add Mapping Rule");
557   }
558   return 0;
559 }
560
561 #if MAP_SKIP_IP6_LOOKUP
562 static clib_error_t *
563 map_pre_resolve_command_fn (vlib_main_t *vm,
564                             unformat_input_t *input,
565                             vlib_cli_command_t *cmd)
566 {
567   unformat_input_t _line_input, *line_input = &_line_input;
568   ip4_address_t ip4nh;
569   ip6_address_t ip6nh;
570   map_main_t *mm = &map_main;
571
572   memset(&ip4nh, 0, sizeof(ip4nh));
573   memset(&ip6nh, 0, sizeof(ip6nh));
574
575   /* Get a line of input. */
576   if (!unformat_user(input, unformat_line_input, line_input))
577     return 0;
578  
579   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
580     if (unformat(line_input, "ip4-nh %U", unformat_ip4_address, &ip4nh))
581       mm->preresolve_ip4 = ip4nh;
582     else if (unformat(line_input, "ip6-nh %U", unformat_ip6_address, &ip6nh))
583       mm->preresolve_ip6 = ip6nh;
584     else
585       return clib_error_return(0, "unknown input `%U'",
586                                format_unformat_error, input);
587   }
588   unformat_free(line_input);
589
590   map_pre_resolve(&ip4nh, &ip6nh);
591
592   return 0;
593 }
594 #endif
595
596 static clib_error_t *
597 map_icmp_relay_source_address_command_fn (vlib_main_t *vm,
598                                           unformat_input_t *input,
599                                           vlib_cli_command_t *cmd)
600 {
601   unformat_input_t _line_input, *line_input = &_line_input;
602   ip4_address_t icmp_src_address;
603   map_main_t *mm = &map_main;
604
605   memset(&icmp_src_address, 0, sizeof(icmp_src_address));
606
607
608   /* Get a line of input. */
609   if (!unformat_user(input, unformat_line_input, line_input))
610     return 0;
611  
612   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
613     if (unformat(line_input, "%U", unformat_ip4_address, &icmp_src_address))
614       mm->icmp_src_address = icmp_src_address;
615     else
616       return clib_error_return(0, "unknown input `%U'",
617                                format_unformat_error, input);
618   }
619   unformat_free(line_input);
620
621   return 0;
622 }
623
624 static clib_error_t *
625 map_traffic_class_command_fn (vlib_main_t *vm,
626                               unformat_input_t *input,
627                               vlib_cli_command_t *cmd)
628 {
629   unformat_input_t _line_input, *line_input = &_line_input;
630   map_main_t *mm = &map_main;
631   u32 tc = 0;
632
633   mm->tc_copy = false;
634
635   /* Get a line of input. */
636   if (!unformat_user(input, unformat_line_input, line_input))
637     return 0;
638  
639   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
640     if (unformat(line_input, "copy"))
641       mm->tc_copy = true;
642     else if (unformat(line_input, "%x", &tc))
643       mm->tc = tc & 0xff;
644     else
645       return clib_error_return(0, "unknown input `%U'",
646                                format_unformat_error, input);
647   }
648   unformat_free(line_input);
649
650   return 0;
651 }
652
653 static u8 *
654 format_map_domain (u8 *s, va_list *args)
655 {
656   map_domain_t *d = va_arg(*args, map_domain_t *);
657   bool counters = va_arg(*args, int);
658   map_main_t *mm = &map_main;
659   ip6_address_t ip6_prefix;
660
661   if (d->rules)
662     memset(&ip6_prefix, 0, sizeof(ip6_prefix));
663   else
664     ip6_prefix = d->ip6_prefix;
665   
666   s = format(s,
667              "[%d] ip4-pfx %U/%d ip6-pfx %U/%d ip6-src %U/%d ea_bits_len %d psid-offset %d psid-len %d mtu %d %s",
668              d - mm->domains,
669              format_ip4_address, &d->ip4_prefix, d->ip4_prefix_len,
670              format_ip6_address, &ip6_prefix, d->ip6_prefix_len,
671              format_ip6_address, &d->ip6_src, d->ip6_src_len,
672              d->ea_bits_len, d->psid_offset, d->psid_length, d->mtu,
673              (d->flags & MAP_DOMAIN_TRANSLATION) ? "map-t" : "");
674
675   if (counters) {
676     map_domain_counter_lock(mm);
677     vlib_counter_t v;
678     vlib_get_combined_counter(&mm->domain_counters[MAP_DOMAIN_COUNTER_TX], d - mm->domains, &v);
679     s = format(s, "  TX: %lld/%lld", v.packets, v.bytes);
680     vlib_get_combined_counter(&mm->domain_counters[MAP_DOMAIN_COUNTER_RX], d - mm->domains, &v);
681     s = format(s, "  RX: %lld/%lld", v.packets, v.bytes);
682     map_domain_counter_unlock(mm);
683   }
684   
685   if (d->rules) {
686     int i;
687     ip6_address_t dst;
688     for (i = 0; i < (0x1 << d->psid_length); i++) {
689       dst = d->rules[i];
690       if (dst.as_u64[0] == 0 && dst.as_u64[1] == 0 )
691         continue;
692       s = format(s,
693                  " rule psid: %d ip6-dst %U\n", i, format_ip6_address, &dst);
694     }
695   }
696   return s;
697 }
698
699 static u8 *
700 format_map_ip4_reass (u8 *s, va_list *args)
701 {
702   map_main_t *mm = &map_main;
703   map_ip4_reass_t *r = va_arg(*args, map_ip4_reass_t *);
704   map_ip4_reass_key_t *k = &r->key;
705   f64 now = vlib_time_now(mm->vlib_main);
706   f64 lifetime = (((f64)mm->ip4_reass_conf_lifetime_ms) / 1000);
707   f64 dt = (r->ts + lifetime > now) ? (r->ts + lifetime - now) : -1;
708   s = format(s,
709              "ip4-reass src=%U  dst=%U  protocol=%d  identifier=%d  port=%d  lifetime=%.3lf\n",
710              format_ip4_address, &k->src.as_u8, format_ip4_address, &k->dst.as_u8,
711              k->protocol, clib_net_to_host_u16(k->fragment_id), (r->port >= 0)?clib_net_to_host_u16(r->port):-1, dt);
712   return s;
713 }
714
715 static u8 *
716 format_map_ip6_reass (u8 *s, va_list *args)
717 {
718   map_main_t *mm = &map_main;
719   map_ip6_reass_t *r = va_arg(*args, map_ip6_reass_t *);
720   map_ip6_reass_key_t *k = &r->key;
721   f64 now = vlib_time_now(mm->vlib_main);
722   f64 lifetime = (((f64)mm->ip6_reass_conf_lifetime_ms) / 1000);
723   f64 dt = (r->ts + lifetime > now) ? (r->ts + lifetime - now) : -1;
724   s = format(s,
725              "ip6-reass src=%U  dst=%U  protocol=%d  identifier=%d  lifetime=%.3lf\n",
726              format_ip6_address, &k->src.as_u8, format_ip6_address, &k->dst.as_u8,
727              k->protocol, clib_net_to_host_u32(k->fragment_id), dt);
728   return s;
729 }
730
731 static clib_error_t *
732 show_map_domain_command_fn (vlib_main_t *vm, unformat_input_t *input, vlib_cli_command_t *cmd)
733 {
734   unformat_input_t _line_input, *line_input = &_line_input;
735   map_main_t *mm = &map_main;
736   map_domain_t *d;
737   bool counters = false;
738   u32 map_domain_index = ~0;
739
740   /* Get a line of input. */
741   if (!unformat_user(input, unformat_line_input, line_input))
742     return 0;
743  
744   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
745     if (unformat(line_input, "counters"))
746       counters = true;
747     else if (unformat(line_input, "index %d", &map_domain_index))
748       ;
749     else
750       return clib_error_return(0, "unknown input `%U'",
751                                format_unformat_error, input);
752   }
753   unformat_free(line_input);
754
755   if (pool_elts(mm->domains) == 0)
756     vlib_cli_output(vm, "No MAP domains are configured...");
757
758   if (map_domain_index == ~0) {
759     pool_foreach(d, mm->domains, ({vlib_cli_output(vm, "%U", format_map_domain, d, counters);}));
760   } else {
761     if (pool_is_free_index(mm->domains, map_domain_index)) {
762       return clib_error_return(0, "MAP domain does not exists %d", map_domain_index);
763     }
764
765     d = pool_elt_at_index(mm->domains, map_domain_index);
766     vlib_cli_output(vm, "%U", format_map_domain, d, counters);
767   }
768
769   return 0;
770 }
771
772 static clib_error_t *
773 show_map_fragments_command_fn (vlib_main_t *vm, unformat_input_t *input, vlib_cli_command_t *cmd)
774 {
775   map_main_t *mm = &map_main;
776   map_ip4_reass_t *f4;
777   map_ip6_reass_t *f6;
778
779   pool_foreach(f4, mm->ip4_reass_pool, ({vlib_cli_output (vm, "%U", format_map_ip4_reass, f4);}));
780   pool_foreach(f6, mm->ip6_reass_pool, ({vlib_cli_output (vm, "%U", format_map_ip6_reass, f6);}));
781   return (0);
782 }
783
784 u64
785 map_error_counter_get (u32 node_index, map_error_t map_error)
786 {
787   vlib_main_t *vm = vlib_get_main();
788   vlib_node_runtime_t *error_node = vlib_node_get_runtime(vm, node_index);
789   vlib_error_main_t *em = &vm->error_main;
790   vlib_error_t e = error_node->errors[map_error];
791   vlib_node_t *n = vlib_get_node(vm, node_index);
792   u32 ci;
793
794   ci = vlib_error_get_code(e);
795   ASSERT (ci < n->n_errors);
796   ci += n->error_heap_index;
797
798   return (em->counters[ci]);
799 }
800
801 static clib_error_t *
802 show_map_stats_command_fn (vlib_main_t *vm, unformat_input_t *input, vlib_cli_command_t *cmd)
803 {
804   map_main_t *mm = &map_main;
805   map_domain_t *d;
806   int domains = 0, rules = 0, domaincount = 0, rulecount = 0;
807   if (pool_elts (mm->domains) == 0)
808     vlib_cli_output(vm, "No MAP domains are configured...");
809
810   pool_foreach(d, mm->domains, ({
811     if (d->rules) {
812       rulecount+= 0x1 << d->psid_length;
813       rules += sizeof(ip6_address_t) * 0x1 << d->psid_length;
814     }
815     domains += sizeof(*d);
816     domaincount++;
817   }));
818
819   vlib_cli_output(vm, "MAP domains structure: %d\n", sizeof (map_domain_t));
820   vlib_cli_output(vm, "MAP domains: %d (%d bytes)\n", domaincount, domains);
821   vlib_cli_output(vm, "MAP rules: %d (%d bytes)\n", rulecount, rules);
822   vlib_cli_output(vm, "Total: %d bytes)\n", rules + domains);
823
824 #if MAP_SKIP_IP6_LOOKUP
825   vlib_cli_output(vm, "MAP pre-resolve: IP6 next-hop: %U (%u), IP4 next-hop: %U (%u)\n",
826                   format_ip6_address, &mm->preresolve_ip6, mm->adj6_index,
827                   format_ip4_address, &mm->preresolve_ip4, mm->adj4_index);
828 #endif
829
830   if (mm->tc_copy)
831     vlib_cli_output(vm, "MAP traffic-class: copy");
832   else
833     vlib_cli_output(vm, "MAP traffic-class: %x", mm->tc);
834
835   vlib_cli_output(vm, "MAP IPv6 inbound security check: %s Fragments: %s", mm->sec_check ? "enabled" : "disabled",
836                   mm->sec_check_frag ? "enabled" : "disabled");
837
838
839   /*
840    * Counters
841    */
842   vlib_combined_counter_main_t *cm = mm->domain_counters;
843   u64 total_pkts[MAP_N_DOMAIN_COUNTER];
844   u64 total_bytes[MAP_N_DOMAIN_COUNTER];
845   int which, i;
846   vlib_counter_t v;
847
848   memset (total_pkts, 0, sizeof (total_pkts));
849   memset (total_bytes, 0, sizeof (total_bytes));
850
851   map_domain_counter_lock (mm);
852   vec_foreach (cm, mm->domain_counters) {
853     which = cm - mm->domain_counters;
854
855     for (i = 0; i < vec_len (cm->maxi); i++) {
856       vlib_get_combined_counter (cm, i, &v);
857       total_pkts[which] += v.packets;
858       total_bytes[which] += v.bytes;
859     }
860   }
861   map_domain_counter_unlock (mm);
862
863   vlib_cli_output(vm, "Encapsulated packets: %d bytes: %d\n", total_pkts[MAP_DOMAIN_COUNTER_TX],
864                   total_bytes[MAP_DOMAIN_COUNTER_TX]);
865   vlib_cli_output(vm, "Decapsulated packets: %d bytes: %d\n", total_pkts[MAP_DOMAIN_COUNTER_RX],
866                   total_bytes[MAP_DOMAIN_COUNTER_RX]);
867
868   vlib_cli_output(vm, "ICMP relayed packets: %d\n", vlib_get_simple_counter(&mm->icmp_relayed, 0));
869
870   return 0;
871 }
872
873 static clib_error_t *
874 map_params_reass_command_fn (vlib_main_t *vm, unformat_input_t *input, vlib_cli_command_t *cmd)
875 {
876   unformat_input_t _line_input, *line_input = &_line_input;
877   u32 lifetime = ~0;
878   f64 ht_ratio = (MAP_IP4_REASS_CONF_HT_RATIO_MAX+1);
879   u32 pool_size = ~0;
880   u64 buffers = ~(0ull);
881   u8 ip4 = 0, ip6 = 0;
882
883   if (!unformat_user(input, unformat_line_input, line_input))
884       return 0;
885
886   while (unformat_check_input(line_input) != UNFORMAT_END_OF_INPUT) {
887     if (!unformat(line_input, "lifetime %u", &lifetime) &&
888         !unformat(line_input, "ht-ratio %lf", &ht_ratio) &&
889         !unformat(line_input, "pool-size %u", &pool_size) &&
890         !unformat(line_input, "buffers %llu", &buffers) &&
891         !((unformat(line_input, "ip4")) && (ip4 = 1)) &&
892         !((unformat(line_input, "ip6")) && (ip6 = 1))) {
893       unformat_free(line_input);
894       return clib_error_return(0, "invalid input");
895     }
896   }
897   unformat_free(line_input);
898
899   if (!ip4 && !ip6)
900     return clib_error_return(0, "must specify ip4 and/or ip6");
901
902   if (ip4) {
903     if (pool_size != ~0 && pool_size > MAP_IP4_REASS_CONF_POOL_SIZE_MAX)
904       return clib_error_return(0, "invalid ip4-reass pool-size ( > %d)", MAP_IP4_REASS_CONF_POOL_SIZE_MAX);
905     if (ht_ratio != (MAP_IP4_REASS_CONF_HT_RATIO_MAX+1) && ht_ratio > MAP_IP4_REASS_CONF_HT_RATIO_MAX)
906       return clib_error_return(0, "invalid ip4-reass ht-ratio ( > %d)", MAP_IP4_REASS_CONF_HT_RATIO_MAX);
907     if (lifetime != ~0 && lifetime > MAP_IP4_REASS_CONF_LIFETIME_MAX)
908       return clib_error_return(0, "invalid ip4-reass lifetime ( > %d)", MAP_IP4_REASS_CONF_LIFETIME_MAX);
909     if (buffers != ~(0ull) && buffers > MAP_IP4_REASS_CONF_BUFFERS_MAX)
910       return clib_error_return(0, "invalid ip4-reass buffers ( > %ld)", MAP_IP4_REASS_CONF_BUFFERS_MAX);
911   }
912
913   if (ip6) {
914     if (pool_size != ~0 && pool_size > MAP_IP6_REASS_CONF_POOL_SIZE_MAX)
915       return clib_error_return(0, "invalid ip6-reass pool-size ( > %d)", MAP_IP6_REASS_CONF_POOL_SIZE_MAX);
916     if (ht_ratio != (MAP_IP4_REASS_CONF_HT_RATIO_MAX+1) && ht_ratio > MAP_IP6_REASS_CONF_HT_RATIO_MAX)
917       return clib_error_return(0, "invalid ip6-reass ht-log2len ( > %d)", MAP_IP6_REASS_CONF_HT_RATIO_MAX);
918     if (lifetime != ~0 && lifetime > MAP_IP6_REASS_CONF_LIFETIME_MAX)
919       return clib_error_return(0, "invalid ip6-reass lifetime ( > %d)", MAP_IP6_REASS_CONF_LIFETIME_MAX);
920     if (buffers != ~(0ull) && buffers > MAP_IP6_REASS_CONF_BUFFERS_MAX)
921       return clib_error_return(0, "invalid ip6-reass buffers ( > %ld)", MAP_IP6_REASS_CONF_BUFFERS_MAX);
922   }
923
924   if (ip4) {
925     u32 reass = 0, packets = 0;
926     if (pool_size != ~0) {
927       if (map_ip4_reass_conf_pool_size(pool_size, &reass, &packets)) {
928         vlib_cli_output(vm, "Could not set ip4-reass pool-size");
929       } else {
930         vlib_cli_output(vm, "Setting ip4-reass pool-size (destroyed-reassembly=%u , dropped-fragments=%u)", reass, packets);
931       }
932     }
933     if (ht_ratio != (MAP_IP4_REASS_CONF_HT_RATIO_MAX+1)) {
934       if (map_ip4_reass_conf_ht_ratio(ht_ratio, &reass, &packets)) {
935         vlib_cli_output(vm, "Could not set ip4-reass ht-log2len");
936       } else {
937         vlib_cli_output(vm, "Setting ip4-reass ht-log2len (destroyed-reassembly=%u , dropped-fragments=%u)", reass, packets);
938       }
939     }
940     if (lifetime != ~0) {
941       if (map_ip4_reass_conf_lifetime(lifetime))
942         vlib_cli_output(vm, "Could not set ip4-reass lifetime");
943       else
944         vlib_cli_output(vm, "Setting ip4-reass lifetime");
945     }
946     if (buffers != ~(0ull)) {
947       if (map_ip4_reass_conf_buffers(buffers))
948         vlib_cli_output(vm, "Could not set ip4-reass buffers");
949       else
950         vlib_cli_output(vm, "Setting ip4-reass buffers");
951     }
952
953     if (map_main.ip4_reass_conf_buffers >
954       map_main.ip4_reass_conf_pool_size * MAP_IP4_REASS_MAX_FRAGMENTS_PER_REASSEMBLY) {
955       vlib_cli_output(vm, "Note: 'ip4-reass buffers' > pool-size * max-fragments-per-reassembly.");
956     }
957   }
958
959   if (ip6) {
960     u32 reass = 0, packets = 0;
961     if (pool_size != ~0) {
962       if (map_ip6_reass_conf_pool_size(pool_size, &reass, &packets)) {
963         vlib_cli_output(vm, "Could not set ip6-reass pool-size");
964       } else {
965         vlib_cli_output(vm, "Setting ip6-reass pool-size (destroyed-reassembly=%u , dropped-fragments=%u)", reass, packets);
966       }
967     }
968     if (ht_ratio != (MAP_IP4_REASS_CONF_HT_RATIO_MAX+1)) {
969       if (map_ip6_reass_conf_ht_ratio(ht_ratio, &reass, &packets)) {
970         vlib_cli_output(vm, "Could not set ip6-reass ht-log2len");
971       } else {
972         vlib_cli_output(vm, "Setting ip6-reass ht-log2len (destroyed-reassembly=%u , dropped-fragments=%u)", reass, packets);
973       }
974     }
975     if (lifetime != ~0) {
976       if (map_ip6_reass_conf_lifetime(lifetime))
977         vlib_cli_output(vm, "Could not set ip6-reass lifetime");
978       else
979         vlib_cli_output(vm, "Setting ip6-reass lifetime");
980     }
981     if (buffers != ~(0ull)) {
982       if (map_ip6_reass_conf_buffers(buffers))
983         vlib_cli_output(vm, "Could not set ip6-reass buffers");
984       else
985         vlib_cli_output(vm, "Setting ip6-reass buffers");
986     }
987
988     if (map_main.ip6_reass_conf_buffers >
989         map_main.ip6_reass_conf_pool_size * MAP_IP6_REASS_MAX_FRAGMENTS_PER_REASSEMBLY) {
990       vlib_cli_output(vm, "Note: 'ip6-reass buffers' > pool-size * max-fragments-per-reassembly.");
991     }
992   }
993
994   return 0;
995 }
996
997
998 /*
999  * packet trace format function
1000  */
1001 u8 *
1002 format_map_trace (u8 *s, va_list *args)
1003 {
1004   CLIB_UNUSED(vlib_main_t *vm) = va_arg (*args, vlib_main_t *);
1005   CLIB_UNUSED(vlib_node_t *node) = va_arg (*args, vlib_node_t *);
1006   map_trace_t *t = va_arg (*args, map_trace_t *);
1007   u32 map_domain_index = t->map_domain_index;
1008   u16 port = t->port;
1009
1010   s = format(s, "MAP domain index: %d L4 port: %u", map_domain_index, clib_net_to_host_u16(port));
1011
1012   return s;
1013 }
1014
1015 static_always_inline map_ip4_reass_t *
1016 map_ip4_reass_lookup(map_ip4_reass_key_t *k, u32 bucket, f64 now)
1017 {
1018   map_main_t *mm = &map_main;
1019   u32 ri = mm->ip4_reass_hash_table[bucket];
1020   while(ri != MAP_REASS_INDEX_NONE) {
1021     map_ip4_reass_t * r = pool_elt_at_index(mm->ip4_reass_pool, ri);
1022     if (r->key.as_u64[0] == k->as_u64[0] &&
1023         r->key.as_u64[1] == k->as_u64[1] &&
1024         now < r->ts + (((f64)mm->ip4_reass_conf_lifetime_ms) / 1000)) {
1025       return r;
1026     }
1027     ri = r->bucket_next;
1028   }
1029   return NULL;
1030 }
1031
1032 #define map_ip4_reass_pool_index(r) (r - map_main.ip4_reass_pool)
1033
1034 void
1035 map_ip4_reass_free(map_ip4_reass_t *r, u32 **pi_to_drop)
1036 {
1037   map_main_t *mm = &map_main;
1038   map_ip4_reass_get_fragments(r, pi_to_drop);
1039
1040   // Unlink in hash bucket
1041   map_ip4_reass_t *r2 = NULL;
1042   u32 r2i = mm->ip4_reass_hash_table[r->bucket];
1043   while (r2i != map_ip4_reass_pool_index(r)) {
1044     ASSERT(r2i != MAP_REASS_INDEX_NONE);
1045     r2 = pool_elt_at_index(mm->ip4_reass_pool, r2i);
1046     r2i = r2->bucket_next;
1047   }
1048   if (r2) {
1049     r2->bucket_next = r->bucket_next;
1050   } else {
1051     mm->ip4_reass_hash_table[r->bucket] = r->bucket_next;
1052   }
1053
1054   // Unlink in list
1055   if (r->fifo_next == map_ip4_reass_pool_index(r)) {
1056     mm->ip4_reass_fifo_last = MAP_REASS_INDEX_NONE;
1057   } else {
1058     if(mm->ip4_reass_fifo_last == map_ip4_reass_pool_index(r))
1059       mm->ip4_reass_fifo_last = r->fifo_prev;
1060     pool_elt_at_index(mm->ip4_reass_pool, r->fifo_prev)->fifo_next = r->fifo_next;
1061     pool_elt_at_index(mm->ip4_reass_pool, r->fifo_next)->fifo_prev = r->fifo_prev;
1062   }
1063
1064   pool_put(mm->ip4_reass_pool, r);
1065   mm->ip4_reass_allocated--;
1066 }
1067
1068 map_ip4_reass_t *
1069 map_ip4_reass_get(u32 src, u32 dst, u16 fragment_id,
1070                   u8 protocol, u32 **pi_to_drop)
1071 {
1072   map_ip4_reass_t * r;
1073   map_main_t *mm = &map_main;
1074   map_ip4_reass_key_t k = {.src.data_u32 = src,
1075       .dst.data_u32 = dst,
1076       .fragment_id = fragment_id,
1077       .protocol = protocol };
1078
1079   u32 h = 0;
1080   h = crc_u32(k.as_u32[0], h);
1081   h = crc_u32(k.as_u32[1], h);
1082   h = crc_u32(k.as_u32[2], h);
1083   h = crc_u32(k.as_u32[3], h);
1084   h = h >> (32 - mm->ip4_reass_ht_log2len);
1085
1086   f64 now = vlib_time_now(mm->vlib_main);
1087
1088   //Cache garbage collection
1089   while (mm->ip4_reass_fifo_last != MAP_REASS_INDEX_NONE) {
1090     map_ip4_reass_t *last = pool_elt_at_index(mm->ip4_reass_pool, mm->ip4_reass_fifo_last);
1091     if (last->ts + (((f64)mm->ip4_reass_conf_lifetime_ms) / 1000) < now)
1092       map_ip4_reass_free(last, pi_to_drop);
1093     else
1094       break;
1095   }
1096
1097   if ((r = map_ip4_reass_lookup(&k, h, now)))
1098     return r;
1099
1100   if (mm->ip4_reass_allocated >= mm->ip4_reass_conf_pool_size)
1101     return NULL;
1102
1103   pool_get(mm->ip4_reass_pool, r);
1104   mm->ip4_reass_allocated++;
1105   int i;
1106   for (i=0; i<MAP_IP4_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++)
1107     r->fragments[i] = ~0;
1108
1109   u32 ri = map_ip4_reass_pool_index(r);
1110
1111   //Link in new bucket
1112   r->bucket = h;
1113   r->bucket_next = mm->ip4_reass_hash_table[h];
1114   mm->ip4_reass_hash_table[h] = ri;
1115
1116   //Link in fifo
1117   if(mm->ip4_reass_fifo_last != MAP_REASS_INDEX_NONE) {
1118     r->fifo_next = pool_elt_at_index(mm->ip4_reass_pool, mm->ip4_reass_fifo_last)->fifo_next;
1119     r->fifo_prev = mm->ip4_reass_fifo_last;
1120     pool_elt_at_index(mm->ip4_reass_pool, r->fifo_prev)->fifo_next = ri;
1121     pool_elt_at_index(mm->ip4_reass_pool, r->fifo_next)->fifo_prev = ri;
1122   } else {
1123     r->fifo_next = r->fifo_prev = ri;
1124     mm->ip4_reass_fifo_last = ri;
1125   }
1126
1127   //Set other fields
1128   r->ts = now;
1129   r->key = k;
1130   r->port = -1;
1131 #ifdef MAP_IP4_REASS_COUNT_BYTES
1132   r->expected_total = 0xffff;
1133   r->forwarded = 0;
1134 #endif
1135
1136   return r;
1137 }
1138
1139 int
1140 map_ip4_reass_add_fragment(map_ip4_reass_t *r, u32 pi)
1141 {
1142   if (map_main.ip4_reass_buffered_counter >= map_main.ip4_reass_conf_buffers)
1143     return -1;
1144
1145   int i;
1146   for (i=0; i<MAP_IP4_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++)
1147     if(r->fragments[i] == ~0) {
1148       r->fragments[i] = pi;
1149       map_main.ip4_reass_buffered_counter++;
1150       return 0;
1151     }
1152   return -1;
1153 }
1154
1155 static_always_inline map_ip6_reass_t *
1156 map_ip6_reass_lookup(map_ip6_reass_key_t *k, u32 bucket, f64 now)
1157 {
1158   map_main_t *mm = &map_main;
1159   u32 ri = mm->ip6_reass_hash_table[bucket];
1160   while(ri != MAP_REASS_INDEX_NONE) {
1161     map_ip6_reass_t * r = pool_elt_at_index(mm->ip6_reass_pool, ri);
1162     if(now < r->ts + (((f64)mm->ip6_reass_conf_lifetime_ms) / 1000) &&
1163         r->key.as_u64[0] == k->as_u64[0] &&
1164         r->key.as_u64[1] == k->as_u64[1] &&
1165         r->key.as_u64[2] == k->as_u64[2] &&
1166         r->key.as_u64[3] == k->as_u64[3] &&
1167         r->key.as_u64[4] == k->as_u64[4])
1168       return r;
1169     ri = r->bucket_next;
1170   }
1171   return NULL;
1172 }
1173
1174 #define map_ip6_reass_pool_index(r) (r - map_main.ip6_reass_pool)
1175
1176 void
1177 map_ip6_reass_free(map_ip6_reass_t *r, u32 **pi_to_drop)
1178 {
1179   map_main_t *mm = &map_main;
1180   int i;
1181   for (i=0; i<MAP_IP6_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++)
1182     if(r->fragments[i].pi != ~0) {
1183       vec_add1(*pi_to_drop, r->fragments[i].pi);
1184       r->fragments[i].pi = ~0;
1185       map_main.ip6_reass_buffered_counter--;
1186     }
1187
1188   // Unlink in hash bucket
1189   map_ip6_reass_t *r2 = NULL;
1190   u32 r2i = mm->ip6_reass_hash_table[r->bucket];
1191   while (r2i != map_ip6_reass_pool_index(r)) {
1192     ASSERT(r2i != MAP_REASS_INDEX_NONE);
1193     r2 = pool_elt_at_index(mm->ip6_reass_pool, r2i);
1194     r2i = r2->bucket_next;
1195   }
1196   if (r2) {
1197     r2->bucket_next = r->bucket_next;
1198   } else {
1199     mm->ip6_reass_hash_table[r->bucket] = r->bucket_next;
1200   }
1201
1202   // Unlink in list
1203   if (r->fifo_next == map_ip6_reass_pool_index(r)) {
1204     //Single element in the list, list is now empty
1205     mm->ip6_reass_fifo_last = MAP_REASS_INDEX_NONE;
1206   } else {
1207     if (mm->ip6_reass_fifo_last == map_ip6_reass_pool_index(r)) //First element
1208       mm->ip6_reass_fifo_last = r->fifo_prev;
1209     pool_elt_at_index(mm->ip6_reass_pool, r->fifo_prev)->fifo_next = r->fifo_next;
1210     pool_elt_at_index(mm->ip6_reass_pool, r->fifo_next)->fifo_prev = r->fifo_prev;
1211   }
1212
1213   // Free from pool if necessary
1214   pool_put(mm->ip6_reass_pool, r);
1215   mm->ip6_reass_allocated--;
1216 }
1217
1218 map_ip6_reass_t *
1219 map_ip6_reass_get(ip6_address_t *src, ip6_address_t *dst, u32 fragment_id,
1220                   u8 protocol, u32 **pi_to_drop)
1221 {
1222   map_ip6_reass_t * r;
1223   map_main_t *mm = &map_main;
1224   map_ip6_reass_key_t k = {
1225       .src = *src,
1226       .dst = *dst,
1227       .fragment_id = fragment_id,
1228       .protocol = protocol };
1229
1230   u32 h = 0;
1231   int i;
1232   for (i=0; i<10; i++)
1233     h = crc_u32(k.as_u32[i], h);
1234   h = h >> (32 - mm->ip6_reass_ht_log2len);
1235
1236   f64 now = vlib_time_now(mm->vlib_main);
1237
1238   //Cache garbage collection
1239   while (mm->ip6_reass_fifo_last != MAP_REASS_INDEX_NONE) {
1240     map_ip6_reass_t *last = pool_elt_at_index(mm->ip6_reass_pool, mm->ip6_reass_fifo_last);
1241     if (last->ts + (((f64)mm->ip6_reass_conf_lifetime_ms) / 1000) < now)
1242       map_ip6_reass_free(last, pi_to_drop);
1243     else
1244       break;
1245   }
1246
1247   if ((r = map_ip6_reass_lookup(&k, h, now)))
1248     return r;
1249
1250   if (mm->ip6_reass_allocated >= mm->ip6_reass_conf_pool_size)
1251     return NULL;
1252
1253   pool_get(mm->ip6_reass_pool, r);
1254   mm->ip6_reass_allocated++;
1255   for (i=0; i<MAP_IP6_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++) {
1256     r->fragments[i].pi = ~0;
1257     r->fragments[i].next_data_len = 0;
1258     r->fragments[i].next_data_offset = 0;
1259   }
1260
1261   u32 ri = map_ip6_reass_pool_index(r);
1262
1263   //Link in new bucket
1264   r->bucket = h;
1265   r->bucket_next = mm->ip6_reass_hash_table[h];
1266   mm->ip6_reass_hash_table[h] = ri;
1267
1268   //Link in fifo
1269   if(mm->ip6_reass_fifo_last != MAP_REASS_INDEX_NONE) {
1270     r->fifo_next = pool_elt_at_index(mm->ip6_reass_pool, mm->ip6_reass_fifo_last)->fifo_next;
1271     r->fifo_prev = mm->ip6_reass_fifo_last;
1272     pool_elt_at_index(mm->ip6_reass_pool, r->fifo_prev)->fifo_next = ri;
1273     pool_elt_at_index(mm->ip6_reass_pool, r->fifo_next)->fifo_prev = ri;
1274   } else {
1275     r->fifo_next = r->fifo_prev = ri;
1276     mm->ip6_reass_fifo_last = ri;
1277   }
1278
1279   //Set other fields
1280   r->ts = now;
1281   r->key = k;
1282   r->ip4_header.ip_version_and_header_length = 0;
1283 #ifdef MAP_IP6_REASS_COUNT_BYTES
1284   r->expected_total = 0xffff;
1285   r->forwarded = 0;
1286 #endif
1287   return r;
1288 }
1289
1290 int
1291 map_ip6_reass_add_fragment(map_ip6_reass_t *r, u32 pi,
1292                            u16 data_offset, u16 next_data_offset,
1293                            u8 *data_start, u16 data_len)
1294 {
1295   map_ip6_fragment_t *f = NULL, *prev_f = NULL;
1296   u16 copied_len = (data_len > 20) ? 20 : data_len;
1297
1298   if (map_main.ip6_reass_buffered_counter >= map_main.ip6_reass_conf_buffers)
1299     return -1;
1300
1301   //Lookup for fragments for the current buffer
1302   //and the one before that
1303   int i;
1304   for (i=0; i<MAP_IP6_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++) {
1305     if (data_offset && r->fragments[i].next_data_offset == data_offset) {
1306       prev_f = &r->fragments[i]; // This is buffer for previous packet
1307     } else if (r->fragments[i].next_data_offset == next_data_offset) {
1308       f = &r->fragments[i]; // This is a buffer for the current packet
1309     } else if (r->fragments[i].next_data_offset == 0) { //Available
1310       if (f == NULL)
1311         f = &r->fragments[i];
1312       else if (prev_f == NULL)
1313         prev_f = &r->fragments[i];
1314     }
1315   }
1316
1317   if (!f || f->pi != ~0)
1318     return -1;
1319
1320   if (data_offset) {
1321     if (!prev_f)
1322       return -1;
1323
1324     memcpy(prev_f->next_data, data_start, copied_len);
1325     prev_f->next_data_len = copied_len;
1326     prev_f->next_data_offset = data_offset;
1327   } else {
1328     if (((ip4_header_t *)data_start)->ip_version_and_header_length != 0x45)
1329       return -1;
1330
1331     if (r->ip4_header.ip_version_and_header_length == 0)
1332       memcpy(&r->ip4_header, data_start, sizeof(ip4_header_t));
1333   }
1334
1335   if(data_len > 20) {
1336     f->next_data_offset = next_data_offset;
1337     f->pi = pi;
1338     map_main.ip6_reass_buffered_counter++;
1339   }
1340   return 0;
1341 }
1342
1343 void map_ip4_reass_reinit(u32 *trashed_reass, u32 *dropped_packets)
1344 {
1345   map_main_t *mm = &map_main;
1346   int i;
1347
1348   if(dropped_packets)
1349     *dropped_packets = mm->ip4_reass_buffered_counter;
1350   if(trashed_reass)
1351     *trashed_reass = mm->ip4_reass_allocated;
1352   if (mm->ip4_reass_fifo_last != MAP_REASS_INDEX_NONE) {
1353     u16 ri = mm->ip4_reass_fifo_last;
1354     do {
1355       map_ip4_reass_t *r = pool_elt_at_index(mm->ip4_reass_pool, ri);
1356       for (i=0; i<MAP_IP4_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++)
1357         if (r->fragments[i] != ~0)
1358           map_ip4_drop_pi(r->fragments[i]);
1359
1360       ri = r->fifo_next;
1361       pool_put(mm->ip4_reass_pool, r);
1362     } while (ri != mm->ip4_reass_fifo_last);
1363   }
1364
1365   vec_free(mm->ip4_reass_hash_table);
1366   vec_resize(mm->ip4_reass_hash_table, 1 << mm->ip4_reass_ht_log2len);
1367   for (i=0; i<(1 << mm->ip4_reass_ht_log2len); i++)
1368     mm->ip4_reass_hash_table[i] = MAP_REASS_INDEX_NONE;
1369   pool_free(mm->ip4_reass_pool);
1370   pool_alloc(mm->ip4_reass_pool, mm->ip4_reass_conf_pool_size);
1371
1372   mm->ip4_reass_allocated = 0;
1373   mm->ip4_reass_fifo_last = MAP_REASS_INDEX_NONE;
1374   mm->ip4_reass_buffered_counter = 0;
1375 }
1376
1377 u8 map_get_ht_log2len(f32 ht_ratio, u16 pool_size)
1378 {
1379   u32 desired_size = (u32)(pool_size * ht_ratio);
1380   u8 i;
1381   for (i=1; i<31; i++)
1382     if ((1 << i) >= desired_size)
1383       return i;
1384   return 4;
1385 }
1386
1387 int map_ip4_reass_conf_ht_ratio(f32 ht_ratio, u32 *trashed_reass, u32 *dropped_packets)
1388 {
1389   map_main_t *mm = &map_main;
1390   if (ht_ratio > MAP_IP4_REASS_CONF_HT_RATIO_MAX)
1391     return -1;
1392
1393   map_ip4_reass_lock();
1394   mm->ip4_reass_conf_ht_ratio = ht_ratio;
1395   mm->ip4_reass_ht_log2len = map_get_ht_log2len(ht_ratio, mm->ip4_reass_conf_pool_size);
1396   map_ip4_reass_reinit(trashed_reass, dropped_packets);
1397   map_ip4_reass_unlock();
1398   return 0;
1399 }
1400
1401 int map_ip4_reass_conf_pool_size(u16 pool_size, u32 *trashed_reass, u32 *dropped_packets)
1402 {
1403   map_main_t *mm = &map_main;
1404   if (pool_size > MAP_IP4_REASS_CONF_POOL_SIZE_MAX)
1405     return -1;
1406
1407   map_ip4_reass_lock();
1408   mm->ip4_reass_conf_pool_size = pool_size;
1409   map_ip4_reass_reinit(trashed_reass, dropped_packets);
1410   map_ip4_reass_unlock();
1411   return 0;
1412 }
1413
1414 int map_ip4_reass_conf_lifetime(u16 lifetime_ms)
1415 {
1416   map_main.ip4_reass_conf_lifetime_ms = lifetime_ms;
1417   return 0;
1418 }
1419
1420 int map_ip4_reass_conf_buffers(u32 buffers)
1421 {
1422   map_main.ip4_reass_conf_buffers = buffers;
1423   return 0;
1424 }
1425
1426 void map_ip6_reass_reinit(u32 *trashed_reass, u32 *dropped_packets)
1427 {
1428   map_main_t *mm = &map_main;
1429   if(dropped_packets)
1430     *dropped_packets = mm->ip6_reass_buffered_counter;
1431   if(trashed_reass)
1432     *trashed_reass = mm->ip6_reass_allocated;
1433   int i;
1434   if (mm->ip6_reass_fifo_last != MAP_REASS_INDEX_NONE) {
1435     u16 ri = mm->ip6_reass_fifo_last;
1436     do {
1437       map_ip6_reass_t *r = pool_elt_at_index(mm->ip6_reass_pool, ri);
1438       for (i=0; i<MAP_IP6_REASS_MAX_FRAGMENTS_PER_REASSEMBLY; i++)
1439         if (r->fragments[i].pi != ~0)
1440           map_ip6_drop_pi(r->fragments[i].pi);
1441
1442       ri = r->fifo_next;
1443       pool_put(mm->ip6_reass_pool, r);
1444     } while (ri != mm->ip6_reass_fifo_last);
1445     mm->ip6_reass_fifo_last = MAP_REASS_INDEX_NONE;
1446   }
1447
1448   vec_free(mm->ip6_reass_hash_table);
1449   vec_resize(mm->ip6_reass_hash_table, 1 << mm->ip6_reass_ht_log2len);
1450   for(i=0; i<(1 << mm->ip6_reass_ht_log2len); i++)
1451     mm->ip6_reass_hash_table[i] = MAP_REASS_INDEX_NONE;
1452   pool_free(mm->ip6_reass_pool);
1453   pool_alloc(mm->ip6_reass_pool, mm->ip4_reass_conf_pool_size);
1454
1455   mm->ip6_reass_allocated = 0;
1456   mm->ip6_reass_buffered_counter = 0;
1457 }
1458
1459 int map_ip6_reass_conf_ht_ratio(f32 ht_ratio, u32 *trashed_reass, u32 *dropped_packets)
1460 {
1461   map_main_t *mm = &map_main;
1462   if (ht_ratio > MAP_IP6_REASS_CONF_HT_RATIO_MAX)
1463     return -1;
1464
1465   map_ip6_reass_lock();
1466   mm->ip6_reass_conf_ht_ratio = ht_ratio;
1467   mm->ip6_reass_ht_log2len = map_get_ht_log2len(ht_ratio, mm->ip6_reass_conf_pool_size);
1468   map_ip6_reass_reinit(trashed_reass, dropped_packets);
1469   map_ip6_reass_unlock();
1470   return 0;
1471 }
1472
1473 int map_ip6_reass_conf_pool_size(u16 pool_size, u32 *trashed_reass, u32 *dropped_packets)
1474 {
1475   map_main_t *mm = &map_main;
1476   if (pool_size > MAP_IP6_REASS_CONF_POOL_SIZE_MAX)
1477     return -1;
1478
1479   map_ip6_reass_lock();
1480   mm->ip6_reass_conf_pool_size = pool_size;
1481   map_ip6_reass_reinit(trashed_reass, dropped_packets);
1482   map_ip6_reass_unlock();
1483   return 0;
1484 }
1485
1486 int map_ip6_reass_conf_lifetime(u16 lifetime_ms)
1487 {
1488   map_main.ip6_reass_conf_lifetime_ms = lifetime_ms;
1489   return 0;
1490 }
1491
1492 int map_ip6_reass_conf_buffers(u32 buffers)
1493 {
1494   map_main.ip6_reass_conf_buffers = buffers;
1495   return 0;
1496 }
1497
1498 VLIB_CLI_COMMAND(map_ip4_reass_lifetime_command, static) = {
1499   .path = "map params reassembly",
1500   .short_help = "[ip4 | ip6] [lifetime <lifetime-ms>] [pool-size <pool-size>] [buffers <buffers>] [ht-ratio <ht-ratio>]",
1501   .function = map_params_reass_command_fn,
1502 };
1503
1504 VLIB_CLI_COMMAND(map_traffic_class_command, static) = {
1505   .path = "map params traffic-class",
1506   .short_help = 
1507   "traffic-class {0x0-0xff | copy}",
1508   .function = map_traffic_class_command_fn,
1509 };
1510
1511 VLIB_CLI_COMMAND(map_pre_resolve_command, static) = {
1512   .path = "map params pre-resolve",
1513   .short_help = 
1514   "pre-resolve {ip4-nh <address>} | {ip6-nh <address>}",
1515   .function = map_pre_resolve_command_fn,
1516 };
1517
1518 VLIB_CLI_COMMAND(map_security_check_command, static) = {
1519   .path = "map params security-check",
1520   .short_help = 
1521   "security-check on|off",
1522   .function = map_security_check_command_fn,
1523 };
1524
1525 VLIB_CLI_COMMAND(map_icmp_relay_source_address_command, static) = {
1526   .path = "map params icmp-source-address",
1527   .short_help = 
1528   "icmp-source-address <ip4-address>",
1529   .function = map_icmp_relay_source_address_command_fn,
1530 };
1531
1532 VLIB_CLI_COMMAND(map_security_check_frag_command, static) = {
1533   .path = "map params security-check fragments",
1534   .short_help = 
1535   "fragments on|off",
1536   .function = map_security_check_frag_command_fn,
1537 };
1538
1539 VLIB_CLI_COMMAND(map_add_domain_command, static) = {
1540   .path = "map add domain",
1541   .short_help = 
1542   "map add domain ip4-pfx <ip4-pfx> ip6-pfx <ip6-pfx> ip6-src <ip6-pfx> "
1543       "ea-bits-len <n> psid-offset <n> psid-len <n> [map-t] [mtu <mtu>]",
1544   .function = map_add_domain_command_fn,
1545 };
1546
1547 VLIB_CLI_COMMAND(map_add_rule_command, static) = {
1548   .path = "map add rule",
1549   .short_help = 
1550   "map add rule index <domain> psid <psid> ip6-dst <ip6-addr>",
1551   .function = map_add_rule_command_fn,
1552 };
1553
1554 VLIB_CLI_COMMAND(map_del_command, static) = {
1555   .path = "map del domain",
1556   .short_help = 
1557   "map del domain index <domain>",
1558   .function = map_del_domain_command_fn,
1559 };
1560
1561 VLIB_CLI_COMMAND(show_map_domain_command, static) = {
1562   .path = "show map domain",
1563   .function = show_map_domain_command_fn,
1564 };
1565
1566 VLIB_CLI_COMMAND(show_map_stats_command, static) = {
1567   .path = "show map stats",
1568   .function = show_map_stats_command_fn,
1569 };
1570
1571 VLIB_CLI_COMMAND(show_map_fragments_command, static) = {
1572   .path = "show map fragments",
1573   .function = show_map_fragments_command_fn,
1574 };
1575
1576 /*
1577  * map_init
1578  */
1579 clib_error_t *map_init (vlib_main_t *vm)
1580 {
1581   map_main_t *mm = &map_main;
1582   mm->vnet_main = vnet_get_main();
1583   mm->vlib_main = vm;
1584
1585 #ifdef MAP_SKIP_IP6_LOOKUP  
1586   memset(&mm->preresolve_ip4, 0, sizeof(mm->preresolve_ip4));
1587   memset(&mm->preresolve_ip6, 0, sizeof(mm->preresolve_ip6));
1588   mm->adj4_index = 0;
1589   mm->adj6_index = 0;
1590 #endif
1591
1592   /* traffic class */
1593   mm->tc = 0;
1594   mm->tc_copy = true;
1595
1596   /* Inbound security check */
1597   mm->sec_check = true;
1598   mm->sec_check_frag = false;
1599
1600   vec_validate(mm->domain_counters, MAP_N_DOMAIN_COUNTER - 1);
1601   mm->domain_counters[MAP_DOMAIN_COUNTER_RX].name = "rx";
1602   mm->domain_counters[MAP_DOMAIN_COUNTER_TX].name = "tx";
1603
1604   vlib_validate_simple_counter(&mm->icmp_relayed, 0);
1605   vlib_zero_simple_counter(&mm->icmp_relayed, 0);
1606
1607   /* IP4 virtual reassembly */
1608   mm->ip4_reass_hash_table = 0;
1609   mm->ip4_reass_pool = 0;
1610   mm->ip4_reass_lock = clib_mem_alloc_aligned(CLIB_CACHE_LINE_BYTES, CLIB_CACHE_LINE_BYTES);
1611   mm->ip4_reass_conf_ht_ratio = MAP_IP4_REASS_HT_RATIO_DEFAULT;
1612   mm->ip4_reass_conf_lifetime_ms = MAP_IP4_REASS_LIFETIME_DEFAULT;
1613   mm->ip4_reass_conf_pool_size = MAP_IP4_REASS_POOL_SIZE_DEFAULT;
1614   mm->ip4_reass_conf_buffers = MAP_IP4_REASS_BUFFERS_DEFAULT;
1615   mm->ip4_reass_ht_log2len = map_get_ht_log2len(mm->ip4_reass_conf_ht_ratio, mm->ip4_reass_conf_pool_size);
1616   mm->ip4_reass_fifo_last = MAP_REASS_INDEX_NONE;
1617   map_ip4_reass_reinit(NULL, NULL);
1618
1619   /* IP6 virtual reassembly */
1620   mm->ip6_reass_hash_table = 0;
1621   mm->ip6_reass_pool = 0;
1622   mm->ip6_reass_lock = clib_mem_alloc_aligned(CLIB_CACHE_LINE_BYTES, CLIB_CACHE_LINE_BYTES);
1623   mm->ip6_reass_conf_ht_ratio = MAP_IP6_REASS_HT_RATIO_DEFAULT;
1624   mm->ip6_reass_conf_lifetime_ms = MAP_IP6_REASS_LIFETIME_DEFAULT;
1625   mm->ip6_reass_conf_pool_size = MAP_IP6_REASS_POOL_SIZE_DEFAULT;
1626   mm->ip6_reass_conf_buffers = MAP_IP6_REASS_BUFFERS_DEFAULT;
1627   mm->ip6_reass_ht_log2len = map_get_ht_log2len(mm->ip6_reass_conf_ht_ratio, mm->ip6_reass_conf_pool_size);
1628   mm->ip6_reass_fifo_last = MAP_REASS_INDEX_NONE;
1629   map_ip6_reass_reinit(NULL, NULL);
1630
1631   return 0;
1632 }
1633
1634 VLIB_INIT_FUNCTION(map_init);