session udp: fix transport flags and migration
[vpp.git] / src / vnet / udp / udp.h
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 #ifndef __included_udp_h__
16 #define __included_udp_h__
17
18 #include <vnet/vnet.h>
19 #include <vnet/udp/udp_packet.h>
20 #include <vnet/ip/ip.h>
21 #include <vnet/ip/ip4.h>
22 #include <vnet/ip/ip4_packet.h>
23 #include <vnet/pg/pg.h>
24 #include <vnet/ip/format.h>
25
26 #include <vnet/ip/ip.h>
27 #include <vnet/session/transport.h>
28
29 typedef enum
30 {
31 #define udp_error(n,s) UDP_ERROR_##n,
32 #include <vnet/udp/udp_error.def>
33 #undef udp_error
34   UDP_N_ERROR,
35 } udp_error_t;
36
37 #define foreach_udp_connection_flag                                     \
38   _(CONNECTED, "CONNECTED")     /**< connected mode */                  \
39   _(OWNS_PORT, "OWNS_PORT")     /**< port belong to conn (UDPC) */      \
40   _(CLOSING, "CLOSING")         /**< conn closed with data */           \
41   _(LISTEN, "LISTEN")           /**< conn is listening */               \
42   _(MIGRATED, "MIGRATED")       /**< cloned to another thread */        \
43
44 enum udp_conn_flags_bits
45 {
46 #define _(sym, str) UDP_CONN_F_BIT_##sym,
47   foreach_udp_connection_flag
48 #undef _
49   UDP_CONN_N_FLAGS
50 };
51
52 typedef enum udp_conn_flags_
53 {
54 #define _(sym, str) UDP_CONN_F_##sym = 1 << UDP_CONN_F_BIT_##sym,
55   foreach_udp_connection_flag
56 #undef _
57 } udp_conn_flags_t;
58
59 typedef struct
60 {
61   /** Required for pool_get_aligned */
62   CLIB_CACHE_LINE_ALIGN_MARK (cacheline0);
63   transport_connection_t connection;    /**< must be first */
64   clib_spinlock_t rx_lock;              /**< rx fifo lock */
65   u8 flags;                             /**< connection flags */
66 } udp_connection_t;
67
68 #define foreach_udp4_dst_port                   \
69 _ (53, dns)                                     \
70 _ (67, dhcp_to_server)                          \
71 _ (68, dhcp_to_client)                          \
72 _ (500, ikev2)                                  \
73 _ (2152, GTPU)                                  \
74 _ (3784, bfd4)                                  \
75 _ (3785, bfd_echo4)                             \
76 _ (4341, lisp_gpe)                              \
77 _ (4342, lisp_cp)                               \
78 _ (4500, ipsec)                                 \
79 _ (4739, ipfix)                                 \
80 _ (4789, vxlan)                                 \
81 _ (4789, vxlan6)                                \
82 _ (48879, vxlan_gbp)                            \
83 _ (4790, VXLAN_GPE)                             \
84 _ (6633, vpath_3)                               \
85 _ (6081, geneve)                                \
86 _ (53053, dns_reply)
87
88
89 #define foreach_udp6_dst_port                   \
90 _ (53, dns6)                                    \
91 _ (547, dhcpv6_to_server)                       \
92 _ (546, dhcpv6_to_client)                       \
93 _ (2152, GTPU6)                                 \
94 _ (3784, bfd6)                                  \
95 _ (3785, bfd_echo6)                             \
96 _ (4341, lisp_gpe6)                             \
97 _ (4342, lisp_cp6)                              \
98 _ (48879, vxlan6_gbp)                           \
99 _ (4790, VXLAN6_GPE)                            \
100 _ (6633, vpath6_3)                              \
101 _ (6081, geneve6)                               \
102 _ (8138, BIER)                                  \
103 _ (53053, dns_reply6)
104
105 typedef enum
106 {
107 #define _(n,f) UDP_DST_PORT_##f = n,
108   foreach_udp4_dst_port foreach_udp6_dst_port
109 #undef _
110 } udp_dst_port_t;
111
112 typedef enum
113 {
114 #define _(n,f) UDP6_DST_PORT_##f = n,
115   foreach_udp6_dst_port
116 #undef _
117 } udp6_dst_port_t;
118
119 typedef struct
120 {
121   /* Name (a c string). */
122   char *name;
123
124   /* Port number in host byte order. */
125   udp_dst_port_t dst_port;
126
127   /* Node which handles this type. */
128   u32 node_index;
129
130   /* Next index for this type. */
131   u32 next_index;
132
133   /* UDP sessions refcount (not tunnels) */
134   u32 n_connections;
135
136   /* Parser for packet generator edits for this protocol */
137   unformat_function_t *unformat_pg_edit;
138 } udp_dst_port_info_t;
139
140 typedef enum
141 {
142   UDP_IP6 = 0,
143   UDP_IP4,                      /* the code is full of is_ip4... */
144   N_UDP_AF,
145 } udp_af_t;
146
147 typedef struct
148 {
149   udp_dst_port_info_t *dst_port_infos[N_UDP_AF];
150
151   /* Hash tables mapping name/protocol to protocol info index. */
152   uword *dst_port_info_by_name[N_UDP_AF];
153   uword *dst_port_info_by_dst_port[N_UDP_AF];
154
155   /* Sparse vector mapping udp dst_port in network byte order
156      to next index. */
157   u16 *next_by_dst_port4;
158   u16 *next_by_dst_port6;
159   u8 punt_unknown4;
160   u8 punt_unknown6;
161
162   /* Udp local to input arc index */
163   u32 local_to_input_edge[N_UDP_AF];
164
165   /*
166    * Per-worker thread udp connection pools used with session layer
167    */
168   udp_connection_t **connections;
169   u32 *connection_peekers;
170   clib_spinlock_t *peekers_readers_locks;
171   clib_spinlock_t *peekers_write_locks;
172   udp_connection_t *listener_pool;
173
174 } udp_main_t;
175
176 extern udp_main_t udp_main;
177 extern vlib_node_registration_t udp4_input_node;
178 extern vlib_node_registration_t udp6_input_node;
179 extern vlib_node_registration_t udp4_local_node;
180 extern vlib_node_registration_t udp6_local_node;
181
182 always_inline udp_connection_t *
183 udp_connection_get (u32 conn_index, u32 thread_index)
184 {
185   if (pool_is_free_index (udp_main.connections[thread_index], conn_index))
186     return 0;
187   return pool_elt_at_index (udp_main.connections[thread_index], conn_index);
188 }
189
190 always_inline udp_connection_t *
191 udp_listener_get (u32 conn_index)
192 {
193   return pool_elt_at_index (udp_main.listener_pool, conn_index);
194 }
195
196 always_inline udp_main_t *
197 vnet_get_udp_main ()
198 {
199   return &udp_main;
200 }
201
202 always_inline udp_connection_t *
203 udp_get_connection_from_transport (transport_connection_t * tc)
204 {
205   return ((udp_connection_t *) tc);
206 }
207
208 always_inline u32
209 udp_connection_index (udp_connection_t * uc)
210 {
211   return (uc - udp_main.connections[uc->c_thread_index]);
212 }
213
214 udp_connection_t *udp_connection_alloc (u32 thread_index);
215
216 /**
217  * Acquires a lock that blocks a connection pool from expanding.
218  */
219 always_inline void
220 udp_pool_add_peeker (u32 thread_index)
221 {
222   if (thread_index != vlib_get_thread_index ())
223     return;
224   clib_spinlock_lock_if_init (&udp_main.peekers_readers_locks[thread_index]);
225   udp_main.connection_peekers[thread_index] += 1;
226   if (udp_main.connection_peekers[thread_index] == 1)
227     clib_spinlock_lock_if_init (&udp_main.peekers_write_locks[thread_index]);
228   clib_spinlock_unlock_if_init (&udp_main.peekers_readers_locks
229                                 [thread_index]);
230 }
231
232 always_inline void
233 udp_pool_remove_peeker (u32 thread_index)
234 {
235   if (thread_index != vlib_get_thread_index ())
236     return;
237   ASSERT (udp_main.connection_peekers[thread_index] > 0);
238   clib_spinlock_lock_if_init (&udp_main.peekers_readers_locks[thread_index]);
239   udp_main.connection_peekers[thread_index] -= 1;
240   if (udp_main.connection_peekers[thread_index] == 0)
241     clib_spinlock_unlock_if_init (&udp_main.peekers_write_locks
242                                   [thread_index]);
243   clib_spinlock_unlock_if_init (&udp_main.peekers_readers_locks
244                                 [thread_index]);
245 }
246
247 always_inline udp_connection_t *
248 udp_connection_clone_safe (u32 connection_index, u32 thread_index)
249 {
250   udp_connection_t *old_c, *new_c;
251   u32 current_thread_index = vlib_get_thread_index ();
252   new_c = udp_connection_alloc (current_thread_index);
253
254   /* If during the memcpy pool is reallocated AND the memory allocator
255    * decides to give the old chunk of memory to somebody in a hurry to
256    * scribble something on it, we have a problem. So add this thread as
257    * a session pool peeker.
258    */
259   udp_pool_add_peeker (thread_index);
260   old_c = udp_main.connections[thread_index] + connection_index;
261   clib_memcpy_fast (new_c, old_c, sizeof (*new_c));
262   old_c->flags |= UDP_CONN_F_MIGRATED;
263   udp_pool_remove_peeker (thread_index);
264   new_c->c_thread_index = current_thread_index;
265   new_c->c_c_index = udp_connection_index (new_c);
266   new_c->c_fib_index = old_c->c_fib_index;
267   return new_c;
268 }
269
270
271 always_inline udp_dst_port_info_t *
272 udp_get_dst_port_info (udp_main_t * um, udp_dst_port_t dst_port, u8 is_ip4)
273 {
274   uword *p = hash_get (um->dst_port_info_by_dst_port[is_ip4], dst_port);
275   return p ? vec_elt_at_index (um->dst_port_infos[is_ip4], p[0]) : 0;
276 }
277
278 format_function_t format_udp_header;
279 format_function_t format_udp_rx_trace;
280 unformat_function_t unformat_udp_header;
281
282 void udp_add_dst_port (udp_main_t * um, udp_dst_port_t dst_port,
283                        char *dst_port_name, u8 is_ip4);
284 void udp_register_dst_port (vlib_main_t * vm,
285                             udp_dst_port_t dst_port,
286                             u32 node_index, u8 is_ip4);
287 void udp_unregister_dst_port (vlib_main_t * vm,
288                               udp_dst_port_t dst_port, u8 is_ip4);
289 bool udp_is_valid_dst_port (udp_dst_port_t dst_port, u8 is_ip4);
290
291 void udp_connection_share_port (u16 lcl_port, u8 is_ip4);
292
293 void udp_punt_unknown (vlib_main_t * vm, u8 is_ip4, u8 is_add);
294
295 always_inline void *
296 vlib_buffer_push_udp (vlib_buffer_t * b, u16 sp, u16 dp, u8 offload_csum)
297 {
298   udp_header_t *uh;
299   u16 udp_len = sizeof (udp_header_t) + b->current_length;
300   if (PREDICT_FALSE (b->flags & VLIB_BUFFER_TOTAL_LENGTH_VALID))
301     udp_len += b->total_length_not_including_first_buffer;
302
303   uh = vlib_buffer_push_uninit (b, sizeof (udp_header_t));
304   uh->src_port = sp;
305   uh->dst_port = dp;
306   uh->checksum = 0;
307   uh->length = clib_host_to_net_u16 (udp_len);
308   if (offload_csum)
309     {
310       b->flags |= VNET_BUFFER_F_OFFLOAD_UDP_CKSUM;
311       vnet_buffer (b)->l4_hdr_offset = (u8 *) uh - b->data;
312     }
313   return uh;
314 }
315
316 always_inline void
317 ip_udp_fixup_one (vlib_main_t * vm, vlib_buffer_t * b0, u8 is_ip4)
318 {
319   u16 new_l0;
320   udp_header_t *udp0;
321
322   if (is_ip4)
323     {
324       ip4_header_t *ip0;
325       ip_csum_t sum0;
326       u16 old_l0 = 0;
327
328       ip0 = vlib_buffer_get_current (b0);
329
330       /* fix the <bleep>ing outer-IP checksum */
331       sum0 = ip0->checksum;
332       /* old_l0 always 0, see the rewrite setup */
333       new_l0 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b0));
334
335       sum0 = ip_csum_update (sum0, old_l0, new_l0, ip4_header_t,
336                              length /* changed member */ );
337       ip0->checksum = ip_csum_fold (sum0);
338       ip0->length = new_l0;
339
340       /* Fix UDP length */
341       udp0 = (udp_header_t *) (ip0 + 1);
342       new_l0 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b0)
343                                      - sizeof (*ip0));
344       udp0->length = new_l0;
345     }
346   else
347     {
348       ip6_header_t *ip0;
349       int bogus0;
350
351       ip0 = vlib_buffer_get_current (b0);
352
353       new_l0 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b0)
354                                      - sizeof (*ip0));
355       ip0->payload_length = new_l0;
356
357       /* Fix UDP length */
358       udp0 = (udp_header_t *) (ip0 + 1);
359       udp0->length = new_l0;
360
361       udp0->checksum =
362         ip6_tcp_udp_icmp_compute_checksum (vm, b0, ip0, &bogus0);
363       ASSERT (bogus0 == 0);
364
365       if (udp0->checksum == 0)
366         udp0->checksum = 0xffff;
367     }
368 }
369
370 always_inline void
371 ip_udp_encap_one (vlib_main_t * vm, vlib_buffer_t * b0, u8 * ec0, word ec_len,
372                   u8 is_ip4)
373 {
374   vlib_buffer_advance (b0, -ec_len);
375
376   if (is_ip4)
377     {
378       ip4_header_t *ip0;
379
380       ip0 = vlib_buffer_get_current (b0);
381
382       /* Apply the encap string. */
383       clib_memcpy_fast (ip0, ec0, ec_len);
384       ip_udp_fixup_one (vm, b0, 1);
385     }
386   else
387     {
388       ip6_header_t *ip0;
389
390       ip0 = vlib_buffer_get_current (b0);
391
392       /* Apply the encap string. */
393       clib_memcpy_fast (ip0, ec0, ec_len);
394       ip_udp_fixup_one (vm, b0, 0);
395     }
396 }
397
398 always_inline void
399 ip_udp_encap_two (vlib_main_t * vm, vlib_buffer_t * b0, vlib_buffer_t * b1,
400                   u8 * ec0, u8 * ec1, word ec_len, u8 is_v4)
401 {
402   u16 new_l0, new_l1;
403   udp_header_t *udp0, *udp1;
404
405   ASSERT (_vec_len (ec0) == _vec_len (ec1));
406
407   vlib_buffer_advance (b0, -ec_len);
408   vlib_buffer_advance (b1, -ec_len);
409
410   if (is_v4)
411     {
412       ip4_header_t *ip0, *ip1;
413       ip_csum_t sum0, sum1;
414       u16 old_l0 = 0, old_l1 = 0;
415
416       ip0 = vlib_buffer_get_current (b0);
417       ip1 = vlib_buffer_get_current (b1);
418
419       /* Apply the encap string */
420       clib_memcpy_fast (ip0, ec0, ec_len);
421       clib_memcpy_fast (ip1, ec1, ec_len);
422
423       /* fix the <bleep>ing outer-IP checksum */
424       sum0 = ip0->checksum;
425       sum1 = ip1->checksum;
426
427       /* old_l0 always 0, see the rewrite setup */
428       new_l0 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b0));
429       new_l1 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b1));
430
431       sum0 = ip_csum_update (sum0, old_l0, new_l0, ip4_header_t,
432                              length /* changed member */ );
433       sum1 = ip_csum_update (sum1, old_l1, new_l1, ip4_header_t,
434                              length /* changed member */ );
435
436       ip0->checksum = ip_csum_fold (sum0);
437       ip1->checksum = ip_csum_fold (sum1);
438
439       ip0->length = new_l0;
440       ip1->length = new_l1;
441
442       /* Fix UDP length */
443       udp0 = (udp_header_t *) (ip0 + 1);
444       udp1 = (udp_header_t *) (ip1 + 1);
445
446       new_l0 =
447         clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b0) -
448                               sizeof (*ip0));
449       new_l1 =
450         clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b1) -
451                               sizeof (*ip1));
452       udp0->length = new_l0;
453       udp1->length = new_l1;
454     }
455   else
456     {
457       ip6_header_t *ip0, *ip1;
458       int bogus0, bogus1;
459
460       ip0 = vlib_buffer_get_current (b0);
461       ip1 = vlib_buffer_get_current (b1);
462
463       /* Apply the encap string. */
464       clib_memcpy_fast (ip0, ec0, ec_len);
465       clib_memcpy_fast (ip1, ec1, ec_len);
466
467       new_l0 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b0)
468                                      - sizeof (*ip0));
469       new_l1 = clib_host_to_net_u16 (vlib_buffer_length_in_chain (vm, b1)
470                                      - sizeof (*ip1));
471       ip0->payload_length = new_l0;
472       ip1->payload_length = new_l1;
473
474       /* Fix UDP length */
475       udp0 = (udp_header_t *) (ip0 + 1);
476       udp1 = (udp_header_t *) (ip1 + 1);
477
478       udp0->length = new_l0;
479       udp1->length = new_l1;
480
481       udp0->checksum =
482         ip6_tcp_udp_icmp_compute_checksum (vm, b0, ip0, &bogus0);
483       udp1->checksum =
484         ip6_tcp_udp_icmp_compute_checksum (vm, b1, ip1, &bogus1);
485       ASSERT (bogus0 == 0);
486       ASSERT (bogus1 == 0);
487
488       if (udp0->checksum == 0)
489         udp0->checksum = 0xffff;
490       if (udp1->checksum == 0)
491         udp1->checksum = 0xffff;
492     }
493 }
494
495 /*
496  * fd.io coding-style-patch-verification: ON
497  *
498  * Local Variables:
499  * eval: (c-set-style "gnu")
500  * End:
501  */
502
503 #endif /* __included_udp_h__ */