vcl: handle rx notifications on reused sessions
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <vcl/vppcom.h>
19 #include <vcl/vcl_debug.h>
20 #include <vcl/vcl_private.h>
21 #include <svm/fifo_segment.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static int
26 vcl_wait_for_segment (u64 segment_handle)
27 {
28   vcl_worker_t *wrk = vcl_worker_get_current ();
29   u32 wait_for_seconds = 10, segment_index;
30   f64 timeout;
31
32   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
33     return 0;
34
35   timeout = clib_time_now (&wrk->clib_time) + wait_for_seconds;
36   while (clib_time_now (&wrk->clib_time) < timeout)
37     {
38       segment_index = vcl_segment_table_lookup (segment_handle);
39       if (segment_index != VCL_INVALID_SEGMENT_INDEX)
40         return 0;
41       usleep (10);
42     }
43   return 1;
44 }
45
46 static inline int
47 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq, u32 n_max_msg)
48 {
49   svm_msg_q_msg_t *msg;
50   u32 n_msgs;
51   int i;
52
53   n_msgs = clib_min (svm_msg_q_size (mq), n_max_msg);
54   for (i = 0; i < n_msgs; i++)
55     {
56       vec_add2 (wrk->mq_msg_vector, msg, 1);
57       svm_msg_q_sub_w_lock (mq, msg);
58     }
59   return n_msgs;
60 }
61
62 const char *
63 vppcom_session_state_str (vcl_session_state_t state)
64 {
65   char *st;
66
67   switch (state)
68     {
69     case STATE_START:
70       st = "STATE_START";
71       break;
72
73     case STATE_CONNECT:
74       st = "STATE_CONNECT";
75       break;
76
77     case STATE_LISTEN:
78       st = "STATE_LISTEN";
79       break;
80
81     case STATE_ACCEPT:
82       st = "STATE_ACCEPT";
83       break;
84
85     case STATE_VPP_CLOSING:
86       st = "STATE_VPP_CLOSING";
87       break;
88
89     case STATE_DISCONNECT:
90       st = "STATE_DISCONNECT";
91       break;
92
93     case STATE_FAILED:
94       st = "STATE_FAILED";
95       break;
96
97     case STATE_UPDATED:
98       st = "STATE_UPDATED";
99       break;
100
101     case STATE_LISTEN_NO_MQ:
102       st = "STATE_LISTEN_NO_MQ";
103       break;
104
105     default:
106       st = "UNKNOWN_STATE";
107       break;
108     }
109
110   return st;
111 }
112
113 u8 *
114 format_ip4_address (u8 * s, va_list * args)
115 {
116   u8 *a = va_arg (*args, u8 *);
117   return format (s, "%d.%d.%d.%d", a[0], a[1], a[2], a[3]);
118 }
119
120 u8 *
121 format_ip6_address (u8 * s, va_list * args)
122 {
123   ip6_address_t *a = va_arg (*args, ip6_address_t *);
124   u32 i, i_max_n_zero, max_n_zeros, i_first_zero, n_zeros, last_double_colon;
125
126   i_max_n_zero = ARRAY_LEN (a->as_u16);
127   max_n_zeros = 0;
128   i_first_zero = i_max_n_zero;
129   n_zeros = 0;
130   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
131     {
132       u32 is_zero = a->as_u16[i] == 0;
133       if (is_zero && i_first_zero >= ARRAY_LEN (a->as_u16))
134         {
135           i_first_zero = i;
136           n_zeros = 0;
137         }
138       n_zeros += is_zero;
139       if ((!is_zero && n_zeros > max_n_zeros)
140           || (i + 1 >= ARRAY_LEN (a->as_u16) && n_zeros > max_n_zeros))
141         {
142           i_max_n_zero = i_first_zero;
143           max_n_zeros = n_zeros;
144           i_first_zero = ARRAY_LEN (a->as_u16);
145           n_zeros = 0;
146         }
147     }
148
149   last_double_colon = 0;
150   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
151     {
152       if (i == i_max_n_zero && max_n_zeros > 1)
153         {
154           s = format (s, "::");
155           i += max_n_zeros - 1;
156           last_double_colon = 1;
157         }
158       else
159         {
160           s = format (s, "%s%x",
161                       (last_double_colon || i == 0) ? "" : ":",
162                       clib_net_to_host_u16 (a->as_u16[i]));
163           last_double_colon = 0;
164         }
165     }
166
167   return s;
168 }
169
170 /* Format an IP46 address. */
171 u8 *
172 format_ip46_address (u8 * s, va_list * args)
173 {
174   ip46_address_t *ip46 = va_arg (*args, ip46_address_t *);
175   ip46_type_t type = va_arg (*args, ip46_type_t);
176   int is_ip4 = 1;
177
178   switch (type)
179     {
180     case IP46_TYPE_ANY:
181       is_ip4 = ip46_address_is_ip4 (ip46);
182       break;
183     case IP46_TYPE_IP4:
184       is_ip4 = 1;
185       break;
186     case IP46_TYPE_IP6:
187       is_ip4 = 0;
188       break;
189     }
190
191   return is_ip4 ?
192     format (s, "%U", format_ip4_address, &ip46->ip4) :
193     format (s, "%U", format_ip6_address, &ip46->ip6);
194 }
195
196 /*
197  * VPPCOM Utility Functions
198  */
199
200 static void
201 vcl_send_session_listen (vcl_worker_t * wrk, vcl_session_t * s)
202 {
203   app_session_evt_t _app_evt, *app_evt = &_app_evt;
204   session_listen_msg_t *mp;
205   svm_msg_q_t *mq;
206
207   mq = vcl_worker_ctrl_mq (wrk);
208   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_LISTEN);
209   mp = (session_listen_msg_t *) app_evt->evt->data;
210   memset (mp, 0, sizeof (*mp));
211   mp->client_index = wrk->my_client_index;
212   mp->context = s->session_index;
213   mp->wrk_index = wrk->vpp_wrk_index;
214   mp->is_ip4 = s->transport.is_ip4;
215   clib_memcpy_fast (&mp->ip, &s->transport.lcl_ip, sizeof (mp->ip));
216   mp->port = s->transport.lcl_port;
217   mp->proto = s->session_type;
218   app_send_ctrl_evt_to_vpp (mq, app_evt);
219 }
220
221 static void
222 vcl_send_session_connect (vcl_worker_t * wrk, vcl_session_t * s)
223 {
224   app_session_evt_t _app_evt, *app_evt = &_app_evt;
225   session_connect_msg_t *mp;
226   svm_msg_q_t *mq;
227
228   mq = vcl_worker_ctrl_mq (wrk);
229   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_CONNECT);
230   mp = (session_connect_msg_t *) app_evt->evt->data;
231   memset (mp, 0, sizeof (*mp));
232   mp->client_index = wrk->my_client_index;
233   mp->context = s->session_index;
234   mp->wrk_index = wrk->vpp_wrk_index;
235   mp->is_ip4 = s->transport.is_ip4;
236   mp->parent_handle = s->parent_handle;
237   clib_memcpy_fast (&mp->ip, &s->transport.rmt_ip, sizeof (mp->ip));
238   clib_memcpy_fast (&mp->lcl_ip, &s->transport.lcl_ip, sizeof (mp->lcl_ip));
239   mp->port = s->transport.rmt_port;
240   mp->proto = s->session_type;
241   app_send_ctrl_evt_to_vpp (mq, app_evt);
242 }
243
244 void
245 vcl_send_session_unlisten (vcl_worker_t * wrk, vcl_session_t * s)
246 {
247   app_session_evt_t _app_evt, *app_evt = &_app_evt;
248   session_unlisten_msg_t *mp;
249   svm_msg_q_t *mq;
250
251   mq = vcl_worker_ctrl_mq (wrk);
252   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_UNLISTEN);
253   mp = (session_unlisten_msg_t *) app_evt->evt->data;
254   memset (mp, 0, sizeof (*mp));
255   mp->client_index = wrk->my_client_index;
256   mp->wrk_index = wrk->vpp_wrk_index;
257   mp->handle = s->vpp_handle;
258   mp->context = wrk->wrk_index;
259   app_send_ctrl_evt_to_vpp (mq, app_evt);
260 }
261
262 static void
263 vcl_send_session_disconnect (vcl_worker_t * wrk, vcl_session_t * s)
264 {
265   app_session_evt_t _app_evt, *app_evt = &_app_evt;
266   session_disconnect_msg_t *mp;
267   svm_msg_q_t *mq;
268
269   /* Send to thread that owns the session */
270   mq = s->vpp_evt_q;
271   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_DISCONNECT);
272   mp = (session_disconnect_msg_t *) app_evt->evt->data;
273   memset (mp, 0, sizeof (*mp));
274   mp->client_index = wrk->my_client_index;
275   mp->handle = s->vpp_handle;
276   app_send_ctrl_evt_to_vpp (mq, app_evt);
277 }
278
279 static void
280 vcl_send_app_detach (vcl_worker_t * wrk)
281 {
282   app_session_evt_t _app_evt, *app_evt = &_app_evt;
283   session_app_detach_msg_t *mp;
284   svm_msg_q_t *mq;
285
286   mq = vcl_worker_ctrl_mq (wrk);
287   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_DETACH);
288   mp = (session_app_detach_msg_t *) app_evt->evt->data;
289   memset (mp, 0, sizeof (*mp));
290   mp->client_index = wrk->my_client_index;
291   app_send_ctrl_evt_to_vpp (mq, app_evt);
292 }
293
294 static void
295 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
296                                  session_handle_t handle, int retval)
297 {
298   app_session_evt_t _app_evt, *app_evt = &_app_evt;
299   session_accepted_reply_msg_t *rmp;
300   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
301   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
302   rmp->handle = handle;
303   rmp->context = context;
304   rmp->retval = retval;
305   app_send_ctrl_evt_to_vpp (mq, app_evt);
306 }
307
308 static void
309 vcl_send_session_disconnected_reply (svm_msg_q_t * mq, u32 context,
310                                      session_handle_t handle, int retval)
311 {
312   app_session_evt_t _app_evt, *app_evt = &_app_evt;
313   session_disconnected_reply_msg_t *rmp;
314   app_alloc_ctrl_evt_to_vpp (mq, app_evt,
315                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
316   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
317   rmp->handle = handle;
318   rmp->context = context;
319   rmp->retval = retval;
320   app_send_ctrl_evt_to_vpp (mq, app_evt);
321 }
322
323 static void
324 vcl_send_session_reset_reply (svm_msg_q_t * mq, u32 context,
325                               session_handle_t handle, int retval)
326 {
327   app_session_evt_t _app_evt, *app_evt = &_app_evt;
328   session_reset_reply_msg_t *rmp;
329   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_RESET_REPLY);
330   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
331   rmp->handle = handle;
332   rmp->context = context;
333   rmp->retval = retval;
334   app_send_ctrl_evt_to_vpp (mq, app_evt);
335 }
336
337 void
338 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
339                                 u32 wrk_index)
340 {
341   app_session_evt_t _app_evt, *app_evt = &_app_evt;
342   session_worker_update_msg_t *mp;
343   svm_msg_q_t *mq;
344
345   mq = vcl_session_vpp_evt_q (wrk, s);
346   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_WORKER_UPDATE);
347   mp = (session_worker_update_msg_t *) app_evt->evt->data;
348   mp->client_index = wrk->my_client_index;
349   mp->handle = s->vpp_handle;
350   mp->req_wrk_index = wrk->vpp_wrk_index;
351   mp->wrk_index = wrk_index;
352   app_send_ctrl_evt_to_vpp (mq, app_evt);
353 }
354
355 static u32
356 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp,
357                               u32 ls_index)
358 {
359   vcl_session_t *session, *listen_session;
360   svm_fifo_t *rx_fifo, *tx_fifo;
361   u32 vpp_wrk_index;
362   svm_msg_q_t *evt_q;
363
364   session = vcl_session_alloc (wrk);
365
366   listen_session = vcl_session_get (wrk, ls_index);
367   if (listen_session->vpp_handle != mp->listener_handle)
368     {
369       VDBG (0, "ERROR: listener handle %lu does not match session %u",
370             mp->listener_handle, ls_index);
371       goto error;
372     }
373
374   if (vcl_wait_for_segment (mp->segment_handle))
375     {
376       VDBG (0, "ERROR: segment for session %u couldn't be mounted!",
377             session->session_index);
378       goto error;
379     }
380
381   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
382   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
383   session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
384                                          svm_msg_q_t *);
385   rx_fifo->client_session_index = session->session_index;
386   tx_fifo->client_session_index = session->session_index;
387   rx_fifo->client_thread_index = vcl_get_worker_index ();
388   tx_fifo->client_thread_index = vcl_get_worker_index ();
389   vpp_wrk_index = tx_fifo->master_thread_index;
390   vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
391   wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
392
393   session->vpp_handle = mp->handle;
394   session->vpp_thread_index = rx_fifo->master_thread_index;
395   session->rx_fifo = rx_fifo;
396   session->tx_fifo = tx_fifo;
397
398   session->session_state = STATE_ACCEPT;
399   session->transport.rmt_port = mp->rmt.port;
400   session->transport.is_ip4 = mp->rmt.is_ip4;
401   clib_memcpy_fast (&session->transport.rmt_ip, &mp->rmt.ip,
402                     sizeof (ip46_address_t));
403
404   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
405   session->transport.lcl_port = listen_session->transport.lcl_port;
406   session->transport.lcl_ip = listen_session->transport.lcl_ip;
407   session->session_type = listen_session->session_type;
408   session->is_dgram = vcl_proto_is_dgram (session->session_type);
409   session->listener_index = listen_session->session_index;
410   listen_session->n_accepted_sessions++;
411
412   VDBG (1, "session %u [0x%llx]: client accept request from %s address %U"
413         " port %d queue %p!", session->session_index, mp->handle,
414         mp->rmt.is_ip4 ? "IPv4" : "IPv6", format_ip46_address, &mp->rmt.ip,
415         mp->rmt.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
416         clib_net_to_host_u16 (mp->rmt.port), session->vpp_evt_q);
417   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
418
419   vcl_send_session_accepted_reply (session->vpp_evt_q, mp->context,
420                                    session->vpp_handle, 0);
421
422   return session->session_index;
423
424 error:
425   evt_q = uword_to_pointer (mp->vpp_event_queue_address, svm_msg_q_t *);
426   vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
427                                    VNET_API_ERROR_INVALID_ARGUMENT);
428   vcl_session_free (wrk, session);
429   return VCL_INVALID_SESSION_INDEX;
430 }
431
432 static u32
433 vcl_session_connected_handler (vcl_worker_t * wrk,
434                                session_connected_msg_t * mp)
435 {
436   u32 session_index, vpp_wrk_index;
437   svm_fifo_t *rx_fifo, *tx_fifo;
438   vcl_session_t *session = 0;
439
440   session_index = mp->context;
441   session = vcl_session_get (wrk, session_index);
442   if (!session)
443     {
444       VDBG (0, "ERROR: vpp handle 0x%llx has no session index (%u)!",
445             mp->handle, session_index);
446       return VCL_INVALID_SESSION_INDEX;
447     }
448   if (mp->retval)
449     {
450       VDBG (0, "ERROR: session index %u: connect failed! %U",
451             session_index, format_api_error, ntohl (mp->retval));
452       session->session_state = STATE_FAILED | STATE_DISCONNECT;
453       session->vpp_handle = mp->handle;
454       return session_index;
455     }
456
457   session->vpp_handle = mp->handle;
458   session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
459                                          svm_msg_q_t *);
460   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
461   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
462   if (vcl_wait_for_segment (mp->segment_handle))
463     {
464       VDBG (0, "segment for session %u couldn't be mounted!",
465             session->session_index);
466       session->session_state = STATE_FAILED | STATE_DISCONNECT;
467       vcl_send_session_disconnect (wrk, session);
468       return session_index;
469     }
470
471   rx_fifo->client_session_index = session_index;
472   tx_fifo->client_session_index = session_index;
473   rx_fifo->client_thread_index = vcl_get_worker_index ();
474   tx_fifo->client_thread_index = vcl_get_worker_index ();
475
476   vpp_wrk_index = tx_fifo->master_thread_index;
477   vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
478   wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
479
480   if (mp->ct_rx_fifo)
481     {
482       session->ct_rx_fifo = uword_to_pointer (mp->ct_rx_fifo, svm_fifo_t *);
483       session->ct_tx_fifo = uword_to_pointer (mp->ct_tx_fifo, svm_fifo_t *);
484       if (vcl_wait_for_segment (mp->ct_segment_handle))
485         {
486           VDBG (0, "ct segment for session %u couldn't be mounted!",
487                 session->session_index);
488           session->session_state = STATE_FAILED | STATE_DISCONNECT;
489           vcl_send_session_disconnect (wrk, session);
490           return session_index;
491         }
492     }
493
494   session->rx_fifo = rx_fifo;
495   session->tx_fifo = tx_fifo;
496   session->vpp_thread_index = rx_fifo->master_thread_index;
497   session->transport.is_ip4 = mp->lcl.is_ip4;
498   clib_memcpy_fast (&session->transport.lcl_ip, &mp->lcl.ip,
499                     sizeof (session->transport.lcl_ip));
500   session->transport.lcl_port = mp->lcl.port;
501   session->session_state = STATE_CONNECT;
502
503   /* Add it to lookup table */
504   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
505
506   VDBG (1, "session %u [0x%llx] connected! rx_fifo %p, refcnt %d, tx_fifo %p,"
507         " refcnt %d", session_index, mp->handle, session->rx_fifo,
508         session->rx_fifo->refcnt, session->tx_fifo, session->tx_fifo->refcnt);
509
510   return session_index;
511 }
512
513 static int
514 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
515 {
516   vcl_session_msg_t *accepted_msg;
517   int i;
518
519   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
520     {
521       accepted_msg = &session->accept_evts_fifo[i];
522       if (accepted_msg->accepted_msg.handle == handle)
523         {
524           accepted_msg->flags |= flags;
525           return 1;
526         }
527     }
528   return 0;
529 }
530
531 static u32
532 vcl_session_reset_handler (vcl_worker_t * wrk,
533                            session_reset_msg_t * reset_msg)
534 {
535   vcl_session_t *session;
536   u32 sid;
537
538   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
539   session = vcl_session_get (wrk, sid);
540   if (!session)
541     {
542       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
543       return VCL_INVALID_SESSION_INDEX;
544     }
545
546   /* Caught a reset before actually accepting the session */
547   if (session->session_state == STATE_LISTEN)
548     {
549
550       if (!vcl_flag_accepted_session (session, reset_msg->handle,
551                                       VCL_ACCEPTED_F_RESET))
552         VDBG (0, "session was not accepted!");
553       return VCL_INVALID_SESSION_INDEX;
554     }
555
556   session->session_state = STATE_DISCONNECT;
557   VDBG (0, "reset session %u [0x%llx]", sid, reset_msg->handle);
558   return sid;
559 }
560
561 static u32
562 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
563 {
564   vcl_session_t *session;
565   u32 sid = mp->context;
566
567   session = vcl_session_get (wrk, sid);
568   if (mp->retval)
569     {
570       VERR ("session %u [0x%llx]: bind failed: %U", sid, mp->handle,
571             format_api_error, mp->retval);
572       if (session)
573         {
574           session->session_state = STATE_FAILED;
575           session->vpp_handle = mp->handle;
576           return sid;
577         }
578       else
579         {
580           VDBG (0, "ERROR: session %u [0x%llx]: Invalid session index!",
581                 sid, mp->handle);
582           return VCL_INVALID_SESSION_INDEX;
583         }
584     }
585
586   session->vpp_handle = mp->handle;
587   session->transport.is_ip4 = mp->lcl_is_ip4;
588   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
589                     sizeof (ip46_address_t));
590   session->transport.lcl_port = mp->lcl_port;
591   vcl_session_table_add_listener (wrk, mp->handle, sid);
592   session->session_state = STATE_LISTEN;
593
594   session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
595   vec_validate (wrk->vpp_event_queues, 0);
596   wrk->vpp_event_queues[0] = session->vpp_evt_q;
597
598   if (session->is_dgram)
599     {
600       svm_fifo_t *rx_fifo, *tx_fifo;
601       session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
602       rx_fifo = uword_to_pointer (mp->rx_fifo, svm_fifo_t *);
603       rx_fifo->client_session_index = sid;
604       tx_fifo = uword_to_pointer (mp->tx_fifo, svm_fifo_t *);
605       tx_fifo->client_session_index = sid;
606       session->rx_fifo = rx_fifo;
607       session->tx_fifo = tx_fifo;
608     }
609
610   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
611   return sid;
612 }
613
614 static void
615 vcl_session_unlisten_reply_handler (vcl_worker_t * wrk, void *data)
616 {
617   session_unlisten_reply_msg_t *mp = (session_unlisten_reply_msg_t *) data;
618   vcl_session_t *s;
619
620   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
621   if (!s || s->session_state != STATE_DISCONNECT)
622     {
623       VDBG (0, "Unlisten reply with wrong handle %llx", mp->handle);
624       return;
625     }
626
627   if (mp->retval)
628     VDBG (0, "ERROR: session %u [0xllx]: unlisten failed: %U",
629           s->session_index, mp->handle, format_api_error, ntohl (mp->retval));
630
631   if (mp->context != wrk->wrk_index)
632     VDBG (0, "wrong context");
633
634   vcl_session_table_del_vpp_handle (wrk, mp->handle);
635   vcl_session_free (wrk, s);
636 }
637
638 static vcl_session_t *
639 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
640 {
641   vcl_session_msg_t *vcl_msg;
642   vcl_session_t *session;
643
644   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
645   if (PREDICT_FALSE (session != 0))
646     VWRN ("session overlap handle %lu state %u!", msg->handle,
647           session->session_state);
648
649   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
650   if (!session)
651     {
652       VERR ("couldn't find listen session: listener handle %llx",
653             msg->listener_handle);
654       return 0;
655     }
656
657   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
658   vcl_msg->accepted_msg = *msg;
659   /* Session handle points to listener until fully accepted by app */
660   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
661
662   return session;
663 }
664
665 static vcl_session_t *
666 vcl_session_disconnected_handler (vcl_worker_t * wrk,
667                                   session_disconnected_msg_t * msg)
668 {
669   vcl_session_t *session;
670
671   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
672   if (!session)
673     {
674       VDBG (0, "request to disconnect unknown handle 0x%llx", msg->handle);
675       return 0;
676     }
677
678   /* Caught a disconnect before actually accepting the session */
679   if (session->session_state == STATE_LISTEN)
680     {
681       if (!vcl_flag_accepted_session (session, msg->handle,
682                                       VCL_ACCEPTED_F_CLOSED))
683         VDBG (0, "session was not accepted!");
684       return 0;
685     }
686
687   session->session_state = STATE_VPP_CLOSING;
688   return session;
689 }
690
691 static void
692 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
693 {
694   session_req_worker_update_msg_t *msg;
695   vcl_session_t *s;
696
697   msg = (session_req_worker_update_msg_t *) data;
698   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
699   if (!s)
700     return;
701
702   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
703 }
704
705 static void
706 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
707 {
708   session_worker_update_reply_msg_t *msg;
709   vcl_session_t *s;
710
711   msg = (session_worker_update_reply_msg_t *) data;
712   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
713   if (!s)
714     {
715       VDBG (0, "unknown handle 0x%llx", msg->handle);
716       return;
717     }
718   if (vcl_wait_for_segment (msg->segment_handle))
719     {
720       clib_warning ("segment for session %u couldn't be mounted!",
721                     s->session_index);
722       return;
723     }
724
725   if (s->rx_fifo)
726     {
727       s->rx_fifo = uword_to_pointer (msg->rx_fifo, svm_fifo_t *);
728       s->tx_fifo = uword_to_pointer (msg->tx_fifo, svm_fifo_t *);
729       s->rx_fifo->client_session_index = s->session_index;
730       s->tx_fifo->client_session_index = s->session_index;
731       s->rx_fifo->client_thread_index = wrk->wrk_index;
732       s->tx_fifo->client_thread_index = wrk->wrk_index;
733     }
734   s->session_state = STATE_UPDATED;
735
736   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
737         s->vpp_handle, wrk->wrk_index);
738 }
739
740 static int
741 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
742 {
743   session_disconnected_msg_t *disconnected_msg;
744   vcl_session_t *session;
745
746   switch (e->event_type)
747     {
748     case SESSION_IO_EVT_RX:
749     case SESSION_IO_EVT_TX:
750       session = vcl_session_get (wrk, e->session_index);
751       if (!session || !(session->session_state & STATE_OPEN))
752         break;
753       vec_add1 (wrk->unhandled_evts_vector, *e);
754       break;
755     case SESSION_CTRL_EVT_ACCEPTED:
756       vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
757       break;
758     case SESSION_CTRL_EVT_CONNECTED:
759       vcl_session_connected_handler (wrk,
760                                      (session_connected_msg_t *) e->data);
761       break;
762     case SESSION_CTRL_EVT_DISCONNECTED:
763       disconnected_msg = (session_disconnected_msg_t *) e->data;
764       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
765       if (!session)
766         break;
767       VDBG (0, "disconnected session %u [0x%llx]", session->session_index,
768             session->vpp_handle);
769       break;
770     case SESSION_CTRL_EVT_RESET:
771       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
772       break;
773     case SESSION_CTRL_EVT_BOUND:
774       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
775       break;
776     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
777       vcl_session_unlisten_reply_handler (wrk, e->data);
778       break;
779     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
780       vcl_session_req_worker_update_handler (wrk, e->data);
781       break;
782     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
783       vcl_session_worker_update_reply_handler (wrk, e->data);
784       break;
785     default:
786       clib_warning ("unhandled %u", e->event_type);
787     }
788   return VPPCOM_OK;
789 }
790
791 static int
792 vppcom_wait_for_session_state_change (u32 session_index,
793                                       vcl_session_state_t state,
794                                       f64 wait_for_time)
795 {
796   vcl_worker_t *wrk = vcl_worker_get_current ();
797   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
798   vcl_session_t *volatile session;
799   svm_msg_q_msg_t msg;
800   session_event_t *e;
801
802   do
803     {
804       session = vcl_session_get (wrk, session_index);
805       if (PREDICT_FALSE (!session))
806         {
807           return VPPCOM_EBADFD;
808         }
809       if (session->session_state & state)
810         {
811           return VPPCOM_OK;
812         }
813       if (session->session_state & STATE_FAILED)
814         {
815           return VPPCOM_ECONNREFUSED;
816         }
817
818       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
819         {
820           usleep (100);
821           continue;
822         }
823       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
824       vcl_handle_mq_event (wrk, e);
825       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
826     }
827   while (clib_time_now (&wrk->clib_time) < timeout);
828
829   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
830         vppcom_session_state_str (state));
831   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
832
833   return VPPCOM_ETIMEDOUT;
834 }
835
836 static void
837 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
838 {
839   vcl_session_state_t state;
840   vcl_session_t *s;
841   u32 *sip;
842
843   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
844     return;
845
846   vec_foreach (sip, wrk->pending_session_wrk_updates)
847   {
848     s = vcl_session_get (wrk, *sip);
849     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
850     state = s->session_state;
851     vppcom_wait_for_session_state_change (s->session_index, STATE_UPDATED, 5);
852     s->session_state = state;
853   }
854   vec_reset_length (wrk->pending_session_wrk_updates);
855 }
856
857 void
858 vcl_flush_mq_events (void)
859 {
860   vcl_worker_t *wrk = vcl_worker_get_current ();
861   svm_msg_q_msg_t *msg;
862   session_event_t *e;
863   svm_msg_q_t *mq;
864   int i;
865
866   mq = wrk->app_event_queue;
867   svm_msg_q_lock (mq);
868   vcl_mq_dequeue_batch (wrk, mq, ~0);
869   svm_msg_q_unlock (mq);
870
871   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
872     {
873       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
874       e = svm_msg_q_msg_data (mq, msg);
875       vcl_handle_mq_event (wrk, e);
876       svm_msg_q_free_msg (mq, msg);
877     }
878   vec_reset_length (wrk->mq_msg_vector);
879   vcl_handle_pending_wrk_updates (wrk);
880 }
881
882 static int
883 vppcom_app_session_enable (void)
884 {
885   int rv;
886
887   if (vcm->app_state != STATE_APP_ENABLED)
888     {
889       vppcom_send_session_enable_disable (1 /* is_enabled == TRUE */ );
890       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
891       if (PREDICT_FALSE (rv))
892         {
893           VDBG (0, "application session enable timed out! returning %d (%s)",
894                 rv, vppcom_retval_str (rv));
895           return rv;
896         }
897     }
898   return VPPCOM_OK;
899 }
900
901 static int
902 vppcom_app_attach (void)
903 {
904   int rv;
905
906   vppcom_app_send_attach ();
907   rv = vcl_wait_for_app_state_change (STATE_APP_ATTACHED);
908   if (PREDICT_FALSE (rv))
909     {
910       VDBG (0, "application attach timed out! returning %d (%s)", rv,
911             vppcom_retval_str (rv));
912       return rv;
913     }
914
915   return VPPCOM_OK;
916 }
917
918 static int
919 vppcom_session_unbind (u32 session_handle)
920 {
921   vcl_worker_t *wrk = vcl_worker_get_current ();
922   session_accepted_msg_t *accepted_msg;
923   vcl_session_t *session = 0;
924   vcl_session_msg_t *evt;
925
926   session = vcl_session_get_w_handle (wrk, session_handle);
927   if (!session)
928     return VPPCOM_EBADFD;
929
930   /* Flush pending accept events, if any */
931   while (clib_fifo_elts (session->accept_evts_fifo))
932     {
933       clib_fifo_sub2 (session->accept_evts_fifo, evt);
934       accepted_msg = &evt->accepted_msg;
935       vcl_session_table_del_vpp_handle (wrk, accepted_msg->handle);
936       vcl_send_session_accepted_reply (session->vpp_evt_q,
937                                        accepted_msg->context,
938                                        session->vpp_handle, -1);
939     }
940   clib_fifo_free (session->accept_evts_fifo);
941
942   vcl_send_session_unlisten (wrk, session);
943
944   VDBG (1, "session %u [0x%llx]: sending unbind!", session->session_index,
945         session->vpp_handle);
946   vcl_evt (VCL_EVT_UNBIND, session);
947
948   session->vpp_handle = ~0;
949   session->session_state = STATE_DISCONNECT;
950
951   return VPPCOM_OK;
952 }
953
954 static int
955 vppcom_session_disconnect (u32 session_handle)
956 {
957   vcl_worker_t *wrk = vcl_worker_get_current ();
958   svm_msg_q_t *vpp_evt_q;
959   vcl_session_t *session, *listen_session;
960   vcl_session_state_t state;
961   u64 vpp_handle;
962
963   session = vcl_session_get_w_handle (wrk, session_handle);
964   if (!session)
965     return VPPCOM_EBADFD;
966
967   vpp_handle = session->vpp_handle;
968   state = session->session_state;
969
970   VDBG (1, "session %u [0x%llx] state 0x%x (%s)", session->session_index,
971         vpp_handle, state, vppcom_session_state_str (state));
972
973   if (PREDICT_FALSE (state & STATE_LISTEN))
974     {
975       VDBG (0, "ERROR: Cannot disconnect a listen socket!");
976       return VPPCOM_EBADFD;
977     }
978
979   if (state & STATE_VPP_CLOSING)
980     {
981       vpp_evt_q = vcl_session_vpp_evt_q (wrk, session);
982       vcl_send_session_disconnected_reply (vpp_evt_q, wrk->my_client_index,
983                                            vpp_handle, 0);
984       VDBG (1, "session %u [0x%llx]: sending disconnect REPLY...",
985             session->session_index, vpp_handle);
986     }
987   else
988     {
989       VDBG (1, "session %u [0x%llx]: sending disconnect...",
990             session->session_index, vpp_handle);
991       vcl_send_session_disconnect (wrk, session);
992     }
993
994   if (session->listener_index != VCL_INVALID_SESSION_INDEX)
995     {
996       listen_session = vcl_session_get (wrk, session->listener_index);
997       listen_session->n_accepted_sessions--;
998     }
999
1000   return VPPCOM_OK;
1001 }
1002
1003 /**
1004  * Handle app exit
1005  *
1006  * Notify vpp of the disconnect and mark the worker as free. If we're the
1007  * last worker, do a full cleanup otherwise, since we're probably a forked
1008  * child, avoid syscalls as much as possible. We might've lost privileges.
1009  */
1010 void
1011 vppcom_app_exit (void)
1012 {
1013   if (!pool_elts (vcm->workers))
1014     return;
1015   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1016   vcl_set_worker_index (~0);
1017   vcl_elog_stop (vcm);
1018   if (vec_len (vcm->workers) == 1)
1019     vppcom_disconnect_from_vpp ();
1020   else
1021     vl_client_send_disconnect (1 /* vpp should cleanup */ );
1022 }
1023
1024 /*
1025  * VPPCOM Public API functions
1026  */
1027 int
1028 vppcom_app_create (char *app_name)
1029 {
1030   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
1031   int rv;
1032
1033   if (vcm->is_init)
1034     {
1035       VDBG (1, "already initialized");
1036       return VPPCOM_EEXIST;
1037     }
1038
1039   vcm->is_init = 1;
1040   vppcom_cfg (&vcm->cfg);
1041   vcl_cfg = &vcm->cfg;
1042
1043   vcm->main_cpu = pthread_self ();
1044   vcm->main_pid = getpid ();
1045   vcm->app_name = format (0, "%s", app_name);
1046   vppcom_init_error_string_table ();
1047   fifo_segment_main_init (&vcm->segment_main, vcl_cfg->segment_baseva,
1048                           20 /* timeout in secs */ );
1049   pool_alloc (vcm->workers, vcl_cfg->max_workers);
1050   clib_spinlock_init (&vcm->workers_lock);
1051   clib_rwlock_init (&vcm->segment_table_lock);
1052   atexit (vppcom_app_exit);
1053
1054   /* Allocate default worker */
1055   vcl_worker_alloc_and_init ();
1056
1057   /* API hookup and connect to VPP */
1058   vppcom_api_hookup ();
1059   vcl_elog_init (vcm);
1060   vcm->app_state = STATE_APP_START;
1061   rv = vppcom_connect_to_vpp (app_name);
1062   if (rv)
1063     {
1064       VERR ("couldn't connect to VPP!");
1065       return rv;
1066     }
1067   VDBG (0, "sending session enable");
1068   rv = vppcom_app_session_enable ();
1069   if (rv)
1070     {
1071       VERR ("vppcom_app_session_enable() failed!");
1072       return rv;
1073     }
1074
1075   VDBG (0, "sending app attach");
1076   rv = vppcom_app_attach ();
1077   if (rv)
1078     {
1079       VERR ("vppcom_app_attach() failed!");
1080       return rv;
1081     }
1082
1083   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
1084         vcm->workers[0].my_client_index, vcm->workers[0].my_client_index);
1085
1086   return VPPCOM_OK;
1087 }
1088
1089 void
1090 vppcom_app_destroy (void)
1091 {
1092   int rv;
1093   f64 orig_app_timeout;
1094
1095   if (!pool_elts (vcm->workers))
1096     return;
1097
1098   vcl_evt (VCL_EVT_DETACH, vcm);
1099
1100   if (pool_elts (vcm->workers) == 1)
1101     {
1102       vcl_send_app_detach (vcl_worker_get_current ());
1103       orig_app_timeout = vcm->cfg.app_timeout;
1104       vcm->cfg.app_timeout = 2.0;
1105       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
1106       vcm->cfg.app_timeout = orig_app_timeout;
1107       if (PREDICT_FALSE (rv))
1108         VDBG (0, "application detach timed out! returning %d (%s)", rv,
1109               vppcom_retval_str (rv));
1110       vec_free (vcm->app_name);
1111       vcl_worker_cleanup (vcl_worker_get_current (), 0 /* notify vpp */ );
1112     }
1113   else
1114     {
1115       vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1116     }
1117
1118   vcl_set_worker_index (~0);
1119   vcl_elog_stop (vcm);
1120   vl_client_disconnect_from_vlib ();
1121 }
1122
1123 int
1124 vppcom_session_create (u8 proto, u8 is_nonblocking)
1125 {
1126   vcl_worker_t *wrk = vcl_worker_get_current ();
1127   vcl_session_t *session;
1128
1129   session = vcl_session_alloc (wrk);
1130
1131   session->session_type = proto;
1132   session->session_state = STATE_START;
1133   session->vpp_handle = ~0;
1134   session->is_dgram = vcl_proto_is_dgram (proto);
1135
1136   if (is_nonblocking)
1137     VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
1138
1139   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1140            is_nonblocking, session_index);
1141
1142   VDBG (0, "created session %u", session->session_index);
1143
1144   return vcl_session_handle (session);
1145 }
1146
1147 int
1148 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * session,
1149                      vcl_session_handle_t sh, u8 do_disconnect)
1150 {
1151   vcl_session_state_t state;
1152   u32 next_sh, vep_sh;
1153   int rv = VPPCOM_OK;
1154   u64 vpp_handle;
1155   u8 is_vep;
1156
1157   is_vep = session->is_vep;
1158   next_sh = session->vep.next_sh;
1159   vep_sh = session->vep.vep_sh;
1160   state = session->session_state;
1161   vpp_handle = session->vpp_handle;
1162
1163   VDBG (1, "session %u [0x%llx] closing", session->session_index, vpp_handle);
1164
1165   if (is_vep)
1166     {
1167       while (next_sh != ~0)
1168         {
1169           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1170           if (PREDICT_FALSE (rv < 0))
1171             VDBG (0, "vpp handle 0x%llx, sh %u: EPOLL_CTL_DEL vep_idx %u"
1172                   " failed! rv %d (%s)", vpp_handle, next_sh, vep_sh, rv,
1173                   vppcom_retval_str (rv));
1174
1175           next_sh = session->vep.next_sh;
1176         }
1177     }
1178   else
1179     {
1180       if (session->is_vep_session)
1181         {
1182           rv = vppcom_epoll_ctl (vep_sh, EPOLL_CTL_DEL, sh, 0);
1183           if (rv < 0)
1184             VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1185                   "failed! rv %d (%s)", session->session_index, vpp_handle,
1186                   vep_sh, rv, vppcom_retval_str (rv));
1187         }
1188
1189       if (!do_disconnect)
1190         {
1191           VDBG (1, "session %u [0x%llx] disconnect skipped",
1192                 session->session_index, vpp_handle);
1193           goto cleanup;
1194         }
1195
1196       if (state & STATE_LISTEN)
1197         {
1198           rv = vppcom_session_unbind (sh);
1199           if (PREDICT_FALSE (rv < 0))
1200             VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1201                   "rv %d (%s)", session->session_index, vpp_handle, rv,
1202                   vppcom_retval_str (rv));
1203           return rv;
1204         }
1205       else if ((state & STATE_OPEN)
1206                || (vcl_session_is_connectable_listener (wrk, session)))
1207         {
1208           rv = vppcom_session_disconnect (sh);
1209           if (PREDICT_FALSE (rv < 0))
1210             VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1211                   " rv %d (%s)", session->session_index, vpp_handle,
1212                   rv, vppcom_retval_str (rv));
1213         }
1214       else if (state == STATE_DISCONNECT)
1215         {
1216           svm_msg_q_t *mq = vcl_session_vpp_evt_q (wrk, session);
1217           vcl_send_session_reset_reply (mq, wrk->my_client_index,
1218                                         session->vpp_handle, 0);
1219         }
1220     }
1221
1222   VDBG (0, "session %u [0x%llx] removed", session->session_index, vpp_handle);
1223
1224 cleanup:
1225   vcl_session_table_del_vpp_handle (wrk, vpp_handle);
1226   vcl_session_free (wrk, session);
1227   vcl_evt (VCL_EVT_CLOSE, session, rv);
1228
1229   return rv;
1230 }
1231
1232 int
1233 vppcom_session_close (uint32_t session_handle)
1234 {
1235   vcl_worker_t *wrk = vcl_worker_get_current ();
1236   vcl_session_t *session;
1237
1238   session = vcl_session_get_w_handle (wrk, session_handle);
1239   if (!session)
1240     return VPPCOM_EBADFD;
1241   return vcl_session_cleanup (wrk, session, session_handle,
1242                               1 /* do_disconnect */ );
1243 }
1244
1245 int
1246 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1247 {
1248   vcl_worker_t *wrk = vcl_worker_get_current ();
1249   vcl_session_t *session = 0;
1250
1251   if (!ep || !ep->ip)
1252     return VPPCOM_EINVAL;
1253
1254   session = vcl_session_get_w_handle (wrk, session_handle);
1255   if (!session)
1256     return VPPCOM_EBADFD;
1257
1258   if (session->is_vep)
1259     {
1260       VDBG (0, "ERROR: cannot bind to epoll session %u!",
1261             session->session_index);
1262       return VPPCOM_EBADFD;
1263     }
1264
1265   session->transport.is_ip4 = ep->is_ip4;
1266   if (ep->is_ip4)
1267     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1268                       sizeof (ip4_address_t));
1269   else
1270     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1271                       sizeof (ip6_address_t));
1272   session->transport.lcl_port = ep->port;
1273
1274   VDBG (0, "session %u handle %u: binding to local %s address %U port %u, "
1275         "proto %s", session->session_index, session_handle,
1276         session->transport.is_ip4 ? "IPv4" : "IPv6",
1277         format_ip46_address, &session->transport.lcl_ip,
1278         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1279         clib_net_to_host_u16 (session->transport.lcl_port),
1280         vppcom_proto_str (session->session_type));
1281   vcl_evt (VCL_EVT_BIND, session);
1282
1283   if (session->session_type == VPPCOM_PROTO_UDP)
1284     vppcom_session_listen (session_handle, 10);
1285
1286   return VPPCOM_OK;
1287 }
1288
1289 int
1290 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1291 {
1292   vcl_worker_t *wrk = vcl_worker_get_current ();
1293   vcl_session_t *listen_session = 0;
1294   u64 listen_vpp_handle;
1295   int rv;
1296
1297   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1298   if (!listen_session || listen_session->is_vep)
1299     return VPPCOM_EBADFD;
1300
1301   if (q_len == 0 || q_len == ~0)
1302     q_len = vcm->cfg.listen_queue_size;
1303
1304   listen_vpp_handle = listen_session->vpp_handle;
1305   if (listen_session->session_state & STATE_LISTEN)
1306     {
1307       VDBG (0, "session %u [0x%llx]: already in listen state!",
1308             listen_sh, listen_vpp_handle);
1309       return VPPCOM_OK;
1310     }
1311
1312   VDBG (0, "session %u: sending vpp listen request...", listen_sh);
1313
1314   /*
1315    * Send listen request to vpp and wait for reply
1316    */
1317   vcl_send_session_listen (wrk, listen_session);
1318   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1319                                              STATE_LISTEN,
1320                                              vcm->cfg.session_timeout);
1321
1322   if (PREDICT_FALSE (rv))
1323     {
1324       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1325       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1326             listen_sh, listen_session->vpp_handle, rv,
1327             vppcom_retval_str (rv));
1328       return rv;
1329     }
1330
1331   return VPPCOM_OK;
1332 }
1333
1334 int
1335 vppcom_session_tls_add_cert (uint32_t session_handle, char *cert,
1336                              uint32_t cert_len)
1337 {
1338
1339   vcl_worker_t *wrk = vcl_worker_get_current ();
1340   vcl_session_t *session = 0;
1341
1342   session = vcl_session_get_w_handle (wrk, session_handle);
1343   if (!session)
1344     return VPPCOM_EBADFD;
1345
1346   if (cert_len == 0 || cert_len == ~0)
1347     return VPPCOM_EBADFD;
1348
1349   /*
1350    * Send listen request to vpp and wait for reply
1351    */
1352   vppcom_send_application_tls_cert_add (session, cert, cert_len);
1353   vcm->app_state = STATE_APP_ADDING_TLS_DATA;
1354   vcl_wait_for_app_state_change (STATE_APP_READY);
1355   return VPPCOM_OK;
1356
1357 }
1358
1359 int
1360 vppcom_session_tls_add_key (uint32_t session_handle, char *key,
1361                             uint32_t key_len)
1362 {
1363
1364   vcl_worker_t *wrk = vcl_worker_get_current ();
1365   vcl_session_t *session = 0;
1366
1367   session = vcl_session_get_w_handle (wrk, session_handle);
1368   if (!session)
1369     return VPPCOM_EBADFD;
1370
1371   if (key_len == 0 || key_len == ~0)
1372     return VPPCOM_EBADFD;
1373
1374   vppcom_send_application_tls_key_add (session, key, key_len);
1375   vcm->app_state = STATE_APP_ADDING_TLS_DATA;
1376   vcl_wait_for_app_state_change (STATE_APP_READY);
1377   return VPPCOM_OK;
1378 }
1379
1380 static int
1381 validate_args_session_accept_ (vcl_worker_t * wrk, vcl_session_t * ls)
1382 {
1383   if (ls->is_vep)
1384     {
1385       VDBG (0, "ERROR: cannot accept on epoll session %u!",
1386             ls->session_index);
1387       return VPPCOM_EBADFD;
1388     }
1389
1390   if ((ls->session_state != STATE_LISTEN)
1391       && (!vcl_session_is_connectable_listener (wrk, ls)))
1392     {
1393       VDBG (0,
1394             "ERROR: session [0x%llx]: not in listen state! state 0x%x"
1395             " (%s)", ls->vpp_handle, ls->session_state,
1396             vppcom_session_state_str (ls->session_state));
1397       return VPPCOM_EBADFD;
1398     }
1399   return VPPCOM_OK;
1400 }
1401
1402 int
1403 vppcom_unformat_proto (uint8_t * proto, char *proto_str)
1404 {
1405   if (!strcmp (proto_str, "TCP"))
1406     *proto = VPPCOM_PROTO_TCP;
1407   else if (!strcmp (proto_str, "tcp"))
1408     *proto = VPPCOM_PROTO_TCP;
1409   else if (!strcmp (proto_str, "UDP"))
1410     *proto = VPPCOM_PROTO_UDP;
1411   else if (!strcmp (proto_str, "udp"))
1412     *proto = VPPCOM_PROTO_UDP;
1413   else if (!strcmp (proto_str, "UDPC"))
1414     *proto = VPPCOM_PROTO_UDPC;
1415   else if (!strcmp (proto_str, "udpc"))
1416     *proto = VPPCOM_PROTO_UDPC;
1417   else if (!strcmp (proto_str, "SCTP"))
1418     *proto = VPPCOM_PROTO_SCTP;
1419   else if (!strcmp (proto_str, "sctp"))
1420     *proto = VPPCOM_PROTO_SCTP;
1421   else if (!strcmp (proto_str, "TLS"))
1422     *proto = VPPCOM_PROTO_TLS;
1423   else if (!strcmp (proto_str, "tls"))
1424     *proto = VPPCOM_PROTO_TLS;
1425   else if (!strcmp (proto_str, "QUIC"))
1426     *proto = VPPCOM_PROTO_QUIC;
1427   else if (!strcmp (proto_str, "quic"))
1428     *proto = VPPCOM_PROTO_QUIC;
1429   else
1430     return 1;
1431   return 0;
1432 }
1433
1434 int
1435 vppcom_session_accept (uint32_t listen_session_handle, vppcom_endpt_t * ep,
1436                        uint32_t flags)
1437 {
1438   u32 client_session_index = ~0, listen_session_index, accept_flags = 0;
1439   vcl_worker_t *wrk = vcl_worker_get_current ();
1440   session_accepted_msg_t accepted_msg;
1441   vcl_session_t *listen_session = 0;
1442   vcl_session_t *client_session = 0;
1443   vcl_session_msg_t *evt;
1444   svm_msg_q_msg_t msg;
1445   session_event_t *e;
1446   u8 is_nonblocking;
1447   int rv;
1448
1449   listen_session = vcl_session_get_w_handle (wrk, listen_session_handle);
1450   if (!listen_session)
1451     return VPPCOM_EBADFD;
1452
1453   listen_session_index = listen_session->session_index;
1454   if ((rv = validate_args_session_accept_ (wrk, listen_session)))
1455     return rv;
1456
1457   if (clib_fifo_elts (listen_session->accept_evts_fifo))
1458     {
1459       clib_fifo_sub2 (listen_session->accept_evts_fifo, evt);
1460       accept_flags = evt->flags;
1461       accepted_msg = evt->accepted_msg;
1462       goto handle;
1463     }
1464
1465   is_nonblocking = VCL_SESS_ATTR_TEST (listen_session->attr,
1466                                        VCL_SESS_ATTR_NONBLOCK);
1467   if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1468     return VPPCOM_EAGAIN;
1469
1470   while (1)
1471     {
1472       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_WAIT, 0))
1473         return VPPCOM_EAGAIN;
1474
1475       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1476       if (e->event_type != SESSION_CTRL_EVT_ACCEPTED)
1477         {
1478           VDBG (0, "discarded event: %u", e->event_type);
1479           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1480           continue;
1481         }
1482       clib_memcpy_fast (&accepted_msg, e->data, sizeof (accepted_msg));
1483       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1484       break;
1485     }
1486
1487 handle:
1488
1489   client_session_index = vcl_session_accepted_handler (wrk, &accepted_msg,
1490                                                        listen_session_index);
1491   if (client_session_index == VCL_INVALID_SESSION_INDEX)
1492     return VPPCOM_ECONNABORTED;
1493
1494   listen_session = vcl_session_get (wrk, listen_session_index);
1495   client_session = vcl_session_get (wrk, client_session_index);
1496
1497   if (flags & O_NONBLOCK)
1498     VCL_SESS_ATTR_SET (client_session->attr, VCL_SESS_ATTR_NONBLOCK);
1499
1500   VDBG (1, "listener %u [0x%llx]: Got a connect request! session %u [0x%llx],"
1501         " flags %d, is_nonblocking %u", listen_session->session_index,
1502         listen_session->vpp_handle, client_session_index,
1503         client_session->vpp_handle, flags,
1504         VCL_SESS_ATTR_TEST (client_session->attr, VCL_SESS_ATTR_NONBLOCK));
1505
1506   if (ep)
1507     {
1508       ep->is_ip4 = client_session->transport.is_ip4;
1509       ep->port = client_session->transport.rmt_port;
1510       if (client_session->transport.is_ip4)
1511         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1512                           sizeof (ip4_address_t));
1513       else
1514         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1515                           sizeof (ip6_address_t));
1516     }
1517
1518   VDBG (0, "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1519         "local: %U:%u", listen_session_handle, listen_session->vpp_handle,
1520         client_session_index, client_session->vpp_handle,
1521         format_ip46_address, &client_session->transport.rmt_ip,
1522         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1523         clib_net_to_host_u16 (client_session->transport.rmt_port),
1524         format_ip46_address, &client_session->transport.lcl_ip,
1525         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1526         clib_net_to_host_u16 (client_session->transport.lcl_port));
1527   vcl_evt (VCL_EVT_ACCEPT, client_session, listen_session,
1528            client_session_index);
1529
1530   /*
1531    * Session might have been closed already
1532    */
1533   if (accept_flags)
1534     {
1535       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1536         client_session->session_state = STATE_VPP_CLOSING;
1537       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1538         client_session->session_state = STATE_DISCONNECT;
1539     }
1540   return vcl_session_handle (client_session);
1541 }
1542
1543 static void
1544 vcl_ip_copy_from_ep (ip46_address_t * ip, vppcom_endpt_t * ep)
1545 {
1546   if (ep->is_ip4)
1547     clib_memcpy_fast (&ip->ip4, ep->ip, sizeof (ip4_address_t));
1548   else
1549     clib_memcpy_fast (&ip->ip6, ep->ip, sizeof (ip6_address_t));
1550 }
1551
1552 void
1553 vcl_ip_copy_to_ep (ip46_address_t * ip, vppcom_endpt_t * ep, u8 is_ip4)
1554 {
1555   ep->is_ip4 = is_ip4;
1556   if (is_ip4)
1557     clib_memcpy_fast (ep->ip, &ip->ip4, sizeof (ip4_address_t));
1558   else
1559     clib_memcpy_fast (ep->ip, &ip->ip6, sizeof (ip6_address_t));
1560 }
1561
1562 int
1563 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1564 {
1565   vcl_worker_t *wrk = vcl_worker_get_current ();
1566   vcl_session_t *session = 0;
1567   u32 session_index;
1568   int rv;
1569
1570   session = vcl_session_get_w_handle (wrk, session_handle);
1571   if (!session)
1572     return VPPCOM_EBADFD;
1573   session_index = session->session_index;
1574
1575   if (PREDICT_FALSE (session->is_vep))
1576     {
1577       VDBG (0, "ERROR: cannot connect epoll session %u!",
1578             session->session_index);
1579       return VPPCOM_EBADFD;
1580     }
1581
1582   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1583     {
1584       VDBG (0, "session handle %u [0x%llx]: session already "
1585             "connected to %s %U port %d proto %s, state 0x%x (%s)",
1586             session_handle, session->vpp_handle,
1587             session->transport.is_ip4 ? "IPv4" : "IPv6", format_ip46_address,
1588             &session->transport.rmt_ip, session->transport.is_ip4 ?
1589             IP46_TYPE_IP4 : IP46_TYPE_IP6,
1590             clib_net_to_host_u16 (session->transport.rmt_port),
1591             vppcom_proto_str (session->session_type), session->session_state,
1592             vppcom_session_state_str (session->session_state));
1593       return VPPCOM_OK;
1594     }
1595
1596   session->transport.is_ip4 = server_ep->is_ip4;
1597   vcl_ip_copy_from_ep (&session->transport.rmt_ip, server_ep);
1598   session->transport.rmt_port = server_ep->port;
1599   session->parent_handle = VCL_INVALID_SESSION_HANDLE;
1600
1601   VDBG (0, "session handle %u: connecting to server %s %U "
1602         "port %d proto %s", session_handle,
1603         session->transport.is_ip4 ? "IPv4" : "IPv6",
1604         format_ip46_address,
1605         &session->transport.rmt_ip, session->transport.is_ip4 ?
1606         IP46_TYPE_IP4 : IP46_TYPE_IP6,
1607         clib_net_to_host_u16 (session->transport.rmt_port),
1608         vppcom_proto_str (session->session_type));
1609
1610   vcl_send_session_connect (wrk, session);
1611
1612   if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK))
1613     return VPPCOM_EINPROGRESS;
1614
1615   /*
1616    * Wait for reply from vpp if blocking
1617    */
1618   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1619                                              vcm->cfg.session_timeout);
1620
1621   session = vcl_session_get (wrk, session_index);
1622   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1623         session->vpp_handle, rv ? "failed" : "succeeded");
1624
1625   return rv;
1626 }
1627
1628 int
1629 vppcom_session_stream_connect (uint32_t session_handle,
1630                                uint32_t parent_session_handle)
1631 {
1632   vcl_worker_t *wrk = vcl_worker_get_current ();
1633   vcl_session_t *session, *parent_session;
1634   u32 session_index, parent_session_index;
1635   int rv;
1636
1637   session = vcl_session_get_w_handle (wrk, session_handle);
1638   if (!session)
1639     return VPPCOM_EBADFD;
1640   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1641   if (!parent_session)
1642     return VPPCOM_EBADFD;
1643
1644   session_index = session->session_index;
1645   parent_session_index = parent_session->session_index;
1646   if (PREDICT_FALSE (session->is_vep))
1647     {
1648       VDBG (0, "ERROR: cannot connect epoll session %u!",
1649             session->session_index);
1650       return VPPCOM_EBADFD;
1651     }
1652
1653   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1654     {
1655       VDBG (0, "session handle %u [0x%llx]: session already "
1656             "connected to session %u [0x%llx] proto %s, state 0x%x (%s)",
1657             session_handle, session->vpp_handle,
1658             parent_session_handle, parent_session->vpp_handle,
1659             vppcom_proto_str (session->session_type), session->session_state,
1660             vppcom_session_state_str (session->session_state));
1661       return VPPCOM_OK;
1662     }
1663
1664   /* Connect to quic session specifics */
1665   session->transport.is_ip4 = parent_session->transport.is_ip4;
1666   session->transport.rmt_ip.ip4.as_u32 = (uint32_t) 1;
1667   session->transport.rmt_port = 0;
1668   session->parent_handle = parent_session->vpp_handle;
1669
1670   VDBG (0, "session handle %u: connecting to session %u [0x%llx]",
1671         session_handle, parent_session_handle, parent_session->vpp_handle);
1672
1673   /*
1674    * Send connect request and wait for reply from vpp
1675    */
1676   vcl_send_session_connect (wrk, session);
1677   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1678                                              vcm->cfg.session_timeout);
1679
1680   session->listener_index = parent_session_index;
1681   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1682   if (parent_session)
1683     parent_session->n_accepted_sessions++;
1684
1685   session = vcl_session_get (wrk, session_index);
1686   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1687         session->vpp_handle, rv ? "failed" : "succeeded");
1688
1689   return rv;
1690 }
1691
1692 static u8
1693 vcl_is_rx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1694 {
1695   return (e->event_type == SESSION_IO_EVT_RX && e->session_index == sid);
1696 }
1697
1698 static inline int
1699 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
1700                               u8 peek)
1701 {
1702   vcl_worker_t *wrk = vcl_worker_get_current ();
1703   int n_read = 0, is_nonblocking;
1704   vcl_session_t *s = 0;
1705   svm_fifo_t *rx_fifo;
1706   svm_msg_q_msg_t msg;
1707   session_event_t *e;
1708   svm_msg_q_t *mq;
1709   u8 is_ct;
1710
1711   if (PREDICT_FALSE (!buf))
1712     return VPPCOM_EINVAL;
1713
1714   s = vcl_session_get_w_handle (wrk, session_handle);
1715   if (PREDICT_FALSE (!s || s->is_vep))
1716     return VPPCOM_EBADFD;
1717
1718   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1719     {
1720       VDBG (0, "session %u[0x%llx] is not open! state 0x%x (%s)",
1721             s->session_index, s->vpp_handle, s->session_state,
1722             vppcom_session_state_str (s->session_state));
1723       return vcl_session_closed_error (s);
1724     }
1725
1726   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1727   is_ct = vcl_session_is_ct (s);
1728   mq = wrk->app_event_queue;
1729   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
1730   s->has_rx_evt = 0;
1731
1732   if (svm_fifo_is_empty_cons (rx_fifo))
1733     {
1734       if (is_nonblocking)
1735         {
1736           svm_fifo_unset_event (s->rx_fifo);
1737           return VPPCOM_EWOULDBLOCK;
1738         }
1739       while (svm_fifo_is_empty_cons (rx_fifo))
1740         {
1741           if (vcl_session_is_closing (s))
1742             return vcl_session_closing_error (s);
1743
1744           svm_fifo_unset_event (s->rx_fifo);
1745           svm_msg_q_lock (mq);
1746           if (svm_msg_q_is_empty (mq))
1747             svm_msg_q_wait (mq);
1748
1749           svm_msg_q_sub_w_lock (mq, &msg);
1750           e = svm_msg_q_msg_data (mq, &msg);
1751           svm_msg_q_unlock (mq);
1752           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1753             vcl_handle_mq_event (wrk, e);
1754           svm_msg_q_free_msg (mq, &msg);
1755         }
1756     }
1757
1758   if (s->is_dgram)
1759     n_read = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
1760   else
1761     n_read = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
1762
1763   if (svm_fifo_is_empty_cons (rx_fifo))
1764     svm_fifo_unset_event (s->rx_fifo);
1765
1766   /* Cut-through sessions might request tx notifications on rx fifos */
1767   if (PREDICT_FALSE (rx_fifo->want_deq_ntf))
1768     {
1769       app_send_io_evt_to_vpp (s->vpp_evt_q, s->rx_fifo->master_session_index,
1770                               SESSION_IO_EVT_RX, SVM_Q_WAIT);
1771       svm_fifo_reset_has_deq_ntf (s->rx_fifo);
1772     }
1773
1774   VDBG (2, "session %u[0x%llx]: read %d bytes from (%p)", s->session_index,
1775         s->vpp_handle, n_read, rx_fifo);
1776
1777   return n_read;
1778 }
1779
1780 int
1781 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
1782 {
1783   return (vppcom_session_read_internal (session_handle, buf, n, 0));
1784 }
1785
1786 static int
1787 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
1788 {
1789   return (vppcom_session_read_internal (session_handle, buf, n, 1));
1790 }
1791
1792 int
1793 vppcom_session_read_segments (uint32_t session_handle,
1794                               vppcom_data_segments_t ds)
1795 {
1796   vcl_worker_t *wrk = vcl_worker_get_current ();
1797   int n_read = 0, is_nonblocking;
1798   vcl_session_t *s = 0;
1799   svm_fifo_t *rx_fifo;
1800   svm_msg_q_msg_t msg;
1801   session_event_t *e;
1802   svm_msg_q_t *mq;
1803   u8 is_ct;
1804
1805   s = vcl_session_get_w_handle (wrk, session_handle);
1806   if (PREDICT_FALSE (!s || s->is_vep))
1807     return VPPCOM_EBADFD;
1808
1809   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1810     return vcl_session_closed_error (s);
1811
1812   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1813   is_ct = vcl_session_is_ct (s);
1814   mq = is_ct ? s->our_evt_q : wrk->app_event_queue;
1815   rx_fifo = s->rx_fifo;
1816   s->has_rx_evt = 0;
1817
1818   if (is_ct)
1819     svm_fifo_unset_event (s->rx_fifo);
1820
1821   if (svm_fifo_is_empty_cons (rx_fifo))
1822     {
1823       if (is_nonblocking)
1824         {
1825           svm_fifo_unset_event (rx_fifo);
1826           return VPPCOM_EWOULDBLOCK;
1827         }
1828       while (svm_fifo_is_empty_cons (rx_fifo))
1829         {
1830           if (vcl_session_is_closing (s))
1831             return vcl_session_closing_error (s);
1832
1833           svm_fifo_unset_event (rx_fifo);
1834           svm_msg_q_lock (mq);
1835           if (svm_msg_q_is_empty (mq))
1836             svm_msg_q_wait (mq);
1837
1838           svm_msg_q_sub_w_lock (mq, &msg);
1839           e = svm_msg_q_msg_data (mq, &msg);
1840           svm_msg_q_unlock (mq);
1841           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1842             vcl_handle_mq_event (wrk, e);
1843           svm_msg_q_free_msg (mq, &msg);
1844         }
1845     }
1846
1847   n_read = svm_fifo_segments (rx_fifo, (svm_fifo_seg_t *) ds);
1848   svm_fifo_unset_event (rx_fifo);
1849
1850   return n_read;
1851 }
1852
1853 void
1854 vppcom_session_free_segments (uint32_t session_handle,
1855                               vppcom_data_segments_t ds)
1856 {
1857   vcl_worker_t *wrk = vcl_worker_get_current ();
1858   vcl_session_t *s;
1859
1860   s = vcl_session_get_w_handle (wrk, session_handle);
1861   if (PREDICT_FALSE (!s || s->is_vep))
1862     return;
1863
1864   svm_fifo_segments_free (s->rx_fifo, (svm_fifo_seg_t *) ds);
1865 }
1866
1867 int
1868 vppcom_data_segment_copy (void *buf, vppcom_data_segments_t ds, u32 max_bytes)
1869 {
1870   u32 first_copy = clib_min (ds[0].len, max_bytes);
1871   clib_memcpy_fast (buf, ds[0].data, first_copy);
1872   if (first_copy < max_bytes)
1873     {
1874       clib_memcpy_fast (buf + first_copy, ds[1].data,
1875                         clib_min (ds[1].len, max_bytes - first_copy));
1876     }
1877   return 0;
1878 }
1879
1880 static u8
1881 vcl_is_tx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1882 {
1883   return (e->event_type == SESSION_IO_EVT_TX && e->session_index == sid);
1884 }
1885
1886 static inline int
1887 vppcom_session_write_inline (uint32_t session_handle, void *buf, size_t n,
1888                              u8 is_flush)
1889 {
1890   vcl_worker_t *wrk = vcl_worker_get_current ();
1891   int n_write, is_nonblocking;
1892   vcl_session_t *s = 0;
1893   session_evt_type_t et;
1894   svm_msg_q_msg_t msg;
1895   svm_fifo_t *tx_fifo;
1896   session_event_t *e;
1897   svm_msg_q_t *mq;
1898   u8 is_ct;
1899
1900   if (PREDICT_FALSE (!buf))
1901     return VPPCOM_EINVAL;
1902
1903   s = vcl_session_get_w_handle (wrk, session_handle);
1904   if (PREDICT_FALSE (!s))
1905     return VPPCOM_EBADFD;
1906
1907   if (PREDICT_FALSE (s->is_vep))
1908     {
1909       VDBG (0, "ERROR: session %u [0x%llx]: cannot write to an epoll"
1910             " session!", s->session_index, s->vpp_handle);
1911       return VPPCOM_EBADFD;
1912     }
1913
1914   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1915     {
1916       VDBG (1, "session %u [0x%llx]: is not open! state 0x%x (%s)",
1917             s->session_index, s->vpp_handle, s->session_state,
1918             vppcom_session_state_str (s->session_state));
1919       return vcl_session_closed_error (s);;
1920     }
1921
1922   is_ct = vcl_session_is_ct (s);
1923   tx_fifo = is_ct ? s->ct_tx_fifo : s->tx_fifo;
1924   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1925
1926   mq = wrk->app_event_queue;
1927   if (svm_fifo_is_full_prod (tx_fifo))
1928     {
1929       if (is_nonblocking)
1930         {
1931           return VPPCOM_EWOULDBLOCK;
1932         }
1933       while (svm_fifo_is_full_prod (tx_fifo))
1934         {
1935           svm_fifo_add_want_deq_ntf (tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
1936           if (vcl_session_is_closing (s))
1937             return vcl_session_closing_error (s);
1938           svm_msg_q_lock (mq);
1939           if (svm_msg_q_is_empty (mq))
1940             svm_msg_q_wait (mq);
1941
1942           svm_msg_q_sub_w_lock (mq, &msg);
1943           e = svm_msg_q_msg_data (mq, &msg);
1944           svm_msg_q_unlock (mq);
1945
1946           if (!vcl_is_tx_evt_for_session (e, s->session_index, is_ct))
1947             vcl_handle_mq_event (wrk, e);
1948           svm_msg_q_free_msg (mq, &msg);
1949         }
1950     }
1951
1952   et = SESSION_IO_EVT_TX;
1953   if (is_flush && !is_ct)
1954     et = SESSION_IO_EVT_TX_FLUSH;
1955
1956   if (s->is_dgram)
1957     n_write = app_send_dgram_raw (tx_fifo, &s->transport,
1958                                   s->vpp_evt_q, buf, n, et,
1959                                   0 /* do_evt */ , SVM_Q_WAIT);
1960   else
1961     n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
1962                                    0 /* do_evt */ , SVM_Q_WAIT);
1963
1964   if (svm_fifo_set_event (s->tx_fifo))
1965     app_send_io_evt_to_vpp (s->vpp_evt_q, s->tx_fifo->master_session_index,
1966                             et, SVM_Q_WAIT);
1967
1968   ASSERT (n_write > 0);
1969
1970   VDBG (2, "session %u [0x%llx]: wrote %d bytes", s->session_index,
1971         s->vpp_handle, n_write);
1972
1973   return n_write;
1974 }
1975
1976 int
1977 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
1978 {
1979   return vppcom_session_write_inline (session_handle, buf, n,
1980                                       0 /* is_flush */ );
1981 }
1982
1983 int
1984 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
1985 {
1986   return vppcom_session_write_inline (session_handle, buf, n,
1987                                       1 /* is_flush */ );
1988 }
1989
1990 #define vcl_fifo_rx_evt_valid_or_break(_s)                              \
1991 if (PREDICT_FALSE (!_s->rx_fifo))                                       \
1992   break;                                                                \
1993 if (PREDICT_FALSE (svm_fifo_is_empty (_s->rx_fifo)))                    \
1994   {                                                                     \
1995     if (!vcl_session_is_ct (_s))                                        \
1996       {                                                                 \
1997         svm_fifo_unset_event (_s->rx_fifo);                             \
1998         if (svm_fifo_is_empty (_s->rx_fifo))                            \
1999           break;                                                        \
2000       }                                                                 \
2001     else if (svm_fifo_is_empty (_s->ct_rx_fifo))                        \
2002       {                                                                 \
2003         svm_fifo_unset_event (_s->ct_rx_fifo);                          \
2004         if (svm_fifo_is_empty (_s->ct_rx_fifo))                         \
2005           break;                                                        \
2006       }                                                                 \
2007   }                                                                     \
2008
2009 static void
2010 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2011                             unsigned long n_bits, unsigned long *read_map,
2012                             unsigned long *write_map,
2013                             unsigned long *except_map, u32 * bits_set)
2014 {
2015   session_disconnected_msg_t *disconnected_msg;
2016   session_connected_msg_t *connected_msg;
2017   vcl_session_t *session;
2018   u32 sid;
2019
2020   switch (e->event_type)
2021     {
2022     case SESSION_IO_EVT_RX:
2023       sid = e->session_index;
2024       session = vcl_session_get (wrk, sid);
2025       if (!session)
2026         break;
2027       vcl_fifo_rx_evt_valid_or_break (session);
2028       if (sid < n_bits && read_map)
2029         {
2030           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2031           *bits_set += 1;
2032         }
2033       break;
2034     case SESSION_IO_EVT_TX:
2035       sid = e->session_index;
2036       session = vcl_session_get (wrk, sid);
2037       if (!session)
2038         break;
2039       if (sid < n_bits && write_map)
2040         {
2041           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2042           *bits_set += 1;
2043         }
2044       break;
2045     case SESSION_CTRL_EVT_ACCEPTED:
2046       session = vcl_session_accepted (wrk,
2047                                       (session_accepted_msg_t *) e->data);
2048       if (!session)
2049         break;
2050       sid = session->session_index;
2051       if (sid < n_bits && read_map)
2052         {
2053           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2054           *bits_set += 1;
2055         }
2056       break;
2057     case SESSION_CTRL_EVT_CONNECTED:
2058       connected_msg = (session_connected_msg_t *) e->data;
2059       sid = vcl_session_connected_handler (wrk, connected_msg);
2060       if (sid == VCL_INVALID_SESSION_INDEX)
2061         break;
2062       if (sid < n_bits && write_map)
2063         {
2064           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2065           *bits_set += 1;
2066         }
2067       break;
2068     case SESSION_CTRL_EVT_DISCONNECTED:
2069       disconnected_msg = (session_disconnected_msg_t *) e->data;
2070       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2071       if (!session)
2072         break;
2073       sid = session->session_index;
2074       if (sid < n_bits && except_map)
2075         {
2076           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2077           *bits_set += 1;
2078         }
2079       break;
2080     case SESSION_CTRL_EVT_RESET:
2081       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2082       if (sid < n_bits && except_map)
2083         {
2084           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2085           *bits_set += 1;
2086         }
2087       break;
2088     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2089       vcl_session_unlisten_reply_handler (wrk, e->data);
2090       break;
2091     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2092       vcl_session_worker_update_reply_handler (wrk, e->data);
2093       break;
2094     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2095       vcl_session_req_worker_update_handler (wrk, e->data);
2096       break;
2097     default:
2098       clib_warning ("unhandled: %u", e->event_type);
2099       break;
2100     }
2101 }
2102
2103 static int
2104 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2105                       unsigned long n_bits, unsigned long *read_map,
2106                       unsigned long *write_map, unsigned long *except_map,
2107                       double time_to_wait, u32 * bits_set)
2108 {
2109   svm_msg_q_msg_t *msg;
2110   session_event_t *e;
2111   u32 i;
2112
2113   svm_msg_q_lock (mq);
2114   if (svm_msg_q_is_empty (mq))
2115     {
2116       if (*bits_set)
2117         {
2118           svm_msg_q_unlock (mq);
2119           return 0;
2120         }
2121
2122       if (!time_to_wait)
2123         {
2124           svm_msg_q_unlock (mq);
2125           return 0;
2126         }
2127       else if (time_to_wait < 0)
2128         {
2129           svm_msg_q_wait (mq);
2130         }
2131       else
2132         {
2133           if (svm_msg_q_timedwait (mq, time_to_wait))
2134             {
2135               svm_msg_q_unlock (mq);
2136               return 0;
2137             }
2138         }
2139     }
2140   vcl_mq_dequeue_batch (wrk, mq, ~0);
2141   svm_msg_q_unlock (mq);
2142
2143   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2144     {
2145       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2146       e = svm_msg_q_msg_data (mq, msg);
2147       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2148                                   except_map, bits_set);
2149       svm_msg_q_free_msg (mq, msg);
2150     }
2151   vec_reset_length (wrk->mq_msg_vector);
2152   vcl_handle_pending_wrk_updates (wrk);
2153   return *bits_set;
2154 }
2155
2156 static int
2157 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2158                        vcl_si_set * read_map, vcl_si_set * write_map,
2159                        vcl_si_set * except_map, double time_to_wait,
2160                        u32 * bits_set)
2161 {
2162   double wait = 0, start = 0;
2163
2164   if (!*bits_set)
2165     {
2166       wait = time_to_wait;
2167       start = clib_time_now (&wrk->clib_time);
2168     }
2169
2170   do
2171     {
2172       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2173                             write_map, except_map, wait, bits_set);
2174       if (*bits_set)
2175         return *bits_set;
2176       if (wait == -1)
2177         continue;
2178
2179       wait = wait - (clib_time_now (&wrk->clib_time) - start);
2180     }
2181   while (wait > 0);
2182
2183   return 0;
2184 }
2185
2186 static int
2187 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2188                        vcl_si_set * read_map, vcl_si_set * write_map,
2189                        vcl_si_set * except_map, double time_to_wait,
2190                        u32 * bits_set)
2191 {
2192   vcl_mq_evt_conn_t *mqc;
2193   int __clib_unused n_read;
2194   int n_mq_evts, i;
2195   u64 buf;
2196
2197   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2198   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2199                           vec_len (wrk->mq_events), time_to_wait);
2200   for (i = 0; i < n_mq_evts; i++)
2201     {
2202       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2203       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2204       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2205                             except_map, 0, bits_set);
2206     }
2207
2208   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2209 }
2210
2211 int
2212 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2213                vcl_si_set * except_map, double time_to_wait)
2214 {
2215   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2216   vcl_worker_t *wrk = vcl_worker_get_current ();
2217   vcl_session_t *session = 0;
2218   int rv, i;
2219
2220   if (n_bits && read_map)
2221     {
2222       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2223       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2224                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2225       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2226     }
2227   if (n_bits && write_map)
2228     {
2229       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2230       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2231                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2232       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2233     }
2234   if (n_bits && except_map)
2235     {
2236       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2237       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2238                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2239       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2240     }
2241
2242   if (!n_bits)
2243     return 0;
2244
2245   if (!write_map)
2246     goto check_rd;
2247
2248   /* *INDENT-OFF* */
2249   clib_bitmap_foreach (sid, wrk->wr_bitmap, ({
2250     if (!(session = vcl_session_get (wrk, sid)))
2251       {
2252         if (except_map && sid < minbits)
2253           clib_bitmap_set_no_check (except_map, sid, 1);
2254         continue;
2255       }
2256
2257     rv = svm_fifo_is_full_prod (session->tx_fifo);
2258     if (!rv)
2259       {
2260         clib_bitmap_set_no_check ((uword*)write_map, sid, 1);
2261         bits_set++;
2262       }
2263     else
2264       svm_fifo_add_want_deq_ntf (session->tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
2265   }));
2266
2267 check_rd:
2268   if (!read_map)
2269     goto check_mq;
2270
2271   clib_bitmap_foreach (sid, wrk->rd_bitmap, ({
2272     if (!(session = vcl_session_get (wrk, sid)))
2273       {
2274         if (except_map && sid < minbits)
2275           clib_bitmap_set_no_check (except_map, sid, 1);
2276         continue;
2277       }
2278
2279     rv = vcl_session_read_ready (session);
2280     if (rv)
2281       {
2282         clib_bitmap_set_no_check ((uword*)read_map, sid, 1);
2283         bits_set++;
2284       }
2285   }));
2286   /* *INDENT-ON* */
2287
2288 check_mq:
2289
2290   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2291     {
2292       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2293                                   read_map, write_map, except_map, &bits_set);
2294     }
2295   vec_reset_length (wrk->unhandled_evts_vector);
2296
2297   if (vcm->cfg.use_mq_eventfd)
2298     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2299                            time_to_wait, &bits_set);
2300   else
2301     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2302                            time_to_wait, &bits_set);
2303
2304   return (bits_set);
2305 }
2306
2307 static inline void
2308 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_handle)
2309 {
2310   vcl_session_t *session;
2311   vppcom_epoll_t *vep;
2312   u32 sh = vep_handle;
2313
2314   if (VPPCOM_DEBUG <= 2)
2315     return;
2316
2317   session = vcl_session_get_w_handle (wrk, vep_handle);
2318   if (PREDICT_FALSE (!session))
2319     {
2320       VDBG (0, "ERROR: Invalid vep_sh (%u)!", vep_handle);
2321       goto done;
2322     }
2323   if (PREDICT_FALSE (!session->is_vep))
2324     {
2325       VDBG (0, "ERROR: vep_sh (%u) is not a vep!", vep_handle);
2326       goto done;
2327     }
2328   vep = &session->vep;
2329   VDBG (0, "vep_sh (%u): Dumping epoll chain\n"
2330         "{\n"
2331         "   is_vep         = %u\n"
2332         "   is_vep_session = %u\n"
2333         "   next_sh        = 0x%x (%u)\n"
2334         "}\n", vep_handle, session->is_vep, session->is_vep_session,
2335         vep->next_sh, vep->next_sh);
2336
2337   for (sh = vep->next_sh; sh != ~0; sh = vep->next_sh)
2338     {
2339       session = vcl_session_get_w_handle (wrk, sh);
2340       if (PREDICT_FALSE (!session))
2341         {
2342           VDBG (0, "ERROR: Invalid sh (%u)!", sh);
2343           goto done;
2344         }
2345       if (PREDICT_FALSE (session->is_vep))
2346         {
2347           VDBG (0, "ERROR: sh (%u) is a vep!", vep_handle);
2348         }
2349       else if (PREDICT_FALSE (!session->is_vep_session))
2350         {
2351           VDBG (0, "ERROR: sh (%u) is not a vep session handle!", sh);
2352           goto done;
2353         }
2354       vep = &session->vep;
2355       if (PREDICT_FALSE (vep->vep_sh != vep_handle))
2356         VDBG (0, "ERROR: session (%u) vep_sh (%u) != vep_sh (%u)!",
2357               sh, session->vep.vep_sh, vep_handle);
2358       if (session->is_vep_session)
2359         {
2360           VDBG (0, "vep_sh[%u]: sh 0x%x (%u)\n"
2361                 "{\n"
2362                 "   next_sh        = 0x%x (%u)\n"
2363                 "   prev_sh        = 0x%x (%u)\n"
2364                 "   vep_sh         = 0x%x (%u)\n"
2365                 "   ev.events      = 0x%x\n"
2366                 "   ev.data.u64    = 0x%llx\n"
2367                 "   et_mask        = 0x%x\n"
2368                 "}\n",
2369                 vep_handle, sh, sh, vep->next_sh, vep->next_sh, vep->prev_sh,
2370                 vep->prev_sh, vep->vep_sh, vep->vep_sh, vep->ev.events,
2371                 vep->ev.data.u64, vep->et_mask);
2372         }
2373     }
2374
2375 done:
2376   VDBG (0, "vep_sh (%u): Dump complete!\n", vep_handle);
2377 }
2378
2379 int
2380 vppcom_epoll_create (void)
2381 {
2382   vcl_worker_t *wrk = vcl_worker_get_current ();
2383   vcl_session_t *vep_session;
2384
2385   vep_session = vcl_session_alloc (wrk);
2386
2387   vep_session->is_vep = 1;
2388   vep_session->vep.vep_sh = ~0;
2389   vep_session->vep.next_sh = ~0;
2390   vep_session->vep.prev_sh = ~0;
2391   vep_session->vpp_handle = ~0;
2392
2393   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2394   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2395
2396   return vcl_session_handle (vep_session);
2397 }
2398
2399 int
2400 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2401                   struct epoll_event *event)
2402 {
2403   vcl_worker_t *wrk = vcl_worker_get_current ();
2404   vcl_session_t *vep_session;
2405   vcl_session_t *session;
2406   int rv = VPPCOM_OK;
2407
2408   if (vep_handle == session_handle)
2409     {
2410       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2411       return VPPCOM_EINVAL;
2412     }
2413
2414   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2415   if (PREDICT_FALSE (!vep_session))
2416     {
2417       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2418       return VPPCOM_EBADFD;
2419     }
2420   if (PREDICT_FALSE (!vep_session->is_vep))
2421     {
2422       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2423       return VPPCOM_EINVAL;
2424     }
2425
2426   ASSERT (vep_session->vep.vep_sh == ~0);
2427   ASSERT (vep_session->vep.prev_sh == ~0);
2428
2429   session = vcl_session_get_w_handle (wrk, session_handle);
2430   if (PREDICT_FALSE (!session))
2431     {
2432       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2433       return VPPCOM_EBADFD;
2434     }
2435   if (PREDICT_FALSE (session->is_vep))
2436     {
2437       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2438       return VPPCOM_EINVAL;
2439     }
2440
2441   switch (op)
2442     {
2443     case EPOLL_CTL_ADD:
2444       if (PREDICT_FALSE (!event))
2445         {
2446           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2447           return VPPCOM_EINVAL;
2448         }
2449       if (vep_session->vep.next_sh != ~0)
2450         {
2451           vcl_session_t *next_session;
2452           next_session = vcl_session_get_w_handle (wrk,
2453                                                    vep_session->vep.next_sh);
2454           if (PREDICT_FALSE (!next_session))
2455             {
2456               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sh (%u) on "
2457                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2458               return VPPCOM_EBADFD;
2459             }
2460           ASSERT (next_session->vep.prev_sh == vep_handle);
2461           next_session->vep.prev_sh = session_handle;
2462         }
2463       session->vep.next_sh = vep_session->vep.next_sh;
2464       session->vep.prev_sh = vep_handle;
2465       session->vep.vep_sh = vep_handle;
2466       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2467       session->vep.ev = *event;
2468       session->is_vep = 0;
2469       session->is_vep_session = 1;
2470       vep_session->vep.next_sh = session_handle;
2471
2472       if (session->tx_fifo)
2473         svm_fifo_add_want_deq_ntf (session->tx_fifo,
2474                                    SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2475
2476       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2477             vep_handle, session_handle, event->events, event->data.u64);
2478       vcl_evt (VCL_EVT_EPOLL_CTLADD, session, event->events, event->data.u64);
2479       break;
2480
2481     case EPOLL_CTL_MOD:
2482       if (PREDICT_FALSE (!event))
2483         {
2484           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2485           rv = VPPCOM_EINVAL;
2486           goto done;
2487         }
2488       else if (PREDICT_FALSE (!session->is_vep_session))
2489         {
2490           VDBG (0, "sh %u EPOLL_CTL_MOD: not a vep session!", session_handle);
2491           rv = VPPCOM_EINVAL;
2492           goto done;
2493         }
2494       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2495         {
2496           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2497                 session_handle, session->vep.vep_sh, vep_handle);
2498           rv = VPPCOM_EINVAL;
2499           goto done;
2500         }
2501       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2502       session->vep.ev = *event;
2503       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2504             vep_handle, session_handle, event->events, event->data.u64);
2505       break;
2506
2507     case EPOLL_CTL_DEL:
2508       if (PREDICT_FALSE (!session->is_vep_session))
2509         {
2510           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
2511           rv = VPPCOM_EINVAL;
2512           goto done;
2513         }
2514       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2515         {
2516           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
2517                 session_handle, session->vep.vep_sh, vep_handle);
2518           rv = VPPCOM_EINVAL;
2519           goto done;
2520         }
2521
2522       if (session->vep.prev_sh == vep_handle)
2523         vep_session->vep.next_sh = session->vep.next_sh;
2524       else
2525         {
2526           vcl_session_t *prev_session;
2527           prev_session = vcl_session_get_w_handle (wrk, session->vep.prev_sh);
2528           if (PREDICT_FALSE (!prev_session))
2529             {
2530               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sh (%u) on sh (%u)!",
2531                     session->vep.prev_sh, session_handle);
2532               return VPPCOM_EBADFD;
2533             }
2534           ASSERT (prev_session->vep.next_sh == session_handle);
2535           prev_session->vep.next_sh = session->vep.next_sh;
2536         }
2537       if (session->vep.next_sh != ~0)
2538         {
2539           vcl_session_t *next_session;
2540           next_session = vcl_session_get_w_handle (wrk, session->vep.next_sh);
2541           if (PREDICT_FALSE (!next_session))
2542             {
2543               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sh (%u) on sh (%u)!",
2544                     session->vep.next_sh, session_handle);
2545               return VPPCOM_EBADFD;
2546             }
2547           ASSERT (next_session->vep.prev_sh == session_handle);
2548           next_session->vep.prev_sh = session->vep.prev_sh;
2549         }
2550
2551       memset (&session->vep, 0, sizeof (session->vep));
2552       session->vep.next_sh = ~0;
2553       session->vep.prev_sh = ~0;
2554       session->vep.vep_sh = ~0;
2555       session->is_vep_session = 0;
2556
2557       if (session->tx_fifo)
2558         svm_fifo_del_want_deq_ntf (session->tx_fifo, SVM_FIFO_NO_DEQ_NOTIF);
2559
2560       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sh %u!", vep_handle,
2561             session_handle);
2562       vcl_evt (VCL_EVT_EPOLL_CTLDEL, session, vep_sh);
2563       break;
2564
2565     default:
2566       VDBG (0, "Invalid operation (%d)!", op);
2567       rv = VPPCOM_EINVAL;
2568     }
2569
2570   vep_verify_epoll_chain (wrk, vep_handle);
2571
2572 done:
2573   return rv;
2574 }
2575
2576 static inline void
2577 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2578                                 struct epoll_event *events, u32 * num_ev)
2579 {
2580   session_disconnected_msg_t *disconnected_msg;
2581   session_connected_msg_t *connected_msg;
2582   u32 sid = ~0, session_events;
2583   u64 session_evt_data = ~0;
2584   vcl_session_t *session;
2585   u8 add_event = 0;
2586
2587   switch (e->event_type)
2588     {
2589     case SESSION_IO_EVT_RX:
2590       sid = e->session_index;
2591       if (!(session = vcl_session_get (wrk, sid)))
2592         break;
2593       vcl_fifo_rx_evt_valid_or_break (session);
2594       session_events = session->vep.ev.events;
2595       if (!(EPOLLIN & session->vep.ev.events) || session->has_rx_evt)
2596         break;
2597       add_event = 1;
2598       events[*num_ev].events |= EPOLLIN;
2599       session_evt_data = session->vep.ev.data.u64;
2600       session->has_rx_evt = 1;
2601       break;
2602     case SESSION_IO_EVT_TX:
2603       sid = e->session_index;
2604       if (!(session = vcl_session_get (wrk, sid)))
2605         break;
2606       session_events = session->vep.ev.events;
2607       if (!(EPOLLOUT & session_events))
2608         break;
2609       add_event = 1;
2610       events[*num_ev].events |= EPOLLOUT;
2611       session_evt_data = session->vep.ev.data.u64;
2612       svm_fifo_reset_has_deq_ntf (session->tx_fifo);
2613       break;
2614     case SESSION_CTRL_EVT_ACCEPTED:
2615       session = vcl_session_accepted (wrk,
2616                                       (session_accepted_msg_t *) e->data);
2617       if (!session)
2618         break;
2619
2620       session_events = session->vep.ev.events;
2621       if (!(EPOLLIN & session_events))
2622         break;
2623
2624       add_event = 1;
2625       events[*num_ev].events |= EPOLLIN;
2626       session_evt_data = session->vep.ev.data.u64;
2627       break;
2628     case SESSION_CTRL_EVT_CONNECTED:
2629       connected_msg = (session_connected_msg_t *) e->data;
2630       vcl_session_connected_handler (wrk, connected_msg);
2631       /* Generate EPOLLOUT because there's no connected event */
2632       sid = vcl_session_index_from_vpp_handle (wrk, connected_msg->handle);
2633       if (!(session = vcl_session_get (wrk, sid)))
2634         break;
2635       session_events = session->vep.ev.events;
2636       if (!(EPOLLOUT & session_events))
2637         break;
2638       add_event = 1;
2639       events[*num_ev].events |= EPOLLOUT;
2640       session_evt_data = session->vep.ev.data.u64;
2641       if (session->session_state & STATE_FAILED)
2642         events[*num_ev].events |= EPOLLHUP;
2643       break;
2644     case SESSION_CTRL_EVT_DISCONNECTED:
2645       disconnected_msg = (session_disconnected_msg_t *) e->data;
2646       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2647       if (!session)
2648         break;
2649       session_events = session->vep.ev.events;
2650       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2651         break;
2652       add_event = 1;
2653       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2654       session_evt_data = session->vep.ev.data.u64;
2655       break;
2656     case SESSION_CTRL_EVT_RESET:
2657       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2658       if (!(session = vcl_session_get (wrk, sid)))
2659         break;
2660       session_events = session->vep.ev.events;
2661       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2662         break;
2663       add_event = 1;
2664       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2665       session_evt_data = session->vep.ev.data.u64;
2666       break;
2667     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2668       vcl_session_unlisten_reply_handler (wrk, e->data);
2669       break;
2670     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2671       vcl_session_req_worker_update_handler (wrk, e->data);
2672       break;
2673     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2674       vcl_session_worker_update_reply_handler (wrk, e->data);
2675       break;
2676     default:
2677       VDBG (0, "unhandled: %u", e->event_type);
2678       break;
2679     }
2680
2681   if (add_event)
2682     {
2683       events[*num_ev].data.u64 = session_evt_data;
2684       if (EPOLLONESHOT & session_events)
2685         {
2686           session = vcl_session_get (wrk, sid);
2687           session->vep.ev.events = 0;
2688         }
2689       *num_ev += 1;
2690     }
2691 }
2692
2693 static int
2694 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2695                           struct epoll_event *events, u32 maxevents,
2696                           double wait_for_time, u32 * num_ev)
2697 {
2698   svm_msg_q_msg_t *msg;
2699   session_event_t *e;
2700   int i;
2701
2702   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
2703     goto handle_dequeued;
2704
2705   svm_msg_q_lock (mq);
2706   if (svm_msg_q_is_empty (mq))
2707     {
2708       if (!wait_for_time)
2709         {
2710           svm_msg_q_unlock (mq);
2711           return 0;
2712         }
2713       else if (wait_for_time < 0)
2714         {
2715           svm_msg_q_wait (mq);
2716         }
2717       else
2718         {
2719           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
2720             {
2721               svm_msg_q_unlock (mq);
2722               return 0;
2723             }
2724         }
2725     }
2726   ASSERT (maxevents > *num_ev);
2727   vcl_mq_dequeue_batch (wrk, mq, maxevents - *num_ev);
2728   svm_msg_q_unlock (mq);
2729
2730 handle_dequeued:
2731   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2732     {
2733       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2734       e = svm_msg_q_msg_data (mq, msg);
2735       vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
2736       svm_msg_q_free_msg (mq, msg);
2737     }
2738   vec_reset_length (wrk->mq_msg_vector);
2739   vcl_handle_pending_wrk_updates (wrk);
2740   return *num_ev;
2741 }
2742
2743 static int
2744 vppcom_epoll_wait_condvar (vcl_worker_t * wrk, struct epoll_event *events,
2745                            int maxevents, u32 n_evts, double wait_for_time)
2746 {
2747   double wait = 0, start = 0, now;
2748
2749   if (!n_evts)
2750     {
2751       wait = wait_for_time;
2752       start = clib_time_now (&wrk->clib_time);
2753     }
2754
2755   do
2756     {
2757       vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events, maxevents,
2758                                 wait, &n_evts);
2759       if (n_evts)
2760         return n_evts;
2761       if (wait == -1)
2762         continue;
2763
2764       now = clib_time_now (&wrk->clib_time);
2765       wait -= now - start;
2766       start = now;
2767     }
2768   while (wait > 0);
2769
2770   return 0;
2771 }
2772
2773 static int
2774 vppcom_epoll_wait_eventfd (vcl_worker_t * wrk, struct epoll_event *events,
2775                            int maxevents, u32 n_evts, double wait_for_time)
2776 {
2777   vcl_mq_evt_conn_t *mqc;
2778   int __clib_unused n_read;
2779   int n_mq_evts, i;
2780   u64 buf;
2781
2782   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2783 again:
2784   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2785                           vec_len (wrk->mq_events), wait_for_time);
2786   for (i = 0; i < n_mq_evts; i++)
2787     {
2788       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2789       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2790       vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0, &n_evts);
2791     }
2792   if (!n_evts && n_mq_evts > 0)
2793     goto again;
2794
2795   return (int) n_evts;
2796 }
2797
2798 int
2799 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
2800                    int maxevents, double wait_for_time)
2801 {
2802   vcl_worker_t *wrk = vcl_worker_get_current ();
2803   vcl_session_t *vep_session;
2804   u32 n_evts = 0;
2805   int i;
2806
2807   if (PREDICT_FALSE (maxevents <= 0))
2808     {
2809       VDBG (0, "ERROR: Invalid maxevents (%d)!", maxevents);
2810       return VPPCOM_EINVAL;
2811     }
2812
2813   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2814   if (!vep_session)
2815     return VPPCOM_EBADFD;
2816
2817   if (PREDICT_FALSE (!vep_session->is_vep))
2818     {
2819       VDBG (0, "ERROR: vep_idx (%u) is not a vep!", vep_handle);
2820       return VPPCOM_EINVAL;
2821     }
2822
2823   memset (events, 0, sizeof (*events) * maxevents);
2824
2825   if (vec_len (wrk->unhandled_evts_vector))
2826     {
2827       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2828         {
2829           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
2830                                           events, &n_evts);
2831           if (n_evts == maxevents)
2832             {
2833               vec_delete (wrk->unhandled_evts_vector, i + 1, 0);
2834               return n_evts;
2835             }
2836         }
2837       vec_reset_length (wrk->unhandled_evts_vector);
2838     }
2839
2840   if (vcm->cfg.use_mq_eventfd)
2841     return vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
2842                                       wait_for_time);
2843
2844   return vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
2845                                     wait_for_time);
2846 }
2847
2848 int
2849 vppcom_session_attr (uint32_t session_handle, uint32_t op,
2850                      void *buffer, uint32_t * buflen)
2851 {
2852   vcl_worker_t *wrk = vcl_worker_get_current ();
2853   vcl_session_t *session;
2854   int rv = VPPCOM_OK;
2855   u32 *flags = buffer, tmp_flags = 0;
2856   vppcom_endpt_t *ep = buffer;
2857
2858   session = vcl_session_get_w_handle (wrk, session_handle);
2859   if (!session)
2860     return VPPCOM_EBADFD;
2861
2862   switch (op)
2863     {
2864     case VPPCOM_ATTR_GET_NREAD:
2865       rv = vcl_session_read_ready (session);
2866       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sh %u, nread = %d", session_handle,
2867             rv);
2868       break;
2869
2870     case VPPCOM_ATTR_GET_NWRITE:
2871       rv = vcl_session_write_ready (session);
2872       VDBG (2, "VPPCOM_ATTR_GET_NWRITE: sh %u, nwrite = %d", session_handle,
2873             rv);
2874       break;
2875
2876     case VPPCOM_ATTR_GET_FLAGS:
2877       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
2878         {
2879           *flags = O_RDWR | (VCL_SESS_ATTR_TEST (session->attr,
2880                                                  VCL_SESS_ATTR_NONBLOCK));
2881           *buflen = sizeof (*flags);
2882           VDBG (2, "VPPCOM_ATTR_GET_FLAGS: sh %u, flags = 0x%08x, "
2883                 "is_nonblocking = %u", session_handle, *flags,
2884                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2885         }
2886       else
2887         rv = VPPCOM_EINVAL;
2888       break;
2889
2890     case VPPCOM_ATTR_SET_FLAGS:
2891       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
2892         {
2893           if (*flags & O_NONBLOCK)
2894             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
2895           else
2896             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_NONBLOCK);
2897
2898           VDBG (2, "VPPCOM_ATTR_SET_FLAGS: sh %u, flags = 0x%08x,"
2899                 " is_nonblocking = %u", session_handle, *flags,
2900                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2901         }
2902       else
2903         rv = VPPCOM_EINVAL;
2904       break;
2905
2906     case VPPCOM_ATTR_GET_PEER_ADDR:
2907       if (PREDICT_TRUE (buffer && buflen &&
2908                         (*buflen >= sizeof (*ep)) && ep->ip))
2909         {
2910           ep->is_ip4 = session->transport.is_ip4;
2911           ep->port = session->transport.rmt_port;
2912           if (session->transport.is_ip4)
2913             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
2914                               sizeof (ip4_address_t));
2915           else
2916             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
2917                               sizeof (ip6_address_t));
2918           *buflen = sizeof (*ep);
2919           VDBG (1, "VPPCOM_ATTR_GET_PEER_ADDR: sh %u, is_ip4 = %u, "
2920                 "addr = %U, port %u", session_handle, ep->is_ip4,
2921                 format_ip46_address, &session->transport.rmt_ip,
2922                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2923                 clib_net_to_host_u16 (ep->port));
2924         }
2925       else
2926         rv = VPPCOM_EINVAL;
2927       break;
2928
2929     case VPPCOM_ATTR_GET_LCL_ADDR:
2930       if (PREDICT_TRUE (buffer && buflen &&
2931                         (*buflen >= sizeof (*ep)) && ep->ip))
2932         {
2933           ep->is_ip4 = session->transport.is_ip4;
2934           ep->port = session->transport.lcl_port;
2935           if (session->transport.is_ip4)
2936             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
2937                               sizeof (ip4_address_t));
2938           else
2939             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
2940                               sizeof (ip6_address_t));
2941           *buflen = sizeof (*ep);
2942           VDBG (1, "VPPCOM_ATTR_GET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
2943                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
2944                 &session->transport.lcl_ip,
2945                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2946                 clib_net_to_host_u16 (ep->port));
2947         }
2948       else
2949         rv = VPPCOM_EINVAL;
2950       break;
2951
2952     case VPPCOM_ATTR_SET_LCL_ADDR:
2953       if (PREDICT_TRUE (buffer && buflen &&
2954                         (*buflen >= sizeof (*ep)) && ep->ip))
2955         {
2956           session->transport.is_ip4 = ep->is_ip4;
2957           session->transport.lcl_port = ep->port;
2958           vcl_ip_copy_from_ep (&session->transport.lcl_ip, ep);
2959           *buflen = sizeof (*ep);
2960           VDBG (1, "VPPCOM_ATTR_SET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
2961                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
2962                 &session->transport.lcl_ip,
2963                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2964                 clib_net_to_host_u16 (ep->port));
2965         }
2966       else
2967         rv = VPPCOM_EINVAL;
2968       break;
2969
2970     case VPPCOM_ATTR_GET_LIBC_EPFD:
2971       rv = session->libc_epfd;
2972       VDBG (2, "VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d", rv);
2973       break;
2974
2975     case VPPCOM_ATTR_SET_LIBC_EPFD:
2976       if (PREDICT_TRUE (buffer && buflen &&
2977                         (*buflen == sizeof (session->libc_epfd))))
2978         {
2979           session->libc_epfd = *(int *) buffer;
2980           *buflen = sizeof (session->libc_epfd);
2981
2982           VDBG (2, "VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, buflen %d",
2983                 session->libc_epfd, *buflen);
2984         }
2985       else
2986         rv = VPPCOM_EINVAL;
2987       break;
2988
2989     case VPPCOM_ATTR_GET_PROTOCOL:
2990       if (buffer && buflen && (*buflen >= sizeof (int)))
2991         {
2992           *(int *) buffer = session->session_type;
2993           *buflen = sizeof (int);
2994
2995           VDBG (2, "VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
2996                 *(int *) buffer, *(int *) buffer ? "UDP" : "TCP", *buflen);
2997         }
2998       else
2999         rv = VPPCOM_EINVAL;
3000       break;
3001
3002     case VPPCOM_ATTR_GET_LISTEN:
3003       if (buffer && buflen && (*buflen >= sizeof (int)))
3004         {
3005           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3006                                                 VCL_SESS_ATTR_LISTEN);
3007           *buflen = sizeof (int);
3008
3009           VDBG (2, "VPPCOM_ATTR_GET_LISTEN: %d, buflen %d", *(int *) buffer,
3010                 *buflen);
3011         }
3012       else
3013         rv = VPPCOM_EINVAL;
3014       break;
3015
3016     case VPPCOM_ATTR_GET_ERROR:
3017       if (buffer && buflen && (*buflen >= sizeof (int)))
3018         {
3019           *(int *) buffer = 0;
3020           *buflen = sizeof (int);
3021
3022           VDBG (2, "VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
3023                 *(int *) buffer, *buflen);
3024         }
3025       else
3026         rv = VPPCOM_EINVAL;
3027       break;
3028
3029     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
3030       if (buffer && buflen && (*buflen >= sizeof (u32)))
3031         {
3032
3033           /* VPP-TBD */
3034           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3035                                 session->tx_fifo ? session->tx_fifo->nitems :
3036                                 vcm->cfg.tx_fifo_size);
3037           *buflen = sizeof (u32);
3038
3039           VDBG (2, "VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3040                 " #VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer,
3041                 *buflen);
3042         }
3043       else
3044         rv = VPPCOM_EINVAL;
3045       break;
3046
3047     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3048       if (buffer && buflen && (*buflen == sizeof (u32)))
3049         {
3050           /* VPP-TBD */
3051           session->sndbuf_size = *(u32 *) buffer;
3052           VDBG (2, "VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3053                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3054                 *buflen);
3055         }
3056       else
3057         rv = VPPCOM_EINVAL;
3058       break;
3059
3060     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3061       if (buffer && buflen && (*buflen >= sizeof (u32)))
3062         {
3063
3064           /* VPP-TBD */
3065           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3066                                 session->rx_fifo ? session->rx_fifo->nitems :
3067                                 vcm->cfg.rx_fifo_size);
3068           *buflen = sizeof (u32);
3069
3070           VDBG (2, "VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), buflen %d, "
3071                 "#VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer, *buflen);
3072         }
3073       else
3074         rv = VPPCOM_EINVAL;
3075       break;
3076
3077     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3078       if (buffer && buflen && (*buflen == sizeof (u32)))
3079         {
3080           /* VPP-TBD */
3081           session->rcvbuf_size = *(u32 *) buffer;
3082           VDBG (2, "VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), buflen %d,"
3083                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3084                 *buflen);
3085         }
3086       else
3087         rv = VPPCOM_EINVAL;
3088       break;
3089
3090     case VPPCOM_ATTR_GET_REUSEADDR:
3091       if (buffer && buflen && (*buflen >= sizeof (int)))
3092         {
3093           /* VPP-TBD */
3094           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3095                                                 VCL_SESS_ATTR_REUSEADDR);
3096           *buflen = sizeof (int);
3097
3098           VDBG (2, "VPPCOM_ATTR_GET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3099                 *(int *) buffer, *buflen);
3100         }
3101       else
3102         rv = VPPCOM_EINVAL;
3103       break;
3104
3105     case VPPCOM_ATTR_SET_REUSEADDR:
3106       if (buffer && buflen && (*buflen == sizeof (int)) &&
3107           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3108         {
3109           /* VPP-TBD */
3110           if (*(int *) buffer)
3111             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEADDR);
3112           else
3113             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEADDR);
3114
3115           VDBG (2, "VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3116                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_REUSEADDR),
3117                 *buflen);
3118         }
3119       else
3120         rv = VPPCOM_EINVAL;
3121       break;
3122
3123     case VPPCOM_ATTR_GET_REUSEPORT:
3124       if (buffer && buflen && (*buflen >= sizeof (int)))
3125         {
3126           /* VPP-TBD */
3127           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3128                                                 VCL_SESS_ATTR_REUSEPORT);
3129           *buflen = sizeof (int);
3130
3131           VDBG (2, "VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3132                 *(int *) buffer, *buflen);
3133         }
3134       else
3135         rv = VPPCOM_EINVAL;
3136       break;
3137
3138     case VPPCOM_ATTR_SET_REUSEPORT:
3139       if (buffer && buflen && (*buflen == sizeof (int)) &&
3140           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3141         {
3142           /* VPP-TBD */
3143           if (*(int *) buffer)
3144             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEPORT);
3145           else
3146             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEPORT);
3147
3148           VDBG (2, "VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3149                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_REUSEPORT),
3150                 *buflen);
3151         }
3152       else
3153         rv = VPPCOM_EINVAL;
3154       break;
3155
3156     case VPPCOM_ATTR_GET_BROADCAST:
3157       if (buffer && buflen && (*buflen >= sizeof (int)))
3158         {
3159           /* VPP-TBD */
3160           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3161                                                 VCL_SESS_ATTR_BROADCAST);
3162           *buflen = sizeof (int);
3163
3164           VDBG (2, "VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3165                 *(int *) buffer, *buflen);
3166         }
3167       else
3168         rv = VPPCOM_EINVAL;
3169       break;
3170
3171     case VPPCOM_ATTR_SET_BROADCAST:
3172       if (buffer && buflen && (*buflen == sizeof (int)))
3173         {
3174           /* VPP-TBD */
3175           if (*(int *) buffer)
3176             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_BROADCAST);
3177           else
3178             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_BROADCAST);
3179
3180           VDBG (2, "VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3181                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_BROADCAST),
3182                 *buflen);
3183         }
3184       else
3185         rv = VPPCOM_EINVAL;
3186       break;
3187
3188     case VPPCOM_ATTR_GET_V6ONLY:
3189       if (buffer && buflen && (*buflen >= sizeof (int)))
3190         {
3191           /* VPP-TBD */
3192           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3193                                                 VCL_SESS_ATTR_V6ONLY);
3194           *buflen = sizeof (int);
3195
3196           VDBG (2, "VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3197                 *(int *) buffer, *buflen);
3198         }
3199       else
3200         rv = VPPCOM_EINVAL;
3201       break;
3202
3203     case VPPCOM_ATTR_SET_V6ONLY:
3204       if (buffer && buflen && (*buflen == sizeof (int)))
3205         {
3206           /* VPP-TBD */
3207           if (*(int *) buffer)
3208             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_V6ONLY);
3209           else
3210             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_V6ONLY);
3211
3212           VDBG (2, "VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3213                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_V6ONLY),
3214                 *buflen);
3215         }
3216       else
3217         rv = VPPCOM_EINVAL;
3218       break;
3219
3220     case VPPCOM_ATTR_GET_KEEPALIVE:
3221       if (buffer && buflen && (*buflen >= sizeof (int)))
3222         {
3223           /* VPP-TBD */
3224           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3225                                                 VCL_SESS_ATTR_KEEPALIVE);
3226           *buflen = sizeof (int);
3227
3228           VDBG (2, "VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3229                 *(int *) buffer, *buflen);
3230         }
3231       else
3232         rv = VPPCOM_EINVAL;
3233       break;
3234
3235     case VPPCOM_ATTR_SET_KEEPALIVE:
3236       if (buffer && buflen && (*buflen == sizeof (int)))
3237         {
3238           /* VPP-TBD */
3239           if (*(int *) buffer)
3240             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3241           else
3242             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3243
3244           VDBG (2, "VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3245                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_KEEPALIVE),
3246                 *buflen);
3247         }
3248       else
3249         rv = VPPCOM_EINVAL;
3250       break;
3251
3252     case VPPCOM_ATTR_GET_TCP_NODELAY:
3253       if (buffer && buflen && (*buflen >= sizeof (int)))
3254         {
3255           /* VPP-TBD */
3256           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3257                                                 VCL_SESS_ATTR_TCP_NODELAY);
3258           *buflen = sizeof (int);
3259
3260           VDBG (2, "VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3261                 *(int *) buffer, *buflen);
3262         }
3263       else
3264         rv = VPPCOM_EINVAL;
3265       break;
3266
3267     case VPPCOM_ATTR_SET_TCP_NODELAY:
3268       if (buffer && buflen && (*buflen == sizeof (int)))
3269         {
3270           /* VPP-TBD */
3271           if (*(int *) buffer)
3272             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3273           else
3274             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3275
3276           VDBG (2, "VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3277                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_TCP_NODELAY),
3278                 *buflen);
3279         }
3280       else
3281         rv = VPPCOM_EINVAL;
3282       break;
3283
3284     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
3285       if (buffer && buflen && (*buflen >= sizeof (int)))
3286         {
3287           /* VPP-TBD */
3288           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3289                                                 VCL_SESS_ATTR_TCP_KEEPIDLE);
3290           *buflen = sizeof (int);
3291
3292           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3293                 *(int *) buffer, *buflen);
3294         }
3295       else
3296         rv = VPPCOM_EINVAL;
3297       break;
3298
3299     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
3300       if (buffer && buflen && (*buflen == sizeof (int)))
3301         {
3302           /* VPP-TBD */
3303           if (*(int *) buffer)
3304             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3305           else
3306             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3307
3308           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3309                 VCL_SESS_ATTR_TEST (session->attr,
3310                                     VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
3311         }
3312       else
3313         rv = VPPCOM_EINVAL;
3314       break;
3315
3316     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
3317       if (buffer && buflen && (*buflen >= sizeof (int)))
3318         {
3319           /* VPP-TBD */
3320           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3321                                                 VCL_SESS_ATTR_TCP_KEEPINTVL);
3322           *buflen = sizeof (int);
3323
3324           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3325                 *(int *) buffer, *buflen);
3326         }
3327       else
3328         rv = VPPCOM_EINVAL;
3329       break;
3330
3331     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
3332       if (buffer && buflen && (*buflen == sizeof (int)))
3333         {
3334           /* VPP-TBD */
3335           if (*(int *) buffer)
3336             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3337           else
3338             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3339
3340           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3341                 VCL_SESS_ATTR_TEST (session->attr,
3342                                     VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
3343         }
3344       else
3345         rv = VPPCOM_EINVAL;
3346       break;
3347
3348     case VPPCOM_ATTR_GET_TCP_USER_MSS:
3349       if (buffer && buflen && (*buflen >= sizeof (u32)))
3350         {
3351           /* VPP-TBD */
3352           *(u32 *) buffer = session->user_mss;
3353           *buflen = sizeof (int);
3354
3355           VDBG (2, "VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d, #VPP-TBD#",
3356                 *(int *) buffer, *buflen);
3357         }
3358       else
3359         rv = VPPCOM_EINVAL;
3360       break;
3361
3362     case VPPCOM_ATTR_SET_TCP_USER_MSS:
3363       if (buffer && buflen && (*buflen == sizeof (u32)))
3364         {
3365           /* VPP-TBD */
3366           session->user_mss = *(u32 *) buffer;
3367
3368           VDBG (2, "VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d, #VPP-TBD#",
3369                 session->user_mss, *buflen);
3370         }
3371       else
3372         rv = VPPCOM_EINVAL;
3373       break;
3374
3375     case VPPCOM_ATTR_SET_SHUT:
3376       if (*flags == SHUT_RD || *flags == SHUT_RDWR)
3377         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_RD);
3378       if (*flags == SHUT_WR || *flags == SHUT_RDWR)
3379         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_WR);
3380       break;
3381
3382     case VPPCOM_ATTR_GET_SHUT:
3383       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_RD))
3384         tmp_flags = 1;
3385       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_WR))
3386         tmp_flags |= 2;
3387       if (tmp_flags == 1)
3388         *(int *) buffer = SHUT_RD;
3389       else if (tmp_flags == 2)
3390         *(int *) buffer = SHUT_WR;
3391       else if (tmp_flags == 3)
3392         *(int *) buffer = SHUT_RDWR;
3393       *buflen = sizeof (int);
3394       break;
3395     default:
3396       rv = VPPCOM_EINVAL;
3397       break;
3398     }
3399
3400   return rv;
3401 }
3402
3403 int
3404 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
3405                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
3406 {
3407   vcl_worker_t *wrk = vcl_worker_get_current ();
3408   int rv = VPPCOM_OK;
3409   vcl_session_t *session = 0;
3410
3411   if (ep)
3412     {
3413       session = vcl_session_get_w_handle (wrk, session_handle);
3414       if (PREDICT_FALSE (!session))
3415         {
3416           VDBG (0, "sh 0x%llx is closed!", session_handle);
3417           return VPPCOM_EBADFD;
3418         }
3419       ep->is_ip4 = session->transport.is_ip4;
3420       ep->port = session->transport.rmt_port;
3421     }
3422
3423   if (flags == 0)
3424     rv = vppcom_session_read (session_handle, buffer, buflen);
3425   else if (flags & MSG_PEEK)
3426     rv = vppcom_session_peek (session_handle, buffer, buflen);
3427   else
3428     {
3429       VDBG (0, "Unsupport flags for recvfrom %d", flags);
3430       return VPPCOM_EAFNOSUPPORT;
3431     }
3432
3433   if (ep)
3434     {
3435       if (session->transport.is_ip4)
3436         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3437                           sizeof (ip4_address_t));
3438       else
3439         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3440                           sizeof (ip6_address_t));
3441     }
3442
3443   return rv;
3444 }
3445
3446 int
3447 vppcom_session_sendto (uint32_t session_handle, void *buffer,
3448                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
3449 {
3450   if (!buffer)
3451     return VPPCOM_EINVAL;
3452
3453   if (ep)
3454     {
3455       // TBD
3456       return VPPCOM_EINVAL;
3457     }
3458
3459   if (flags)
3460     {
3461       // TBD check the flags and do the right thing
3462       VDBG (2, "handling flags 0x%u (%d) not implemented yet.", flags, flags);
3463     }
3464
3465   return (vppcom_session_write_inline (session_handle, buffer, buflen, 1));
3466 }
3467
3468 int
3469 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
3470 {
3471   vcl_worker_t *wrk = vcl_worker_get_current ();
3472   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
3473   u32 i, keep_trying = 1;
3474   svm_msg_q_msg_t msg;
3475   session_event_t *e;
3476   int rv, num_ev = 0;
3477
3478   VDBG (3, "vp %p, nsids %u, wait_for_time %f", vp, n_sids, wait_for_time);
3479
3480   if (!vp)
3481     return VPPCOM_EFAULT;
3482
3483   do
3484     {
3485       vcl_session_t *session;
3486
3487       /* Dequeue all events and drop all unhandled io events */
3488       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
3489         {
3490           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
3491           vcl_handle_mq_event (wrk, e);
3492           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
3493         }
3494       vec_reset_length (wrk->unhandled_evts_vector);
3495
3496       for (i = 0; i < n_sids; i++)
3497         {
3498           session = vcl_session_get (wrk, vp[i].sh);
3499           if (!session)
3500             {
3501               vp[i].revents = POLLHUP;
3502               num_ev++;
3503               continue;
3504             }
3505
3506           vp[i].revents = 0;
3507
3508           if (POLLIN & vp[i].events)
3509             {
3510               rv = vcl_session_read_ready (session);
3511               if (rv > 0)
3512                 {
3513                   vp[i].revents |= POLLIN;
3514                   num_ev++;
3515                 }
3516               else if (rv < 0)
3517                 {
3518                   switch (rv)
3519                     {
3520                     case VPPCOM_ECONNRESET:
3521                       vp[i].revents = POLLHUP;
3522                       break;
3523
3524                     default:
3525                       vp[i].revents = POLLERR;
3526                       break;
3527                     }
3528                   num_ev++;
3529                 }
3530             }
3531
3532           if (POLLOUT & vp[i].events)
3533             {
3534               rv = vcl_session_write_ready (session);
3535               if (rv > 0)
3536                 {
3537                   vp[i].revents |= POLLOUT;
3538                   num_ev++;
3539                 }
3540               else if (rv < 0)
3541                 {
3542                   switch (rv)
3543                     {
3544                     case VPPCOM_ECONNRESET:
3545                       vp[i].revents = POLLHUP;
3546                       break;
3547
3548                     default:
3549                       vp[i].revents = POLLERR;
3550                       break;
3551                     }
3552                   num_ev++;
3553                 }
3554             }
3555
3556           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
3557             {
3558               vp[i].revents = POLLNVAL;
3559               num_ev++;
3560             }
3561         }
3562       if (wait_for_time != -1)
3563         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
3564     }
3565   while ((num_ev == 0) && keep_trying);
3566
3567   return num_ev;
3568 }
3569
3570 int
3571 vppcom_mq_epoll_fd (void)
3572 {
3573   vcl_worker_t *wrk = vcl_worker_get_current ();
3574   return wrk->mqs_epfd;
3575 }
3576
3577 int
3578 vppcom_session_index (vcl_session_handle_t session_handle)
3579 {
3580   return session_handle & 0xFFFFFF;
3581 }
3582
3583 int
3584 vppcom_session_worker (vcl_session_handle_t session_handle)
3585 {
3586   return session_handle >> 24;
3587 }
3588
3589 int
3590 vppcom_worker_register (void)
3591 {
3592   if (!vcl_worker_alloc_and_init ())
3593     return VPPCOM_EEXIST;
3594
3595   if (vcl_worker_set_bapi ())
3596     return VPPCOM_EEXIST;
3597
3598   if (vcl_worker_register_with_vpp ())
3599     return VPPCOM_EEXIST;
3600
3601   return VPPCOM_OK;
3602 }
3603
3604 void
3605 vppcom_worker_unregister (void)
3606 {
3607   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
3608   vcl_set_worker_index (~0);
3609 }
3610
3611 int
3612 vppcom_worker_index (void)
3613 {
3614   return vcl_get_worker_index ();
3615 }
3616
3617 int
3618 vppcom_worker_mqs_epfd (void)
3619 {
3620   vcl_worker_t *wrk = vcl_worker_get_current ();
3621   if (!vcm->cfg.use_mq_eventfd)
3622     return -1;
3623   return wrk->mqs_epfd;
3624 }
3625
3626 int
3627 vppcom_session_is_connectable_listener (uint32_t session_handle)
3628 {
3629   vcl_session_t *session;
3630   vcl_worker_t *wrk = vcl_worker_get_current ();
3631   session = vcl_session_get_w_handle (wrk, session_handle);
3632   if (!session)
3633     return VPPCOM_EBADFD;
3634   return vcl_session_is_connectable_listener (wrk, session);
3635 }
3636
3637 int
3638 vppcom_session_listener (uint32_t session_handle)
3639 {
3640   vcl_worker_t *wrk = vcl_worker_get_current ();
3641   vcl_session_t *listen_session, *session;
3642   session = vcl_session_get_w_handle (wrk, session_handle);
3643   if (!session)
3644     return VPPCOM_EBADFD;
3645   if (session->listener_index == VCL_INVALID_SESSION_INDEX)
3646     return VPPCOM_EBADFD;
3647   listen_session = vcl_session_get_w_handle (wrk, session->listener_index);
3648   if (!listen_session)
3649     return VPPCOM_EBADFD;
3650   return vcl_session_handle (listen_session);
3651 }
3652
3653 int
3654 vppcom_session_n_accepted (uint32_t session_handle)
3655 {
3656   vcl_worker_t *wrk = vcl_worker_get_current ();
3657   vcl_session_t *session = vcl_session_get_w_handle (wrk, session_handle);
3658   if (!session)
3659     return VPPCOM_EBADFD;
3660   return session->n_accepted_sessions;
3661 }
3662
3663 /*
3664  * fd.io coding-style-patch-verification: ON
3665  *
3666  * Local Variables:
3667  * eval: (c-set-style "gnu")
3668  * End:
3669  */