vcl: add api to expose worker message queues epfd
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <svm/svm_fifo_segment.h>
19 #include <vcl/vppcom.h>
20 #include <vcl/vcl_debug.h>
21 #include <vcl/vcl_private.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static int
26 vcl_wait_for_segment (u64 segment_handle)
27 {
28   vcl_worker_t *wrk = vcl_worker_get_current ();
29   u32 wait_for_seconds = 10, segment_index;
30   f64 timeout;
31
32   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
33     return 0;
34
35   timeout = clib_time_now (&wrk->clib_time) + wait_for_seconds;
36   while (clib_time_now (&wrk->clib_time) < timeout)
37     {
38       segment_index = vcl_segment_table_lookup (segment_handle);
39       if (segment_index != VCL_INVALID_SEGMENT_INDEX)
40         return 0;
41       usleep (10);
42     }
43   return 1;
44 }
45
46 static inline int
47 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq)
48 {
49   svm_msg_q_msg_t *msg;
50   u32 n_msgs;
51   int i;
52
53   n_msgs = svm_msg_q_size (mq);
54   for (i = 0; i < n_msgs; i++)
55     {
56       vec_add2 (wrk->mq_msg_vector, msg, 1);
57       svm_msg_q_sub_w_lock (mq, msg);
58     }
59   return n_msgs;
60 }
61
62 const char *
63 vppcom_session_state_str (session_state_t state)
64 {
65   char *st;
66
67   switch (state)
68     {
69     case STATE_START:
70       st = "STATE_START";
71       break;
72
73     case STATE_CONNECT:
74       st = "STATE_CONNECT";
75       break;
76
77     case STATE_LISTEN:
78       st = "STATE_LISTEN";
79       break;
80
81     case STATE_ACCEPT:
82       st = "STATE_ACCEPT";
83       break;
84
85     case STATE_VPP_CLOSING:
86       st = "STATE_VPP_CLOSING";
87       break;
88
89     case STATE_DISCONNECT:
90       st = "STATE_DISCONNECT";
91       break;
92
93     case STATE_FAILED:
94       st = "STATE_FAILED";
95       break;
96
97     default:
98       st = "UNKNOWN_STATE";
99       break;
100     }
101
102   return st;
103 }
104
105 u8 *
106 format_ip4_address (u8 * s, va_list * args)
107 {
108   u8 *a = va_arg (*args, u8 *);
109   return format (s, "%d.%d.%d.%d", a[0], a[1], a[2], a[3]);
110 }
111
112 u8 *
113 format_ip6_address (u8 * s, va_list * args)
114 {
115   ip6_address_t *a = va_arg (*args, ip6_address_t *);
116   u32 i, i_max_n_zero, max_n_zeros, i_first_zero, n_zeros, last_double_colon;
117
118   i_max_n_zero = ARRAY_LEN (a->as_u16);
119   max_n_zeros = 0;
120   i_first_zero = i_max_n_zero;
121   n_zeros = 0;
122   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
123     {
124       u32 is_zero = a->as_u16[i] == 0;
125       if (is_zero && i_first_zero >= ARRAY_LEN (a->as_u16))
126         {
127           i_first_zero = i;
128           n_zeros = 0;
129         }
130       n_zeros += is_zero;
131       if ((!is_zero && n_zeros > max_n_zeros)
132           || (i + 1 >= ARRAY_LEN (a->as_u16) && n_zeros > max_n_zeros))
133         {
134           i_max_n_zero = i_first_zero;
135           max_n_zeros = n_zeros;
136           i_first_zero = ARRAY_LEN (a->as_u16);
137           n_zeros = 0;
138         }
139     }
140
141   last_double_colon = 0;
142   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
143     {
144       if (i == i_max_n_zero && max_n_zeros > 1)
145         {
146           s = format (s, "::");
147           i += max_n_zeros - 1;
148           last_double_colon = 1;
149         }
150       else
151         {
152           s = format (s, "%s%x",
153                       (last_double_colon || i == 0) ? "" : ":",
154                       clib_net_to_host_u16 (a->as_u16[i]));
155           last_double_colon = 0;
156         }
157     }
158
159   return s;
160 }
161
162 /* Format an IP46 address. */
163 u8 *
164 format_ip46_address (u8 * s, va_list * args)
165 {
166   ip46_address_t *ip46 = va_arg (*args, ip46_address_t *);
167   ip46_type_t type = va_arg (*args, ip46_type_t);
168   int is_ip4 = 1;
169
170   switch (type)
171     {
172     case IP46_TYPE_ANY:
173       is_ip4 = ip46_address_is_ip4 (ip46);
174       break;
175     case IP46_TYPE_IP4:
176       is_ip4 = 1;
177       break;
178     case IP46_TYPE_IP6:
179       is_ip4 = 0;
180       break;
181     }
182
183   return is_ip4 ?
184     format (s, "%U", format_ip4_address, &ip46->ip4) :
185     format (s, "%U", format_ip6_address, &ip46->ip6);
186 }
187
188 /*
189  * VPPCOM Utility Functions
190  */
191
192
193 static void
194 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
195                                  session_handle_t handle, int retval)
196 {
197   app_session_evt_t _app_evt, *app_evt = &_app_evt;
198   session_accepted_reply_msg_t *rmp;
199   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
200   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
201   rmp->handle = handle;
202   rmp->context = context;
203   rmp->retval = retval;
204   app_send_ctrl_evt_to_vpp (mq, app_evt);
205 }
206
207 static void
208 vcl_send_session_disconnected_reply (svm_msg_q_t * mq, u32 context,
209                                      session_handle_t handle, int retval)
210 {
211   app_session_evt_t _app_evt, *app_evt = &_app_evt;
212   session_disconnected_reply_msg_t *rmp;
213   app_alloc_ctrl_evt_to_vpp (mq, app_evt,
214                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
215   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
216   rmp->handle = handle;
217   rmp->context = context;
218   rmp->retval = retval;
219   app_send_ctrl_evt_to_vpp (mq, app_evt);
220 }
221
222 static void
223 vcl_send_session_reset_reply (svm_msg_q_t * mq, u32 context,
224                               session_handle_t handle, int retval)
225 {
226   app_session_evt_t _app_evt, *app_evt = &_app_evt;
227   session_reset_reply_msg_t *rmp;
228   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_RESET_REPLY);
229   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
230   rmp->handle = handle;
231   rmp->context = context;
232   rmp->retval = retval;
233   app_send_ctrl_evt_to_vpp (mq, app_evt);
234 }
235
236 void
237 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
238                                 u32 wrk_index)
239 {
240   app_session_evt_t _app_evt, *app_evt = &_app_evt;
241   session_worker_update_msg_t *mp;
242   svm_msg_q_t *mq;
243
244   mq = vcl_session_vpp_evt_q (wrk, s);
245   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_WORKER_UPDATE);
246   mp = (session_worker_update_msg_t *) app_evt->evt->data;
247   mp->client_index = wrk->my_client_index;
248   mp->handle = s->vpp_handle;
249   mp->req_wrk_index = wrk->vpp_wrk_index;
250   mp->wrk_index = wrk_index;
251   app_send_ctrl_evt_to_vpp (mq, app_evt);
252 }
253
254 static u32
255 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp)
256 {
257   vcl_session_t *session, *listen_session;
258   svm_fifo_t *rx_fifo, *tx_fifo;
259   u32 vpp_wrk_index;
260   svm_msg_q_t *evt_q;
261
262   session = vcl_session_alloc (wrk);
263
264   listen_session = vcl_session_table_lookup_listener (wrk,
265                                                       mp->listener_handle);
266   if (!listen_session)
267     {
268       svm_msg_q_t *evt_q;
269       evt_q = uword_to_pointer (mp->vpp_event_queue_address, svm_msg_q_t *);
270       clib_warning ("VCL<%d>: ERROR: couldn't find listen session: "
271                     "unknown vpp listener handle %llx",
272                     getpid (), mp->listener_handle);
273       vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
274                                        VNET_API_ERROR_INVALID_ARGUMENT);
275       vcl_session_free (wrk, session);
276       return VCL_INVALID_SESSION_INDEX;
277     }
278
279   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
280   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
281
282   if (mp->server_event_queue_address)
283     {
284       session->vpp_evt_q = uword_to_pointer (mp->client_event_queue_address,
285                                              svm_msg_q_t *);
286       session->our_evt_q = uword_to_pointer (mp->server_event_queue_address,
287                                              svm_msg_q_t *);
288       if (vcl_wait_for_segment (mp->segment_handle))
289         {
290           clib_warning ("segment for session %u couldn't be mounted!",
291                         session->session_index);
292           return VCL_INVALID_SESSION_INDEX;
293         }
294       rx_fifo->master_session_index = session->session_index;
295       tx_fifo->master_session_index = session->session_index;
296       rx_fifo->master_thread_index = vcl_get_worker_index ();
297       tx_fifo->master_thread_index = vcl_get_worker_index ();
298       vec_validate (wrk->vpp_event_queues, 0);
299       evt_q = uword_to_pointer (mp->vpp_event_queue_address, svm_msg_q_t *);
300       wrk->vpp_event_queues[0] = evt_q;
301     }
302   else
303     {
304       session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
305                                              svm_msg_q_t *);
306       rx_fifo->client_session_index = session->session_index;
307       tx_fifo->client_session_index = session->session_index;
308       rx_fifo->client_thread_index = vcl_get_worker_index ();
309       tx_fifo->client_thread_index = vcl_get_worker_index ();
310       vpp_wrk_index = tx_fifo->master_thread_index;
311       vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
312       wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
313     }
314
315   session->vpp_handle = mp->handle;
316   session->vpp_thread_index = rx_fifo->master_thread_index;
317   session->client_context = mp->context;
318   session->rx_fifo = rx_fifo;
319   session->tx_fifo = tx_fifo;
320
321   session->session_state = STATE_ACCEPT;
322   session->transport.rmt_port = mp->port;
323   session->transport.is_ip4 = mp->is_ip4;
324   clib_memcpy_fast (&session->transport.rmt_ip, mp->ip,
325                     sizeof (ip46_address_t));
326
327   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
328   session->transport.lcl_port = listen_session->transport.lcl_port;
329   session->transport.lcl_ip = listen_session->transport.lcl_ip;
330   session->session_type = listen_session->session_type;
331   session->is_dgram = session->session_type == VPPCOM_PROTO_UDP;
332
333   VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: client accept request from %s"
334         " address %U port %d queue %p!", getpid (), mp->handle,
335         session->session_index,
336         mp->is_ip4 ? "IPv4" : "IPv6", format_ip46_address, &mp->ip,
337         mp->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
338         clib_net_to_host_u16 (mp->port), session->vpp_evt_q);
339   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
340
341   return session->session_index;
342 }
343
344 static u32
345 vcl_session_connected_handler (vcl_worker_t * wrk,
346                                session_connected_msg_t * mp)
347 {
348   u32 session_index, vpp_wrk_index;
349   svm_fifo_t *rx_fifo, *tx_fifo;
350   vcl_session_t *session = 0;
351   svm_msg_q_t *evt_q;
352
353   session_index = mp->context;
354   session = vcl_session_get (wrk, session_index);
355   if (!session)
356     {
357       clib_warning ("[%s] ERROR: vpp handle 0x%llx, sid %u: "
358                     "Invalid session index (%u)!",
359                     getpid (), mp->handle, session_index);
360       return VCL_INVALID_SESSION_INDEX;
361     }
362   if (mp->retval)
363     {
364       clib_warning ("VCL<%d>: ERROR: sid %u: connect failed! %U", getpid (),
365                     session_index, format_api_error, ntohl (mp->retval));
366       session->session_state = STATE_FAILED;
367       session->vpp_handle = mp->handle;
368       return session_index;
369     }
370
371   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
372   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
373   if (vcl_wait_for_segment (mp->segment_handle))
374     {
375       clib_warning ("segment for session %u couldn't be mounted!",
376                     session->session_index);
377       return VCL_INVALID_SESSION_INDEX;
378     }
379
380   rx_fifo->client_session_index = session_index;
381   tx_fifo->client_session_index = session_index;
382   rx_fifo->client_thread_index = vcl_get_worker_index ();
383   tx_fifo->client_thread_index = vcl_get_worker_index ();
384
385   if (mp->client_event_queue_address)
386     {
387       session->vpp_evt_q = uword_to_pointer (mp->server_event_queue_address,
388                                              svm_msg_q_t *);
389       session->our_evt_q = uword_to_pointer (mp->client_event_queue_address,
390                                              svm_msg_q_t *);
391
392       vec_validate (wrk->vpp_event_queues, 0);
393       evt_q = uword_to_pointer (mp->vpp_event_queue_address, svm_msg_q_t *);
394       wrk->vpp_event_queues[0] = evt_q;
395     }
396   else
397     {
398       session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
399                                              svm_msg_q_t *);
400       vpp_wrk_index = tx_fifo->master_thread_index;
401       vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
402       wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
403     }
404
405   session->rx_fifo = rx_fifo;
406   session->tx_fifo = tx_fifo;
407   session->vpp_handle = mp->handle;
408   session->vpp_thread_index = rx_fifo->master_thread_index;
409   session->transport.is_ip4 = mp->is_ip4;
410   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
411                     sizeof (session->transport.lcl_ip));
412   session->transport.lcl_port = mp->lcl_port;
413   session->session_state = STATE_CONNECT;
414
415   /* Add it to lookup table */
416   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
417
418   VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: connect succeeded! "
419         "session_rx_fifo %p, refcnt %d, session_tx_fifo %p, refcnt %d",
420         getpid (), mp->handle, session_index, session->rx_fifo,
421         session->rx_fifo->refcnt, session->tx_fifo, session->tx_fifo->refcnt);
422
423   return session_index;
424 }
425
426 static int
427 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
428 {
429   vcl_session_msg_t *accepted_msg;
430   int i;
431
432   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
433     {
434       accepted_msg = &session->accept_evts_fifo[i];
435       if (accepted_msg->accepted_msg.handle == handle)
436         {
437           accepted_msg->flags |= flags;
438           return 1;
439         }
440     }
441   return 0;
442 }
443
444 static u32
445 vcl_session_reset_handler (vcl_worker_t * wrk,
446                            session_reset_msg_t * reset_msg)
447 {
448   vcl_session_t *session;
449   u32 sid;
450
451   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
452   session = vcl_session_get (wrk, sid);
453   if (!session)
454     {
455       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
456       return VCL_INVALID_SESSION_INDEX;
457     }
458
459   /* Caught a reset before actually accepting the session */
460   if (session->session_state == STATE_LISTEN)
461     {
462
463       if (!vcl_flag_accepted_session (session, reset_msg->handle,
464                                       VCL_ACCEPTED_F_RESET))
465         VDBG (0, "session was not accepted!");
466       return VCL_INVALID_SESSION_INDEX;
467     }
468
469   session->session_state = STATE_DISCONNECT;
470   VDBG (0, "reset session %u [0x%llx]", sid, reset_msg->handle);
471   return sid;
472 }
473
474 static u32
475 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
476 {
477   vcl_session_t *session;
478   u32 sid = mp->context;
479
480   session = vcl_session_get (wrk, sid);
481   if (mp->retval)
482     {
483       VERR ("vpp handle 0x%llx, sid %u: bind failed: %U", mp->handle, sid,
484             format_api_error, mp->retval);
485       if (session)
486         {
487           session->session_state = STATE_FAILED;
488           session->vpp_handle = mp->handle;
489           return sid;
490         }
491       else
492         {
493           clib_warning ("[%s] ERROR: vpp handle 0x%llx, sid %u: "
494                         "Invalid session index (%u)!",
495                         getpid (), mp->handle, sid);
496           return VCL_INVALID_SESSION_INDEX;
497         }
498     }
499
500   session->vpp_handle = mp->handle;
501   session->transport.is_ip4 = mp->lcl_is_ip4;
502   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
503                     sizeof (ip46_address_t));
504   session->transport.lcl_port = mp->lcl_port;
505   vcl_session_table_add_listener (wrk, mp->handle, sid);
506   session->session_state = STATE_LISTEN;
507
508   session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
509   vec_validate (wrk->vpp_event_queues, 0);
510   wrk->vpp_event_queues[0] = session->vpp_evt_q;
511
512   if (session->is_dgram)
513     {
514       svm_fifo_t *rx_fifo, *tx_fifo;
515       session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
516       rx_fifo = uword_to_pointer (mp->rx_fifo, svm_fifo_t *);
517       rx_fifo->client_session_index = sid;
518       tx_fifo = uword_to_pointer (mp->tx_fifo, svm_fifo_t *);
519       tx_fifo->client_session_index = sid;
520       session->rx_fifo = rx_fifo;
521       session->tx_fifo = tx_fifo;
522     }
523
524   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
525   return sid;
526 }
527
528 static vcl_session_t *
529 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
530 {
531   vcl_session_msg_t *vcl_msg;
532   vcl_session_t *session;
533
534   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
535   if (PREDICT_FALSE (session != 0))
536     VWRN ("session overlap handle %lu state %u!", msg->handle,
537           session->session_state);
538
539   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
540   if (!session)
541     {
542       VERR ("couldn't find listen session: listener handle %llx",
543             msg->listener_handle);
544       return 0;
545     }
546
547   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
548   vcl_msg->accepted_msg = *msg;
549   /* Session handle points to listener until fully accepted by app */
550   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
551
552   return session;
553 }
554
555 static vcl_session_t *
556 vcl_session_disconnected_handler (vcl_worker_t * wrk,
557                                   session_disconnected_msg_t * msg)
558 {
559   vcl_session_t *session;
560
561   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
562   if (!session)
563     {
564       VDBG (0, "request to disconnect unknown handle 0x%llx", msg->handle);
565       return 0;
566     }
567
568   /* Caught a disconnect before actually accepting the session */
569   if (session->session_state == STATE_LISTEN)
570     {
571       if (!vcl_flag_accepted_session (session, msg->handle,
572                                       VCL_ACCEPTED_F_CLOSED))
573         VDBG (0, "session was not accepted!");
574       return 0;
575     }
576
577   session->session_state = STATE_VPP_CLOSING;
578   return session;
579 }
580
581 static void
582 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
583 {
584   session_req_worker_update_msg_t *msg;
585   vcl_session_t *s;
586
587   msg = (session_req_worker_update_msg_t *) data;
588   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
589   if (!s)
590     return;
591
592   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
593 }
594
595 static void
596 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
597 {
598   session_worker_update_reply_msg_t *msg;
599   vcl_session_t *s;
600
601   msg = (session_worker_update_reply_msg_t *) data;
602   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
603   if (!s)
604     {
605       VDBG (0, "unknown handle 0x%llx", msg->handle);
606       return;
607     }
608   if (vcl_wait_for_segment (msg->segment_handle))
609     {
610       clib_warning ("segment for session %u couldn't be mounted!",
611                     s->session_index);
612       return;
613     }
614
615   if (s->rx_fifo)
616     {
617       s->rx_fifo = uword_to_pointer (msg->rx_fifo, svm_fifo_t *);
618       s->tx_fifo = uword_to_pointer (msg->tx_fifo, svm_fifo_t *);
619       s->rx_fifo->client_session_index = s->session_index;
620       s->tx_fifo->client_session_index = s->session_index;
621       s->rx_fifo->client_thread_index = wrk->wrk_index;
622       s->tx_fifo->client_thread_index = wrk->wrk_index;
623     }
624   s->session_state = STATE_UPDATED;
625
626   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
627         s->vpp_handle, wrk->wrk_index);
628 }
629
630 static int
631 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
632 {
633   session_disconnected_msg_t *disconnected_msg;
634   vcl_session_t *session;
635
636   switch (e->event_type)
637     {
638     case FIFO_EVENT_APP_RX:
639     case FIFO_EVENT_APP_TX:
640     case SESSION_IO_EVT_CT_RX:
641     case SESSION_IO_EVT_CT_TX:
642       vec_add1 (wrk->unhandled_evts_vector, *e);
643       break;
644     case SESSION_CTRL_EVT_ACCEPTED:
645       vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
646       break;
647     case SESSION_CTRL_EVT_CONNECTED:
648       vcl_session_connected_handler (wrk,
649                                      (session_connected_msg_t *) e->data);
650       break;
651     case SESSION_CTRL_EVT_DISCONNECTED:
652       disconnected_msg = (session_disconnected_msg_t *) e->data;
653       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
654       if (!session)
655         break;
656       session->session_state = STATE_DISCONNECT;
657       VDBG (0, "disconnected session %u [0x%llx]", session->session_index,
658             session->vpp_handle);
659       break;
660     case SESSION_CTRL_EVT_RESET:
661       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
662       break;
663     case SESSION_CTRL_EVT_BOUND:
664       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
665       break;
666     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
667       vcl_session_req_worker_update_handler (wrk, e->data);
668       break;
669     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
670       vcl_session_worker_update_reply_handler (wrk, e->data);
671       break;
672     default:
673       clib_warning ("unhandled %u", e->event_type);
674     }
675   return VPPCOM_OK;
676 }
677
678 static int
679 vppcom_wait_for_session_state_change (u32 session_index,
680                                       session_state_t state,
681                                       f64 wait_for_time)
682 {
683   vcl_worker_t *wrk = vcl_worker_get_current ();
684   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
685   vcl_session_t *volatile session;
686   svm_msg_q_msg_t msg;
687   session_event_t *e;
688
689   do
690     {
691       session = vcl_session_get (wrk, session_index);
692       if (PREDICT_FALSE (!session))
693         {
694           return VPPCOM_EBADFD;
695         }
696       if (session->session_state & state)
697         {
698           return VPPCOM_OK;
699         }
700       if (session->session_state & STATE_FAILED)
701         {
702           return VPPCOM_ECONNREFUSED;
703         }
704
705       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
706         {
707           usleep (100);
708           continue;
709         }
710       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
711       vcl_handle_mq_event (wrk, e);
712       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
713     }
714   while (clib_time_now (&wrk->clib_time) < timeout);
715
716   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
717         vppcom_session_state_str (state));
718   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
719
720   return VPPCOM_ETIMEDOUT;
721 }
722
723 static void
724 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
725 {
726   session_state_t state;
727   vcl_session_t *s;
728   u32 *sip;
729
730   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
731     return;
732
733   vec_foreach (sip, wrk->pending_session_wrk_updates)
734   {
735     s = vcl_session_get (wrk, *sip);
736     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
737     state = s->session_state;
738     vppcom_wait_for_session_state_change (s->session_index, STATE_UPDATED, 5);
739     s->session_state = state;
740   }
741   vec_reset_length (wrk->pending_session_wrk_updates);
742 }
743
744 void
745 vcl_flush_mq_events (void)
746 {
747   vcl_worker_t *wrk = vcl_worker_get_current ();
748   svm_msg_q_msg_t *msg;
749   session_event_t *e;
750   svm_msg_q_t *mq;
751   int i;
752
753   mq = wrk->app_event_queue;
754   svm_msg_q_lock (mq);
755   vcl_mq_dequeue_batch (wrk, mq);
756   svm_msg_q_unlock (mq);
757
758   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
759     {
760       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
761       e = svm_msg_q_msg_data (mq, msg);
762       vcl_handle_mq_event (wrk, e);
763       svm_msg_q_free_msg (mq, msg);
764     }
765   vec_reset_length (wrk->mq_msg_vector);
766   vcl_handle_pending_wrk_updates (wrk);
767 }
768
769 static int
770 vppcom_app_session_enable (void)
771 {
772   int rv;
773
774   if (vcm->app_state != STATE_APP_ENABLED)
775     {
776       vppcom_send_session_enable_disable (1 /* is_enabled == TRUE */ );
777       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
778       if (PREDICT_FALSE (rv))
779         {
780           VDBG (0, "VCL<%d>: application session enable timed out! "
781                 "returning %d (%s)", getpid (), rv, vppcom_retval_str (rv));
782           return rv;
783         }
784     }
785   return VPPCOM_OK;
786 }
787
788 static int
789 vppcom_app_attach (void)
790 {
791   int rv;
792
793   vppcom_app_send_attach ();
794   rv = vcl_wait_for_app_state_change (STATE_APP_ATTACHED);
795   if (PREDICT_FALSE (rv))
796     {
797       VDBG (0, "VCL<%d>: application attach timed out! returning %d (%s)",
798             getpid (), rv, vppcom_retval_str (rv));
799       return rv;
800     }
801
802   return VPPCOM_OK;
803 }
804
805 static int
806 vppcom_session_unbind (u32 session_handle)
807 {
808   vcl_worker_t *wrk = vcl_worker_get_current ();
809   vcl_session_t *session = 0;
810   u64 vpp_handle;
811
812   session = vcl_session_get_w_handle (wrk, session_handle);
813   if (!session)
814     return VPPCOM_EBADFD;
815
816   vpp_handle = session->vpp_handle;
817   vcl_session_table_del_listener (wrk, vpp_handle);
818   session->vpp_handle = ~0;
819   session->session_state = STATE_DISCONNECT;
820
821   VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: sending unbind msg! new state"
822         " 0x%x (%s)", getpid (), vpp_handle, session_handle, STATE_DISCONNECT,
823         vppcom_session_state_str (STATE_DISCONNECT));
824   vcl_evt (VCL_EVT_UNBIND, session);
825   vppcom_send_unbind_sock (vpp_handle);
826
827   return VPPCOM_OK;
828 }
829
830 static int
831 vppcom_session_disconnect (u32 session_handle)
832 {
833   vcl_worker_t *wrk = vcl_worker_get_current ();
834   svm_msg_q_t *vpp_evt_q;
835   vcl_session_t *session;
836   session_state_t state;
837   u64 vpp_handle;
838
839   session = vcl_session_get_w_handle (wrk, session_handle);
840   if (!session)
841     return VPPCOM_EBADFD;
842
843   vpp_handle = session->vpp_handle;
844   state = session->session_state;
845
846   VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u state 0x%x (%s)", getpid (),
847         vpp_handle, session_handle, state, vppcom_session_state_str (state));
848
849   if (PREDICT_FALSE (state & STATE_LISTEN))
850     {
851       clib_warning ("VCL<%d>: ERROR: vpp handle 0x%llx, sid %u: "
852                     "Cannot disconnect a listen socket!",
853                     getpid (), vpp_handle, session_handle);
854       return VPPCOM_EBADFD;
855     }
856
857   if (state & STATE_VPP_CLOSING)
858     {
859       vpp_evt_q = vcl_session_vpp_evt_q (wrk, session);
860       vcl_send_session_disconnected_reply (vpp_evt_q, wrk->my_client_index,
861                                            vpp_handle, 0);
862       VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: sending disconnect "
863             "REPLY...", getpid (), vpp_handle, session_handle);
864     }
865   else
866     {
867       VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: sending disconnect...",
868             getpid (), vpp_handle, session_handle);
869       vppcom_send_disconnect_session (vpp_handle);
870     }
871
872   return VPPCOM_OK;
873 }
874
875 /**
876  * Handle app exit
877  *
878  * Notify vpp of the disconnect and mark the worker as free. If we're the
879  * last worker, do a full cleanup otherwise, since we're probably a forked
880  * child, avoid syscalls as much as possible. We might've lost privileges.
881  */
882 void
883 vppcom_app_exit (void)
884 {
885   if (!pool_elts (vcm->workers))
886     return;
887   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
888   vcl_set_worker_index (~0);
889   vcl_elog_stop (vcm);
890   if (vec_len (vcm->workers) == 1)
891     vl_client_disconnect_from_vlib ();
892   else
893     vl_client_send_disconnect (1 /* vpp should cleanup */ );
894 }
895
896 /*
897  * VPPCOM Public API functions
898  */
899 int
900 vppcom_app_create (char *app_name)
901 {
902   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
903   int rv;
904
905   if (vcm->is_init)
906     {
907       VDBG (1, "already initialized");
908       return VPPCOM_EEXIST;
909     }
910
911   vcm->is_init = 1;
912   vppcom_cfg (&vcm->cfg);
913   vcl_cfg = &vcm->cfg;
914
915   vcm->main_cpu = pthread_self ();
916   vcm->main_pid = getpid ();
917   vcm->app_name = format (0, "%s", app_name);
918   vppcom_init_error_string_table ();
919   svm_fifo_segment_main_init (&vcm->segment_main, vcl_cfg->segment_baseva,
920                               20 /* timeout in secs */ );
921   pool_alloc (vcm->workers, vcl_cfg->max_workers);
922   clib_spinlock_init (&vcm->workers_lock);
923   clib_rwlock_init (&vcm->segment_table_lock);
924   atexit (vppcom_app_exit);
925
926   /* Allocate default worker */
927   vcl_worker_alloc_and_init ();
928
929   /* API hookup and connect to VPP */
930   vppcom_api_hookup ();
931   vcl_elog_init (vcm);
932   vcm->app_state = STATE_APP_START;
933   rv = vppcom_connect_to_vpp (app_name);
934   if (rv)
935     {
936       VERR ("couldn't connect to VPP!");
937       return rv;
938     }
939   VDBG (0, "sending session enable");
940   rv = vppcom_app_session_enable ();
941   if (rv)
942     {
943       VERR ("vppcom_app_session_enable() failed!");
944       return rv;
945     }
946
947   VDBG (0, "sending app attach");
948   rv = vppcom_app_attach ();
949   if (rv)
950     {
951       VERR ("vppcom_app_attach() failed!");
952       return rv;
953     }
954
955   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
956         vcm->workers[0].my_client_index, vcm->workers[0].my_client_index);
957
958   return VPPCOM_OK;
959 }
960
961 void
962 vppcom_app_destroy (void)
963 {
964   int rv;
965   f64 orig_app_timeout;
966
967   if (!pool_elts (vcm->workers))
968     return;
969
970   vcl_evt (VCL_EVT_DETACH, vcm);
971
972   if (pool_elts (vcm->workers) == 1)
973     {
974       vppcom_app_send_detach ();
975       orig_app_timeout = vcm->cfg.app_timeout;
976       vcm->cfg.app_timeout = 2.0;
977       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
978       vcm->cfg.app_timeout = orig_app_timeout;
979       if (PREDICT_FALSE (rv))
980         VDBG (0, "application detach timed out! returning %d (%s)", rv,
981               vppcom_retval_str (rv));
982       vec_free (vcm->app_name);
983       vcl_worker_cleanup (vcl_worker_get_current (), 0 /* notify vpp */ );
984     }
985   else
986     {
987       vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
988     }
989
990   vcl_set_worker_index (~0);
991   vcl_elog_stop (vcm);
992   vl_client_disconnect_from_vlib ();
993 }
994
995 int
996 vppcom_session_create (u8 proto, u8 is_nonblocking)
997 {
998   vcl_worker_t *wrk = vcl_worker_get_current ();
999   vcl_session_t *session;
1000
1001   session = vcl_session_alloc (wrk);
1002
1003   session->session_type = proto;
1004   session->session_state = STATE_START;
1005   session->vpp_handle = ~0;
1006   session->is_dgram = proto == VPPCOM_PROTO_UDP;
1007
1008   if (is_nonblocking)
1009     VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
1010
1011   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1012            is_nonblocking, session_index);
1013
1014   VDBG (0, "created sid %u", session->session_index);
1015
1016   return vcl_session_handle (session);
1017 }
1018
1019 int
1020 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * session,
1021                      vcl_session_handle_t sh, u8 do_disconnect)
1022 {
1023   session_state_t state;
1024   u32 next_sh, vep_sh;
1025   int rv = VPPCOM_OK;
1026   u64 vpp_handle;
1027   u8 is_vep;
1028
1029   is_vep = session->is_vep;
1030   next_sh = session->vep.next_sh;
1031   vep_sh = session->vep.vep_sh;
1032   state = session->session_state;
1033   vpp_handle = session->vpp_handle;
1034
1035   VDBG (1, "session %u [0x%llx] closing", session->session_index, vpp_handle);
1036
1037   if (is_vep)
1038     {
1039       while (next_sh != ~0)
1040         {
1041           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1042           if (PREDICT_FALSE (rv < 0))
1043             VDBG (0, "vpp handle 0x%llx, sid %u: EPOLL_CTL_DEL vep_idx %u"
1044                   " failed! rv %d (%s)", vpp_handle, next_sh, vep_sh, rv,
1045                   vppcom_retval_str (rv));
1046
1047           next_sh = session->vep.next_sh;
1048         }
1049     }
1050   else
1051     {
1052       if (session->is_vep_session)
1053         {
1054           rv = vppcom_epoll_ctl (vep_sh, EPOLL_CTL_DEL, sh, 0);
1055           if (rv < 0)
1056             VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1057                   "failed! rv %d (%s)", session->session_index, vpp_handle,
1058                   vep_sh, rv, vppcom_retval_str (rv));
1059         }
1060
1061       if (!do_disconnect)
1062         {
1063           VDBG (0, "session %u [0x%llx] disconnect skipped",
1064                 session->session_index, vpp_handle);
1065           goto cleanup;
1066         }
1067
1068       if (state & STATE_LISTEN)
1069         {
1070           rv = vppcom_session_unbind (sh);
1071           if (PREDICT_FALSE (rv < 0))
1072             VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1073                   "rv %d (%s)", session->session_index, vpp_handle, rv,
1074                   vppcom_retval_str (rv));
1075         }
1076       else if (state & STATE_OPEN)
1077         {
1078           rv = vppcom_session_disconnect (sh);
1079           if (PREDICT_FALSE (rv < 0))
1080             VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1081                   " rv %d (%s)", session->session_index, vpp_handle,
1082                   rv, vppcom_retval_str (rv));
1083         }
1084       else if (state == STATE_DISCONNECT)
1085         {
1086           svm_msg_q_t *mq = vcl_session_vpp_evt_q (wrk, session);
1087           vcl_send_session_reset_reply (mq, wrk->my_client_index,
1088                                         session->vpp_handle, 0);
1089         }
1090     }
1091
1092   if (vcl_session_is_ct (session))
1093     {
1094       vcl_cut_through_registration_t *ctr;
1095       uword mq_addr;
1096
1097       mq_addr = pointer_to_uword (session->our_evt_q);
1098       ctr = vcl_ct_registration_lock_and_lookup (wrk, mq_addr);
1099       ASSERT (ctr);
1100       if (ctr->epoll_evt_conn_index != ~0)
1101         vcl_mq_epoll_del_evfd (wrk, ctr->epoll_evt_conn_index);
1102       VDBG (0, "Removing ct registration %u",
1103             vcl_ct_registration_index (wrk, ctr));
1104       vcl_ct_registration_del (wrk, ctr);
1105       vcl_ct_registration_lookup_del (wrk, mq_addr);
1106       vcl_ct_registration_unlock (wrk);
1107     }
1108
1109 cleanup:
1110   vcl_session_table_del_vpp_handle (wrk, vpp_handle);
1111   vcl_session_free (wrk, session);
1112
1113   VDBG (0, "session %u [0x%llx] removed", session->session_index, vpp_handle);
1114   vcl_evt (VCL_EVT_CLOSE, session, rv);
1115
1116   return rv;
1117 }
1118
1119 int
1120 vppcom_session_close (uint32_t session_handle)
1121 {
1122   vcl_worker_t *wrk = vcl_worker_get_current ();
1123   vcl_session_t *session;
1124
1125   session = vcl_session_get_w_handle (wrk, session_handle);
1126   if (!session)
1127     return VPPCOM_EBADFD;
1128   return vcl_session_cleanup (wrk, session, session_handle,
1129                               1 /* do_disconnect */ );
1130 }
1131
1132 int
1133 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1134 {
1135   vcl_worker_t *wrk = vcl_worker_get_current ();
1136   vcl_session_t *session = 0;
1137
1138   if (!ep || !ep->ip)
1139     return VPPCOM_EINVAL;
1140
1141   session = vcl_session_get_w_handle (wrk, session_handle);
1142   if (!session)
1143     return VPPCOM_EBADFD;
1144
1145   if (session->is_vep)
1146     {
1147       clib_warning ("VCL<%d>: ERROR: sid %u: cannot "
1148                     "bind to an epoll session!", getpid (), session_handle);
1149       return VPPCOM_EBADFD;
1150     }
1151
1152   session->transport.is_ip4 = ep->is_ip4;
1153   if (ep->is_ip4)
1154     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1155                       sizeof (ip4_address_t));
1156   else
1157     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1158                       sizeof (ip6_address_t));
1159   session->transport.lcl_port = ep->port;
1160
1161   VDBG (0, "VCL<%d>: sid %u: binding to local %s address %U port %u, "
1162         "proto %s", getpid (), session_handle,
1163         session->transport.is_ip4 ? "IPv4" : "IPv6",
1164         format_ip46_address, &session->transport.lcl_ip,
1165         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1166         clib_net_to_host_u16 (session->transport.lcl_port),
1167         vppcom_proto_str (session->session_type));
1168   vcl_evt (VCL_EVT_BIND, session);
1169
1170   if (session->session_type == VPPCOM_PROTO_UDP)
1171     vppcom_session_listen (session_handle, 10);
1172
1173   return VPPCOM_OK;
1174 }
1175
1176 int
1177 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1178 {
1179   vcl_worker_t *wrk = vcl_worker_get_current ();
1180   vcl_session_t *listen_session = 0;
1181   u64 listen_vpp_handle;
1182   int rv;
1183
1184   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1185   if (!listen_session || listen_session->is_vep)
1186     return VPPCOM_EBADFD;
1187
1188   if (q_len == 0 || q_len == ~0)
1189     q_len = vcm->cfg.listen_queue_size;
1190
1191   listen_vpp_handle = listen_session->vpp_handle;
1192   if (listen_session->session_state & STATE_LISTEN)
1193     {
1194       VDBG (0, "session %u [0x%llx]: already in listen state!",
1195             listen_sh, listen_vpp_handle);
1196       return VPPCOM_OK;
1197     }
1198
1199   VDBG (0, "session %u [0x%llx]: sending vpp listen request...",
1200         listen_sh, listen_vpp_handle);
1201
1202   /*
1203    * Send listen request to vpp and wait for reply
1204    */
1205   vppcom_send_bind_sock (listen_session);
1206   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1207                                              STATE_LISTEN,
1208                                              vcm->cfg.session_timeout);
1209
1210   if (PREDICT_FALSE (rv))
1211     {
1212       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1213       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1214             listen_sh, listen_session->vpp_handle, rv,
1215             vppcom_retval_str (rv));
1216       return rv;
1217     }
1218
1219   return VPPCOM_OK;
1220 }
1221
1222 int
1223 vppcom_session_tls_add_cert (uint32_t session_handle, char *cert,
1224                              uint32_t cert_len)
1225 {
1226
1227   vcl_worker_t *wrk = vcl_worker_get_current ();
1228   vcl_session_t *session = 0;
1229
1230   session = vcl_session_get_w_handle (wrk, session_handle);
1231   if (!session)
1232     return VPPCOM_EBADFD;
1233
1234   if (cert_len == 0 || cert_len == ~0)
1235     return VPPCOM_EBADFD;
1236
1237   /*
1238    * Send listen request to vpp and wait for reply
1239    */
1240   vppcom_send_application_tls_cert_add (session, cert, cert_len);
1241
1242   return VPPCOM_OK;
1243
1244 }
1245
1246 int
1247 vppcom_session_tls_add_key (uint32_t session_handle, char *key,
1248                             uint32_t key_len)
1249 {
1250
1251   vcl_worker_t *wrk = vcl_worker_get_current ();
1252   vcl_session_t *session = 0;
1253
1254   session = vcl_session_get_w_handle (wrk, session_handle);
1255   if (!session)
1256     return VPPCOM_EBADFD;
1257
1258   if (key_len == 0 || key_len == ~0)
1259     return VPPCOM_EBADFD;
1260
1261   /*
1262    * Send listen request to vpp and wait for reply
1263    */
1264   vppcom_send_application_tls_key_add (session, key, key_len);
1265
1266   return VPPCOM_OK;
1267
1268
1269 }
1270
1271 static int
1272 validate_args_session_accept_ (vcl_worker_t * wrk,
1273                                vcl_session_t * listen_session)
1274 {
1275   /* Input validation - expects spinlock on sessions_lockp */
1276   if (listen_session->is_vep)
1277     {
1278       clib_warning ("VCL<%d>: ERROR: sid %u: cannot accept on an "
1279                     "epoll session!", getpid (),
1280                     listen_session->session_index);
1281       return VPPCOM_EBADFD;
1282     }
1283
1284   if (listen_session->session_state != STATE_LISTEN)
1285     {
1286       clib_warning ("VCL<%d>: ERROR: vpp handle 0x%llx, sid %u: "
1287                     "not in listen state! state 0x%x (%s)", getpid (),
1288                     listen_session->vpp_handle, listen_session->session_index,
1289                     listen_session->session_state,
1290                     vppcom_session_state_str (listen_session->session_state));
1291       return VPPCOM_EBADFD;
1292     }
1293   return VPPCOM_OK;
1294 }
1295
1296 int
1297 vppcom_session_accept (uint32_t listen_session_handle, vppcom_endpt_t * ep,
1298                        uint32_t flags)
1299 {
1300   u32 client_session_index = ~0, listen_session_index, accept_flags = 0;
1301   vcl_worker_t *wrk = vcl_worker_get_current ();
1302   session_accepted_msg_t accepted_msg;
1303   vcl_session_t *listen_session = 0;
1304   vcl_session_t *client_session = 0;
1305   svm_msg_q_t *vpp_evt_q;
1306   vcl_session_msg_t *evt;
1307   u64 listen_vpp_handle;
1308   svm_msg_q_msg_t msg;
1309   session_event_t *e;
1310   u8 is_nonblocking;
1311   int rv;
1312
1313   listen_session = vcl_session_get_w_handle (wrk, listen_session_handle);
1314   if (!listen_session)
1315     return VPPCOM_EBADFD;
1316
1317   listen_session_index = listen_session->session_index;
1318   if ((rv = validate_args_session_accept_ (wrk, listen_session)))
1319     return rv;
1320
1321   if (clib_fifo_elts (listen_session->accept_evts_fifo))
1322     {
1323       clib_fifo_sub2 (listen_session->accept_evts_fifo, evt);
1324       accept_flags = evt->flags;
1325       accepted_msg = evt->accepted_msg;
1326       goto handle;
1327     }
1328
1329   is_nonblocking = VCL_SESS_ATTR_TEST (listen_session->attr,
1330                                        VCL_SESS_ATTR_NONBLOCK);
1331   if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1332     return VPPCOM_EAGAIN;
1333
1334   while (1)
1335     {
1336       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_WAIT, 0))
1337         return VPPCOM_EAGAIN;
1338
1339       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1340       if (e->event_type != SESSION_CTRL_EVT_ACCEPTED)
1341         {
1342           clib_warning ("discarded event: %u", e->event_type);
1343           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1344           continue;
1345         }
1346       clib_memcpy_fast (&accepted_msg, e->data, sizeof (accepted_msg));
1347       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1348       break;
1349     }
1350
1351 handle:
1352
1353   client_session_index = vcl_session_accepted_handler (wrk, &accepted_msg);
1354   listen_session = vcl_session_get (wrk, listen_session_index);
1355   client_session = vcl_session_get (wrk, client_session_index);
1356
1357   if (flags & O_NONBLOCK)
1358     VCL_SESS_ATTR_SET (client_session->attr, VCL_SESS_ATTR_NONBLOCK);
1359
1360   listen_vpp_handle = listen_session->vpp_handle;
1361   VDBG (1, "vpp handle 0x%llx, sid %u: Got a client request! "
1362         "vpp handle 0x%llx, sid %u, flags %d, is_nonblocking %u",
1363         listen_vpp_handle, listen_session_handle,
1364         client_session->vpp_handle, client_session_index,
1365         flags, VCL_SESS_ATTR_TEST (client_session->attr,
1366                                    VCL_SESS_ATTR_NONBLOCK));
1367
1368   if (ep)
1369     {
1370       ep->is_ip4 = client_session->transport.is_ip4;
1371       ep->port = client_session->transport.rmt_port;
1372       if (client_session->transport.is_ip4)
1373         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1374                           sizeof (ip4_address_t));
1375       else
1376         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1377                           sizeof (ip6_address_t));
1378     }
1379
1380   if (accepted_msg.server_event_queue_address)
1381     vpp_evt_q = uword_to_pointer (accepted_msg.vpp_event_queue_address,
1382                                   svm_msg_q_t *);
1383   else
1384     vpp_evt_q = client_session->vpp_evt_q;
1385
1386   vcl_send_session_accepted_reply (vpp_evt_q, client_session->client_context,
1387                                    client_session->vpp_handle, 0);
1388
1389   VDBG (0, "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1390         "local: %U:%u", listen_session_handle, listen_vpp_handle,
1391         client_session_index, client_session->vpp_handle,
1392         format_ip46_address, &client_session->transport.rmt_ip,
1393         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1394         clib_net_to_host_u16 (client_session->transport.rmt_port),
1395         format_ip46_address, &client_session->transport.lcl_ip,
1396         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1397         clib_net_to_host_u16 (client_session->transport.lcl_port));
1398   vcl_evt (VCL_EVT_ACCEPT, client_session, listen_session,
1399            client_session_index);
1400
1401   /*
1402    * Session might have been closed already
1403    */
1404   if (accept_flags)
1405     {
1406       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1407         client_session->session_state = STATE_VPP_CLOSING;
1408       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1409         client_session->session_state = STATE_DISCONNECT;
1410     }
1411   return vcl_session_handle (client_session);
1412 }
1413
1414 int
1415 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1416 {
1417   vcl_worker_t *wrk = vcl_worker_get_current ();
1418   vcl_session_t *session = 0;
1419   u32 session_index;
1420   int rv;
1421
1422   session = vcl_session_get_w_handle (wrk, session_handle);
1423   if (!session)
1424     return VPPCOM_EBADFD;
1425   session_index = session->session_index;
1426
1427   if (PREDICT_FALSE (session->is_vep))
1428     {
1429       clib_warning ("VCL<%d>: ERROR: sid %u: cannot "
1430                     "connect on an epoll session!", getpid (),
1431                     session_handle);
1432       return VPPCOM_EBADFD;
1433     }
1434
1435   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1436     {
1437       VDBG (0, "session handle %u [0x%llx]: session already "
1438             "connected to %s %U port %d proto %s, state 0x%x (%s)",
1439             session_handle, session->vpp_handle,
1440             session->transport.is_ip4 ? "IPv4" : "IPv6",
1441             format_ip46_address,
1442             &session->transport.rmt_ip, session->transport.is_ip4 ?
1443             IP46_TYPE_IP4 : IP46_TYPE_IP6,
1444             clib_net_to_host_u16 (session->transport.rmt_port),
1445             vppcom_proto_str (session->session_type), session->session_state,
1446             vppcom_session_state_str (session->session_state));
1447       return VPPCOM_OK;
1448     }
1449
1450   session->transport.is_ip4 = server_ep->is_ip4;
1451   if (session->transport.is_ip4)
1452     clib_memcpy_fast (&session->transport.rmt_ip.ip4, server_ep->ip,
1453                       sizeof (ip4_address_t));
1454   else
1455     clib_memcpy_fast (&session->transport.rmt_ip.ip6, server_ep->ip,
1456                       sizeof (ip6_address_t));
1457   session->transport.rmt_port = server_ep->port;
1458
1459   VDBG (0, "session handle %u [0x%llx]: connecting to server %s %U "
1460         "port %d proto %s", session_handle, session->vpp_handle,
1461         session->transport.is_ip4 ? "IPv4" : "IPv6",
1462         format_ip46_address,
1463         &session->transport.rmt_ip, session->transport.is_ip4 ?
1464         IP46_TYPE_IP4 : IP46_TYPE_IP6,
1465         clib_net_to_host_u16 (session->transport.rmt_port),
1466         vppcom_proto_str (session->session_type));
1467
1468   /*
1469    * Send connect request and wait for reply from vpp
1470    */
1471   vppcom_send_connect_sock (session);
1472   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1473                                              vcm->cfg.session_timeout);
1474
1475   session = vcl_session_get (wrk, session_index);
1476
1477   if (PREDICT_FALSE (rv))
1478     {
1479       if (VPPCOM_DEBUG > 0)
1480         {
1481           if (session)
1482             clib_warning ("VCL<%d>: vpp handle 0x%llx, sid %u: connect "
1483                           "failed! returning %d (%s)", getpid (),
1484                           session->vpp_handle, session_handle, rv,
1485                           vppcom_retval_str (rv));
1486           else
1487             clib_warning ("VCL<%d>: no session for sid %u: connect failed! "
1488                           "returning %d (%s)", getpid (),
1489                           session_handle, rv, vppcom_retval_str (rv));
1490         }
1491     }
1492   else
1493     VDBG (0, "VCL<%d>: vpp handle 0x%llx, sid %u: connected!",
1494           getpid (), session->vpp_handle, session_handle);
1495
1496   return rv;
1497 }
1498
1499 static u8
1500 vcl_is_rx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1501 {
1502   if (!is_ct)
1503     return (e->event_type == FIFO_EVENT_APP_RX
1504             && e->fifo->client_session_index == sid);
1505   else
1506     return (e->event_type == SESSION_IO_EVT_CT_TX);
1507 }
1508
1509 static inline u8
1510 vcl_session_is_readable (vcl_session_t * s)
1511 {
1512   return ((s->session_state & STATE_OPEN)
1513           || (s->session_state == STATE_LISTEN
1514               && s->session_type == VPPCOM_PROTO_UDP));
1515 }
1516
1517 static inline int
1518 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
1519                               u8 peek)
1520 {
1521   vcl_worker_t *wrk = vcl_worker_get_current ();
1522   int n_read = 0, rv, is_nonblocking;
1523   vcl_session_t *s = 0;
1524   svm_fifo_t *rx_fifo;
1525   svm_msg_q_msg_t msg;
1526   session_event_t *e;
1527   svm_msg_q_t *mq;
1528   u8 is_ct;
1529
1530   if (PREDICT_FALSE (!buf))
1531     return VPPCOM_EINVAL;
1532
1533   s = vcl_session_get_w_handle (wrk, session_handle);
1534   if (PREDICT_FALSE (!s || s->is_vep))
1535     return VPPCOM_EBADFD;
1536
1537   if (PREDICT_FALSE (!vcl_session_is_readable (s)))
1538     {
1539       session_state_t state = s->session_state;
1540       rv = ((state & STATE_DISCONNECT) ? VPPCOM_ECONNRESET : VPPCOM_ENOTCONN);
1541
1542       VDBG (0, "session handle %u[0x%llx] is not open! state 0x%x (%s),"
1543             " returning %d (%s)", session_handle, s->vpp_handle, state,
1544             vppcom_session_state_str (state), rv, vppcom_retval_str (rv));
1545       return rv;
1546     }
1547
1548   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1549   is_ct = vcl_session_is_ct (s);
1550   mq = is_ct ? s->our_evt_q : wrk->app_event_queue;
1551   rx_fifo = s->rx_fifo;
1552   s->has_rx_evt = 0;
1553
1554   if (svm_fifo_is_empty (rx_fifo))
1555     {
1556       if (is_nonblocking)
1557         {
1558           svm_fifo_unset_event (rx_fifo);
1559           return VPPCOM_EWOULDBLOCK;
1560         }
1561       while (svm_fifo_is_empty (rx_fifo))
1562         {
1563           svm_fifo_unset_event (rx_fifo);
1564           svm_msg_q_lock (mq);
1565           if (svm_msg_q_is_empty (mq))
1566             svm_msg_q_wait (mq);
1567
1568           svm_msg_q_sub_w_lock (mq, &msg);
1569           e = svm_msg_q_msg_data (mq, &msg);
1570           svm_msg_q_unlock (mq);
1571           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1572             vcl_handle_mq_event (wrk, e);
1573           svm_msg_q_free_msg (mq, &msg);
1574
1575           if (PREDICT_FALSE (s->session_state == STATE_DISCONNECT))
1576             return VPPCOM_ECONNRESET;
1577         }
1578     }
1579
1580   if (s->is_dgram)
1581     n_read = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
1582   else
1583     n_read = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
1584
1585   if (svm_fifo_is_empty (rx_fifo))
1586     svm_fifo_unset_event (rx_fifo);
1587
1588   if (is_ct && svm_fifo_needs_tx_ntf (rx_fifo, n_read))
1589     {
1590       svm_fifo_clear_tx_ntf (s->rx_fifo);
1591       app_send_io_evt_to_vpp (s->vpp_evt_q, s->rx_fifo, SESSION_IO_EVT_CT_RX,
1592                               SVM_Q_WAIT);
1593     }
1594
1595   VDBG (2, "vpp handle 0x%llx, sid %u: read %d bytes from (%p)",
1596         s->vpp_handle, session_handle, n_read, rx_fifo);
1597
1598   return n_read;
1599 }
1600
1601 int
1602 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
1603 {
1604   return (vppcom_session_read_internal (session_handle, buf, n, 0));
1605 }
1606
1607 static int
1608 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
1609 {
1610   return (vppcom_session_read_internal (session_handle, buf, n, 1));
1611 }
1612
1613 int
1614 vppcom_session_read_segments (uint32_t session_handle,
1615                               vppcom_data_segments_t ds)
1616 {
1617   vcl_worker_t *wrk = vcl_worker_get_current ();
1618   int n_read = 0, rv, is_nonblocking;
1619   vcl_session_t *s = 0;
1620   svm_fifo_t *rx_fifo;
1621   svm_msg_q_msg_t msg;
1622   session_event_t *e;
1623   svm_msg_q_t *mq;
1624   u8 is_ct;
1625
1626   s = vcl_session_get_w_handle (wrk, session_handle);
1627   if (PREDICT_FALSE (!s || s->is_vep))
1628     return VPPCOM_EBADFD;
1629
1630   if (PREDICT_FALSE (!vcl_session_is_readable (s)))
1631     {
1632       session_state_t state = s->session_state;
1633       rv = ((state & STATE_DISCONNECT) ? VPPCOM_ECONNRESET : VPPCOM_ENOTCONN);
1634       return rv;
1635     }
1636
1637   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1638   is_ct = vcl_session_is_ct (s);
1639   mq = is_ct ? s->our_evt_q : wrk->app_event_queue;
1640   rx_fifo = s->rx_fifo;
1641   s->has_rx_evt = 0;
1642
1643   if (svm_fifo_is_empty (rx_fifo))
1644     {
1645       if (is_nonblocking)
1646         {
1647           svm_fifo_unset_event (rx_fifo);
1648           return VPPCOM_EWOULDBLOCK;
1649         }
1650       while (svm_fifo_is_empty (rx_fifo))
1651         {
1652           svm_fifo_unset_event (rx_fifo);
1653           svm_msg_q_lock (mq);
1654           if (svm_msg_q_is_empty (mq))
1655             svm_msg_q_wait (mq);
1656
1657           svm_msg_q_sub_w_lock (mq, &msg);
1658           e = svm_msg_q_msg_data (mq, &msg);
1659           svm_msg_q_unlock (mq);
1660           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1661             vcl_handle_mq_event (wrk, e);
1662           svm_msg_q_free_msg (mq, &msg);
1663
1664           if (PREDICT_FALSE (s->session_state == STATE_DISCONNECT))
1665             return VPPCOM_ECONNRESET;
1666         }
1667     }
1668
1669   n_read = svm_fifo_segments (rx_fifo, (svm_fifo_segment_t *) ds);
1670   svm_fifo_unset_event (rx_fifo);
1671
1672   if (is_ct && n_read + svm_fifo_max_dequeue (rx_fifo) == rx_fifo->nitems)
1673     {
1674       /* If the peer is not polling send notification */
1675       if (!svm_fifo_has_event (s->rx_fifo))
1676         app_send_io_evt_to_vpp (s->vpp_evt_q, s->rx_fifo,
1677                                 SESSION_IO_EVT_CT_RX, SVM_Q_WAIT);
1678     }
1679
1680   return n_read;
1681 }
1682
1683 void
1684 vppcom_session_free_segments (uint32_t session_handle,
1685                               vppcom_data_segments_t ds)
1686 {
1687   vcl_worker_t *wrk = vcl_worker_get_current ();
1688   vcl_session_t *s;
1689
1690   s = vcl_session_get_w_handle (wrk, session_handle);
1691   if (PREDICT_FALSE (!s || s->is_vep))
1692     return;
1693
1694   svm_fifo_segments_free (s->rx_fifo, (svm_fifo_segment_t *) ds);
1695 }
1696
1697 static inline int
1698 vppcom_session_read_ready (vcl_session_t * session)
1699 {
1700   /* Assumes caller has acquired spinlock: vcm->sessions_lockp */
1701   if (PREDICT_FALSE (session->is_vep))
1702     {
1703       clib_warning ("VCL<%d>: ERROR: sid %u: cannot read from an "
1704                     "epoll session!", getpid (), session->session_index);
1705       return VPPCOM_EBADFD;
1706     }
1707
1708   if (PREDICT_FALSE (!(session->session_state & (STATE_OPEN | STATE_LISTEN))))
1709     {
1710       session_state_t state = session->session_state;
1711       int rv;
1712
1713       rv = ((state & STATE_DISCONNECT) ? VPPCOM_ECONNRESET : VPPCOM_ENOTCONN);
1714
1715       VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: session is not open!"
1716             " state 0x%x (%s), returning %d (%s)", getpid (),
1717             session->vpp_handle, session->session_index, state,
1718             vppcom_session_state_str (state), rv, vppcom_retval_str (rv));
1719       return rv;
1720     }
1721
1722   if (session->session_state & STATE_LISTEN)
1723     return clib_fifo_elts (session->accept_evts_fifo);
1724
1725   return svm_fifo_max_dequeue (session->rx_fifo);
1726 }
1727
1728 int
1729 vppcom_data_segment_copy (void *buf, vppcom_data_segments_t ds, u32 max_bytes)
1730 {
1731   u32 first_copy = clib_min (ds[0].len, max_bytes);
1732   clib_memcpy_fast (buf, ds[0].data, first_copy);
1733   if (first_copy < max_bytes)
1734     {
1735       clib_memcpy_fast (buf + first_copy, ds[1].data,
1736                         clib_min (ds[1].len, max_bytes - first_copy));
1737     }
1738   return 0;
1739 }
1740
1741 static u8
1742 vcl_is_tx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1743 {
1744   if (!is_ct)
1745     return (e->event_type == FIFO_EVENT_APP_TX
1746             && e->fifo->client_session_index == sid);
1747   else
1748     return (e->event_type == SESSION_IO_EVT_CT_RX);
1749 }
1750
1751 static inline int
1752 vppcom_session_write_inline (uint32_t session_handle, void *buf, size_t n,
1753                              u8 is_flush)
1754 {
1755   vcl_worker_t *wrk = vcl_worker_get_current ();
1756   int rv, n_write, is_nonblocking;
1757   vcl_session_t *s = 0;
1758   svm_fifo_t *tx_fifo = 0;
1759   session_evt_type_t et;
1760   svm_msg_q_msg_t msg;
1761   session_event_t *e;
1762   svm_msg_q_t *mq;
1763   u8 is_ct;
1764
1765   if (PREDICT_FALSE (!buf))
1766     return VPPCOM_EINVAL;
1767
1768   s = vcl_session_get_w_handle (wrk, session_handle);
1769   if (PREDICT_FALSE (!s))
1770     return VPPCOM_EBADFD;
1771
1772   if (PREDICT_FALSE (s->is_vep))
1773     {
1774       clib_warning ("VCL<%d>: ERROR: vpp handle 0x%llx, sid %u: "
1775                     "cannot write to an epoll session!",
1776                     getpid (), s->vpp_handle, session_handle);
1777
1778       return VPPCOM_EBADFD;
1779     }
1780
1781   if (PREDICT_FALSE (!(s->session_state & STATE_OPEN)))
1782     {
1783       session_state_t state = s->session_state;
1784       rv = ((state & STATE_DISCONNECT) ? VPPCOM_ECONNRESET : VPPCOM_ENOTCONN);
1785       VDBG (1, "VCL<%d>: vpp handle 0x%llx, sid %u: session is not open! "
1786             "state 0x%x (%s)", getpid (), s->vpp_handle, session_handle,
1787             state, vppcom_session_state_str (state));
1788       return rv;
1789     }
1790
1791   tx_fifo = s->tx_fifo;
1792   is_ct = vcl_session_is_ct (s);
1793   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1794   mq = is_ct ? s->our_evt_q : wrk->app_event_queue;
1795   if (svm_fifo_is_full (tx_fifo))
1796     {
1797       if (is_nonblocking)
1798         {
1799           return VPPCOM_EWOULDBLOCK;
1800         }
1801       while (svm_fifo_is_full (tx_fifo))
1802         {
1803           svm_fifo_add_want_tx_ntf (tx_fifo, SVM_FIFO_WANT_TX_NOTIF);
1804           svm_msg_q_lock (mq);
1805           if (svm_msg_q_is_empty (mq))
1806             svm_msg_q_wait (mq);
1807
1808           svm_msg_q_sub_w_lock (mq, &msg);
1809           e = svm_msg_q_msg_data (mq, &msg);
1810           svm_msg_q_unlock (mq);
1811
1812           if (!vcl_is_tx_evt_for_session (e, s->session_index, is_ct))
1813             vcl_handle_mq_event (wrk, e);
1814           svm_msg_q_free_msg (mq, &msg);
1815
1816           if (PREDICT_FALSE (!(s->session_state & STATE_OPEN)))
1817             return VPPCOM_ECONNRESET;
1818         }
1819     }
1820
1821   ASSERT (FIFO_EVENT_APP_TX + 1 == SESSION_IO_EVT_CT_TX);
1822   et = FIFO_EVENT_APP_TX + vcl_session_is_ct (s);
1823   if (is_flush && !vcl_session_is_ct (s))
1824     et = SESSION_IO_EVT_TX_FLUSH;
1825
1826   if (s->is_dgram)
1827     n_write = app_send_dgram_raw (tx_fifo, &s->transport,
1828                                   s->vpp_evt_q, buf, n, et, SVM_Q_WAIT);
1829   else
1830     n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
1831                                    SVM_Q_WAIT);
1832
1833   ASSERT (n_write > 0);
1834
1835   VDBG (2, "VCL<%d>: vpp handle 0x%llx, sid %u: wrote %d bytes", getpid (),
1836         s->vpp_handle, session_handle, n_write);
1837
1838   return n_write;
1839 }
1840
1841 int
1842 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
1843 {
1844   return vppcom_session_write_inline (session_handle, buf, n,
1845                                       0 /* is_flush */ );
1846 }
1847
1848 int
1849 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
1850 {
1851   return vppcom_session_write_inline (session_handle, buf, n,
1852                                       1 /* is_flush */ );
1853 }
1854
1855
1856 static vcl_session_t *
1857 vcl_ct_session_get_from_fifo (vcl_worker_t * wrk, svm_fifo_t * f, u8 type)
1858 {
1859   vcl_session_t *s;
1860   s = vcl_session_get (wrk, f->client_session_index);
1861   if (s)
1862     {
1863       /* rx fifo */
1864       if (type == 0 && s->rx_fifo == f)
1865         return s;
1866       /* tx fifo */
1867       if (type == 1 && s->tx_fifo == f)
1868         return s;
1869     }
1870   s = vcl_session_get (wrk, f->master_session_index);
1871   if (s)
1872     {
1873       if (type == 0 && s->rx_fifo == f)
1874         return s;
1875       if (type == 1 && s->tx_fifo == f)
1876         return s;
1877     }
1878   return 0;
1879 }
1880
1881 static inline int
1882 vppcom_session_write_ready (vcl_session_t * session)
1883 {
1884   /* Assumes caller has acquired spinlock: vcm->sessions_lockp */
1885   if (PREDICT_FALSE (session->is_vep))
1886     {
1887       VDBG (0, "session %u [0x%llx]: cannot write to an epoll session!",
1888             session->session_index, session->vpp_handle);
1889       return VPPCOM_EBADFD;
1890     }
1891
1892   if (PREDICT_FALSE (session->session_state & STATE_LISTEN))
1893     {
1894       if (session->tx_fifo)
1895         return svm_fifo_max_enqueue (session->tx_fifo);
1896       else
1897         return VPPCOM_EBADFD;
1898     }
1899
1900   if (PREDICT_FALSE (!(session->session_state & STATE_OPEN)))
1901     {
1902       session_state_t state = session->session_state;
1903       int rv;
1904
1905       rv = ((state & STATE_DISCONNECT) ? VPPCOM_ECONNRESET : VPPCOM_ENOTCONN);
1906       VDBG (0, "session %u [0x%llx]: session is not open! state 0x%x (%s), "
1907             "returning %d (%s)", session->session_index, session->vpp_handle,
1908             state, vppcom_session_state_str (state), rv,
1909             vppcom_retval_str (rv));
1910       return rv;
1911     }
1912
1913   return svm_fifo_max_enqueue (session->tx_fifo);
1914 }
1915
1916 #define vcl_fifo_rx_evt_valid_or_break(_fifo)                   \
1917 if (PREDICT_FALSE (svm_fifo_is_empty (_fifo)))                  \
1918   {                                                             \
1919     svm_fifo_unset_event (_fifo);                               \
1920     if (svm_fifo_is_empty (_fifo))                              \
1921       break;                                                    \
1922   }                                                             \
1923
1924 static void
1925 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
1926                             unsigned long n_bits, unsigned long *read_map,
1927                             unsigned long *write_map,
1928                             unsigned long *except_map, u32 * bits_set)
1929 {
1930   session_disconnected_msg_t *disconnected_msg;
1931   session_connected_msg_t *connected_msg;
1932   vcl_session_t *session;
1933   u32 sid;
1934
1935   switch (e->event_type)
1936     {
1937     case FIFO_EVENT_APP_RX:
1938       vcl_fifo_rx_evt_valid_or_break (e->fifo);
1939       sid = e->fifo->client_session_index;
1940       session = vcl_session_get (wrk, sid);
1941       if (!session)
1942         break;
1943       if (sid < n_bits && read_map)
1944         {
1945           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
1946           *bits_set += 1;
1947         }
1948       break;
1949     case FIFO_EVENT_APP_TX:
1950       sid = e->fifo->client_session_index;
1951       session = vcl_session_get (wrk, sid);
1952       if (!session)
1953         break;
1954       if (sid < n_bits && write_map)
1955         {
1956           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
1957           *bits_set += 1;
1958         }
1959       break;
1960     case SESSION_IO_EVT_CT_TX:
1961       vcl_fifo_rx_evt_valid_or_break (e->fifo);
1962       session = vcl_ct_session_get_from_fifo (wrk, e->fifo, 0);
1963       if (!session)
1964         break;
1965       sid = session->session_index;
1966       if (sid < n_bits && read_map)
1967         {
1968           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
1969           *bits_set += 1;
1970         }
1971       break;
1972     case SESSION_IO_EVT_CT_RX:
1973       session = vcl_ct_session_get_from_fifo (wrk, e->fifo, 1);
1974       if (!session)
1975         break;
1976       sid = session->session_index;
1977       if (sid < n_bits && write_map)
1978         {
1979           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
1980           *bits_set += 1;
1981         }
1982       break;
1983     case SESSION_CTRL_EVT_ACCEPTED:
1984       session = vcl_session_accepted (wrk,
1985                                       (session_accepted_msg_t *) e->data);
1986       if (!session)
1987         break;
1988       sid = session->session_index;
1989       if (sid < n_bits && read_map)
1990         {
1991           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
1992           *bits_set += 1;
1993         }
1994       break;
1995     case SESSION_CTRL_EVT_CONNECTED:
1996       connected_msg = (session_connected_msg_t *) e->data;
1997       vcl_session_connected_handler (wrk, connected_msg);
1998       break;
1999     case SESSION_CTRL_EVT_DISCONNECTED:
2000       disconnected_msg = (session_disconnected_msg_t *) e->data;
2001       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2002       if (!session)
2003         break;
2004       sid = session->session_index;
2005       if (sid < n_bits && except_map)
2006         {
2007           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2008           *bits_set += 1;
2009         }
2010       break;
2011     case SESSION_CTRL_EVT_RESET:
2012       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2013       if (sid < n_bits && except_map)
2014         {
2015           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2016           *bits_set += 1;
2017         }
2018       break;
2019     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2020       vcl_session_worker_update_reply_handler (wrk, e->data);
2021       break;
2022     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2023       vcl_session_req_worker_update_handler (wrk, e->data);
2024       break;
2025     default:
2026       clib_warning ("unhandled: %u", e->event_type);
2027       break;
2028     }
2029 }
2030
2031 static int
2032 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2033                       unsigned long n_bits, unsigned long *read_map,
2034                       unsigned long *write_map, unsigned long *except_map,
2035                       double time_to_wait, u32 * bits_set)
2036 {
2037   svm_msg_q_msg_t *msg;
2038   session_event_t *e;
2039   u32 i;
2040
2041   svm_msg_q_lock (mq);
2042   if (svm_msg_q_is_empty (mq))
2043     {
2044       if (*bits_set)
2045         {
2046           svm_msg_q_unlock (mq);
2047           return 0;
2048         }
2049
2050       if (!time_to_wait)
2051         {
2052           svm_msg_q_unlock (mq);
2053           return 0;
2054         }
2055       else if (time_to_wait < 0)
2056         {
2057           svm_msg_q_wait (mq);
2058         }
2059       else
2060         {
2061           if (svm_msg_q_timedwait (mq, time_to_wait))
2062             {
2063               svm_msg_q_unlock (mq);
2064               return 0;
2065             }
2066         }
2067     }
2068   vcl_mq_dequeue_batch (wrk, mq);
2069   svm_msg_q_unlock (mq);
2070
2071   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2072     {
2073       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2074       e = svm_msg_q_msg_data (mq, msg);
2075       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2076                                   except_map, bits_set);
2077       svm_msg_q_free_msg (mq, msg);
2078     }
2079   vec_reset_length (wrk->mq_msg_vector);
2080   vcl_handle_pending_wrk_updates (wrk);
2081   return *bits_set;
2082 }
2083
2084 static int
2085 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2086                        vcl_si_set * read_map, vcl_si_set * write_map,
2087                        vcl_si_set * except_map, double time_to_wait,
2088                        u32 * bits_set)
2089 {
2090   double total_wait = 0, wait_slice;
2091   vcl_cut_through_registration_t *cr;
2092
2093   time_to_wait = (time_to_wait == -1) ? 1e6 : time_to_wait;
2094   wait_slice = wrk->cut_through_registrations ? 10e-6 : time_to_wait;
2095   do
2096     {
2097       vcl_ct_registration_lock (wrk);
2098       /* *INDENT-OFF* */
2099       pool_foreach (cr, wrk->cut_through_registrations, ({
2100         vcl_select_handle_mq (wrk, cr->mq, n_bits, read_map, write_map, except_map,
2101                               0, bits_set);
2102       }));
2103       /* *INDENT-ON* */
2104       vcl_ct_registration_unlock (wrk);
2105
2106       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2107                             write_map, except_map, wait_slice, bits_set);
2108       total_wait += wait_slice;
2109       if (*bits_set)
2110         return *bits_set;
2111     }
2112   while (total_wait < time_to_wait);
2113
2114   return 0;
2115 }
2116
2117 static int
2118 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2119                        vcl_si_set * read_map, vcl_si_set * write_map,
2120                        vcl_si_set * except_map, double time_to_wait,
2121                        u32 * bits_set)
2122 {
2123   vcl_mq_evt_conn_t *mqc;
2124   int __clib_unused n_read;
2125   int n_mq_evts, i;
2126   u64 buf;
2127
2128   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2129   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2130                           vec_len (wrk->mq_events), time_to_wait);
2131   for (i = 0; i < n_mq_evts; i++)
2132     {
2133       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2134       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2135       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2136                             except_map, 0, bits_set);
2137     }
2138
2139   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2140 }
2141
2142 int
2143 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2144                vcl_si_set * except_map, double time_to_wait)
2145 {
2146   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2147   vcl_worker_t *wrk = vcl_worker_get_current ();
2148   vcl_session_t *session = 0;
2149   int rv, i;
2150
2151   if (n_bits && read_map)
2152     {
2153       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2154       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2155                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2156       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2157     }
2158   if (n_bits && write_map)
2159     {
2160       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2161       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2162                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2163       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2164     }
2165   if (n_bits && except_map)
2166     {
2167       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2168       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2169                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2170       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2171     }
2172
2173   if (!n_bits)
2174     return 0;
2175
2176   if (!write_map)
2177     goto check_rd;
2178
2179   /* *INDENT-OFF* */
2180   clib_bitmap_foreach (sid, wrk->wr_bitmap, ({
2181     if (!(session = vcl_session_get (wrk, sid)))
2182       {
2183         if (except_map && sid < minbits)
2184           clib_bitmap_set_no_check (except_map, sid, 1);
2185         continue;
2186       }
2187
2188     rv = svm_fifo_is_full (session->tx_fifo);
2189     if (!rv)
2190       {
2191         clib_bitmap_set_no_check ((uword*)write_map, sid, 1);
2192         bits_set++;
2193       }
2194     else
2195       svm_fifo_add_want_tx_ntf (session->tx_fifo, SVM_FIFO_WANT_TX_NOTIF);
2196   }));
2197
2198 check_rd:
2199   if (!read_map)
2200     goto check_mq;
2201
2202   clib_bitmap_foreach (sid, wrk->rd_bitmap, ({
2203     if (!(session = vcl_session_get (wrk, sid)))
2204       {
2205         if (except_map && sid < minbits)
2206           clib_bitmap_set_no_check (except_map, sid, 1);
2207         continue;
2208       }
2209
2210     rv = vppcom_session_read_ready (session);
2211     if (rv)
2212       {
2213         clib_bitmap_set_no_check ((uword*)read_map, sid, 1);
2214         bits_set++;
2215       }
2216   }));
2217   /* *INDENT-ON* */
2218
2219 check_mq:
2220
2221   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2222     {
2223       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2224                                   read_map, write_map, except_map, &bits_set);
2225     }
2226   vec_reset_length (wrk->unhandled_evts_vector);
2227
2228   if (vcm->cfg.use_mq_eventfd)
2229     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2230                            time_to_wait, &bits_set);
2231   else
2232     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2233                            time_to_wait, &bits_set);
2234
2235   return (bits_set);
2236 }
2237
2238 static inline void
2239 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_idx)
2240 {
2241   vcl_session_t *session;
2242   vppcom_epoll_t *vep;
2243   u32 sid = vep_idx;
2244
2245   if (VPPCOM_DEBUG <= 1)
2246     return;
2247
2248   /* Assumes caller has acquired spinlock: vcm->sessions_lockp */
2249   session = vcl_session_get (wrk, vep_idx);
2250   if (PREDICT_FALSE (!session))
2251     {
2252       clib_warning ("VCL<%d>: ERROR: Invalid vep_idx (%u)!",
2253                     getpid (), vep_idx);
2254       goto done;
2255     }
2256   if (PREDICT_FALSE (!session->is_vep))
2257     {
2258       clib_warning ("VCL<%d>: ERROR: vep_idx (%u) is not a vep!",
2259                     getpid (), vep_idx);
2260       goto done;
2261     }
2262   vep = &session->vep;
2263   clib_warning ("VCL<%d>: vep_idx (%u): Dumping epoll chain\n"
2264                 "{\n"
2265                 "   is_vep         = %u\n"
2266                 "   is_vep_session = %u\n"
2267                 "   next_sid       = 0x%x (%u)\n"
2268                 "   wait_cont_idx  = 0x%x (%u)\n"
2269                 "}\n", getpid (), vep_idx,
2270                 session->is_vep, session->is_vep_session,
2271                 vep->next_sh, vep->next_sh,
2272                 session->wait_cont_idx, session->wait_cont_idx);
2273
2274   for (sid = vep->next_sh; sid != ~0; sid = vep->next_sh)
2275     {
2276       session = vcl_session_get (wrk, sid);
2277       if (PREDICT_FALSE (!session))
2278         {
2279           clib_warning ("VCL<%d>: ERROR: Invalid sid (%u)!", getpid (), sid);
2280           goto done;
2281         }
2282       if (PREDICT_FALSE (session->is_vep))
2283         clib_warning ("VCL<%d>: ERROR: sid (%u) is a vep!",
2284                       getpid (), vep_idx);
2285       else if (PREDICT_FALSE (!session->is_vep_session))
2286         {
2287           clib_warning ("VCL<%d>: ERROR: session (%u) "
2288                         "is not a vep session!", getpid (), sid);
2289           goto done;
2290         }
2291       vep = &session->vep;
2292       if (PREDICT_FALSE (vep->vep_sh != vep_idx))
2293         clib_warning ("VCL<%d>: ERROR: session (%u) vep_idx (%u) != "
2294                       "vep_idx (%u)!", getpid (),
2295                       sid, session->vep.vep_sh, vep_idx);
2296       if (session->is_vep_session)
2297         {
2298           clib_warning ("vep_idx[%u]: sid 0x%x (%u)\n"
2299                         "{\n"
2300                         "   next_sid       = 0x%x (%u)\n"
2301                         "   prev_sid       = 0x%x (%u)\n"
2302                         "   vep_idx        = 0x%x (%u)\n"
2303                         "   ev.events      = 0x%x\n"
2304                         "   ev.data.u64    = 0x%llx\n"
2305                         "   et_mask        = 0x%x\n"
2306                         "}\n",
2307                         vep_idx, sid, sid,
2308                         vep->next_sh, vep->next_sh,
2309                         vep->prev_sh, vep->prev_sh,
2310                         vep->vep_sh, vep->vep_sh,
2311                         vep->ev.events, vep->ev.data.u64, vep->et_mask);
2312         }
2313     }
2314
2315 done:
2316   clib_warning ("VCL<%d>: vep_idx (%u): Dump complete!\n",
2317                 getpid (), vep_idx);
2318 }
2319
2320 int
2321 vppcom_epoll_create (void)
2322 {
2323   vcl_worker_t *wrk = vcl_worker_get_current ();
2324   vcl_session_t *vep_session;
2325
2326   vep_session = vcl_session_alloc (wrk);
2327
2328   vep_session->is_vep = 1;
2329   vep_session->vep.vep_sh = ~0;
2330   vep_session->vep.next_sh = ~0;
2331   vep_session->vep.prev_sh = ~0;
2332   vep_session->wait_cont_idx = ~0;
2333   vep_session->vpp_handle = ~0;
2334
2335   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2336   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2337
2338   return vcl_session_handle (vep_session);
2339 }
2340
2341 int
2342 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2343                   struct epoll_event *event)
2344 {
2345   vcl_worker_t *wrk = vcl_worker_get_current ();
2346   vcl_session_t *vep_session;
2347   vcl_session_t *session;
2348   int rv = VPPCOM_OK;
2349
2350   if (vep_handle == session_handle)
2351     {
2352       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2353       return VPPCOM_EINVAL;
2354     }
2355
2356   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2357   if (PREDICT_FALSE (!vep_session))
2358     {
2359       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2360       return VPPCOM_EBADFD;
2361     }
2362   if (PREDICT_FALSE (!vep_session->is_vep))
2363     {
2364       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2365       return VPPCOM_EINVAL;
2366     }
2367
2368   ASSERT (vep_session->vep.vep_sh == ~0);
2369   ASSERT (vep_session->vep.prev_sh == ~0);
2370
2371   session = vcl_session_get_w_handle (wrk, session_handle);
2372   if (PREDICT_FALSE (!session))
2373     {
2374       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2375       return VPPCOM_EBADFD;
2376     }
2377   if (PREDICT_FALSE (session->is_vep))
2378     {
2379       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2380       return VPPCOM_EINVAL;
2381     }
2382
2383   switch (op)
2384     {
2385     case EPOLL_CTL_ADD:
2386       if (PREDICT_FALSE (!event))
2387         {
2388           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2389           return VPPCOM_EINVAL;
2390         }
2391       if (vep_session->vep.next_sh != ~0)
2392         {
2393           vcl_session_t *next_session;
2394           next_session = vcl_session_get_w_handle (wrk,
2395                                                    vep_session->vep.next_sh);
2396           if (PREDICT_FALSE (!next_session))
2397             {
2398               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sid (%u) on "
2399                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2400               return VPPCOM_EBADFD;
2401             }
2402           ASSERT (next_session->vep.prev_sh == vep_handle);
2403           next_session->vep.prev_sh = session_handle;
2404         }
2405       session->vep.next_sh = vep_session->vep.next_sh;
2406       session->vep.prev_sh = vep_handle;
2407       session->vep.vep_sh = vep_handle;
2408       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2409       session->vep.ev = *event;
2410       session->is_vep = 0;
2411       session->is_vep_session = 1;
2412       vep_session->vep.next_sh = session_handle;
2413
2414       if (session->tx_fifo)
2415         svm_fifo_add_want_tx_ntf (session->tx_fifo,
2416                                   SVM_FIFO_WANT_TX_NOTIF_IF_FULL);
2417
2418       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2419             vep_handle, session_handle, event->events, event->data.u64);
2420       vcl_evt (VCL_EVT_EPOLL_CTLADD, session, event->events, event->data.u64);
2421       break;
2422
2423     case EPOLL_CTL_MOD:
2424       if (PREDICT_FALSE (!event))
2425         {
2426           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2427           rv = VPPCOM_EINVAL;
2428           goto done;
2429         }
2430       else if (PREDICT_FALSE (!session->is_vep_session))
2431         {
2432           VDBG (0, "sid %u EPOLL_CTL_MOD: not a vep session!",
2433                 session_handle);
2434           rv = VPPCOM_EINVAL;
2435           goto done;
2436         }
2437       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2438         {
2439           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2440                 session_handle, session->vep.vep_sh, vep_handle);
2441           rv = VPPCOM_EINVAL;
2442           goto done;
2443         }
2444       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2445       session->vep.ev = *event;
2446       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2447             vep_handle, session_handle, event->events, event->data.u64);
2448       break;
2449
2450     case EPOLL_CTL_DEL:
2451       if (PREDICT_FALSE (!session->is_vep_session))
2452         {
2453           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
2454           rv = VPPCOM_EINVAL;
2455           goto done;
2456         }
2457       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2458         {
2459           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
2460                 session_handle, session->vep.vep_sh, vep_handle);
2461           rv = VPPCOM_EINVAL;
2462           goto done;
2463         }
2464
2465       vep_session->wait_cont_idx =
2466         (vep_session->wait_cont_idx == session_handle) ?
2467         session->vep.next_sh : vep_session->wait_cont_idx;
2468
2469       if (session->vep.prev_sh == vep_handle)
2470         vep_session->vep.next_sh = session->vep.next_sh;
2471       else
2472         {
2473           vcl_session_t *prev_session;
2474           prev_session = vcl_session_get_w_handle (wrk, session->vep.prev_sh);
2475           if (PREDICT_FALSE (!prev_session))
2476             {
2477               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sid (%u) on sid (%u)!",
2478                     session->vep.prev_sh, session_handle);
2479               return VPPCOM_EBADFD;
2480             }
2481           ASSERT (prev_session->vep.next_sh == session_handle);
2482           prev_session->vep.next_sh = session->vep.next_sh;
2483         }
2484       if (session->vep.next_sh != ~0)
2485         {
2486           vcl_session_t *next_session;
2487           next_session = vcl_session_get_w_handle (wrk, session->vep.next_sh);
2488           if (PREDICT_FALSE (!next_session))
2489             {
2490               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sid (%u) on sid (%u)!",
2491                     session->vep.next_sh, session_handle);
2492               return VPPCOM_EBADFD;
2493             }
2494           ASSERT (next_session->vep.prev_sh == session_handle);
2495           next_session->vep.prev_sh = session->vep.prev_sh;
2496         }
2497
2498       memset (&session->vep, 0, sizeof (session->vep));
2499       session->vep.next_sh = ~0;
2500       session->vep.prev_sh = ~0;
2501       session->vep.vep_sh = ~0;
2502       session->is_vep_session = 0;
2503
2504       if (session->tx_fifo)
2505         svm_fifo_del_want_tx_ntf (session->tx_fifo, SVM_FIFO_NO_TX_NOTIF);
2506
2507       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sid %u!", vep_handle,
2508             session_handle);
2509       vcl_evt (VCL_EVT_EPOLL_CTLDEL, session, vep_sh);
2510       break;
2511
2512     default:
2513       VDBG (0, "Invalid operation (%d)!", op);
2514       rv = VPPCOM_EINVAL;
2515     }
2516
2517   vep_verify_epoll_chain (wrk, vep_handle);
2518
2519 done:
2520   return rv;
2521 }
2522
2523 static inline void
2524 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2525                                 struct epoll_event *events, u32 * num_ev)
2526 {
2527   session_disconnected_msg_t *disconnected_msg;
2528   session_connected_msg_t *connected_msg;
2529   u32 sid = ~0, session_events;
2530   u64 session_evt_data = ~0;
2531   vcl_session_t *session;
2532   u8 add_event = 0;
2533
2534   switch (e->event_type)
2535     {
2536     case FIFO_EVENT_APP_RX:
2537       ASSERT (e->fifo->client_thread_index == vcl_get_worker_index ());
2538       vcl_fifo_rx_evt_valid_or_break (e->fifo);
2539       sid = e->fifo->client_session_index;
2540       if (!(session = vcl_session_get (wrk, sid)))
2541         break;
2542       session_events = session->vep.ev.events;
2543       if (!(EPOLLIN & session->vep.ev.events) || session->has_rx_evt)
2544         break;
2545       add_event = 1;
2546       events[*num_ev].events |= EPOLLIN;
2547       session_evt_data = session->vep.ev.data.u64;
2548       session->has_rx_evt = 1;
2549       break;
2550     case FIFO_EVENT_APP_TX:
2551       sid = e->fifo->client_session_index;
2552       if (!(session = vcl_session_get (wrk, sid)))
2553         break;
2554       session_events = session->vep.ev.events;
2555       if (!(EPOLLOUT & session_events))
2556         break;
2557       add_event = 1;
2558       events[*num_ev].events |= EPOLLOUT;
2559       session_evt_data = session->vep.ev.data.u64;
2560       svm_fifo_reset_tx_ntf (session->tx_fifo);
2561       break;
2562     case SESSION_IO_EVT_CT_TX:
2563       vcl_fifo_rx_evt_valid_or_break (e->fifo);
2564       session = vcl_ct_session_get_from_fifo (wrk, e->fifo, 0);
2565       if (PREDICT_FALSE (!session))
2566         break;
2567       sid = session->session_index;
2568       session_events = session->vep.ev.events;
2569       if (!(EPOLLIN & session->vep.ev.events) || session->has_rx_evt)
2570         break;
2571       add_event = 1;
2572       events[*num_ev].events |= EPOLLIN;
2573       session_evt_data = session->vep.ev.data.u64;
2574       session->has_rx_evt = 1;
2575       break;
2576     case SESSION_IO_EVT_CT_RX:
2577       session = vcl_ct_session_get_from_fifo (wrk, e->fifo, 1);
2578       if (PREDICT_FALSE (!session))
2579         break;
2580       sid = session->session_index;
2581       session_events = session->vep.ev.events;
2582       if (!(EPOLLOUT & session_events))
2583         break;
2584       add_event = 1;
2585       events[*num_ev].events |= EPOLLOUT;
2586       session_evt_data = session->vep.ev.data.u64;
2587       svm_fifo_reset_tx_ntf (session->tx_fifo);
2588       break;
2589     case SESSION_CTRL_EVT_ACCEPTED:
2590       session = vcl_session_accepted (wrk,
2591                                       (session_accepted_msg_t *) e->data);
2592       if (!session)
2593         break;
2594
2595       session_events = session->vep.ev.events;
2596       if (!(EPOLLIN & session_events))
2597         break;
2598
2599       add_event = 1;
2600       events[*num_ev].events |= EPOLLIN;
2601       session_evt_data = session->vep.ev.data.u64;
2602       break;
2603     case SESSION_CTRL_EVT_CONNECTED:
2604       connected_msg = (session_connected_msg_t *) e->data;
2605       vcl_session_connected_handler (wrk, connected_msg);
2606       /* Generate EPOLLOUT because there's no connected event */
2607       sid = vcl_session_index_from_vpp_handle (wrk, connected_msg->handle);
2608       if (!(session = vcl_session_get (wrk, sid)))
2609         break;
2610       session_events = session->vep.ev.events;
2611       if (!(EPOLLOUT & session_events))
2612         break;
2613       add_event = 1;
2614       events[*num_ev].events |= EPOLLOUT;
2615       session_evt_data = session->vep.ev.data.u64;
2616       break;
2617     case SESSION_CTRL_EVT_DISCONNECTED:
2618       disconnected_msg = (session_disconnected_msg_t *) e->data;
2619       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2620       if (!session)
2621         break;
2622       session_events = session->vep.ev.events;
2623       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2624         break;
2625       add_event = 1;
2626       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2627       session_evt_data = session->vep.ev.data.u64;
2628       break;
2629     case SESSION_CTRL_EVT_RESET:
2630       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2631       if (!(session = vcl_session_get (wrk, sid)))
2632         break;
2633       session_events = session->vep.ev.events;
2634       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2635         break;
2636       add_event = 1;
2637       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2638       session_evt_data = session->vep.ev.data.u64;
2639       break;
2640     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2641       vcl_session_req_worker_update_handler (wrk, e->data);
2642       break;
2643     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2644       vcl_session_worker_update_reply_handler (wrk, e->data);
2645       break;
2646     default:
2647       VDBG (0, "unhandled: %u", e->event_type);
2648       break;
2649     }
2650
2651   if (add_event)
2652     {
2653       events[*num_ev].data.u64 = session_evt_data;
2654       if (EPOLLONESHOT & session_events)
2655         {
2656           session = vcl_session_get (wrk, sid);
2657           session->vep.ev.events = 0;
2658         }
2659       *num_ev += 1;
2660     }
2661 }
2662
2663 static int
2664 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2665                           struct epoll_event *events, u32 maxevents,
2666                           double wait_for_time, u32 * num_ev)
2667 {
2668   svm_msg_q_msg_t *msg;
2669   session_event_t *e;
2670   int i;
2671
2672   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
2673     goto handle_dequeued;
2674
2675   svm_msg_q_lock (mq);
2676   if (svm_msg_q_is_empty (mq))
2677     {
2678       if (!wait_for_time)
2679         {
2680           svm_msg_q_unlock (mq);
2681           return 0;
2682         }
2683       else if (wait_for_time < 0)
2684         {
2685           svm_msg_q_wait (mq);
2686         }
2687       else
2688         {
2689           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
2690             {
2691               svm_msg_q_unlock (mq);
2692               return 0;
2693             }
2694         }
2695     }
2696   vcl_mq_dequeue_batch (wrk, mq);
2697   svm_msg_q_unlock (mq);
2698
2699 handle_dequeued:
2700   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2701     {
2702       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2703       e = svm_msg_q_msg_data (mq, msg);
2704       if (*num_ev < maxevents)
2705         vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
2706       else
2707         vec_add1 (wrk->unhandled_evts_vector, *e);
2708       svm_msg_q_free_msg (mq, msg);
2709     }
2710   vec_reset_length (wrk->mq_msg_vector);
2711   vcl_handle_pending_wrk_updates (wrk);
2712   return *num_ev;
2713 }
2714
2715 static int
2716 vppcom_epoll_wait_condvar (vcl_worker_t * wrk, struct epoll_event *events,
2717                            int maxevents, u32 n_evts, double wait_for_time)
2718 {
2719   vcl_cut_through_registration_t *cr;
2720   double total_wait = 0, wait_slice;
2721   int rv;
2722
2723   wait_for_time = (wait_for_time == -1) ? (double) 1e6 : wait_for_time;
2724   wait_slice = wrk->cut_through_registrations ? 10e-6 : wait_for_time;
2725
2726   do
2727     {
2728       vcl_ct_registration_lock (wrk);
2729       /* *INDENT-OFF* */
2730       pool_foreach (cr, wrk->cut_through_registrations, ({
2731         vcl_epoll_wait_handle_mq (wrk, cr->mq, events, maxevents, 0, &n_evts);
2732       }));
2733       /* *INDENT-ON* */
2734       vcl_ct_registration_unlock (wrk);
2735
2736       rv = vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events,
2737                                      maxevents, n_evts ? 0 : wait_slice,
2738                                      &n_evts);
2739       if (rv)
2740         total_wait += wait_slice;
2741       if (n_evts)
2742         return n_evts;
2743     }
2744   while (total_wait < wait_for_time);
2745   return n_evts;
2746 }
2747
2748 static int
2749 vppcom_epoll_wait_eventfd (vcl_worker_t * wrk, struct epoll_event *events,
2750                            int maxevents, u32 n_evts, double wait_for_time)
2751 {
2752   vcl_mq_evt_conn_t *mqc;
2753   int __clib_unused n_read;
2754   int n_mq_evts, i;
2755   u64 buf;
2756
2757   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2758 again:
2759   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2760                           vec_len (wrk->mq_events), wait_for_time);
2761   for (i = 0; i < n_mq_evts; i++)
2762     {
2763       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2764       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2765       vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0, &n_evts);
2766     }
2767   if (!n_evts && n_mq_evts > 0)
2768     goto again;
2769
2770   return (int) n_evts;
2771 }
2772
2773 int
2774 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
2775                    int maxevents, double wait_for_time)
2776 {
2777   vcl_worker_t *wrk = vcl_worker_get_current ();
2778   vcl_session_t *vep_session;
2779   u32 n_evts = 0;
2780   int i;
2781
2782   if (PREDICT_FALSE (maxevents <= 0))
2783     {
2784       clib_warning ("VCL<%d>: ERROR: Invalid maxevents (%d)!",
2785                     getpid (), maxevents);
2786       return VPPCOM_EINVAL;
2787     }
2788
2789   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2790   if (!vep_session)
2791     return VPPCOM_EBADFD;
2792
2793   if (PREDICT_FALSE (!vep_session->is_vep))
2794     {
2795       clib_warning ("VCL<%d>: ERROR: vep_idx (%u) is not a vep!",
2796                     getpid (), vep_handle);
2797       return VPPCOM_EINVAL;
2798     }
2799
2800   memset (events, 0, sizeof (*events) * maxevents);
2801
2802   if (vec_len (wrk->unhandled_evts_vector))
2803     {
2804       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2805         {
2806           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
2807                                           events, &n_evts);
2808           if (n_evts == maxevents)
2809             {
2810               i += 1;
2811               break;
2812             }
2813         }
2814
2815       vec_delete (wrk->unhandled_evts_vector, i, 0);
2816     }
2817
2818   if (vcm->cfg.use_mq_eventfd)
2819     return vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
2820                                       wait_for_time);
2821
2822   return vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
2823                                     wait_for_time);
2824 }
2825
2826 int
2827 vppcom_session_attr (uint32_t session_handle, uint32_t op,
2828                      void *buffer, uint32_t * buflen)
2829 {
2830   vcl_worker_t *wrk = vcl_worker_get_current ();
2831   vcl_session_t *session;
2832   int rv = VPPCOM_OK;
2833   u32 *flags = buffer, tmp_flags = 0;
2834   vppcom_endpt_t *ep = buffer;
2835
2836   session = vcl_session_get_w_handle (wrk, session_handle);
2837   if (!session)
2838     return VPPCOM_EBADFD;
2839
2840   switch (op)
2841     {
2842     case VPPCOM_ATTR_GET_NREAD:
2843       rv = vppcom_session_read_ready (session);
2844       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sid %u, nread = %d", rv);
2845       break;
2846
2847     case VPPCOM_ATTR_GET_NWRITE:
2848       rv = vppcom_session_write_ready (session);
2849       VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_NWRITE: sid %u, nwrite = %d",
2850             getpid (), session_handle, rv);
2851       break;
2852
2853     case VPPCOM_ATTR_GET_FLAGS:
2854       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
2855         {
2856           *flags = O_RDWR | (VCL_SESS_ATTR_TEST (session->attr,
2857                                                  VCL_SESS_ATTR_NONBLOCK));
2858           *buflen = sizeof (*flags);
2859           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_FLAGS: sid %u, flags = 0x%08x, "
2860                 "is_nonblocking = %u", getpid (),
2861                 session_handle, *flags,
2862                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2863         }
2864       else
2865         rv = VPPCOM_EINVAL;
2866       break;
2867
2868     case VPPCOM_ATTR_SET_FLAGS:
2869       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
2870         {
2871           if (*flags & O_NONBLOCK)
2872             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
2873           else
2874             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_NONBLOCK);
2875
2876           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_FLAGS: sid %u, flags = 0x%08x,"
2877                 " is_nonblocking = %u",
2878                 getpid (), session_handle, *flags,
2879                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2880         }
2881       else
2882         rv = VPPCOM_EINVAL;
2883       break;
2884
2885     case VPPCOM_ATTR_GET_PEER_ADDR:
2886       if (PREDICT_TRUE (buffer && buflen &&
2887                         (*buflen >= sizeof (*ep)) && ep->ip))
2888         {
2889           ep->is_ip4 = session->transport.is_ip4;
2890           ep->port = session->transport.rmt_port;
2891           if (session->transport.is_ip4)
2892             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
2893                               sizeof (ip4_address_t));
2894           else
2895             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
2896                               sizeof (ip6_address_t));
2897           *buflen = sizeof (*ep);
2898           VDBG (1, "VCL<%d>: VPPCOM_ATTR_GET_PEER_ADDR: sid %u, is_ip4 = %u, "
2899                 "addr = %U, port %u", getpid (),
2900                 session_handle, ep->is_ip4, format_ip46_address,
2901                 &session->transport.rmt_ip,
2902                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2903                 clib_net_to_host_u16 (ep->port));
2904         }
2905       else
2906         rv = VPPCOM_EINVAL;
2907       break;
2908
2909     case VPPCOM_ATTR_GET_LCL_ADDR:
2910       if (PREDICT_TRUE (buffer && buflen &&
2911                         (*buflen >= sizeof (*ep)) && ep->ip))
2912         {
2913           ep->is_ip4 = session->transport.is_ip4;
2914           ep->port = session->transport.lcl_port;
2915           if (session->transport.is_ip4)
2916             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
2917                               sizeof (ip4_address_t));
2918           else
2919             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
2920                               sizeof (ip6_address_t));
2921           *buflen = sizeof (*ep);
2922           VDBG (1, "VCL<%d>: VPPCOM_ATTR_GET_LCL_ADDR: sid %u, is_ip4 = %u,"
2923                 " addr = %U port %d", getpid (),
2924                 session_handle, ep->is_ip4, format_ip46_address,
2925                 &session->transport.lcl_ip,
2926                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2927                 clib_net_to_host_u16 (ep->port));
2928         }
2929       else
2930         rv = VPPCOM_EINVAL;
2931       break;
2932
2933     case VPPCOM_ATTR_GET_LIBC_EPFD:
2934       rv = session->libc_epfd;
2935       VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d",
2936             getpid (), rv);
2937       break;
2938
2939     case VPPCOM_ATTR_SET_LIBC_EPFD:
2940       if (PREDICT_TRUE (buffer && buflen &&
2941                         (*buflen == sizeof (session->libc_epfd))))
2942         {
2943           session->libc_epfd = *(int *) buffer;
2944           *buflen = sizeof (session->libc_epfd);
2945
2946           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, "
2947                 "buflen %d", getpid (), session->libc_epfd, *buflen);
2948         }
2949       else
2950         rv = VPPCOM_EINVAL;
2951       break;
2952
2953     case VPPCOM_ATTR_GET_PROTOCOL:
2954       if (buffer && buflen && (*buflen >= sizeof (int)))
2955         {
2956           *(int *) buffer = session->session_type;
2957           *buflen = sizeof (int);
2958
2959           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
2960                 getpid (), *(int *) buffer, *(int *) buffer ? "UDP" : "TCP",
2961                 *buflen);
2962         }
2963       else
2964         rv = VPPCOM_EINVAL;
2965       break;
2966
2967     case VPPCOM_ATTR_GET_LISTEN:
2968       if (buffer && buflen && (*buflen >= sizeof (int)))
2969         {
2970           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
2971                                                 VCL_SESS_ATTR_LISTEN);
2972           *buflen = sizeof (int);
2973
2974           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_LISTEN: %d, buflen %d",
2975                 getpid (), *(int *) buffer, *buflen);
2976         }
2977       else
2978         rv = VPPCOM_EINVAL;
2979       break;
2980
2981     case VPPCOM_ATTR_GET_ERROR:
2982       if (buffer && buflen && (*buflen >= sizeof (int)))
2983         {
2984           *(int *) buffer = 0;
2985           *buflen = sizeof (int);
2986
2987           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
2988                 getpid (), *(int *) buffer, *buflen);
2989         }
2990       else
2991         rv = VPPCOM_EINVAL;
2992       break;
2993
2994     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
2995       if (buffer && buflen && (*buflen >= sizeof (u32)))
2996         {
2997
2998           /* VPP-TBD */
2999           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3000                                 session->tx_fifo ? session->tx_fifo->nitems :
3001                                 vcm->cfg.tx_fifo_size);
3002           *buflen = sizeof (u32);
3003
3004           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), "
3005                 "buflen %d, #VPP-TBD#", getpid (),
3006                 *(size_t *) buffer, *(size_t *) buffer, *buflen);
3007         }
3008       else
3009         rv = VPPCOM_EINVAL;
3010       break;
3011
3012     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3013       if (buffer && buflen && (*buflen == sizeof (u32)))
3014         {
3015           /* VPP-TBD */
3016           session->sndbuf_size = *(u32 *) buffer;
3017           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), "
3018                 "buflen %d, #VPP-TBD#", getpid (),
3019                 session->sndbuf_size, session->sndbuf_size, *buflen);
3020         }
3021       else
3022         rv = VPPCOM_EINVAL;
3023       break;
3024
3025     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3026       if (buffer && buflen && (*buflen >= sizeof (u32)))
3027         {
3028
3029           /* VPP-TBD */
3030           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3031                                 session->rx_fifo ? session->rx_fifo->nitems :
3032                                 vcm->cfg.rx_fifo_size);
3033           *buflen = sizeof (u32);
3034
3035           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), "
3036                 "buflen %d, #VPP-TBD#", getpid (),
3037                 *(size_t *) buffer, *(size_t *) buffer, *buflen);
3038         }
3039       else
3040         rv = VPPCOM_EINVAL;
3041       break;
3042
3043     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3044       if (buffer && buflen && (*buflen == sizeof (u32)))
3045         {
3046           /* VPP-TBD */
3047           session->rcvbuf_size = *(u32 *) buffer;
3048           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), "
3049                 "buflen %d, #VPP-TBD#", getpid (),
3050                 session->sndbuf_size, session->sndbuf_size, *buflen);
3051         }
3052       else
3053         rv = VPPCOM_EINVAL;
3054       break;
3055
3056     case VPPCOM_ATTR_GET_REUSEADDR:
3057       if (buffer && buflen && (*buflen >= sizeof (int)))
3058         {
3059           /* VPP-TBD */
3060           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3061                                                 VCL_SESS_ATTR_REUSEADDR);
3062           *buflen = sizeof (int);
3063
3064           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_REUSEADDR: %d, "
3065                 "buflen %d, #VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3066         }
3067       else
3068         rv = VPPCOM_EINVAL;
3069       break;
3070
3071     case VPPCOM_ATTR_SET_REUSEADDR:
3072       if (buffer && buflen && (*buflen == sizeof (int)) &&
3073           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3074         {
3075           /* VPP-TBD */
3076           if (*(int *) buffer)
3077             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEADDR);
3078           else
3079             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEADDR);
3080
3081           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d,"
3082                 " #VPP-TBD#", getpid (),
3083                 VCL_SESS_ATTR_TEST (session->attr,
3084                                     VCL_SESS_ATTR_REUSEADDR), *buflen);
3085         }
3086       else
3087         rv = VPPCOM_EINVAL;
3088       break;
3089
3090     case VPPCOM_ATTR_GET_REUSEPORT:
3091       if (buffer && buflen && (*buflen >= sizeof (int)))
3092         {
3093           /* VPP-TBD */
3094           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3095                                                 VCL_SESS_ATTR_REUSEPORT);
3096           *buflen = sizeof (int);
3097
3098           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d,"
3099                 " #VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3100         }
3101       else
3102         rv = VPPCOM_EINVAL;
3103       break;
3104
3105     case VPPCOM_ATTR_SET_REUSEPORT:
3106       if (buffer && buflen && (*buflen == sizeof (int)) &&
3107           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3108         {
3109           /* VPP-TBD */
3110           if (*(int *) buffer)
3111             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEPORT);
3112           else
3113             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEPORT);
3114
3115           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d,"
3116                 " #VPP-TBD#", getpid (),
3117                 VCL_SESS_ATTR_TEST (session->attr,
3118                                     VCL_SESS_ATTR_REUSEPORT), *buflen);
3119         }
3120       else
3121         rv = VPPCOM_EINVAL;
3122       break;
3123
3124     case VPPCOM_ATTR_GET_BROADCAST:
3125       if (buffer && buflen && (*buflen >= sizeof (int)))
3126         {
3127           /* VPP-TBD */
3128           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3129                                                 VCL_SESS_ATTR_BROADCAST);
3130           *buflen = sizeof (int);
3131
3132           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d,"
3133                 " #VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3134         }
3135       else
3136         rv = VPPCOM_EINVAL;
3137       break;
3138
3139     case VPPCOM_ATTR_SET_BROADCAST:
3140       if (buffer && buflen && (*buflen == sizeof (int)))
3141         {
3142           /* VPP-TBD */
3143           if (*(int *) buffer)
3144             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_BROADCAST);
3145           else
3146             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_BROADCAST);
3147
3148           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, "
3149                 "#VPP-TBD#", getpid (),
3150                 VCL_SESS_ATTR_TEST (session->attr,
3151                                     VCL_SESS_ATTR_BROADCAST), *buflen);
3152         }
3153       else
3154         rv = VPPCOM_EINVAL;
3155       break;
3156
3157     case VPPCOM_ATTR_GET_V6ONLY:
3158       if (buffer && buflen && (*buflen >= sizeof (int)))
3159         {
3160           /* VPP-TBD */
3161           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3162                                                 VCL_SESS_ATTR_V6ONLY);
3163           *buflen = sizeof (int);
3164
3165           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, "
3166                 "#VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3167         }
3168       else
3169         rv = VPPCOM_EINVAL;
3170       break;
3171
3172     case VPPCOM_ATTR_SET_V6ONLY:
3173       if (buffer && buflen && (*buflen == sizeof (int)))
3174         {
3175           /* VPP-TBD */
3176           if (*(int *) buffer)
3177             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_V6ONLY);
3178           else
3179             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_V6ONLY);
3180
3181           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, "
3182                 "#VPP-TBD#", getpid (),
3183                 VCL_SESS_ATTR_TEST (session->attr,
3184                                     VCL_SESS_ATTR_V6ONLY), *buflen);
3185         }
3186       else
3187         rv = VPPCOM_EINVAL;
3188       break;
3189
3190     case VPPCOM_ATTR_GET_KEEPALIVE:
3191       if (buffer && buflen && (*buflen >= sizeof (int)))
3192         {
3193           /* VPP-TBD */
3194           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3195                                                 VCL_SESS_ATTR_KEEPALIVE);
3196           *buflen = sizeof (int);
3197
3198           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, "
3199                 "#VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3200         }
3201       else
3202         rv = VPPCOM_EINVAL;
3203       break;
3204
3205     case VPPCOM_ATTR_SET_KEEPALIVE:
3206       if (buffer && buflen && (*buflen == sizeof (int)))
3207         {
3208           /* VPP-TBD */
3209           if (*(int *) buffer)
3210             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3211           else
3212             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3213
3214           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, "
3215                 "#VPP-TBD#", getpid (),
3216                 VCL_SESS_ATTR_TEST (session->attr,
3217                                     VCL_SESS_ATTR_KEEPALIVE), *buflen);
3218         }
3219       else
3220         rv = VPPCOM_EINVAL;
3221       break;
3222
3223     case VPPCOM_ATTR_GET_TCP_NODELAY:
3224       if (buffer && buflen && (*buflen >= sizeof (int)))
3225         {
3226           /* VPP-TBD */
3227           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3228                                                 VCL_SESS_ATTR_TCP_NODELAY);
3229           *buflen = sizeof (int);
3230
3231           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, "
3232                 "#VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3233         }
3234       else
3235         rv = VPPCOM_EINVAL;
3236       break;
3237
3238     case VPPCOM_ATTR_SET_TCP_NODELAY:
3239       if (buffer && buflen && (*buflen == sizeof (int)))
3240         {
3241           /* VPP-TBD */
3242           if (*(int *) buffer)
3243             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3244           else
3245             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3246
3247           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, "
3248                 "#VPP-TBD#", getpid (),
3249                 VCL_SESS_ATTR_TEST (session->attr,
3250                                     VCL_SESS_ATTR_TCP_NODELAY), *buflen);
3251         }
3252       else
3253         rv = VPPCOM_EINVAL;
3254       break;
3255
3256     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
3257       if (buffer && buflen && (*buflen >= sizeof (int)))
3258         {
3259           /* VPP-TBD */
3260           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3261                                                 VCL_SESS_ATTR_TCP_KEEPIDLE);
3262           *buflen = sizeof (int);
3263
3264           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, "
3265                 "#VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3266         }
3267       else
3268         rv = VPPCOM_EINVAL;
3269       break;
3270
3271     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
3272       if (buffer && buflen && (*buflen == sizeof (int)))
3273         {
3274           /* VPP-TBD */
3275           if (*(int *) buffer)
3276             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3277           else
3278             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3279
3280           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, "
3281                 "#VPP-TBD#", getpid (),
3282                 VCL_SESS_ATTR_TEST (session->attr,
3283                                     VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
3284         }
3285       else
3286         rv = VPPCOM_EINVAL;
3287       break;
3288
3289     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
3290       if (buffer && buflen && (*buflen >= sizeof (int)))
3291         {
3292           /* VPP-TBD */
3293           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3294                                                 VCL_SESS_ATTR_TCP_KEEPINTVL);
3295           *buflen = sizeof (int);
3296
3297           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, "
3298                 "#VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3299         }
3300       else
3301         rv = VPPCOM_EINVAL;
3302       break;
3303
3304     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
3305       if (buffer && buflen && (*buflen == sizeof (int)))
3306         {
3307           /* VPP-TBD */
3308           if (*(int *) buffer)
3309             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3310           else
3311             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3312
3313           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, "
3314                 "#VPP-TBD#", getpid (),
3315                 VCL_SESS_ATTR_TEST (session->attr,
3316                                     VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
3317         }
3318       else
3319         rv = VPPCOM_EINVAL;
3320       break;
3321
3322     case VPPCOM_ATTR_GET_TCP_USER_MSS:
3323       if (buffer && buflen && (*buflen >= sizeof (u32)))
3324         {
3325           /* VPP-TBD */
3326           *(u32 *) buffer = session->user_mss;
3327           *buflen = sizeof (int);
3328
3329           VDBG (2, "VCL<%d>: VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d,"
3330                 " #VPP-TBD#", getpid (), *(int *) buffer, *buflen);
3331         }
3332       else
3333         rv = VPPCOM_EINVAL;
3334       break;
3335
3336     case VPPCOM_ATTR_SET_TCP_USER_MSS:
3337       if (buffer && buflen && (*buflen == sizeof (u32)))
3338         {
3339           /* VPP-TBD */
3340           session->user_mss = *(u32 *) buffer;
3341
3342           VDBG (2, "VCL<%d>: VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d, "
3343                 "#VPP-TBD#", getpid (), session->user_mss, *buflen);
3344         }
3345       else
3346         rv = VPPCOM_EINVAL;
3347       break;
3348
3349     case VPPCOM_ATTR_SET_SHUT:
3350       if (*flags == SHUT_RD || *flags == SHUT_RDWR)
3351         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_RD);
3352       if (*flags == SHUT_WR || *flags == SHUT_RDWR)
3353         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_WR);
3354       break;
3355
3356     case VPPCOM_ATTR_GET_SHUT:
3357       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_RD))
3358         tmp_flags = 1;
3359       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_WR))
3360         tmp_flags |= 2;
3361       if (tmp_flags == 1)
3362         *(int *) buffer = SHUT_RD;
3363       else if (tmp_flags == 2)
3364         *(int *) buffer = SHUT_WR;
3365       else if (tmp_flags == 3)
3366         *(int *) buffer = SHUT_RDWR;
3367       *buflen = sizeof (int);
3368       break;
3369     default:
3370       rv = VPPCOM_EINVAL;
3371       break;
3372     }
3373
3374   return rv;
3375 }
3376
3377 int
3378 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
3379                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
3380 {
3381   vcl_worker_t *wrk = vcl_worker_get_current ();
3382   int rv = VPPCOM_OK;
3383   vcl_session_t *session = 0;
3384
3385   if (ep)
3386     {
3387       session = vcl_session_get_w_handle (wrk, session_handle);
3388       if (PREDICT_FALSE (!session))
3389         {
3390           VDBG (0, "VCL<%d>: invalid session, sid (%u) has been closed!",
3391                 getpid (), session_handle);
3392           return VPPCOM_EBADFD;
3393         }
3394       ep->is_ip4 = session->transport.is_ip4;
3395       ep->port = session->transport.rmt_port;
3396     }
3397
3398   if (flags == 0)
3399     rv = vppcom_session_read (session_handle, buffer, buflen);
3400   else if (flags & MSG_PEEK)
3401     rv = vppcom_session_peek (session_handle, buffer, buflen);
3402   else
3403     {
3404       VDBG (0, "Unsupport flags for recvfrom %d", flags);
3405       return VPPCOM_EAFNOSUPPORT;
3406     }
3407
3408   if (ep)
3409     {
3410       if (session->transport.is_ip4)
3411         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3412                           sizeof (ip4_address_t));
3413       else
3414         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3415                           sizeof (ip6_address_t));
3416     }
3417
3418   return rv;
3419 }
3420
3421 int
3422 vppcom_session_sendto (uint32_t session_handle, void *buffer,
3423                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
3424 {
3425   if (!buffer)
3426     return VPPCOM_EINVAL;
3427
3428   if (ep)
3429     {
3430       // TBD
3431       return VPPCOM_EINVAL;
3432     }
3433
3434   if (flags)
3435     {
3436       // TBD check the flags and do the right thing
3437       VDBG (2, "VCL<%d>: handling flags 0x%u (%d) not implemented yet.",
3438             getpid (), flags, flags);
3439     }
3440
3441   return (vppcom_session_write_inline (session_handle, buffer, buflen, 1));
3442 }
3443
3444 int
3445 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
3446 {
3447   vcl_worker_t *wrk = vcl_worker_get_current ();
3448   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
3449   u32 i, keep_trying = 1;
3450   svm_msg_q_msg_t msg;
3451   session_event_t *e;
3452   int rv, num_ev = 0;
3453
3454   VDBG (3, "VCL<%d>: vp %p, nsids %u, wait_for_time %f",
3455         getpid (), vp, n_sids, wait_for_time);
3456
3457   if (!vp)
3458     return VPPCOM_EFAULT;
3459
3460   do
3461     {
3462       vcl_session_t *session;
3463
3464       /* Dequeue all events and drop all unhandled io events */
3465       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
3466         {
3467           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
3468           vcl_handle_mq_event (wrk, e);
3469           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
3470         }
3471       vec_reset_length (wrk->unhandled_evts_vector);
3472
3473       for (i = 0; i < n_sids; i++)
3474         {
3475           session = vcl_session_get (wrk, vp[i].sh);
3476           if (!session)
3477             {
3478               vp[i].revents = POLLHUP;
3479               num_ev++;
3480               continue;
3481             }
3482
3483           vp[i].revents = 0;
3484
3485           if (POLLIN & vp[i].events)
3486             {
3487               rv = vppcom_session_read_ready (session);
3488               if (rv > 0)
3489                 {
3490                   vp[i].revents |= POLLIN;
3491                   num_ev++;
3492                 }
3493               else if (rv < 0)
3494                 {
3495                   switch (rv)
3496                     {
3497                     case VPPCOM_ECONNRESET:
3498                       vp[i].revents = POLLHUP;
3499                       break;
3500
3501                     default:
3502                       vp[i].revents = POLLERR;
3503                       break;
3504                     }
3505                   num_ev++;
3506                 }
3507             }
3508
3509           if (POLLOUT & vp[i].events)
3510             {
3511               rv = vppcom_session_write_ready (session);
3512               if (rv > 0)
3513                 {
3514                   vp[i].revents |= POLLOUT;
3515                   num_ev++;
3516                 }
3517               else if (rv < 0)
3518                 {
3519                   switch (rv)
3520                     {
3521                     case VPPCOM_ECONNRESET:
3522                       vp[i].revents = POLLHUP;
3523                       break;
3524
3525                     default:
3526                       vp[i].revents = POLLERR;
3527                       break;
3528                     }
3529                   num_ev++;
3530                 }
3531             }
3532
3533           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
3534             {
3535               vp[i].revents = POLLNVAL;
3536               num_ev++;
3537             }
3538         }
3539       if (wait_for_time != -1)
3540         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
3541     }
3542   while ((num_ev == 0) && keep_trying);
3543
3544   if (VPPCOM_DEBUG > 3)
3545     {
3546       clib_warning ("VCL<%d>: returning %d", getpid (), num_ev);
3547       for (i = 0; i < n_sids; i++)
3548         {
3549           clib_warning ("VCL<%d>: vp[%d].sid %d (0x%x), .events 0x%x, "
3550                         ".revents 0x%x", getpid (), i, vp[i].sh, vp[i].sh,
3551                         vp[i].events, vp[i].revents);
3552         }
3553     }
3554   return num_ev;
3555 }
3556
3557 int
3558 vppcom_mq_epoll_fd (void)
3559 {
3560   vcl_worker_t *wrk = vcl_worker_get_current ();
3561   return wrk->mqs_epfd;
3562 }
3563
3564 int
3565 vppcom_session_index (vcl_session_handle_t session_handle)
3566 {
3567   return session_handle & 0xFFFFFF;
3568 }
3569
3570 int
3571 vppcom_session_worker (vcl_session_handle_t session_handle)
3572 {
3573   return session_handle >> 24;
3574 }
3575
3576 int
3577 vppcom_worker_register (void)
3578 {
3579   if (!vcl_worker_alloc_and_init ())
3580     return VPPCOM_EEXIST;
3581
3582   if (vcl_worker_set_bapi ())
3583     return VPPCOM_EEXIST;
3584
3585   if (vcl_worker_register_with_vpp ())
3586     return VPPCOM_EEXIST;
3587
3588   return VPPCOM_OK;
3589 }
3590
3591 int
3592 vppcom_worker_index (void)
3593 {
3594   return vcl_get_worker_index ();
3595 }
3596
3597 int
3598 vppcom_worker_mqs_epfd (void)
3599 {
3600   vcl_worker_t *wrk = vcl_worker_get_current ();
3601   if (!vcm->cfg.use_mq_eventfd)
3602     return -1;
3603   return wrk->mqs_epfd;
3604 }
3605
3606 /*
3607  * fd.io coding-style-patch-verification: ON
3608  *
3609  * Local Variables:
3610  * eval: (c-set-style "gnu")
3611  * End:
3612  */