vcl session: extended connect/listen configuration
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <vcl/vppcom.h>
19 #include <vcl/vcl_debug.h>
20 #include <vcl/vcl_private.h>
21 #include <svm/fifo_segment.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static inline int
26 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq, u32 n_max_msg)
27 {
28   u32 n_msgs = 0, sz, len;
29
30   while ((sz = svm_msg_q_size (mq)))
31     {
32       len = vec_len (wrk->mq_msg_vector);
33       vec_validate (wrk->mq_msg_vector, len + sz - 1);
34       svm_msg_q_sub_raw_batch (mq, wrk->mq_msg_vector + len, sz);
35       n_msgs += sz;
36     }
37   return n_msgs;
38 }
39
40 const char *
41 vppcom_session_state_str (vcl_session_state_t state)
42 {
43   char *st;
44
45   switch (state)
46     {
47     case VCL_STATE_CLOSED:
48       st = "STATE_CLOSED";
49       break;
50     case VCL_STATE_LISTEN:
51       st = "STATE_LISTEN";
52       break;
53     case VCL_STATE_READY:
54       st = "STATE_READY";
55       break;
56     case VCL_STATE_VPP_CLOSING:
57       st = "STATE_VPP_CLOSING";
58       break;
59     case VCL_STATE_DISCONNECT:
60       st = "STATE_DISCONNECT";
61       break;
62     case VCL_STATE_DETACHED:
63       st = "STATE_DETACHED";
64       break;
65     case VCL_STATE_UPDATED:
66       st = "STATE_UPDATED";
67       break;
68     case VCL_STATE_LISTEN_NO_MQ:
69       st = "STATE_LISTEN_NO_MQ";
70       break;
71     default:
72       st = "UNKNOWN_STATE";
73       break;
74     }
75
76   return st;
77 }
78
79 u8 *
80 format_ip4_address (u8 * s, va_list * args)
81 {
82   u8 *a = va_arg (*args, u8 *);
83   return format (s, "%d.%d.%d.%d", a[0], a[1], a[2], a[3]);
84 }
85
86 u8 *
87 format_ip6_address (u8 * s, va_list * args)
88 {
89   ip6_address_t *a = va_arg (*args, ip6_address_t *);
90   u32 i, i_max_n_zero, max_n_zeros, i_first_zero, n_zeros, last_double_colon;
91
92   i_max_n_zero = ARRAY_LEN (a->as_u16);
93   max_n_zeros = 0;
94   i_first_zero = i_max_n_zero;
95   n_zeros = 0;
96   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
97     {
98       u32 is_zero = a->as_u16[i] == 0;
99       if (is_zero && i_first_zero >= ARRAY_LEN (a->as_u16))
100         {
101           i_first_zero = i;
102           n_zeros = 0;
103         }
104       n_zeros += is_zero;
105       if ((!is_zero && n_zeros > max_n_zeros)
106           || (i + 1 >= ARRAY_LEN (a->as_u16) && n_zeros > max_n_zeros))
107         {
108           i_max_n_zero = i_first_zero;
109           max_n_zeros = n_zeros;
110           i_first_zero = ARRAY_LEN (a->as_u16);
111           n_zeros = 0;
112         }
113     }
114
115   last_double_colon = 0;
116   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
117     {
118       if (i == i_max_n_zero && max_n_zeros > 1)
119         {
120           s = format (s, "::");
121           i += max_n_zeros - 1;
122           last_double_colon = 1;
123         }
124       else
125         {
126           s = format (s, "%s%x",
127                       (last_double_colon || i == 0) ? "" : ":",
128                       clib_net_to_host_u16 (a->as_u16[i]));
129           last_double_colon = 0;
130         }
131     }
132
133   return s;
134 }
135
136 /* Format an IP46 address. */
137 u8 *
138 format_ip46_address (u8 * s, va_list * args)
139 {
140   ip46_address_t *ip46 = va_arg (*args, ip46_address_t *);
141   ip46_type_t type = va_arg (*args, ip46_type_t);
142   int is_ip4 = 1;
143
144   switch (type)
145     {
146     case IP46_TYPE_ANY:
147       is_ip4 = ip46_address_is_ip4 (ip46);
148       break;
149     case IP46_TYPE_IP4:
150       is_ip4 = 1;
151       break;
152     case IP46_TYPE_IP6:
153       is_ip4 = 0;
154       break;
155     }
156
157   return is_ip4 ?
158     format (s, "%U", format_ip4_address, &ip46->ip4) :
159     format (s, "%U", format_ip6_address, &ip46->ip6);
160 }
161
162 /*
163  * VPPCOM Utility Functions
164  */
165
166 static void
167 vcl_msg_add_ext_config (vcl_session_t *s, uword *offset)
168 {
169   svm_fifo_chunk_t *c;
170
171   c = vcl_segment_alloc_chunk (vcl_vpp_worker_segment_handle (0),
172                                0 /* one slice only */, s->ext_config->len,
173                                offset);
174   if (c)
175     clib_memcpy_fast (c->data, s->ext_config, s->ext_config->len);
176 }
177
178 static void
179 vcl_send_session_listen (vcl_worker_t * wrk, vcl_session_t * s)
180 {
181   app_session_evt_t _app_evt, *app_evt = &_app_evt;
182   session_listen_msg_t *mp;
183   svm_msg_q_t *mq;
184
185   mq = vcl_worker_ctrl_mq (wrk);
186   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_LISTEN);
187   mp = (session_listen_msg_t *) app_evt->evt->data;
188   memset (mp, 0, sizeof (*mp));
189   mp->client_index = wrk->api_client_handle;
190   mp->context = s->session_index;
191   mp->wrk_index = wrk->vpp_wrk_index;
192   mp->is_ip4 = s->transport.is_ip4;
193   clib_memcpy_fast (&mp->ip, &s->transport.lcl_ip, sizeof (mp->ip));
194   mp->port = s->transport.lcl_port;
195   mp->proto = s->session_type;
196   mp->ckpair_index = s->ckpair_index;
197   mp->vrf = s->vrf;
198   if (s->flags & VCL_SESSION_F_CONNECTED)
199     mp->flags = TRANSPORT_CFG_F_CONNECTED;
200   if (s->ext_config)
201     vcl_msg_add_ext_config (s, &mp->ext_config);
202   app_send_ctrl_evt_to_vpp (mq, app_evt);
203   if (s->ext_config)
204     {
205       clib_mem_free (s->ext_config);
206       s->ext_config = 0;
207     }
208 }
209
210 static void
211 vcl_send_session_connect (vcl_worker_t * wrk, vcl_session_t * s)
212 {
213   app_session_evt_t _app_evt, *app_evt = &_app_evt;
214   session_connect_msg_t *mp;
215   svm_msg_q_t *mq;
216
217   mq = vcl_worker_ctrl_mq (wrk);
218   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_CONNECT);
219   mp = (session_connect_msg_t *) app_evt->evt->data;
220   memset (mp, 0, sizeof (*mp));
221   mp->client_index = wrk->api_client_handle;
222   mp->context = s->session_index;
223   mp->wrk_index = wrk->vpp_wrk_index;
224   mp->is_ip4 = s->transport.is_ip4;
225   mp->parent_handle = s->parent_handle;
226   clib_memcpy_fast (&mp->ip, &s->transport.rmt_ip, sizeof (mp->ip));
227   clib_memcpy_fast (&mp->lcl_ip, &s->transport.lcl_ip, sizeof (mp->lcl_ip));
228   mp->port = s->transport.rmt_port;
229   mp->lcl_port = s->transport.lcl_port;
230   mp->proto = s->session_type;
231   mp->ckpair_index = s->ckpair_index;
232   mp->vrf = s->vrf;
233   if (s->flags & VCL_SESSION_F_CONNECTED)
234     mp->flags |= TRANSPORT_CFG_F_CONNECTED;
235   if (s->ext_config)
236     vcl_msg_add_ext_config (s, &mp->ext_config);
237   app_send_ctrl_evt_to_vpp (mq, app_evt);
238
239   if (s->ext_config)
240     {
241       clib_mem_free (s->ext_config);
242       s->ext_config = 0;
243     }
244 }
245
246 void
247 vcl_send_session_unlisten (vcl_worker_t * wrk, vcl_session_t * s)
248 {
249   app_session_evt_t _app_evt, *app_evt = &_app_evt;
250   session_unlisten_msg_t *mp;
251   svm_msg_q_t *mq;
252
253   mq = vcl_worker_ctrl_mq (wrk);
254   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_UNLISTEN);
255   mp = (session_unlisten_msg_t *) app_evt->evt->data;
256   memset (mp, 0, sizeof (*mp));
257   mp->client_index = wrk->api_client_handle;
258   mp->wrk_index = wrk->vpp_wrk_index;
259   mp->handle = s->vpp_handle;
260   mp->context = wrk->wrk_index;
261   app_send_ctrl_evt_to_vpp (mq, app_evt);
262 }
263
264 static void
265 vcl_send_session_disconnect (vcl_worker_t * wrk, vcl_session_t * s)
266 {
267   app_session_evt_t _app_evt, *app_evt = &_app_evt;
268   session_disconnect_msg_t *mp;
269   svm_msg_q_t *mq;
270
271   /* Send to thread that owns the session */
272   mq = s->vpp_evt_q;
273   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_DISCONNECT);
274   mp = (session_disconnect_msg_t *) app_evt->evt->data;
275   memset (mp, 0, sizeof (*mp));
276   mp->client_index = wrk->api_client_handle;
277   mp->handle = s->vpp_handle;
278   app_send_ctrl_evt_to_vpp (mq, app_evt);
279 }
280
281 static void
282 vcl_send_app_detach (vcl_worker_t * wrk)
283 {
284   app_session_evt_t _app_evt, *app_evt = &_app_evt;
285   session_app_detach_msg_t *mp;
286   svm_msg_q_t *mq;
287
288   mq = vcl_worker_ctrl_mq (wrk);
289   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_DETACH);
290   mp = (session_app_detach_msg_t *) app_evt->evt->data;
291   memset (mp, 0, sizeof (*mp));
292   mp->client_index = wrk->api_client_handle;
293   app_send_ctrl_evt_to_vpp (mq, app_evt);
294 }
295
296 static void
297 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
298                                  session_handle_t handle, int retval)
299 {
300   app_session_evt_t _app_evt, *app_evt = &_app_evt;
301   session_accepted_reply_msg_t *rmp;
302   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
303   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
304   rmp->handle = handle;
305   rmp->context = context;
306   rmp->retval = retval;
307   app_send_ctrl_evt_to_vpp (mq, app_evt);
308 }
309
310 static void
311 vcl_send_session_disconnected_reply (vcl_worker_t * wrk, vcl_session_t * s,
312                                      int retval)
313 {
314   app_session_evt_t _app_evt, *app_evt = &_app_evt;
315   session_disconnected_reply_msg_t *rmp;
316   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
317                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
318   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
319   rmp->handle = s->vpp_handle;
320   rmp->context = wrk->api_client_handle;
321   rmp->retval = retval;
322   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
323 }
324
325 static void
326 vcl_send_session_reset_reply (vcl_worker_t * wrk, vcl_session_t * s,
327                               int retval)
328 {
329   app_session_evt_t _app_evt, *app_evt = &_app_evt;
330   session_reset_reply_msg_t *rmp;
331   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
332                              SESSION_CTRL_EVT_RESET_REPLY);
333   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
334   rmp->handle = s->vpp_handle;
335   rmp->context = wrk->api_client_handle;
336   rmp->retval = retval;
337   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
338 }
339
340 void
341 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
342                                 u32 wrk_index)
343 {
344   app_session_evt_t _app_evt, *app_evt = &_app_evt;
345   session_worker_update_msg_t *mp;
346
347   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
348                              SESSION_CTRL_EVT_WORKER_UPDATE);
349   mp = (session_worker_update_msg_t *) app_evt->evt->data;
350   mp->client_index = wrk->api_client_handle;
351   mp->handle = s->vpp_handle;
352   mp->req_wrk_index = wrk->vpp_wrk_index;
353   mp->wrk_index = wrk_index;
354   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
355 }
356
357 int
358 vcl_send_worker_rpc (u32 dst_wrk_index, void *data, u32 data_len)
359 {
360   app_session_evt_t _app_evt, *app_evt = &_app_evt;
361   session_app_wrk_rpc_msg_t *mp;
362   vcl_worker_t *dst_wrk, *wrk;
363   svm_msg_q_t *mq;
364   int ret = -1;
365
366   if (data_len > sizeof (mp->data))
367     goto done;
368
369   clib_spinlock_lock (&vcm->workers_lock);
370
371   dst_wrk = vcl_worker_get_if_valid (dst_wrk_index);
372   if (!dst_wrk)
373     goto done;
374
375   wrk = vcl_worker_get_current ();
376   mq = vcl_worker_ctrl_mq (wrk);
377   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_WRK_RPC);
378   mp = (session_app_wrk_rpc_msg_t *) app_evt->evt->data;
379   mp->client_index = wrk->api_client_handle;
380   mp->wrk_index = dst_wrk->vpp_wrk_index;
381   clib_memcpy (mp->data, data, data_len);
382   app_send_ctrl_evt_to_vpp (mq, app_evt);
383   ret = 0;
384
385 done:
386   clib_spinlock_unlock (&vcm->workers_lock);
387   return ret;
388 }
389
390 int
391 vcl_session_transport_attr (vcl_worker_t *wrk, vcl_session_t *s, u8 is_get,
392                             transport_endpt_attr_t *attr)
393 {
394   app_session_evt_t _app_evt, *app_evt = &_app_evt;
395   session_transport_attr_msg_t *mp;
396   svm_msg_q_t *mq;
397   f64 timeout;
398
399   ASSERT (!wrk->session_attr_op);
400   wrk->session_attr_op = 1;
401   wrk->session_attr_op_rv = -1;
402
403   mq = s->vpp_evt_q;
404   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_TRANSPORT_ATTR);
405   mp = (session_transport_attr_msg_t *) app_evt->evt->data;
406   memset (mp, 0, sizeof (*mp));
407   mp->client_index = wrk->api_client_handle;
408   mp->handle = s->vpp_handle;
409   mp->is_get = is_get;
410   mp->attr = *attr;
411   app_send_ctrl_evt_to_vpp (mq, app_evt);
412
413   timeout = clib_time_now (&wrk->clib_time) + 1;
414
415   while (wrk->session_attr_op && clib_time_now (&wrk->clib_time) < timeout)
416     vcl_flush_mq_events ();
417
418   if (!wrk->session_attr_op_rv && is_get)
419     *attr = wrk->session_attr_rv;
420
421   wrk->session_attr_op = 0;
422
423   return wrk->session_attr_op_rv;
424 }
425
426 static u32
427 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp,
428                               u32 ls_index)
429 {
430   vcl_session_t *session, *listen_session;
431   svm_msg_q_t *evt_q;
432
433   session = vcl_session_alloc (wrk);
434
435   listen_session = vcl_session_get (wrk, ls_index);
436   if (listen_session->vpp_handle != mp->listener_handle)
437     {
438       VDBG (0, "ERROR: listener handle %lu does not match session %u",
439             mp->listener_handle, ls_index);
440       goto error;
441     }
442
443   if (vcl_segment_attach_session (mp->segment_handle, mp->server_rx_fifo,
444                                   mp->server_tx_fifo,
445                                   mp->vpp_event_queue_address, 0, session))
446     {
447       VDBG (0, "failed to attach fifos for %u", session->session_index);
448       goto error;
449     }
450
451   session->vpp_handle = mp->handle;
452   session->session_state = VCL_STATE_READY;
453   session->transport.rmt_port = mp->rmt.port;
454   session->transport.is_ip4 = mp->rmt.is_ip4;
455   clib_memcpy_fast (&session->transport.rmt_ip, &mp->rmt.ip,
456                     sizeof (ip46_address_t));
457
458   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
459   session->transport.lcl_port = listen_session->transport.lcl_port;
460   session->transport.lcl_ip = listen_session->transport.lcl_ip;
461   session->session_type = listen_session->session_type;
462   session->is_dgram = vcl_proto_is_dgram (session->session_type);
463   session->listener_index = listen_session->session_index;
464   listen_session->n_accepted_sessions++;
465
466   VDBG (1, "session %u [0x%llx]: client accept request from %s address %U"
467         " port %d queue %p!", session->session_index, mp->handle,
468         mp->rmt.is_ip4 ? "IPv4" : "IPv6", format_ip46_address, &mp->rmt.ip,
469         mp->rmt.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
470         clib_net_to_host_u16 (mp->rmt.port), session->vpp_evt_q);
471   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
472
473   vcl_send_session_accepted_reply (session->vpp_evt_q, mp->context,
474                                    session->vpp_handle, 0);
475
476   return session->session_index;
477
478 error:
479   vcl_segment_attach_mq (vcl_vpp_worker_segment_handle (0),
480                          mp->vpp_event_queue_address, mp->mq_index, &evt_q);
481   vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
482                                    VNET_API_ERROR_INVALID_ARGUMENT);
483   vcl_session_free (wrk, session);
484   return VCL_INVALID_SESSION_INDEX;
485 }
486
487 static u32
488 vcl_session_connected_handler (vcl_worker_t * wrk,
489                                session_connected_msg_t * mp)
490 {
491   vcl_session_t *session = 0;
492   u32 session_index;
493
494   session_index = mp->context;
495   session = vcl_session_get (wrk, session_index);
496   if (!session)
497     {
498       VDBG (0, "ERROR: vpp handle 0x%llx has no session index (%u)!",
499             mp->handle, session_index);
500       return VCL_INVALID_SESSION_INDEX;
501     }
502   if (mp->retval)
503     {
504       VDBG (0, "ERROR: session index %u: connect failed! %U",
505             session_index, format_session_error, mp->retval);
506       session->session_state = VCL_STATE_DETACHED;
507       session->vpp_handle = mp->handle;
508       return session_index;
509     }
510
511   session->vpp_handle = mp->handle;
512
513   if (vcl_segment_attach_session (mp->segment_handle, mp->server_rx_fifo,
514                                   mp->server_tx_fifo,
515                                   mp->vpp_event_queue_address, 0, session))
516     {
517       VDBG (0, "failed to attach fifos for %u", session->session_index);
518       session->session_state = VCL_STATE_DETACHED;
519       vcl_send_session_disconnect (wrk, session);
520       return session_index;
521     }
522
523   if (mp->ct_rx_fifo)
524     {
525       if (vcl_segment_attach_session (mp->ct_segment_handle, mp->ct_rx_fifo,
526                                       mp->ct_tx_fifo, (uword) ~0, 1, session))
527         {
528           VDBG (0, "failed to attach ct fifos for %u", session->session_index);
529           session->session_state = VCL_STATE_DETACHED;
530           vcl_send_session_disconnect (wrk, session);
531           return session_index;
532         }
533     }
534
535   session->transport.is_ip4 = mp->lcl.is_ip4;
536   clib_memcpy_fast (&session->transport.lcl_ip, &mp->lcl.ip,
537                     sizeof (session->transport.lcl_ip));
538   session->transport.lcl_port = mp->lcl.port;
539
540   /* Application closed session before connect reply */
541   if (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK)
542       && session->session_state == VCL_STATE_CLOSED)
543     vcl_send_session_disconnect (wrk, session);
544   else
545     session->session_state = VCL_STATE_READY;
546
547   /* Add it to lookup table */
548   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
549
550   VDBG (1, "session %u [0x%llx] connected! rx_fifo %p, refcnt %d, tx_fifo %p,"
551         " refcnt %d", session_index, mp->handle, session->rx_fifo,
552         session->rx_fifo->refcnt, session->tx_fifo, session->tx_fifo->refcnt);
553
554   return session_index;
555 }
556
557 static int
558 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
559 {
560   vcl_session_msg_t *accepted_msg;
561   int i;
562
563   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
564     {
565       accepted_msg = &session->accept_evts_fifo[i];
566       if (accepted_msg->accepted_msg.handle == handle)
567         {
568           accepted_msg->flags |= flags;
569           return 1;
570         }
571     }
572   return 0;
573 }
574
575 static u32
576 vcl_session_reset_handler (vcl_worker_t * wrk,
577                            session_reset_msg_t * reset_msg)
578 {
579   vcl_session_t *session;
580   u32 sid;
581
582   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
583   session = vcl_session_get (wrk, sid);
584   if (!session)
585     {
586       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
587       return VCL_INVALID_SESSION_INDEX;
588     }
589
590   /* Caught a reset before actually accepting the session */
591   if (session->session_state == VCL_STATE_LISTEN)
592     {
593
594       if (!vcl_flag_accepted_session (session, reset_msg->handle,
595                                       VCL_ACCEPTED_F_RESET))
596         VDBG (0, "session was not accepted!");
597       return VCL_INVALID_SESSION_INDEX;
598     }
599
600   if (session->session_state != VCL_STATE_CLOSED)
601     session->session_state = VCL_STATE_DISCONNECT;
602   VDBG (0, "reset session %u [0x%llx]", sid, reset_msg->handle);
603   return sid;
604 }
605
606 static u32
607 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
608 {
609   vcl_session_t *session;
610   u32 sid = mp->context;
611
612   session = vcl_session_get (wrk, sid);
613   if (mp->retval)
614     {
615       VERR ("session %u [0x%llx]: bind failed: %U", sid, mp->handle,
616             format_session_error, mp->retval);
617       if (session)
618         {
619           session->session_state = VCL_STATE_DETACHED;
620           session->vpp_handle = mp->handle;
621           return sid;
622         }
623       else
624         {
625           VDBG (0, "ERROR: session %u [0x%llx]: Invalid session index!",
626                 sid, mp->handle);
627           return VCL_INVALID_SESSION_INDEX;
628         }
629     }
630
631   session->vpp_handle = mp->handle;
632   session->transport.is_ip4 = mp->lcl_is_ip4;
633   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
634                     sizeof (ip46_address_t));
635   session->transport.lcl_port = mp->lcl_port;
636   vcl_session_table_add_listener (wrk, mp->handle, sid);
637   session->session_state = VCL_STATE_LISTEN;
638
639   if (vcl_session_is_cl (session))
640     {
641       if (vcl_segment_attach_session (mp->segment_handle, mp->rx_fifo,
642                                       mp->tx_fifo, mp->vpp_evt_q, 0, session))
643         {
644           VDBG (0, "failed to attach fifos for %u", session->session_index);
645           session->session_state = VCL_STATE_DETACHED;
646           return VCL_INVALID_SESSION_INDEX;
647         }
648     }
649
650   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
651   return sid;
652 }
653
654 static void
655 vcl_session_unlisten_reply_handler (vcl_worker_t * wrk, void *data)
656 {
657   session_unlisten_reply_msg_t *mp = (session_unlisten_reply_msg_t *) data;
658   vcl_session_t *s;
659
660   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
661   if (!s)
662     {
663       VDBG (0, "Unlisten reply with wrong handle %llx", mp->handle);
664       return;
665     }
666   if (s->session_state != VCL_STATE_DISCONNECT)
667     {
668       /* Connected udp listener */
669       if (s->session_type == VPPCOM_PROTO_UDP
670           && s->session_state == VCL_STATE_CLOSED)
671         return;
672
673       VDBG (0, "Unlisten session in wrong state %llx", mp->handle);
674       return;
675     }
676
677   if (mp->retval)
678     VDBG (0, "ERROR: session %u [0xllx]: unlisten failed: %U",
679           s->session_index, mp->handle, format_session_error, mp->retval);
680
681   if (mp->context != wrk->wrk_index)
682     VDBG (0, "wrong context");
683
684   vcl_session_table_del_vpp_handle (wrk, mp->handle);
685   vcl_session_free (wrk, s);
686 }
687
688 static void
689 vcl_session_migrated_handler (vcl_worker_t * wrk, void *data)
690 {
691   session_migrated_msg_t *mp = (session_migrated_msg_t *) data;
692   vcl_session_t *s;
693   u32 fs_index;
694
695   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
696   if (!s)
697     {
698       VDBG (0, "Migrated notification with wrong handle %llx", mp->handle);
699       return;
700     }
701
702   /* Only validate if a value is provided */
703   if (mp->segment_handle != SESSION_INVALID_HANDLE)
704     {
705       fs_index = vcl_segment_table_lookup (mp->segment_handle);
706       if (fs_index == VCL_INVALID_SEGMENT_INDEX)
707         {
708           VDBG (0, "segment %lx for session %u is not mounted!",
709                 mp->segment_handle, s->session_index);
710           s->session_state = VCL_STATE_DETACHED;
711           return;
712         }
713     }
714
715   s->vpp_handle = mp->new_handle;
716
717   vcl_segment_attach_mq (vcl_vpp_worker_segment_handle (0), mp->vpp_evt_q,
718                          mp->vpp_thread_index, &s->vpp_evt_q);
719
720   vcl_session_table_del_vpp_handle (wrk, mp->handle);
721   vcl_session_table_add_vpp_handle (wrk, mp->new_handle, s->session_index);
722
723   /* Generate new tx event if we have outstanding data */
724   if (svm_fifo_has_event (s->tx_fifo))
725     app_send_io_evt_to_vpp (s->vpp_evt_q,
726                             s->tx_fifo->shr->master_session_index,
727                             SESSION_IO_EVT_TX, SVM_Q_WAIT);
728
729   VDBG (0, "Migrated 0x%lx to thread %u 0x%lx", mp->handle,
730         mp->vpp_thread_index, mp->new_handle);
731 }
732
733 static vcl_session_t *
734 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
735 {
736   vcl_session_msg_t *vcl_msg;
737   vcl_session_t *session;
738
739   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
740   if (PREDICT_FALSE (session != 0))
741     VWRN ("session overlap handle %lu state %u!", msg->handle,
742           session->session_state);
743
744   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
745   if (!session)
746     {
747       VERR ("couldn't find listen session: listener handle %llx",
748             msg->listener_handle);
749       return 0;
750     }
751
752   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
753   vcl_msg->flags = 0;
754   vcl_msg->accepted_msg = *msg;
755   /* Session handle points to listener until fully accepted by app */
756   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
757
758   return session;
759 }
760
761 static vcl_session_t *
762 vcl_session_disconnected_handler (vcl_worker_t * wrk,
763                                   session_disconnected_msg_t * msg)
764 {
765   vcl_session_t *session;
766
767   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
768   if (!session)
769     {
770       VDBG (0, "request to disconnect unknown handle 0x%llx", msg->handle);
771       return 0;
772     }
773
774   /* Late disconnect notification on a session that has been closed */
775   if (session->session_state == VCL_STATE_CLOSED)
776     return 0;
777
778   /* Caught a disconnect before actually accepting the session */
779   if (session->session_state == VCL_STATE_LISTEN)
780     {
781       if (!vcl_flag_accepted_session (session, msg->handle,
782                                       VCL_ACCEPTED_F_CLOSED))
783         VDBG (0, "session was not accepted!");
784       return 0;
785     }
786
787   /* If not already reset change state */
788   if (session->session_state != VCL_STATE_DISCONNECT)
789     session->session_state = VCL_STATE_VPP_CLOSING;
790
791   return session;
792 }
793
794 static int
795 vppcom_session_disconnect (u32 session_handle)
796 {
797   vcl_worker_t *wrk = vcl_worker_get_current ();
798   vcl_session_t *session, *listen_session;
799   vcl_session_state_t state;
800   u64 vpp_handle;
801
802   session = vcl_session_get_w_handle (wrk, session_handle);
803   if (!session)
804     return VPPCOM_EBADFD;
805
806   vpp_handle = session->vpp_handle;
807   state = session->session_state;
808
809   VDBG (1, "session %u [0x%llx] state 0x%x (%s)", session->session_index,
810         vpp_handle, state, vppcom_session_state_str (state));
811
812   if (PREDICT_FALSE (state == VCL_STATE_LISTEN))
813     {
814       VDBG (0, "ERROR: Cannot disconnect a listen socket!");
815       return VPPCOM_EBADFD;
816     }
817
818   if (state == VCL_STATE_VPP_CLOSING)
819     {
820       vcl_send_session_disconnected_reply (wrk, session, 0);
821       VDBG (1, "session %u [0x%llx]: sending disconnect REPLY...",
822             session->session_index, vpp_handle);
823     }
824   else
825     {
826       /* Session doesn't have an event queue yet. Probably a non-blocking
827        * connect. Wait for the reply */
828       if (PREDICT_FALSE (!session->vpp_evt_q))
829         return VPPCOM_OK;
830
831       VDBG (1, "session %u [0x%llx]: sending disconnect...",
832             session->session_index, vpp_handle);
833       vcl_send_session_disconnect (wrk, session);
834     }
835
836   if (session->listener_index != VCL_INVALID_SESSION_INDEX)
837     {
838       listen_session = vcl_session_get (wrk, session->listener_index);
839       listen_session->n_accepted_sessions--;
840     }
841
842   return VPPCOM_OK;
843 }
844
845 static void
846 vcl_session_cleanup_handler (vcl_worker_t * wrk, void *data)
847 {
848   session_cleanup_msg_t *msg;
849   vcl_session_t *session;
850
851   msg = (session_cleanup_msg_t *) data;
852   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
853   if (!session)
854     {
855       VDBG (0, "disconnect confirmed for unknown handle 0x%llx", msg->handle);
856       return;
857     }
858
859   if (msg->type == SESSION_CLEANUP_TRANSPORT)
860     {
861       /* Transport was cleaned up before we confirmed close. Probably the
862        * app is still waiting for some data that cannot be delivered.
863        * Confirm close to make sure everything is cleaned up.
864        * Move to undetermined state to ensure that the session is not
865        * removed before both vpp and the app cleanup.
866        * - If the app closes first, the session is moved to CLOSED state
867        *   and the session cleanup notification from vpp removes the
868        *   session.
869        * - If vpp cleans up the session first, the session is moved to
870        *   DETACHED state lower and subsequently the close from the app
871        *   frees the session
872        */
873       if (session->session_state == VCL_STATE_VPP_CLOSING)
874         {
875           vppcom_session_disconnect (vcl_session_handle (session));
876           session->session_state = VCL_STATE_UPDATED;
877         }
878       else if (session->session_state == VCL_STATE_DISCONNECT)
879         {
880           vcl_send_session_reset_reply (wrk, session, 0);
881           session->session_state = VCL_STATE_UPDATED;
882         }
883       return;
884     }
885
886   vcl_session_table_del_vpp_handle (wrk, msg->handle);
887   /* Should not happen. App did not close the connection so don't free it. */
888   if (session->session_state != VCL_STATE_CLOSED)
889     {
890       VDBG (0, "app did not close session %d", session->session_index);
891       session->session_state = VCL_STATE_DETACHED;
892       session->vpp_handle = VCL_INVALID_SESSION_HANDLE;
893       return;
894     }
895   vcl_session_free (wrk, session);
896 }
897
898 static void
899 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
900 {
901   session_req_worker_update_msg_t *msg;
902   vcl_session_t *s;
903
904   msg = (session_req_worker_update_msg_t *) data;
905   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
906   if (!s)
907     return;
908
909   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
910 }
911
912 static void
913 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
914 {
915   session_worker_update_reply_msg_t *msg;
916   vcl_session_t *s;
917
918   msg = (session_worker_update_reply_msg_t *) data;
919   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
920   if (!s)
921     {
922       VDBG (0, "unknown handle 0x%llx", msg->handle);
923       return;
924     }
925
926   if (s->rx_fifo)
927     {
928       if (vcl_segment_attach_session (msg->segment_handle, msg->rx_fifo,
929                                       msg->tx_fifo, (uword) ~0, 0, s))
930         {
931           VDBG (0, "failed to attach fifos for %u", s->session_index);
932           return;
933         }
934     }
935   s->session_state = VCL_STATE_UPDATED;
936
937   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
938         s->vpp_handle, wrk->wrk_index);
939 }
940
941 static int
942 vcl_api_recv_fd (vcl_worker_t * wrk, int *fds, int n_fds)
943 {
944
945   if (vcm->cfg.vpp_app_socket_api)
946     return vcl_sapi_recv_fds (wrk, fds, n_fds);
947
948   return vcl_bapi_recv_fds (wrk, fds, n_fds);
949 }
950
951 static void
952 vcl_session_app_add_segment_handler (vcl_worker_t * wrk, void *data)
953 {
954   ssvm_segment_type_t seg_type = SSVM_SEGMENT_SHM;
955   session_app_add_segment_msg_t *msg;
956   u64 segment_handle;
957   int fd = -1;
958
959   msg = (session_app_add_segment_msg_t *) data;
960
961   if (msg->fd_flags)
962     {
963       vcl_api_recv_fd (wrk, &fd, 1);
964       seg_type = SSVM_SEGMENT_MEMFD;
965     }
966
967   segment_handle = msg->segment_handle;
968   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
969     {
970       clib_warning ("invalid segment handle");
971       return;
972     }
973
974   if (vcl_segment_attach (segment_handle, (char *) msg->segment_name,
975                           seg_type, fd))
976     {
977       VDBG (0, "vcl_segment_attach ('%s') failed", msg->segment_name);
978       return;
979     }
980
981   VDBG (1, "mapped new segment '%s' size %d", msg->segment_name,
982         msg->segment_size);
983 }
984
985 static void
986 vcl_session_app_del_segment_handler (vcl_worker_t * wrk, void *data)
987 {
988   session_app_del_segment_msg_t *msg = (session_app_del_segment_msg_t *) data;
989   vcl_segment_detach (msg->segment_handle);
990   VDBG (1, "Unmapped segment: %d", msg->segment_handle);
991 }
992
993 static void
994 vcl_worker_rpc_handler (vcl_worker_t * wrk, void *data)
995 {
996   if (!vcm->wrk_rpc_fn)
997     return;
998
999   (vcm->wrk_rpc_fn) (((session_app_wrk_rpc_msg_t *) data)->data);
1000 }
1001
1002 static void
1003 vcl_session_transport_attr_reply_handler (vcl_worker_t *wrk, void *data)
1004 {
1005   session_transport_attr_reply_msg_t *mp;
1006
1007   if (!wrk->session_attr_op)
1008     return;
1009
1010   mp = (session_transport_attr_reply_msg_t *) data;
1011
1012   wrk->session_attr_op_rv = mp->retval;
1013   wrk->session_attr_op = 0;
1014   wrk->session_attr_rv = mp->attr;
1015 }
1016
1017 static int
1018 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
1019 {
1020   session_disconnected_msg_t *disconnected_msg;
1021   session_connected_msg_t *connected_msg;
1022   session_reset_msg_t *reset_msg;
1023   session_event_t *ecpy;
1024   vcl_session_t *s;
1025   u32 sid;
1026
1027   switch (e->event_type)
1028     {
1029     case SESSION_IO_EVT_RX:
1030     case SESSION_IO_EVT_TX:
1031       s = vcl_session_get (wrk, e->session_index);
1032       if (!s || !vcl_session_is_open (s))
1033         break;
1034       vec_add1 (wrk->unhandled_evts_vector, *e);
1035       break;
1036     case SESSION_CTRL_EVT_BOUND:
1037       /* We can only wait for only one listen so not postponed */
1038       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
1039       break;
1040     case SESSION_CTRL_EVT_ACCEPTED:
1041       s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
1042       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1043         {
1044           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1045           *ecpy = *e;
1046           ecpy->postponed = 1;
1047           ecpy->session_index = s->session_index;
1048         }
1049       break;
1050     case SESSION_CTRL_EVT_CONNECTED:
1051       connected_msg = (session_connected_msg_t *) e->data;
1052       sid = vcl_session_connected_handler (wrk, connected_msg);
1053       if (!(s = vcl_session_get (wrk, sid)))
1054         break;
1055       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1056         {
1057           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1058           *ecpy = *e;
1059           ecpy->postponed = 1;
1060           ecpy->session_index = s->session_index;
1061         }
1062       break;
1063     case SESSION_CTRL_EVT_DISCONNECTED:
1064       disconnected_msg = (session_disconnected_msg_t *) e->data;
1065       if (!(s = vcl_session_get_w_vpp_handle (wrk, disconnected_msg->handle)))
1066         break;
1067       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1068         {
1069           vec_add1 (wrk->unhandled_evts_vector, *e);
1070           break;
1071         }
1072       if (!(s = vcl_session_disconnected_handler (wrk, disconnected_msg)))
1073         break;
1074       VDBG (0, "disconnected session %u [0x%llx]", s->session_index,
1075             s->vpp_handle);
1076       break;
1077     case SESSION_CTRL_EVT_RESET:
1078       reset_msg = (session_reset_msg_t *) e->data;
1079       if (!(s = vcl_session_get_w_vpp_handle (wrk, reset_msg->handle)))
1080         break;
1081       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1082         {
1083           vec_add1 (wrk->unhandled_evts_vector, *e);
1084           break;
1085         }
1086       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
1087       break;
1088     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
1089       vcl_session_unlisten_reply_handler (wrk, e->data);
1090       break;
1091     case SESSION_CTRL_EVT_MIGRATED:
1092       vcl_session_migrated_handler (wrk, e->data);
1093       break;
1094     case SESSION_CTRL_EVT_CLEANUP:
1095       vcl_session_cleanup_handler (wrk, e->data);
1096       break;
1097     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
1098       vcl_session_req_worker_update_handler (wrk, e->data);
1099       break;
1100     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
1101       vcl_session_worker_update_reply_handler (wrk, e->data);
1102       break;
1103     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
1104       vcl_session_app_add_segment_handler (wrk, e->data);
1105       break;
1106     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
1107       vcl_session_app_del_segment_handler (wrk, e->data);
1108       break;
1109     case SESSION_CTRL_EVT_APP_WRK_RPC:
1110       vcl_worker_rpc_handler (wrk, e->data);
1111       break;
1112     case SESSION_CTRL_EVT_TRANSPORT_ATTR_REPLY:
1113       vcl_session_transport_attr_reply_handler (wrk, e->data);
1114       break;
1115     default:
1116       clib_warning ("unhandled %u", e->event_type);
1117     }
1118   return VPPCOM_OK;
1119 }
1120
1121 static int
1122 vppcom_wait_for_session_state_change (u32 session_index,
1123                                       vcl_session_state_t state,
1124                                       f64 wait_for_time)
1125 {
1126   vcl_worker_t *wrk = vcl_worker_get_current ();
1127   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
1128   vcl_session_t *volatile session;
1129   svm_msg_q_msg_t msg;
1130   session_event_t *e;
1131
1132   do
1133     {
1134       session = vcl_session_get (wrk, session_index);
1135       if (PREDICT_FALSE (!session))
1136         {
1137           return VPPCOM_EBADFD;
1138         }
1139       if (session->session_state == state)
1140         {
1141           return VPPCOM_OK;
1142         }
1143       if (session->session_state == VCL_STATE_DETACHED)
1144         {
1145           return VPPCOM_ECONNREFUSED;
1146         }
1147
1148       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
1149         {
1150           usleep (100);
1151           continue;
1152         }
1153       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1154       vcl_handle_mq_event (wrk, e);
1155       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1156     }
1157   while (clib_time_now (&wrk->clib_time) < timeout);
1158
1159   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
1160         vppcom_session_state_str (state));
1161   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
1162
1163   return VPPCOM_ETIMEDOUT;
1164 }
1165
1166 static void
1167 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
1168 {
1169   vcl_session_state_t state;
1170   vcl_session_t *s;
1171   u32 *sip;
1172
1173   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
1174     return;
1175
1176   vec_foreach (sip, wrk->pending_session_wrk_updates)
1177   {
1178     s = vcl_session_get (wrk, *sip);
1179     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
1180     state = s->session_state;
1181     vppcom_wait_for_session_state_change (s->session_index, VCL_STATE_UPDATED,
1182                                           5);
1183     s->session_state = state;
1184   }
1185   vec_reset_length (wrk->pending_session_wrk_updates);
1186 }
1187
1188 void
1189 vcl_worker_flush_mq_events (vcl_worker_t *wrk)
1190 {
1191   svm_msg_q_msg_t *msg;
1192   session_event_t *e;
1193   svm_msg_q_t *mq;
1194   int i;
1195
1196   mq = wrk->app_event_queue;
1197   vcl_mq_dequeue_batch (wrk, mq, ~0);
1198
1199   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
1200     {
1201       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
1202       e = svm_msg_q_msg_data (mq, msg);
1203       vcl_handle_mq_event (wrk, e);
1204       svm_msg_q_free_msg (mq, msg);
1205     }
1206   vec_reset_length (wrk->mq_msg_vector);
1207   vcl_handle_pending_wrk_updates (wrk);
1208 }
1209
1210 void
1211 vcl_flush_mq_events (void)
1212 {
1213   vcl_worker_flush_mq_events (vcl_worker_get_current ());
1214 }
1215
1216 static int
1217 vppcom_session_unbind (u32 session_handle)
1218 {
1219   vcl_worker_t *wrk = vcl_worker_get_current ();
1220   session_accepted_msg_t *accepted_msg;
1221   vcl_session_t *session = 0;
1222   vcl_session_msg_t *evt;
1223
1224   session = vcl_session_get_w_handle (wrk, session_handle);
1225   if (!session)
1226     return VPPCOM_EBADFD;
1227
1228   /* Flush pending accept events, if any */
1229   while (clib_fifo_elts (session->accept_evts_fifo))
1230     {
1231       clib_fifo_sub2 (session->accept_evts_fifo, evt);
1232       accepted_msg = &evt->accepted_msg;
1233       vcl_session_table_del_vpp_handle (wrk, accepted_msg->handle);
1234       vcl_send_session_accepted_reply (session->vpp_evt_q,
1235                                        accepted_msg->context,
1236                                        accepted_msg->handle, -1);
1237     }
1238   clib_fifo_free (session->accept_evts_fifo);
1239
1240   vcl_send_session_unlisten (wrk, session);
1241
1242   VDBG (1, "session %u [0x%llx]: sending unbind!", session->session_index,
1243         session->vpp_handle);
1244   vcl_evt (VCL_EVT_UNBIND, session);
1245
1246   session->vpp_handle = ~0;
1247   session->session_state = VCL_STATE_DISCONNECT;
1248
1249   return VPPCOM_OK;
1250 }
1251
1252 /**
1253  * Handle app exit
1254  *
1255  * Notify vpp of the disconnect and mark the worker as free. If we're the
1256  * last worker, do a full cleanup otherwise, since we're probably a forked
1257  * child, avoid syscalls as much as possible. We might've lost privileges.
1258  */
1259 void
1260 vppcom_app_exit (void)
1261 {
1262   if (!pool_elts (vcm->workers))
1263     return;
1264   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1265   vcl_set_worker_index (~0);
1266   vcl_elog_stop (vcm);
1267 }
1268
1269 static int
1270 vcl_api_attach (void)
1271 {
1272   if (vcm->cfg.vpp_app_socket_api)
1273     return vcl_sapi_attach ();
1274
1275   return vcl_bapi_attach ();
1276 }
1277
1278 static void
1279 vcl_api_detach (vcl_worker_t * wrk)
1280 {
1281   vcl_send_app_detach (wrk);
1282
1283   if (vcm->cfg.vpp_app_socket_api)
1284     return vcl_sapi_detach (wrk);
1285
1286   return vcl_bapi_disconnect_from_vpp ();
1287 }
1288
1289 /*
1290  * VPPCOM Public API functions
1291  */
1292 int
1293 vppcom_app_create (const char *app_name)
1294 {
1295   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
1296   int rv;
1297
1298   if (vcm->is_init)
1299     {
1300       VDBG (1, "already initialized");
1301       return VPPCOM_EEXIST;
1302     }
1303
1304   vcm->is_init = 1;
1305   vppcom_cfg (&vcm->cfg);
1306   vcl_cfg = &vcm->cfg;
1307
1308   vcm->main_cpu = pthread_self ();
1309   vcm->main_pid = getpid ();
1310   vcm->app_name = format (0, "%s", app_name);
1311   fifo_segment_main_init (&vcm->segment_main, vcl_cfg->segment_baseva,
1312                           20 /* timeout in secs */ );
1313   pool_alloc (vcm->workers, vcl_cfg->max_workers);
1314   clib_spinlock_init (&vcm->workers_lock);
1315   clib_rwlock_init (&vcm->segment_table_lock);
1316   atexit (vppcom_app_exit);
1317   vcl_elog_init (vcm);
1318
1319   /* Allocate default worker */
1320   vcl_worker_alloc_and_init ();
1321
1322   if ((rv = vcl_api_attach ()))
1323     return rv;
1324
1325   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
1326         vcm->workers[0].api_client_handle, vcm->workers[0].api_client_handle);
1327
1328   return VPPCOM_OK;
1329 }
1330
1331 void
1332 vppcom_app_destroy (void)
1333 {
1334   vcl_worker_t *wrk, *current_wrk;
1335   void *heap;
1336
1337   if (!pool_elts (vcm->workers))
1338     return;
1339
1340   vcl_evt (VCL_EVT_DETACH, vcm);
1341
1342   current_wrk = vcl_worker_get_current ();
1343
1344   /* *INDENT-OFF* */
1345   pool_foreach (wrk, vcm->workers)  {
1346     if (current_wrk != wrk)
1347       vcl_worker_cleanup (wrk, 0 /* notify vpp */ );
1348   }
1349   /* *INDENT-ON* */
1350
1351   vcl_api_detach (current_wrk);
1352   vcl_worker_cleanup (current_wrk, 0 /* notify vpp */ );
1353
1354   vcl_elog_stop (vcm);
1355
1356   /*
1357    * Free the heap and fix vcm
1358    */
1359   heap = clib_mem_get_heap ();
1360   munmap (clib_mem_get_heap_base (heap), clib_mem_get_heap_size (heap));
1361
1362   vcm = &_vppcom_main;
1363   vcm->is_init = 0;
1364 }
1365
1366 int
1367 vppcom_session_create (u8 proto, u8 is_nonblocking)
1368 {
1369   vcl_worker_t *wrk = vcl_worker_get_current ();
1370   vcl_session_t *session;
1371
1372   session = vcl_session_alloc (wrk);
1373
1374   session->session_type = proto;
1375   session->session_state = VCL_STATE_CLOSED;
1376   session->vpp_handle = ~0;
1377   session->ckpair_index = ~0;
1378   session->is_dgram = vcl_proto_is_dgram (proto);
1379
1380   if (is_nonblocking)
1381     vcl_session_set_attr (session, VCL_SESS_ATTR_NONBLOCK);
1382
1383   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1384            is_nonblocking, session_index);
1385
1386   VDBG (0, "created session %u", session->session_index);
1387
1388   return vcl_session_handle (session);
1389 }
1390
1391 int
1392 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * s,
1393                      vcl_session_handle_t sh, u8 do_disconnect)
1394 {
1395   int rv = VPPCOM_OK;
1396
1397   VDBG (1, "session %u [0x%llx] closing", s->session_index, s->vpp_handle);
1398
1399   if (s->flags & VCL_SESSION_F_IS_VEP)
1400     {
1401       u32 next_sh = s->vep.next_sh;
1402       while (next_sh != ~0)
1403         {
1404           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1405           if (PREDICT_FALSE (rv < 0))
1406             VDBG (0, "vpp handle 0x%llx, sh %u: EPOLL_CTL_DEL vep_idx %u"
1407                   " failed! rv %d (%s)", s->vpp_handle, next_sh,
1408                   s->vep.vep_sh, rv, vppcom_retval_str (rv));
1409           next_sh = s->vep.next_sh;
1410         }
1411       goto free_session;
1412     }
1413
1414   if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
1415     {
1416       rv = vppcom_epoll_ctl (s->vep.vep_sh, EPOLL_CTL_DEL, sh, 0);
1417       if (rv < 0)
1418         VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1419               "failed! rv %d (%s)", s->session_index, s->vpp_handle,
1420               s->vep.vep_sh, rv, vppcom_retval_str (rv));
1421     }
1422
1423   if (!do_disconnect)
1424     {
1425       VDBG (1, "session %u [0x%llx] disconnect skipped",
1426             s->session_index, s->vpp_handle);
1427       goto cleanup;
1428     }
1429
1430   if (s->session_state == VCL_STATE_LISTEN)
1431     {
1432       rv = vppcom_session_unbind (sh);
1433       if (PREDICT_FALSE (rv < 0))
1434         VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1435               "rv %d (%s)", s->session_index, s->vpp_handle, rv,
1436               vppcom_retval_str (rv));
1437       return rv;
1438     }
1439   else if (vcl_session_is_ready (s)
1440            || (vcl_session_is_connectable_listener (wrk, s)))
1441     {
1442       rv = vppcom_session_disconnect (sh);
1443       if (PREDICT_FALSE (rv < 0))
1444         VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1445               " rv %d (%s)", s->session_index, s->vpp_handle,
1446               rv, vppcom_retval_str (rv));
1447     }
1448   else if (s->session_state == VCL_STATE_DISCONNECT)
1449     {
1450       vcl_send_session_reset_reply (wrk, s, 0);
1451     }
1452   else if (s->session_state == VCL_STATE_DETACHED)
1453     {
1454       /* Should not happen. VPP cleaned up before app confirmed close */
1455       VDBG (0, "vpp freed session %d before close", s->session_index);
1456       goto free_session;
1457     }
1458
1459   s->session_state = VCL_STATE_CLOSED;
1460
1461   /* Session is removed only after vpp confirms the disconnect */
1462   return rv;
1463
1464 cleanup:
1465   vcl_session_table_del_vpp_handle (wrk, s->vpp_handle);
1466 free_session:
1467   vcl_session_free (wrk, s);
1468   vcl_evt (VCL_EVT_CLOSE, s, rv);
1469
1470   return rv;
1471 }
1472
1473 int
1474 vppcom_session_close (uint32_t session_handle)
1475 {
1476   vcl_worker_t *wrk = vcl_worker_get_current ();
1477   vcl_session_t *session;
1478
1479   session = vcl_session_get_w_handle (wrk, session_handle);
1480   if (!session)
1481     return VPPCOM_EBADFD;
1482   return vcl_session_cleanup (wrk, session, session_handle,
1483                               1 /* do_disconnect */ );
1484 }
1485
1486 int
1487 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1488 {
1489   vcl_worker_t *wrk = vcl_worker_get_current ();
1490   vcl_session_t *session = 0;
1491
1492   if (!ep || !ep->ip)
1493     return VPPCOM_EINVAL;
1494
1495   session = vcl_session_get_w_handle (wrk, session_handle);
1496   if (!session)
1497     return VPPCOM_EBADFD;
1498
1499   if (session->flags & VCL_SESSION_F_IS_VEP)
1500     {
1501       VDBG (0, "ERROR: cannot bind to epoll session %u!",
1502             session->session_index);
1503       return VPPCOM_EBADFD;
1504     }
1505
1506   session->transport.is_ip4 = ep->is_ip4;
1507   if (ep->is_ip4)
1508     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1509                       sizeof (ip4_address_t));
1510   else
1511     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1512                       sizeof (ip6_address_t));
1513   session->transport.lcl_port = ep->port;
1514
1515   VDBG (0, "session %u handle %u: binding to local %s address %U port %u, "
1516         "proto %s", session->session_index, session_handle,
1517         session->transport.is_ip4 ? "IPv4" : "IPv6",
1518         format_ip46_address, &session->transport.lcl_ip,
1519         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1520         clib_net_to_host_u16 (session->transport.lcl_port),
1521         vppcom_proto_str (session->session_type));
1522   vcl_evt (VCL_EVT_BIND, session);
1523
1524   if (session->session_type == VPPCOM_PROTO_UDP)
1525     vppcom_session_listen (session_handle, 10);
1526
1527   return VPPCOM_OK;
1528 }
1529
1530 int
1531 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1532 {
1533   vcl_worker_t *wrk = vcl_worker_get_current ();
1534   vcl_session_t *listen_session = 0;
1535   u64 listen_vpp_handle;
1536   int rv;
1537
1538   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1539   if (!listen_session || (listen_session->flags & VCL_SESSION_F_IS_VEP))
1540     return VPPCOM_EBADFD;
1541
1542   if (q_len == 0 || q_len == ~0)
1543     q_len = vcm->cfg.listen_queue_size;
1544
1545   listen_vpp_handle = listen_session->vpp_handle;
1546   if (listen_session->session_state == VCL_STATE_LISTEN)
1547     {
1548       VDBG (0, "session %u [0x%llx]: already in listen state!",
1549             listen_sh, listen_vpp_handle);
1550       return VPPCOM_OK;
1551     }
1552
1553   VDBG (0, "session %u: sending vpp listen request...", listen_sh);
1554
1555   /*
1556    * Send listen request to vpp and wait for reply
1557    */
1558   vcl_send_session_listen (wrk, listen_session);
1559   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1560                                              VCL_STATE_LISTEN,
1561                                              vcm->cfg.session_timeout);
1562
1563   if (PREDICT_FALSE (rv))
1564     {
1565       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1566       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1567             listen_sh, listen_session->vpp_handle, rv,
1568             vppcom_retval_str (rv));
1569       return rv;
1570     }
1571
1572   return VPPCOM_OK;
1573 }
1574
1575 static int
1576 validate_args_session_accept_ (vcl_worker_t * wrk, vcl_session_t * ls)
1577 {
1578   if (ls->flags & VCL_SESSION_F_IS_VEP)
1579     {
1580       VDBG (0, "ERROR: cannot accept on epoll session %u!",
1581             ls->session_index);
1582       return VPPCOM_EBADFD;
1583     }
1584
1585   if ((ls->session_state != VCL_STATE_LISTEN)
1586       && (!vcl_session_is_connectable_listener (wrk, ls)))
1587     {
1588       VDBG (0, "ERROR: session [0x%llx]: not in listen state! state 0x%x"
1589             " (%s)", ls->vpp_handle, ls->session_state,
1590             vppcom_session_state_str (ls->session_state));
1591       return VPPCOM_EBADFD;
1592     }
1593   return VPPCOM_OK;
1594 }
1595
1596 int
1597 vppcom_unformat_proto (uint8_t * proto, char *proto_str)
1598 {
1599   if (!strcmp (proto_str, "TCP"))
1600     *proto = VPPCOM_PROTO_TCP;
1601   else if (!strcmp (proto_str, "tcp"))
1602     *proto = VPPCOM_PROTO_TCP;
1603   else if (!strcmp (proto_str, "UDP"))
1604     *proto = VPPCOM_PROTO_UDP;
1605   else if (!strcmp (proto_str, "udp"))
1606     *proto = VPPCOM_PROTO_UDP;
1607   else if (!strcmp (proto_str, "TLS"))
1608     *proto = VPPCOM_PROTO_TLS;
1609   else if (!strcmp (proto_str, "tls"))
1610     *proto = VPPCOM_PROTO_TLS;
1611   else if (!strcmp (proto_str, "QUIC"))
1612     *proto = VPPCOM_PROTO_QUIC;
1613   else if (!strcmp (proto_str, "quic"))
1614     *proto = VPPCOM_PROTO_QUIC;
1615   else if (!strcmp (proto_str, "DTLS"))
1616     *proto = VPPCOM_PROTO_DTLS;
1617   else if (!strcmp (proto_str, "dtls"))
1618     *proto = VPPCOM_PROTO_DTLS;
1619   else
1620     return 1;
1621   return 0;
1622 }
1623
1624 int
1625 vppcom_session_accept (uint32_t listen_session_handle, vppcom_endpt_t * ep,
1626                        uint32_t flags)
1627 {
1628   u32 client_session_index = ~0, listen_session_index, accept_flags = 0;
1629   vcl_worker_t *wrk = vcl_worker_get_current ();
1630   session_accepted_msg_t accepted_msg;
1631   vcl_session_t *listen_session = 0;
1632   vcl_session_t *client_session = 0;
1633   vcl_session_msg_t *evt;
1634   u8 is_nonblocking;
1635   int rv;
1636
1637 again:
1638
1639   listen_session = vcl_session_get_w_handle (wrk, listen_session_handle);
1640   if (!listen_session)
1641     return VPPCOM_EBADFD;
1642
1643   listen_session_index = listen_session->session_index;
1644   if ((rv = validate_args_session_accept_ (wrk, listen_session)))
1645     return rv;
1646
1647   if (clib_fifo_elts (listen_session->accept_evts_fifo))
1648     {
1649       clib_fifo_sub2 (listen_session->accept_evts_fifo, evt);
1650       accept_flags = evt->flags;
1651       accepted_msg = evt->accepted_msg;
1652       goto handle;
1653     }
1654
1655   is_nonblocking = vcl_session_has_attr (listen_session,
1656                                          VCL_SESS_ATTR_NONBLOCK);
1657   while (1)
1658     {
1659       if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1660         return VPPCOM_EAGAIN;
1661
1662       svm_msg_q_wait (wrk->app_event_queue, SVM_MQ_WAIT_EMPTY);
1663       vcl_worker_flush_mq_events (wrk);
1664       goto again;
1665     }
1666
1667 handle:
1668
1669   client_session_index = vcl_session_accepted_handler (wrk, &accepted_msg,
1670                                                        listen_session_index);
1671   if (client_session_index == VCL_INVALID_SESSION_INDEX)
1672     return VPPCOM_ECONNABORTED;
1673
1674   listen_session = vcl_session_get (wrk, listen_session_index);
1675   client_session = vcl_session_get (wrk, client_session_index);
1676
1677   if (flags & O_NONBLOCK)
1678     vcl_session_set_attr (client_session, VCL_SESS_ATTR_NONBLOCK);
1679
1680   VDBG (1, "listener %u [0x%llx]: Got a connect request! session %u [0x%llx],"
1681         " flags %d, is_nonblocking %u", listen_session->session_index,
1682         listen_session->vpp_handle, client_session_index,
1683         client_session->vpp_handle, flags,
1684         vcl_session_has_attr (client_session, VCL_SESS_ATTR_NONBLOCK));
1685
1686   if (ep)
1687     {
1688       ep->is_ip4 = client_session->transport.is_ip4;
1689       ep->port = client_session->transport.rmt_port;
1690       if (client_session->transport.is_ip4)
1691         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1692                           sizeof (ip4_address_t));
1693       else
1694         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1695                           sizeof (ip6_address_t));
1696     }
1697
1698   VDBG (0, "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1699         "local: %U:%u", listen_session_handle, listen_session->vpp_handle,
1700         client_session_index, client_session->vpp_handle,
1701         format_ip46_address, &client_session->transport.rmt_ip,
1702         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1703         clib_net_to_host_u16 (client_session->transport.rmt_port),
1704         format_ip46_address, &client_session->transport.lcl_ip,
1705         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1706         clib_net_to_host_u16 (client_session->transport.lcl_port));
1707   vcl_evt (VCL_EVT_ACCEPT, client_session, listen_session,
1708            client_session_index);
1709
1710   /*
1711    * Session might have been closed already
1712    */
1713   if (accept_flags)
1714     {
1715       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1716         client_session->session_state = VCL_STATE_VPP_CLOSING;
1717       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1718         client_session->session_state = VCL_STATE_DISCONNECT;
1719     }
1720   return vcl_session_handle (client_session);
1721 }
1722
1723 int
1724 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1725 {
1726   vcl_worker_t *wrk = vcl_worker_get_current ();
1727   vcl_session_t *session = 0;
1728   u32 session_index;
1729   int rv;
1730
1731   session = vcl_session_get_w_handle (wrk, session_handle);
1732   if (!session)
1733     return VPPCOM_EBADFD;
1734   session_index = session->session_index;
1735
1736   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
1737     {
1738       VDBG (0, "ERROR: cannot connect epoll session %u!",
1739             session->session_index);
1740       return VPPCOM_EBADFD;
1741     }
1742
1743   if (PREDICT_FALSE (vcl_session_is_ready (session)))
1744     {
1745       VDBG (0, "session handle %u [0x%llx]: session already "
1746             "connected to %s %U port %d proto %s, state 0x%x (%s)",
1747             session_handle, session->vpp_handle,
1748             session->transport.is_ip4 ? "IPv4" : "IPv6", format_ip46_address,
1749             &session->transport.rmt_ip, session->transport.is_ip4 ?
1750             IP46_TYPE_IP4 : IP46_TYPE_IP6,
1751             clib_net_to_host_u16 (session->transport.rmt_port),
1752             vppcom_proto_str (session->session_type), session->session_state,
1753             vppcom_session_state_str (session->session_state));
1754       return VPPCOM_OK;
1755     }
1756
1757   /* Attempt to connect a connectionless listener */
1758   if (PREDICT_FALSE (session->session_state == VCL_STATE_LISTEN))
1759     {
1760       if (session->session_type != VPPCOM_PROTO_UDP)
1761         return VPPCOM_EINVAL;
1762       vcl_send_session_unlisten (wrk, session);
1763       session->session_state = VCL_STATE_CLOSED;
1764     }
1765
1766   session->transport.is_ip4 = server_ep->is_ip4;
1767   vcl_ip_copy_from_ep (&session->transport.rmt_ip, server_ep);
1768   session->transport.rmt_port = server_ep->port;
1769   session->parent_handle = VCL_INVALID_SESSION_HANDLE;
1770   session->flags |= VCL_SESSION_F_CONNECTED;
1771
1772   VDBG (0, "session handle %u (%s): connecting to peer %s %U "
1773         "port %d proto %s", session_handle,
1774         vppcom_session_state_str (session->session_state),
1775         session->transport.is_ip4 ? "IPv4" : "IPv6",
1776         format_ip46_address,
1777         &session->transport.rmt_ip, session->transport.is_ip4 ?
1778         IP46_TYPE_IP4 : IP46_TYPE_IP6,
1779         clib_net_to_host_u16 (session->transport.rmt_port),
1780         vppcom_proto_str (session->session_type));
1781
1782   vcl_send_session_connect (wrk, session);
1783
1784   if (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK))
1785     {
1786       /* State set to STATE_UPDATED to ensure the session is not assumed
1787        * to be ready and to also allow the app to close it prior to vpp's
1788        * connected reply. */
1789       session->session_state = VCL_STATE_UPDATED;
1790       return VPPCOM_EINPROGRESS;
1791     }
1792
1793   /*
1794    * Wait for reply from vpp if blocking
1795    */
1796   rv = vppcom_wait_for_session_state_change (session_index, VCL_STATE_READY,
1797                                              vcm->cfg.session_timeout);
1798
1799   session = vcl_session_get (wrk, session_index);
1800   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1801         session->vpp_handle, rv ? "failed" : "succeeded");
1802
1803   return rv;
1804 }
1805
1806 int
1807 vppcom_session_stream_connect (uint32_t session_handle,
1808                                uint32_t parent_session_handle)
1809 {
1810   vcl_worker_t *wrk = vcl_worker_get_current ();
1811   vcl_session_t *session, *parent_session;
1812   u32 session_index, parent_session_index;
1813   int rv;
1814
1815   session = vcl_session_get_w_handle (wrk, session_handle);
1816   if (!session)
1817     return VPPCOM_EBADFD;
1818   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1819   if (!parent_session)
1820     return VPPCOM_EBADFD;
1821
1822   session_index = session->session_index;
1823   parent_session_index = parent_session->session_index;
1824   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
1825     {
1826       VDBG (0, "ERROR: cannot connect epoll session %u!",
1827             session->session_index);
1828       return VPPCOM_EBADFD;
1829     }
1830
1831   if (PREDICT_FALSE (vcl_session_is_ready (session)))
1832     {
1833       VDBG (0, "session handle %u [0x%llx]: session already "
1834             "connected to session %u [0x%llx] proto %s, state 0x%x (%s)",
1835             session_handle, session->vpp_handle,
1836             parent_session_handle, parent_session->vpp_handle,
1837             vppcom_proto_str (session->session_type), session->session_state,
1838             vppcom_session_state_str (session->session_state));
1839       return VPPCOM_OK;
1840     }
1841
1842   /* Connect to quic session specifics */
1843   session->transport.is_ip4 = parent_session->transport.is_ip4;
1844   session->transport.rmt_ip.ip4.as_u32 = (uint32_t) 1;
1845   session->transport.rmt_port = 0;
1846   session->parent_handle = parent_session->vpp_handle;
1847
1848   VDBG (0, "session handle %u: connecting to session %u [0x%llx]",
1849         session_handle, parent_session_handle, parent_session->vpp_handle);
1850
1851   /*
1852    * Send connect request and wait for reply from vpp
1853    */
1854   vcl_send_session_connect (wrk, session);
1855   rv = vppcom_wait_for_session_state_change (session_index, VCL_STATE_READY,
1856                                              vcm->cfg.session_timeout);
1857
1858   session->listener_index = parent_session_index;
1859   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1860   if (parent_session)
1861     parent_session->n_accepted_sessions++;
1862
1863   session = vcl_session_get (wrk, session_index);
1864   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1865         session->vpp_handle, rv ? "failed" : "succeeded");
1866
1867   return rv;
1868 }
1869
1870 static inline int
1871 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
1872                               u8 peek)
1873 {
1874   vcl_worker_t *wrk = vcl_worker_get_current ();
1875   int rv, n_read = 0, is_nonblocking;
1876   vcl_session_t *s = 0;
1877   svm_fifo_t *rx_fifo;
1878   session_event_t *e;
1879   svm_msg_q_t *mq;
1880   u8 is_ct;
1881
1882   if (PREDICT_FALSE (!buf))
1883     return VPPCOM_EINVAL;
1884
1885   s = vcl_session_get_w_handle (wrk, session_handle);
1886   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
1887     return VPPCOM_EBADFD;
1888
1889   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1890     {
1891       VDBG (0, "session %u[0x%llx] is not open! state 0x%x (%s)",
1892             s->session_index, s->vpp_handle, s->session_state,
1893             vppcom_session_state_str (s->session_state));
1894       return vcl_session_closed_error (s);
1895     }
1896
1897   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
1898   is_ct = vcl_session_is_ct (s);
1899   mq = wrk->app_event_queue;
1900   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
1901   s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
1902
1903   if (svm_fifo_is_empty_cons (rx_fifo))
1904     {
1905       if (is_nonblocking)
1906         {
1907           if (vcl_session_is_closing (s))
1908             return vcl_session_closing_error (s);
1909           if (is_ct)
1910             svm_fifo_unset_event (s->rx_fifo);
1911           svm_fifo_unset_event (rx_fifo);
1912           return VPPCOM_EWOULDBLOCK;
1913         }
1914       while (svm_fifo_is_empty_cons (rx_fifo))
1915         {
1916           if (vcl_session_is_closing (s))
1917             return vcl_session_closing_error (s);
1918
1919           if (is_ct)
1920             svm_fifo_unset_event (s->rx_fifo);
1921           svm_fifo_unset_event (rx_fifo);
1922
1923           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
1924           vcl_worker_flush_mq_events (wrk);
1925         }
1926     }
1927
1928 read_again:
1929
1930   if (s->is_dgram)
1931     rv = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
1932   else
1933     rv = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
1934
1935   ASSERT (rv >= 0);
1936   n_read += rv;
1937
1938   if (svm_fifo_is_empty_cons (rx_fifo))
1939     {
1940       if (is_ct)
1941         svm_fifo_unset_event (s->rx_fifo);
1942       svm_fifo_unset_event (rx_fifo);
1943       if (!svm_fifo_is_empty_cons (rx_fifo)
1944           && svm_fifo_set_event (rx_fifo) && is_nonblocking)
1945         {
1946           vec_add2 (wrk->unhandled_evts_vector, e, 1);
1947           e->event_type = SESSION_IO_EVT_RX;
1948           e->session_index = s->session_index;
1949         }
1950     }
1951   else if (PREDICT_FALSE (rv < n && !s->is_dgram))
1952     {
1953       /* More data enqueued while reading. Try to drain it
1954        * or fill the buffer. Avoid doing that for dgrams */
1955       buf += rv;
1956       n -= rv;
1957       goto read_again;
1958     }
1959
1960   if (PREDICT_FALSE (svm_fifo_needs_deq_ntf (rx_fifo, n_read)))
1961     {
1962       svm_fifo_clear_deq_ntf (rx_fifo);
1963       app_send_io_evt_to_vpp (s->vpp_evt_q,
1964                               s->rx_fifo->shr->master_session_index,
1965                               SESSION_IO_EVT_RX, SVM_Q_WAIT);
1966     }
1967
1968   VDBG (2, "session %u[0x%llx]: read %d bytes from (%p)", s->session_index,
1969         s->vpp_handle, n_read, rx_fifo);
1970
1971   return n_read;
1972 }
1973
1974 int
1975 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
1976 {
1977   return (vppcom_session_read_internal (session_handle, buf, n, 0));
1978 }
1979
1980 static int
1981 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
1982 {
1983   return (vppcom_session_read_internal (session_handle, buf, n, 1));
1984 }
1985
1986 int
1987 vppcom_session_read_segments (uint32_t session_handle,
1988                               vppcom_data_segment_t * ds, uint32_t n_segments,
1989                               uint32_t max_bytes)
1990 {
1991   vcl_worker_t *wrk = vcl_worker_get_current ();
1992   int n_read = 0, is_nonblocking;
1993   vcl_session_t *s = 0;
1994   svm_fifo_t *rx_fifo;
1995   svm_msg_q_t *mq;
1996   u8 is_ct;
1997
1998   s = vcl_session_get_w_handle (wrk, session_handle);
1999   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2000     return VPPCOM_EBADFD;
2001
2002   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2003     return vcl_session_closed_error (s);
2004
2005   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2006   is_ct = vcl_session_is_ct (s);
2007   mq = wrk->app_event_queue;
2008   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
2009   s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2010
2011   if (svm_fifo_is_empty_cons (rx_fifo))
2012     {
2013       if (is_nonblocking)
2014         {
2015           if (is_ct)
2016             svm_fifo_unset_event (s->rx_fifo);
2017           svm_fifo_unset_event (rx_fifo);
2018           return VPPCOM_EWOULDBLOCK;
2019         }
2020       while (svm_fifo_is_empty_cons (rx_fifo))
2021         {
2022           if (vcl_session_is_closing (s))
2023             return vcl_session_closing_error (s);
2024
2025           if (is_ct)
2026             svm_fifo_unset_event (s->rx_fifo);
2027           svm_fifo_unset_event (rx_fifo);
2028
2029           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2030           vcl_worker_flush_mq_events (wrk);
2031         }
2032     }
2033
2034   n_read = svm_fifo_segments (rx_fifo, s->rx_bytes_pending,
2035                               (svm_fifo_seg_t *) ds, n_segments, max_bytes);
2036   if (n_read < 0)
2037     return VPPCOM_EAGAIN;
2038
2039   if (svm_fifo_max_dequeue_cons (rx_fifo) == n_read)
2040     {
2041       if (is_ct)
2042         svm_fifo_unset_event (s->rx_fifo);
2043       svm_fifo_unset_event (rx_fifo);
2044       if (svm_fifo_max_dequeue_cons (rx_fifo) != n_read
2045           && svm_fifo_set_event (rx_fifo)
2046           && vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
2047         {
2048           session_event_t *e;
2049           vec_add2 (wrk->unhandled_evts_vector, e, 1);
2050           e->event_type = SESSION_IO_EVT_RX;
2051           e->session_index = s->session_index;
2052         }
2053     }
2054
2055   s->rx_bytes_pending += n_read;
2056   return n_read;
2057 }
2058
2059 void
2060 vppcom_session_free_segments (uint32_t session_handle, uint32_t n_bytes)
2061 {
2062   vcl_worker_t *wrk = vcl_worker_get_current ();
2063   vcl_session_t *s;
2064   u8 is_ct;
2065
2066   s = vcl_session_get_w_handle (wrk, session_handle);
2067   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2068     return;
2069
2070   is_ct = vcl_session_is_ct (s);
2071   svm_fifo_dequeue_drop (is_ct ? s->ct_rx_fifo : s->rx_fifo, n_bytes);
2072
2073   ASSERT (s->rx_bytes_pending < n_bytes);
2074   s->rx_bytes_pending -= n_bytes;
2075 }
2076
2077 always_inline u8
2078 vcl_fifo_is_writeable (svm_fifo_t * f, u32 len, u8 is_dgram)
2079 {
2080   u32 max_enq = svm_fifo_max_enqueue_prod (f);
2081   if (is_dgram)
2082     return max_enq >= (sizeof (session_dgram_hdr_t) + len);
2083   else
2084     return max_enq > 0;
2085 }
2086
2087 always_inline int
2088 vppcom_session_write_inline (vcl_worker_t * wrk, vcl_session_t * s, void *buf,
2089                              size_t n, u8 is_flush, u8 is_dgram)
2090 {
2091   int n_write, is_nonblocking;
2092   session_evt_type_t et;
2093   svm_fifo_t *tx_fifo;
2094   svm_msg_q_t *mq;
2095   u8 is_ct;
2096
2097   if (PREDICT_FALSE (!buf || n == 0))
2098     return VPPCOM_EINVAL;
2099
2100   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2101     {
2102       VDBG (0, "ERROR: session %u [0x%llx]: cannot write to an epoll"
2103             " session!", s->session_index, s->vpp_handle);
2104       return VPPCOM_EBADFD;
2105     }
2106
2107   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2108     {
2109       VDBG (1, "session %u [0x%llx]: is not open! state 0x%x (%s)",
2110             s->session_index, s->vpp_handle, s->session_state,
2111             vppcom_session_state_str (s->session_state));
2112       return vcl_session_closed_error (s);;
2113     }
2114
2115   is_ct = vcl_session_is_ct (s);
2116   tx_fifo = is_ct ? s->ct_tx_fifo : s->tx_fifo;
2117   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2118
2119   mq = wrk->app_event_queue;
2120   if (!vcl_fifo_is_writeable (tx_fifo, n, is_dgram))
2121     {
2122       if (is_nonblocking)
2123         {
2124           return VPPCOM_EWOULDBLOCK;
2125         }
2126       while (!vcl_fifo_is_writeable (tx_fifo, n, is_dgram))
2127         {
2128           svm_fifo_add_want_deq_ntf (tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
2129           if (vcl_session_is_closing (s))
2130             return vcl_session_closing_error (s);
2131
2132           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2133           vcl_worker_flush_mq_events (wrk);
2134         }
2135     }
2136
2137   et = SESSION_IO_EVT_TX;
2138   if (is_flush && !is_ct)
2139     et = SESSION_IO_EVT_TX_FLUSH;
2140
2141   if (is_dgram)
2142     n_write = app_send_dgram_raw (tx_fifo, &s->transport,
2143                                   s->vpp_evt_q, buf, n, et,
2144                                   0 /* do_evt */ , SVM_Q_WAIT);
2145   else
2146     n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
2147                                    0 /* do_evt */ , SVM_Q_WAIT);
2148
2149   if (svm_fifo_set_event (s->tx_fifo))
2150     app_send_io_evt_to_vpp (
2151       s->vpp_evt_q, s->tx_fifo->shr->master_session_index, et, SVM_Q_WAIT);
2152
2153   /* The underlying fifo segment can run out of memory */
2154   if (PREDICT_FALSE (n_write < 0))
2155     return VPPCOM_EAGAIN;
2156
2157   VDBG (2, "session %u [0x%llx]: wrote %d bytes", s->session_index,
2158         s->vpp_handle, n_write);
2159
2160   return n_write;
2161 }
2162
2163 int
2164 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
2165 {
2166   vcl_worker_t *wrk = vcl_worker_get_current ();
2167   vcl_session_t *s;
2168
2169   s = vcl_session_get_w_handle (wrk, session_handle);
2170   if (PREDICT_FALSE (!s))
2171     return VPPCOM_EBADFD;
2172
2173   return vppcom_session_write_inline (wrk, s, buf, n,
2174                                       0 /* is_flush */ , s->is_dgram ? 1 : 0);
2175 }
2176
2177 int
2178 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
2179 {
2180   vcl_worker_t *wrk = vcl_worker_get_current ();
2181   vcl_session_t *s;
2182
2183   s = vcl_session_get_w_handle (wrk, session_handle);
2184   if (PREDICT_FALSE (!s))
2185     return VPPCOM_EBADFD;
2186
2187   return vppcom_session_write_inline (wrk, s, buf, n,
2188                                       1 /* is_flush */ , s->is_dgram ? 1 : 0);
2189 }
2190
2191 #define vcl_fifo_rx_evt_valid_or_break(_s)                              \
2192 if (PREDICT_FALSE (!_s->rx_fifo))                                       \
2193   break;                                                                \
2194 if (PREDICT_FALSE (svm_fifo_is_empty (_s->rx_fifo)))                    \
2195   {                                                                     \
2196     if (!vcl_session_is_ct (_s))                                        \
2197       {                                                                 \
2198         svm_fifo_unset_event (_s->rx_fifo);                             \
2199         if (svm_fifo_is_empty (_s->rx_fifo))                            \
2200           break;                                                        \
2201       }                                                                 \
2202     else if (svm_fifo_is_empty (_s->ct_rx_fifo))                        \
2203       {                                                                 \
2204         svm_fifo_unset_event (_s->rx_fifo); /* rx evts on actual fifo*/ \
2205         if (svm_fifo_is_empty (_s->ct_rx_fifo))                         \
2206           break;                                                        \
2207       }                                                                 \
2208   }                                                                     \
2209
2210 static void
2211 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2212                             unsigned long n_bits, unsigned long *read_map,
2213                             unsigned long *write_map,
2214                             unsigned long *except_map, u32 * bits_set)
2215 {
2216   session_disconnected_msg_t *disconnected_msg;
2217   session_connected_msg_t *connected_msg;
2218   vcl_session_t *s;
2219   u32 sid;
2220
2221   switch (e->event_type)
2222     {
2223     case SESSION_IO_EVT_RX:
2224       sid = e->session_index;
2225       s = vcl_session_get (wrk, sid);
2226       if (!s || !vcl_session_is_open (s))
2227         break;
2228       vcl_fifo_rx_evt_valid_or_break (s);
2229       if (sid < n_bits && read_map)
2230         {
2231           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2232           *bits_set += 1;
2233         }
2234       break;
2235     case SESSION_IO_EVT_TX:
2236       sid = e->session_index;
2237       s = vcl_session_get (wrk, sid);
2238       if (!s || !vcl_session_is_open (s))
2239         break;
2240       if (sid < n_bits && write_map)
2241         {
2242           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2243           *bits_set += 1;
2244         }
2245       break;
2246     case SESSION_CTRL_EVT_ACCEPTED:
2247       if (!e->postponed)
2248         s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
2249       else
2250         s = vcl_session_get (wrk, e->session_index);
2251       if (!s)
2252         break;
2253       sid = s->session_index;
2254       if (sid < n_bits && read_map)
2255         {
2256           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2257           *bits_set += 1;
2258         }
2259       break;
2260     case SESSION_CTRL_EVT_CONNECTED:
2261       if (!e->postponed)
2262         {
2263           connected_msg = (session_connected_msg_t *) e->data;
2264           sid = vcl_session_connected_handler (wrk, connected_msg);
2265         }
2266       else
2267         sid = e->session_index;
2268       if (sid == VCL_INVALID_SESSION_INDEX)
2269         break;
2270       if (sid < n_bits && write_map)
2271         {
2272           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2273           *bits_set += 1;
2274         }
2275       break;
2276     case SESSION_CTRL_EVT_DISCONNECTED:
2277       disconnected_msg = (session_disconnected_msg_t *) e->data;
2278       s = vcl_session_disconnected_handler (wrk, disconnected_msg);
2279       if (!s)
2280         break;
2281       sid = s->session_index;
2282       if (sid < n_bits && except_map)
2283         {
2284           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2285           *bits_set += 1;
2286         }
2287       break;
2288     case SESSION_CTRL_EVT_RESET:
2289       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2290       if (sid < n_bits && except_map)
2291         {
2292           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2293           *bits_set += 1;
2294         }
2295       break;
2296     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2297       vcl_session_unlisten_reply_handler (wrk, e->data);
2298       break;
2299     case SESSION_CTRL_EVT_MIGRATED:
2300       vcl_session_migrated_handler (wrk, e->data);
2301       break;
2302     case SESSION_CTRL_EVT_CLEANUP:
2303       vcl_session_cleanup_handler (wrk, e->data);
2304       break;
2305     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2306       vcl_session_worker_update_reply_handler (wrk, e->data);
2307       break;
2308     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2309       vcl_session_req_worker_update_handler (wrk, e->data);
2310       break;
2311     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
2312       vcl_session_app_add_segment_handler (wrk, e->data);
2313       break;
2314     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
2315       vcl_session_app_del_segment_handler (wrk, e->data);
2316       break;
2317     case SESSION_CTRL_EVT_APP_WRK_RPC:
2318       vcl_worker_rpc_handler (wrk, e->data);
2319       break;
2320     default:
2321       clib_warning ("unhandled: %u", e->event_type);
2322       break;
2323     }
2324 }
2325
2326 static int
2327 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2328                       unsigned long n_bits, unsigned long *read_map,
2329                       unsigned long *write_map, unsigned long *except_map,
2330                       double time_to_wait, u32 * bits_set)
2331 {
2332   svm_msg_q_msg_t *msg;
2333   session_event_t *e;
2334   u32 i;
2335
2336   if (svm_msg_q_is_empty (mq))
2337     {
2338       if (*bits_set)
2339         return 0;
2340
2341       if (!time_to_wait)
2342         return 0;
2343       else if (time_to_wait < 0)
2344         svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2345       else
2346         {
2347           if (svm_msg_q_timedwait (mq, time_to_wait))
2348             return 0;
2349         }
2350     }
2351   vcl_mq_dequeue_batch (wrk, mq, ~0);
2352
2353   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2354     {
2355       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2356       e = svm_msg_q_msg_data (mq, msg);
2357       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2358                                   except_map, bits_set);
2359       svm_msg_q_free_msg (mq, msg);
2360     }
2361   vec_reset_length (wrk->mq_msg_vector);
2362   vcl_handle_pending_wrk_updates (wrk);
2363   return *bits_set;
2364 }
2365
2366 static int
2367 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2368                        vcl_si_set * read_map, vcl_si_set * write_map,
2369                        vcl_si_set * except_map, double time_to_wait,
2370                        u32 * bits_set)
2371 {
2372   double wait = 0, start = 0;
2373
2374   if (!*bits_set)
2375     {
2376       wait = time_to_wait;
2377       start = clib_time_now (&wrk->clib_time);
2378     }
2379
2380   do
2381     {
2382       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2383                             write_map, except_map, wait, bits_set);
2384       if (*bits_set)
2385         return *bits_set;
2386       if (wait == -1)
2387         continue;
2388
2389       wait = wait - (clib_time_now (&wrk->clib_time) - start);
2390     }
2391   while (wait > 0);
2392
2393   return 0;
2394 }
2395
2396 static int
2397 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2398                        vcl_si_set * read_map, vcl_si_set * write_map,
2399                        vcl_si_set * except_map, double time_to_wait,
2400                        u32 * bits_set)
2401 {
2402   vcl_mq_evt_conn_t *mqc;
2403   int __clib_unused n_read;
2404   int n_mq_evts, i;
2405   u64 buf;
2406
2407   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2408   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2409                           vec_len (wrk->mq_events), time_to_wait);
2410   for (i = 0; i < n_mq_evts; i++)
2411     {
2412       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2413       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2414       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2415                             except_map, 0, bits_set);
2416     }
2417
2418   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2419 }
2420
2421 int
2422 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2423                vcl_si_set * except_map, double time_to_wait)
2424 {
2425   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2426   vcl_worker_t *wrk = vcl_worker_get_current ();
2427   vcl_session_t *s = 0;
2428   int i;
2429
2430   if (n_bits && read_map)
2431     {
2432       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2433       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2434                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2435       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2436     }
2437   if (n_bits && write_map)
2438     {
2439       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2440       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2441                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2442       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2443     }
2444   if (n_bits && except_map)
2445     {
2446       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2447       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2448                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2449       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2450     }
2451
2452   if (!n_bits)
2453     return 0;
2454
2455   if (!write_map)
2456     goto check_rd;
2457
2458   clib_bitmap_foreach (sid, wrk->wr_bitmap)
2459     {
2460       if (!(s = vcl_session_get (wrk, sid)))
2461         {
2462           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2463           bits_set++;
2464           continue;
2465         }
2466
2467       if (vcl_session_write_ready (s))
2468         {
2469           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2470           bits_set++;
2471         }
2472       else
2473         {
2474           svm_fifo_t *txf = vcl_session_is_ct (s) ? s->ct_tx_fifo : s->tx_fifo;
2475           svm_fifo_add_want_deq_ntf (txf, SVM_FIFO_WANT_DEQ_NOTIF);
2476         }
2477     }
2478
2479 check_rd:
2480   if (!read_map)
2481     goto check_mq;
2482
2483   clib_bitmap_foreach (sid, wrk->rd_bitmap)
2484     {
2485       if (!(s = vcl_session_get (wrk, sid)))
2486         {
2487           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2488           bits_set++;
2489           continue;
2490         }
2491
2492       if (vcl_session_read_ready (s))
2493         {
2494           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2495           bits_set++;
2496         }
2497     }
2498
2499 check_mq:
2500
2501   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2502     {
2503       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2504                                   read_map, write_map, except_map, &bits_set);
2505     }
2506   vec_reset_length (wrk->unhandled_evts_vector);
2507
2508   if (vcm->cfg.use_mq_eventfd)
2509     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2510                            time_to_wait, &bits_set);
2511   else
2512     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2513                            time_to_wait, &bits_set);
2514
2515   return (bits_set);
2516 }
2517
2518 static inline void
2519 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_handle)
2520 {
2521   vppcom_epoll_t *vep;
2522   u32 sh = vep_handle;
2523   vcl_session_t *s;
2524
2525   if (VPPCOM_DEBUG <= 2)
2526     return;
2527
2528   s = vcl_session_get_w_handle (wrk, vep_handle);
2529   if (PREDICT_FALSE (!s))
2530     {
2531       VDBG (0, "ERROR: Invalid vep_sh (%u)!", vep_handle);
2532       goto done;
2533     }
2534   if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP)))
2535     {
2536       VDBG (0, "ERROR: vep_sh (%u) is not a vep!", vep_handle);
2537       goto done;
2538     }
2539   vep = &s->vep;
2540   VDBG (0, "vep_sh (%u): Dumping epoll chain\n"
2541         "{\n"
2542         "   is_vep         = %u\n"
2543         "   is_vep_session = %u\n"
2544         "   next_sh        = 0x%x (%u)\n"
2545         "}\n", vep_handle, s->flags & VCL_SESSION_F_IS_VEP,
2546         s->flags & VCL_SESSION_F_IS_VEP_SESSION, vep->next_sh, vep->next_sh);
2547
2548   for (sh = vep->next_sh; sh != ~0; sh = vep->next_sh)
2549     {
2550       s = vcl_session_get_w_handle (wrk, sh);
2551       if (PREDICT_FALSE (!s))
2552         {
2553           VDBG (0, "ERROR: Invalid sh (%u)!", sh);
2554           goto done;
2555         }
2556       if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2557         {
2558           VDBG (0, "ERROR: sh (%u) is a vep!", vep_handle);
2559         }
2560       else if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2561         {
2562           VDBG (0, "ERROR: sh (%u) is not a vep session handle!", sh);
2563           goto done;
2564         }
2565       vep = &s->vep;
2566       if (PREDICT_FALSE (vep->vep_sh != vep_handle))
2567         VDBG (0, "ERROR: session (%u) vep_sh (%u) != vep_sh (%u)!",
2568               sh, s->vep.vep_sh, vep_handle);
2569       if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
2570         {
2571           VDBG (0, "vep_sh[%u]: sh 0x%x (%u)\n"
2572                 "{\n"
2573                 "   next_sh        = 0x%x (%u)\n"
2574                 "   prev_sh        = 0x%x (%u)\n"
2575                 "   vep_sh         = 0x%x (%u)\n"
2576                 "   ev.events      = 0x%x\n"
2577                 "   ev.data.u64    = 0x%llx\n"
2578                 "   et_mask        = 0x%x\n"
2579                 "}\n",
2580                 vep_handle, sh, sh, vep->next_sh, vep->next_sh, vep->prev_sh,
2581                 vep->prev_sh, vep->vep_sh, vep->vep_sh, vep->ev.events,
2582                 vep->ev.data.u64, vep->et_mask);
2583         }
2584     }
2585
2586 done:
2587   VDBG (0, "vep_sh (%u): Dump complete!\n", vep_handle);
2588 }
2589
2590 int
2591 vppcom_epoll_create (void)
2592 {
2593   vcl_worker_t *wrk = vcl_worker_get_current ();
2594   vcl_session_t *vep_session;
2595
2596   vep_session = vcl_session_alloc (wrk);
2597
2598   vep_session->flags |= VCL_SESSION_F_IS_VEP;
2599   vep_session->vep.vep_sh = ~0;
2600   vep_session->vep.next_sh = ~0;
2601   vep_session->vep.prev_sh = ~0;
2602   vep_session->vpp_handle = ~0;
2603
2604   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2605   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2606
2607   return vcl_session_handle (vep_session);
2608 }
2609
2610 int
2611 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2612                   struct epoll_event *event)
2613 {
2614   vcl_worker_t *wrk = vcl_worker_get_current ();
2615   vcl_session_t *vep_session;
2616   int rv = VPPCOM_OK;
2617   vcl_session_t *s;
2618   svm_fifo_t *txf;
2619
2620   if (vep_handle == session_handle)
2621     {
2622       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2623       return VPPCOM_EINVAL;
2624     }
2625
2626   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2627   if (PREDICT_FALSE (!vep_session))
2628     {
2629       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2630       return VPPCOM_EBADFD;
2631     }
2632   if (PREDICT_FALSE (!(vep_session->flags & VCL_SESSION_F_IS_VEP)))
2633     {
2634       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2635       return VPPCOM_EINVAL;
2636     }
2637
2638   ASSERT (vep_session->vep.vep_sh == ~0);
2639   ASSERT (vep_session->vep.prev_sh == ~0);
2640
2641   s = vcl_session_get_w_handle (wrk, session_handle);
2642   if (PREDICT_FALSE (!s))
2643     {
2644       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2645       return VPPCOM_EBADFD;
2646     }
2647   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2648     {
2649       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2650       return VPPCOM_EINVAL;
2651     }
2652
2653   switch (op)
2654     {
2655     case EPOLL_CTL_ADD:
2656       if (PREDICT_FALSE (!event))
2657         {
2658           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2659           return VPPCOM_EINVAL;
2660         }
2661       if (vep_session->vep.next_sh != ~0)
2662         {
2663           vcl_session_t *next_session;
2664           next_session = vcl_session_get_w_handle (wrk,
2665                                                    vep_session->vep.next_sh);
2666           if (PREDICT_FALSE (!next_session))
2667             {
2668               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sh (%u) on "
2669                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2670               return VPPCOM_EBADFD;
2671             }
2672           ASSERT (next_session->vep.prev_sh == vep_handle);
2673           next_session->vep.prev_sh = session_handle;
2674         }
2675       s->vep.next_sh = vep_session->vep.next_sh;
2676       s->vep.prev_sh = vep_handle;
2677       s->vep.vep_sh = vep_handle;
2678       s->vep.et_mask = VEP_DEFAULT_ET_MASK;
2679       s->vep.ev = *event;
2680       s->flags &= ~VCL_SESSION_F_IS_VEP;
2681       s->flags |= VCL_SESSION_F_IS_VEP_SESSION;
2682       vep_session->vep.next_sh = session_handle;
2683
2684       txf = vcl_session_is_ct (s) ? s->ct_tx_fifo : s->tx_fifo;
2685       if (txf && (event->events & EPOLLOUT))
2686         svm_fifo_add_want_deq_ntf (txf, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2687
2688       /* Generate EPOLLOUT if tx fifo not full */
2689       if ((event->events & EPOLLOUT) && (vcl_session_write_ready (s) > 0))
2690         {
2691           session_event_t e = { 0 };
2692           e.event_type = SESSION_IO_EVT_TX;
2693           e.session_index = s->session_index;
2694           vec_add1 (wrk->unhandled_evts_vector, e);
2695         }
2696       /* Generate EPOLLIN if rx fifo has data */
2697       if ((event->events & EPOLLIN) && (vcl_session_read_ready (s) > 0))
2698         {
2699           session_event_t e = { 0 };
2700           e.event_type = SESSION_IO_EVT_RX;
2701           e.session_index = s->session_index;
2702           vec_add1 (wrk->unhandled_evts_vector, e);
2703         }
2704       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2705             vep_handle, session_handle, event->events, event->data.u64);
2706       vcl_evt (VCL_EVT_EPOLL_CTLADD, s, event->events, event->data.u64);
2707       break;
2708
2709     case EPOLL_CTL_MOD:
2710       if (PREDICT_FALSE (!event))
2711         {
2712           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2713           rv = VPPCOM_EINVAL;
2714           goto done;
2715         }
2716       else if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2717         {
2718           VDBG (0, "sh %u EPOLL_CTL_MOD: not a vep session!", session_handle);
2719           rv = VPPCOM_EINVAL;
2720           goto done;
2721         }
2722       else if (PREDICT_FALSE (s->vep.vep_sh != vep_handle))
2723         {
2724           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2725                 session_handle, s->vep.vep_sh, vep_handle);
2726           rv = VPPCOM_EINVAL;
2727           goto done;
2728         }
2729
2730       /* Generate EPOLLOUT when tx_fifo/ct_tx_fifo not full */
2731       if ((event->events & EPOLLOUT) &&
2732           !(s->vep.ev.events & EPOLLOUT) && (vcl_session_write_ready (s) > 0))
2733         {
2734           session_event_t e = { 0 };
2735           e.event_type = SESSION_IO_EVT_TX;
2736           e.session_index = s->session_index;
2737           vec_add1 (wrk->unhandled_evts_vector, e);
2738         }
2739       s->vep.et_mask = VEP_DEFAULT_ET_MASK;
2740       s->vep.ev = *event;
2741       txf = vcl_session_is_ct (s) ? s->ct_tx_fifo : s->tx_fifo;
2742       if (txf)
2743         {
2744           if (event->events & EPOLLOUT)
2745             svm_fifo_add_want_deq_ntf (txf, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2746           else
2747             svm_fifo_del_want_deq_ntf (txf, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2748         }
2749       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2750             vep_handle, session_handle, event->events, event->data.u64);
2751       break;
2752
2753     case EPOLL_CTL_DEL:
2754       if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2755         {
2756           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
2757           rv = VPPCOM_EINVAL;
2758           goto done;
2759         }
2760       else if (PREDICT_FALSE (s->vep.vep_sh != vep_handle))
2761         {
2762           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
2763                 session_handle, s->vep.vep_sh, vep_handle);
2764           rv = VPPCOM_EINVAL;
2765           goto done;
2766         }
2767
2768       if (s->vep.prev_sh == vep_handle)
2769         vep_session->vep.next_sh = s->vep.next_sh;
2770       else
2771         {
2772           vcl_session_t *prev_session;
2773           prev_session = vcl_session_get_w_handle (wrk, s->vep.prev_sh);
2774           if (PREDICT_FALSE (!prev_session))
2775             {
2776               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sh (%u) on sh (%u)!",
2777                     s->vep.prev_sh, session_handle);
2778               return VPPCOM_EBADFD;
2779             }
2780           ASSERT (prev_session->vep.next_sh == session_handle);
2781           prev_session->vep.next_sh = s->vep.next_sh;
2782         }
2783       if (s->vep.next_sh != ~0)
2784         {
2785           vcl_session_t *next_session;
2786           next_session = vcl_session_get_w_handle (wrk, s->vep.next_sh);
2787           if (PREDICT_FALSE (!next_session))
2788             {
2789               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sh (%u) on sh (%u)!",
2790                     s->vep.next_sh, session_handle);
2791               return VPPCOM_EBADFD;
2792             }
2793           ASSERT (next_session->vep.prev_sh == session_handle);
2794           next_session->vep.prev_sh = s->vep.prev_sh;
2795         }
2796
2797       memset (&s->vep, 0, sizeof (s->vep));
2798       s->vep.next_sh = ~0;
2799       s->vep.prev_sh = ~0;
2800       s->vep.vep_sh = ~0;
2801       s->flags &= ~VCL_SESSION_F_IS_VEP_SESSION;
2802
2803       txf = vcl_session_is_ct (s) ? s->ct_tx_fifo : s->tx_fifo;
2804       if (txf)
2805         svm_fifo_del_want_deq_ntf (txf, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2806
2807       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sh %u!", vep_handle,
2808             session_handle);
2809       vcl_evt (VCL_EVT_EPOLL_CTLDEL, s, vep_sh);
2810       break;
2811
2812     default:
2813       VDBG (0, "Invalid operation (%d)!", op);
2814       rv = VPPCOM_EINVAL;
2815     }
2816
2817   vep_verify_epoll_chain (wrk, vep_handle);
2818
2819 done:
2820   return rv;
2821 }
2822
2823 static inline void
2824 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2825                                 struct epoll_event *events, u32 * num_ev)
2826 {
2827   session_disconnected_msg_t *disconnected_msg;
2828   session_connected_msg_t *connected_msg;
2829   u32 sid = ~0, session_events;
2830   u64 session_evt_data = ~0;
2831   vcl_session_t *s;
2832   u8 add_event = 0;
2833
2834   switch (e->event_type)
2835     {
2836     case SESSION_IO_EVT_RX:
2837       sid = e->session_index;
2838       s = vcl_session_get (wrk, sid);
2839       if (vcl_session_is_closed (s))
2840         break;
2841       vcl_fifo_rx_evt_valid_or_break (s);
2842       session_events = s->vep.ev.events;
2843       if (!(EPOLLIN & s->vep.ev.events)
2844           || (s->flags & VCL_SESSION_F_HAS_RX_EVT))
2845         break;
2846       add_event = 1;
2847       events[*num_ev].events |= EPOLLIN;
2848       session_evt_data = s->vep.ev.data.u64;
2849       s->flags |= VCL_SESSION_F_HAS_RX_EVT;
2850       break;
2851     case SESSION_IO_EVT_TX:
2852       sid = e->session_index;
2853       s = vcl_session_get (wrk, sid);
2854       if (vcl_session_is_closed (s))
2855         break;
2856       session_events = s->vep.ev.events;
2857       if (!(EPOLLOUT & session_events))
2858         break;
2859       add_event = 1;
2860       events[*num_ev].events |= EPOLLOUT;
2861       session_evt_data = s->vep.ev.data.u64;
2862       svm_fifo_reset_has_deq_ntf (vcl_session_is_ct (s) ?
2863                                   s->ct_tx_fifo : s->tx_fifo);
2864       break;
2865     case SESSION_CTRL_EVT_ACCEPTED:
2866       if (!e->postponed)
2867         s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
2868       else
2869         s = vcl_session_get (wrk, e->session_index);
2870       if (!s)
2871         break;
2872       session_events = s->vep.ev.events;
2873       sid = s->session_index;
2874       if (!(EPOLLIN & session_events))
2875         break;
2876       add_event = 1;
2877       events[*num_ev].events |= EPOLLIN;
2878       session_evt_data = s->vep.ev.data.u64;
2879       break;
2880     case SESSION_CTRL_EVT_CONNECTED:
2881       if (!e->postponed)
2882         {
2883           connected_msg = (session_connected_msg_t *) e->data;
2884           sid = vcl_session_connected_handler (wrk, connected_msg);
2885         }
2886       else
2887         sid = e->session_index;
2888       s = vcl_session_get (wrk, sid);
2889       if (vcl_session_is_closed (s))
2890         break;
2891       session_events = s->vep.ev.events;
2892       /* Generate EPOLLOUT because there's no connected event */
2893       if (!(EPOLLOUT & session_events))
2894         break;
2895       add_event = 1;
2896       events[*num_ev].events |= EPOLLOUT;
2897       session_evt_data = s->vep.ev.data.u64;
2898       if (s->session_state == VCL_STATE_DETACHED)
2899         events[*num_ev].events |= EPOLLHUP;
2900       break;
2901     case SESSION_CTRL_EVT_DISCONNECTED:
2902       disconnected_msg = (session_disconnected_msg_t *) e->data;
2903       s = vcl_session_disconnected_handler (wrk, disconnected_msg);
2904       if (vcl_session_is_closed (s))
2905         break;
2906       sid = s->session_index;
2907       session_events = s->vep.ev.events;
2908       add_event = 1;
2909       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2910       session_evt_data = s->vep.ev.data.u64;
2911       break;
2912     case SESSION_CTRL_EVT_RESET:
2913       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2914       s = vcl_session_get (wrk, sid);
2915       if (vcl_session_is_closed (s))
2916         break;
2917       session_events = s->vep.ev.events;
2918       add_event = 1;
2919       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2920       session_evt_data = s->vep.ev.data.u64;
2921       break;
2922     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2923       vcl_session_unlisten_reply_handler (wrk, e->data);
2924       break;
2925     case SESSION_CTRL_EVT_MIGRATED:
2926       vcl_session_migrated_handler (wrk, e->data);
2927       break;
2928     case SESSION_CTRL_EVT_CLEANUP:
2929       vcl_session_cleanup_handler (wrk, e->data);
2930       break;
2931     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2932       vcl_session_req_worker_update_handler (wrk, e->data);
2933       break;
2934     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2935       vcl_session_worker_update_reply_handler (wrk, e->data);
2936       break;
2937     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
2938       vcl_session_app_add_segment_handler (wrk, e->data);
2939       break;
2940     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
2941       vcl_session_app_del_segment_handler (wrk, e->data);
2942       break;
2943     case SESSION_CTRL_EVT_APP_WRK_RPC:
2944       vcl_worker_rpc_handler (wrk, e->data);
2945       break;
2946     default:
2947       VDBG (0, "unhandled: %u", e->event_type);
2948       break;
2949     }
2950
2951   if (add_event)
2952     {
2953       events[*num_ev].data.u64 = session_evt_data;
2954       if (EPOLLONESHOT & session_events)
2955         {
2956           s = vcl_session_get (wrk, sid);
2957           s->vep.ev.events = 0;
2958         }
2959       *num_ev += 1;
2960     }
2961 }
2962
2963 static int
2964 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2965                           struct epoll_event *events, u32 maxevents,
2966                           double wait_for_time, u32 * num_ev)
2967 {
2968   svm_msg_q_msg_t *msg;
2969   session_event_t *e;
2970   int i;
2971
2972   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
2973     goto handle_dequeued;
2974
2975   if (svm_msg_q_is_empty (mq))
2976     {
2977       if (!wait_for_time)
2978         return 0;
2979       else if (wait_for_time < 0)
2980         svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2981       else
2982         {
2983           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
2984             return 0;
2985         }
2986     }
2987   ASSERT (maxevents > *num_ev);
2988   vcl_mq_dequeue_batch (wrk, mq, ~0);
2989
2990 handle_dequeued:
2991   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2992     {
2993       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2994       e = svm_msg_q_msg_data (mq, msg);
2995       if (*num_ev < maxevents)
2996         vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
2997       else
2998         vcl_handle_mq_event (wrk, e);
2999       svm_msg_q_free_msg (mq, msg);
3000     }
3001   vec_reset_length (wrk->mq_msg_vector);
3002   vcl_handle_pending_wrk_updates (wrk);
3003   return *num_ev;
3004 }
3005
3006 static int
3007 vppcom_epoll_wait_condvar (vcl_worker_t * wrk, struct epoll_event *events,
3008                            int maxevents, u32 n_evts, double wait_for_time)
3009 {
3010   double wait = 0, start = 0, now;
3011
3012   if (!n_evts)
3013     {
3014       wait = wait_for_time;
3015       start = clib_time_now (&wrk->clib_time);
3016     }
3017
3018   do
3019     {
3020       vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events, maxevents,
3021                                 wait, &n_evts);
3022       if (n_evts)
3023         return n_evts;
3024       if (wait == -1)
3025         continue;
3026
3027       now = clib_time_now (&wrk->clib_time);
3028       wait -= (now - start) * 1e3;
3029       start = now;
3030     }
3031   while (wait > 0);
3032
3033   return 0;
3034 }
3035
3036 static int
3037 vppcom_epoll_wait_eventfd (vcl_worker_t * wrk, struct epoll_event *events,
3038                            int maxevents, u32 n_evts, double wait_for_time)
3039 {
3040   double wait = 0, start = 0, now;
3041   int __clib_unused n_read;
3042   vcl_mq_evt_conn_t *mqc;
3043   int n_mq_evts, i;
3044   u64 buf;
3045
3046   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
3047   if (!n_evts)
3048     {
3049       wait = wait_for_time;
3050       start = clib_time_now (&wrk->clib_time);
3051     }
3052
3053   do
3054     {
3055       n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
3056                               vec_len (wrk->mq_events), wait);
3057       if (n_mq_evts < 0)
3058         {
3059           VDBG (0, "epoll_wait error %u", errno);
3060           return n_evts;
3061         }
3062
3063       for (i = 0; i < n_mq_evts; i++)
3064         {
3065           mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
3066           n_read = read (mqc->mq_fd, &buf, sizeof (buf));
3067           vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0,
3068                                     &n_evts);
3069         }
3070
3071       if (n_evts)
3072         return n_evts;
3073       if (wait == -1)
3074         continue;
3075
3076       now = clib_time_now (&wrk->clib_time);
3077       wait -= (now - start) * 1e3;
3078       start = now;
3079     }
3080   while (wait > 0);
3081
3082   return 0;
3083 }
3084
3085 int
3086 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
3087                    int maxevents, double wait_for_time)
3088 {
3089   vcl_worker_t *wrk = vcl_worker_get_current ();
3090   vcl_session_t *vep_session;
3091   u32 n_evts = 0;
3092   int i;
3093
3094   if (PREDICT_FALSE (maxevents <= 0))
3095     {
3096       VDBG (0, "ERROR: Invalid maxevents (%d)!", maxevents);
3097       return VPPCOM_EINVAL;
3098     }
3099
3100   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
3101   if (!vep_session)
3102     return VPPCOM_EBADFD;
3103
3104   if (PREDICT_FALSE (!(vep_session->flags & VCL_SESSION_F_IS_VEP)))
3105     {
3106       VDBG (0, "ERROR: vep_idx (%u) is not a vep!", vep_handle);
3107       return VPPCOM_EINVAL;
3108     }
3109
3110   memset (events, 0, sizeof (*events) * maxevents);
3111
3112   if (vec_len (wrk->unhandled_evts_vector))
3113     {
3114       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
3115         {
3116           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
3117                                           events, &n_evts);
3118           if (n_evts == maxevents)
3119             {
3120               vec_delete (wrk->unhandled_evts_vector, i + 1, 0);
3121               return n_evts;
3122             }
3123         }
3124       vec_reset_length (wrk->unhandled_evts_vector);
3125     }
3126   /* Request to only drain unhandled */
3127   if ((int) wait_for_time == -2)
3128     return n_evts;
3129
3130   if (vcm->cfg.use_mq_eventfd)
3131     return vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
3132                                       wait_for_time);
3133
3134   return vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
3135                                     wait_for_time);
3136 }
3137
3138 int
3139 vppcom_session_attr (uint32_t session_handle, uint32_t op,
3140                      void *buffer, uint32_t * buflen)
3141 {
3142   vcl_worker_t *wrk = vcl_worker_get_current ();
3143   u32 *flags = buffer, tmp_flags = 0;
3144   vppcom_endpt_t *ep = buffer;
3145   transport_endpt_attr_t tea;
3146   vcl_session_t *session;
3147   int rv = VPPCOM_OK;
3148
3149   session = vcl_session_get_w_handle (wrk, session_handle);
3150   if (!session)
3151     return VPPCOM_EBADFD;
3152
3153   switch (op)
3154     {
3155     case VPPCOM_ATTR_GET_NREAD:
3156       rv = vcl_session_read_ready (session);
3157       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sh %u, nread = %d", session_handle,
3158             rv);
3159       break;
3160
3161     case VPPCOM_ATTR_GET_NWRITE:
3162       rv = vcl_session_write_ready (session);
3163       VDBG (2, "VPPCOM_ATTR_GET_NWRITE: sh %u, nwrite = %d", session_handle,
3164             rv);
3165       break;
3166
3167     case VPPCOM_ATTR_GET_FLAGS:
3168       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
3169         {
3170           *flags =
3171             O_RDWR |
3172             (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK) ?
3173              O_NONBLOCK : 0);
3174           *buflen = sizeof (*flags);
3175           VDBG (2, "VPPCOM_ATTR_GET_FLAGS: sh %u, flags = 0x%08x, "
3176                 "is_nonblocking = %u", session_handle, *flags,
3177                 vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK));
3178         }
3179       else
3180         rv = VPPCOM_EINVAL;
3181       break;
3182
3183     case VPPCOM_ATTR_SET_FLAGS:
3184       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
3185         {
3186           if (*flags & O_NONBLOCK)
3187             vcl_session_set_attr (session, VCL_SESS_ATTR_NONBLOCK);
3188           else
3189             vcl_session_clear_attr (session, VCL_SESS_ATTR_NONBLOCK);
3190
3191           VDBG (2, "VPPCOM_ATTR_SET_FLAGS: sh %u, flags = 0x%08x,"
3192                 " is_nonblocking = %u", session_handle, *flags,
3193                 vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK));
3194         }
3195       else
3196         rv = VPPCOM_EINVAL;
3197       break;
3198
3199     case VPPCOM_ATTR_GET_PEER_ADDR:
3200       if (PREDICT_TRUE (buffer && buflen &&
3201                         (*buflen >= sizeof (*ep)) && ep->ip))
3202         {
3203           ep->is_ip4 = session->transport.is_ip4;
3204           ep->port = session->transport.rmt_port;
3205           if (session->transport.is_ip4)
3206             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3207                               sizeof (ip4_address_t));
3208           else
3209             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3210                               sizeof (ip6_address_t));
3211           *buflen = sizeof (*ep);
3212           VDBG (1, "VPPCOM_ATTR_GET_PEER_ADDR: sh %u, is_ip4 = %u, "
3213                 "addr = %U, port %u", session_handle, ep->is_ip4,
3214                 format_ip46_address, &session->transport.rmt_ip,
3215                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3216                 clib_net_to_host_u16 (ep->port));
3217         }
3218       else
3219         rv = VPPCOM_EINVAL;
3220       break;
3221
3222     case VPPCOM_ATTR_GET_LCL_ADDR:
3223       if (PREDICT_TRUE (buffer && buflen &&
3224                         (*buflen >= sizeof (*ep)) && ep->ip))
3225         {
3226           ep->is_ip4 = session->transport.is_ip4;
3227           ep->port = session->transport.lcl_port;
3228           if (session->transport.is_ip4)
3229             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
3230                               sizeof (ip4_address_t));
3231           else
3232             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
3233                               sizeof (ip6_address_t));
3234           *buflen = sizeof (*ep);
3235           VDBG (1, "VPPCOM_ATTR_GET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
3236                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
3237                 &session->transport.lcl_ip,
3238                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3239                 clib_net_to_host_u16 (ep->port));
3240         }
3241       else
3242         rv = VPPCOM_EINVAL;
3243       break;
3244
3245     case VPPCOM_ATTR_SET_LCL_ADDR:
3246       if (PREDICT_TRUE (buffer && buflen &&
3247                         (*buflen >= sizeof (*ep)) && ep->ip))
3248         {
3249           session->transport.is_ip4 = ep->is_ip4;
3250           session->transport.lcl_port = ep->port;
3251           vcl_ip_copy_from_ep (&session->transport.lcl_ip, ep);
3252           *buflen = sizeof (*ep);
3253           VDBG (1, "VPPCOM_ATTR_SET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
3254                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
3255                 &session->transport.lcl_ip,
3256                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3257                 clib_net_to_host_u16 (ep->port));
3258         }
3259       else
3260         rv = VPPCOM_EINVAL;
3261       break;
3262
3263     case VPPCOM_ATTR_GET_LIBC_EPFD:
3264       rv = session->libc_epfd;
3265       VDBG (2, "VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d", rv);
3266       break;
3267
3268     case VPPCOM_ATTR_SET_LIBC_EPFD:
3269       if (PREDICT_TRUE (buffer && buflen &&
3270                         (*buflen == sizeof (session->libc_epfd))))
3271         {
3272           session->libc_epfd = *(int *) buffer;
3273           *buflen = sizeof (session->libc_epfd);
3274
3275           VDBG (2, "VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, buflen %d",
3276                 session->libc_epfd, *buflen);
3277         }
3278       else
3279         rv = VPPCOM_EINVAL;
3280       break;
3281
3282     case VPPCOM_ATTR_GET_PROTOCOL:
3283       if (buffer && buflen && (*buflen >= sizeof (int)))
3284         {
3285           *(int *) buffer = session->session_type;
3286           *buflen = sizeof (int);
3287
3288           VDBG (2, "VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
3289                 *(int *) buffer, *(int *) buffer ? "UDP" : "TCP", *buflen);
3290         }
3291       else
3292         rv = VPPCOM_EINVAL;
3293       break;
3294
3295     case VPPCOM_ATTR_GET_LISTEN:
3296       if (buffer && buflen && (*buflen >= sizeof (int)))
3297         {
3298           *(int *) buffer = vcl_session_has_attr (session,
3299                                                   VCL_SESS_ATTR_LISTEN);
3300           *buflen = sizeof (int);
3301
3302           VDBG (2, "VPPCOM_ATTR_GET_LISTEN: %d, buflen %d", *(int *) buffer,
3303                 *buflen);
3304         }
3305       else
3306         rv = VPPCOM_EINVAL;
3307       break;
3308
3309     case VPPCOM_ATTR_GET_ERROR:
3310       if (buffer && buflen && (*buflen >= sizeof (int)))
3311         {
3312           *(int *) buffer = 0;
3313           *buflen = sizeof (int);
3314
3315           VDBG (2, "VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
3316                 *(int *) buffer, *buflen);
3317         }
3318       else
3319         rv = VPPCOM_EINVAL;
3320       break;
3321
3322     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
3323       if (buffer && buflen && (*buflen >= sizeof (u32)))
3324         {
3325
3326           /* VPP-TBD */
3327           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3328                                 session->tx_fifo ?
3329                                 svm_fifo_size (session->tx_fifo) :
3330                                 vcm->cfg.tx_fifo_size);
3331           *buflen = sizeof (u32);
3332
3333           VDBG (2, "VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3334                 " #VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer,
3335                 *buflen);
3336         }
3337       else
3338         rv = VPPCOM_EINVAL;
3339       break;
3340
3341     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3342       if (buffer && buflen && (*buflen == sizeof (u32)))
3343         {
3344           /* VPP-TBD */
3345           session->sndbuf_size = *(u32 *) buffer;
3346           VDBG (2, "VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3347                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3348                 *buflen);
3349         }
3350       else
3351         rv = VPPCOM_EINVAL;
3352       break;
3353
3354     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3355       if (buffer && buflen && (*buflen >= sizeof (u32)))
3356         {
3357
3358           /* VPP-TBD */
3359           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3360                                 session->rx_fifo ?
3361                                 svm_fifo_size (session->rx_fifo) :
3362                                 vcm->cfg.rx_fifo_size);
3363           *buflen = sizeof (u32);
3364
3365           VDBG (2, "VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), buflen %d, "
3366                 "#VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer, *buflen);
3367         }
3368       else
3369         rv = VPPCOM_EINVAL;
3370       break;
3371
3372     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3373       if (buffer && buflen && (*buflen == sizeof (u32)))
3374         {
3375           /* VPP-TBD */
3376           session->rcvbuf_size = *(u32 *) buffer;
3377           VDBG (2, "VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), buflen %d,"
3378                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3379                 *buflen);
3380         }
3381       else
3382         rv = VPPCOM_EINVAL;
3383       break;
3384
3385     case VPPCOM_ATTR_GET_REUSEADDR:
3386       if (buffer && buflen && (*buflen >= sizeof (int)))
3387         {
3388           /* VPP-TBD */
3389           *(int *) buffer = vcl_session_has_attr (session,
3390                                                   VCL_SESS_ATTR_REUSEADDR);
3391           *buflen = sizeof (int);
3392
3393           VDBG (2, "VPPCOM_ATTR_GET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3394                 *(int *) buffer, *buflen);
3395         }
3396       else
3397         rv = VPPCOM_EINVAL;
3398       break;
3399
3400     case VPPCOM_ATTR_SET_REUSEADDR:
3401       if (buffer && buflen && (*buflen == sizeof (int)) &&
3402           !vcl_session_has_attr (session, VCL_SESS_ATTR_LISTEN))
3403         {
3404           /* VPP-TBD */
3405           if (*(int *) buffer)
3406             vcl_session_set_attr (session, VCL_SESS_ATTR_REUSEADDR);
3407           else
3408             vcl_session_clear_attr (session, VCL_SESS_ATTR_REUSEADDR);
3409
3410           VDBG (2, "VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3411                 vcl_session_has_attr (session, VCL_SESS_ATTR_REUSEADDR),
3412                 *buflen);
3413         }
3414       else
3415         rv = VPPCOM_EINVAL;
3416       break;
3417
3418     case VPPCOM_ATTR_GET_REUSEPORT:
3419       if (buffer && buflen && (*buflen >= sizeof (int)))
3420         {
3421           /* VPP-TBD */
3422           *(int *) buffer = vcl_session_has_attr (session,
3423                                                   VCL_SESS_ATTR_REUSEPORT);
3424           *buflen = sizeof (int);
3425
3426           VDBG (2, "VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3427                 *(int *) buffer, *buflen);
3428         }
3429       else
3430         rv = VPPCOM_EINVAL;
3431       break;
3432
3433     case VPPCOM_ATTR_SET_REUSEPORT:
3434       if (buffer && buflen && (*buflen == sizeof (int)) &&
3435           !vcl_session_has_attr (session, VCL_SESS_ATTR_LISTEN))
3436         {
3437           /* VPP-TBD */
3438           if (*(int *) buffer)
3439             vcl_session_set_attr (session, VCL_SESS_ATTR_REUSEPORT);
3440           else
3441             vcl_session_clear_attr (session, VCL_SESS_ATTR_REUSEPORT);
3442
3443           VDBG (2, "VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3444                 vcl_session_has_attr (session, VCL_SESS_ATTR_REUSEPORT),
3445                 *buflen);
3446         }
3447       else
3448         rv = VPPCOM_EINVAL;
3449       break;
3450
3451     case VPPCOM_ATTR_GET_BROADCAST:
3452       if (buffer && buflen && (*buflen >= sizeof (int)))
3453         {
3454           /* VPP-TBD */
3455           *(int *) buffer = vcl_session_has_attr (session,
3456                                                   VCL_SESS_ATTR_BROADCAST);
3457           *buflen = sizeof (int);
3458
3459           VDBG (2, "VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3460                 *(int *) buffer, *buflen);
3461         }
3462       else
3463         rv = VPPCOM_EINVAL;
3464       break;
3465
3466     case VPPCOM_ATTR_SET_BROADCAST:
3467       if (buffer && buflen && (*buflen == sizeof (int)))
3468         {
3469           /* VPP-TBD */
3470           if (*(int *) buffer)
3471             vcl_session_set_attr (session, VCL_SESS_ATTR_BROADCAST);
3472           else
3473             vcl_session_clear_attr (session, VCL_SESS_ATTR_BROADCAST);
3474
3475           VDBG (2, "VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3476                 vcl_session_has_attr (session, VCL_SESS_ATTR_BROADCAST),
3477                 *buflen);
3478         }
3479       else
3480         rv = VPPCOM_EINVAL;
3481       break;
3482
3483     case VPPCOM_ATTR_GET_V6ONLY:
3484       if (buffer && buflen && (*buflen >= sizeof (int)))
3485         {
3486           /* VPP-TBD */
3487           *(int *) buffer = vcl_session_has_attr (session,
3488                                                   VCL_SESS_ATTR_V6ONLY);
3489           *buflen = sizeof (int);
3490
3491           VDBG (2, "VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3492                 *(int *) buffer, *buflen);
3493         }
3494       else
3495         rv = VPPCOM_EINVAL;
3496       break;
3497
3498     case VPPCOM_ATTR_SET_V6ONLY:
3499       if (buffer && buflen && (*buflen == sizeof (int)))
3500         {
3501           /* VPP-TBD */
3502           if (*(int *) buffer)
3503             vcl_session_set_attr (session, VCL_SESS_ATTR_V6ONLY);
3504           else
3505             vcl_session_clear_attr (session, VCL_SESS_ATTR_V6ONLY);
3506
3507           VDBG (2, "VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3508                 vcl_session_has_attr (session, VCL_SESS_ATTR_V6ONLY),
3509                 *buflen);
3510         }
3511       else
3512         rv = VPPCOM_EINVAL;
3513       break;
3514
3515     case VPPCOM_ATTR_GET_KEEPALIVE:
3516       if (buffer && buflen && (*buflen >= sizeof (int)))
3517         {
3518           /* VPP-TBD */
3519           *(int *) buffer = vcl_session_has_attr (session,
3520                                                   VCL_SESS_ATTR_KEEPALIVE);
3521           *buflen = sizeof (int);
3522
3523           VDBG (2, "VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3524                 *(int *) buffer, *buflen);
3525         }
3526       else
3527         rv = VPPCOM_EINVAL;
3528       break;
3529
3530     case VPPCOM_ATTR_SET_KEEPALIVE:
3531       if (buffer && buflen && (*buflen == sizeof (int)))
3532         {
3533           /* VPP-TBD */
3534           if (*(int *) buffer)
3535             vcl_session_set_attr (session, VCL_SESS_ATTR_KEEPALIVE);
3536           else
3537             vcl_session_clear_attr (session, VCL_SESS_ATTR_KEEPALIVE);
3538
3539           VDBG (2, "VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3540                 vcl_session_has_attr (session, VCL_SESS_ATTR_KEEPALIVE),
3541                 *buflen);
3542         }
3543       else
3544         rv = VPPCOM_EINVAL;
3545       break;
3546
3547     case VPPCOM_ATTR_GET_TCP_NODELAY:
3548       if (buffer && buflen && (*buflen >= sizeof (int)))
3549         {
3550           /* VPP-TBD */
3551           *(int *) buffer = vcl_session_has_attr (session,
3552                                                   VCL_SESS_ATTR_TCP_NODELAY);
3553           *buflen = sizeof (int);
3554
3555           VDBG (2, "VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3556                 *(int *) buffer, *buflen);
3557         }
3558       else
3559         rv = VPPCOM_EINVAL;
3560       break;
3561
3562     case VPPCOM_ATTR_SET_TCP_NODELAY:
3563       if (buffer && buflen && (*buflen == sizeof (int)))
3564         {
3565           /* VPP-TBD */
3566           if (*(int *) buffer)
3567             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_NODELAY);
3568           else
3569             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_NODELAY);
3570
3571           VDBG (2, "VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3572                 vcl_session_has_attr (session, VCL_SESS_ATTR_TCP_NODELAY),
3573                 *buflen);
3574         }
3575       else
3576         rv = VPPCOM_EINVAL;
3577       break;
3578
3579     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
3580       if (buffer && buflen && (*buflen >= sizeof (int)))
3581         {
3582           /* VPP-TBD */
3583           *(int *) buffer = vcl_session_has_attr (session,
3584                                                   VCL_SESS_ATTR_TCP_KEEPIDLE);
3585           *buflen = sizeof (int);
3586
3587           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3588                 *(int *) buffer, *buflen);
3589         }
3590       else
3591         rv = VPPCOM_EINVAL;
3592       break;
3593
3594     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
3595       if (buffer && buflen && (*buflen == sizeof (int)))
3596         {
3597           /* VPP-TBD */
3598           if (*(int *) buffer)
3599             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_KEEPIDLE);
3600           else
3601             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_KEEPIDLE);
3602
3603           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3604                 vcl_session_has_attr (session,
3605                                       VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
3606         }
3607       else
3608         rv = VPPCOM_EINVAL;
3609       break;
3610
3611     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
3612       if (buffer && buflen && (*buflen >= sizeof (int)))
3613         {
3614           /* VPP-TBD */
3615           *(int *) buffer = vcl_session_has_attr (session,
3616                                                   VCL_SESS_ATTR_TCP_KEEPINTVL);
3617           *buflen = sizeof (int);
3618
3619           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3620                 *(int *) buffer, *buflen);
3621         }
3622       else
3623         rv = VPPCOM_EINVAL;
3624       break;
3625
3626     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
3627       if (buffer && buflen && (*buflen == sizeof (int)))
3628         {
3629           /* VPP-TBD */
3630           if (*(int *) buffer)
3631             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_KEEPINTVL);
3632           else
3633             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_KEEPINTVL);
3634
3635           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3636                 vcl_session_has_attr (session,
3637                                       VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
3638         }
3639       else
3640         rv = VPPCOM_EINVAL;
3641       break;
3642
3643     case VPPCOM_ATTR_GET_TCP_USER_MSS:
3644       if (!(buffer && buflen && (*buflen >= sizeof (u32))))
3645         {
3646           rv = VPPCOM_EINVAL;
3647           break;
3648         }
3649
3650       tea.type = TRANSPORT_ENDPT_ATTR_MSS;
3651       tea.mss = *(u32 *) buffer;
3652       if (vcl_session_transport_attr (wrk, session, 1 /* is_get */, &tea))
3653         rv = VPPCOM_ENOPROTOOPT;
3654
3655       if (!rv)
3656         {
3657           *(u32 *) buffer = tea.mss;
3658           *buflen = sizeof (int);
3659         }
3660
3661       VDBG (2, "VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d", *(int *) buffer,
3662             *buflen);
3663       break;
3664
3665     case VPPCOM_ATTR_SET_TCP_USER_MSS:
3666       if (!(buffer && buflen && (*buflen == sizeof (u32))))
3667         {
3668           rv = VPPCOM_EINVAL;
3669           break;
3670         }
3671
3672       tea.type = TRANSPORT_ENDPT_ATTR_MSS;
3673       tea.mss = *(u32 *) buffer;
3674       if (vcl_session_transport_attr (wrk, session, 0 /* is_get */, &tea))
3675         rv = VPPCOM_ENOPROTOOPT;
3676
3677       VDBG (2, "VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d", tea.mss,
3678             *buflen);
3679       break;
3680
3681     case VPPCOM_ATTR_SET_SHUT:
3682       if (*flags == SHUT_RD || *flags == SHUT_RDWR)
3683         vcl_session_set_attr (session, VCL_SESS_ATTR_SHUT_RD);
3684       if (*flags == SHUT_WR || *flags == SHUT_RDWR)
3685         vcl_session_set_attr (session, VCL_SESS_ATTR_SHUT_WR);
3686       break;
3687
3688     case VPPCOM_ATTR_GET_SHUT:
3689       if (vcl_session_has_attr (session, VCL_SESS_ATTR_SHUT_RD))
3690         tmp_flags = 1;
3691       if (vcl_session_has_attr (session, VCL_SESS_ATTR_SHUT_WR))
3692         tmp_flags |= 2;
3693       if (tmp_flags == 1)
3694         *(int *) buffer = SHUT_RD;
3695       else if (tmp_flags == 2)
3696         *(int *) buffer = SHUT_WR;
3697       else if (tmp_flags == 3)
3698         *(int *) buffer = SHUT_RDWR;
3699       *buflen = sizeof (int);
3700       break;
3701
3702     case VPPCOM_ATTR_SET_CONNECTED:
3703       session->flags |= VCL_SESSION_F_CONNECTED;
3704       break;
3705
3706     case VPPCOM_ATTR_SET_CKPAIR:
3707       if (!(buffer && buflen && (*buflen == sizeof (int))) ||
3708           !vcl_session_has_crypto (session))
3709         {
3710           rv = VPPCOM_EINVAL;
3711           break;
3712         }
3713       session->ckpair_index = *(uint32_t *) buffer;
3714       break;
3715
3716     case VPPCOM_ATTR_SET_VRF:
3717       if (!(buffer && buflen && (*buflen == sizeof (u32))))
3718         {
3719           rv = VPPCOM_EINVAL;
3720           break;
3721         }
3722       session->vrf = *(u32 *) buffer;
3723       break;
3724
3725     case VPPCOM_ATTR_GET_VRF:
3726       if (!(buffer && buflen && (*buflen >= sizeof (u32))))
3727         {
3728           rv = VPPCOM_EINVAL;
3729           break;
3730         }
3731       *(u32 *) buffer = session->vrf;
3732       *buflen = sizeof (u32);
3733       break;
3734
3735     case VPPCOM_ATTR_GET_DOMAIN:
3736       if (!(buffer && buflen && (*buflen >= sizeof (int))))
3737         {
3738           rv = VPPCOM_EINVAL;
3739           break;
3740         }
3741
3742       if (session->transport.is_ip4)
3743         *(int *) buffer = AF_INET;
3744       else
3745         *(int *) buffer = AF_INET6;
3746       *buflen = sizeof (int);
3747
3748       VDBG (2, "VPPCOM_ATTR_GET_DOMAIN: %d, buflen %u", *(int *) buffer,
3749             *buflen);
3750       break;
3751
3752     default:
3753       rv = VPPCOM_EINVAL;
3754       break;
3755     }
3756
3757   return rv;
3758 }
3759
3760 int
3761 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
3762                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
3763 {
3764   vcl_worker_t *wrk = vcl_worker_get_current ();
3765   vcl_session_t *session;
3766   int rv = VPPCOM_OK;
3767
3768   if (flags == 0)
3769     rv = vppcom_session_read (session_handle, buffer, buflen);
3770   else if (flags & MSG_PEEK)
3771     rv = vppcom_session_peek (session_handle, buffer, buflen);
3772   else
3773     {
3774       VDBG (0, "Unsupport flags for recvfrom %d", flags);
3775       return VPPCOM_EAFNOSUPPORT;
3776     }
3777
3778   if (ep && rv > 0)
3779     {
3780       session = vcl_session_get_w_handle (wrk, session_handle);
3781       if (session->transport.is_ip4)
3782         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3783                           sizeof (ip4_address_t));
3784       else
3785         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3786                           sizeof (ip6_address_t));
3787       ep->is_ip4 = session->transport.is_ip4;
3788       ep->port = session->transport.rmt_port;
3789     }
3790
3791   return rv;
3792 }
3793
3794 int
3795 vppcom_session_sendto (uint32_t session_handle, void *buffer,
3796                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
3797 {
3798   vcl_worker_t *wrk = vcl_worker_get_current ();
3799   vcl_session_t *s;
3800
3801   s = vcl_session_get_w_handle (wrk, session_handle);
3802   if (!s)
3803     return VPPCOM_EBADFD;
3804
3805   if (!buffer)
3806     return VPPCOM_EINVAL;
3807
3808   if (ep)
3809     {
3810       if (!vcl_session_is_cl (s))
3811         return VPPCOM_EINVAL;
3812
3813       /* Session not connected/bound in vpp. Create it by 'connecting' it */
3814       if (PREDICT_FALSE (s->session_state == VCL_STATE_CLOSED))
3815         {
3816           u32 session_index = s->session_index;
3817           f64 timeout = vcm->cfg.session_timeout;
3818           int rv;
3819
3820           vcl_send_session_connect (wrk, s);
3821           rv = vppcom_wait_for_session_state_change (session_index,
3822                                                      VCL_STATE_READY,
3823                                                      timeout);
3824           if (rv < 0)
3825             return rv;
3826           s = vcl_session_get (wrk, session_index);
3827         }
3828
3829       s->transport.is_ip4 = ep->is_ip4;
3830       s->transport.rmt_port = ep->port;
3831       vcl_ip_copy_from_ep (&s->transport.rmt_ip, ep);
3832     }
3833
3834   if (flags)
3835     {
3836       // TBD check the flags and do the right thing
3837       VDBG (2, "handling flags 0x%u (%d) not implemented yet.", flags, flags);
3838     }
3839
3840   return (vppcom_session_write_inline (wrk, s, buffer, buflen, 1,
3841                                        s->is_dgram ? 1 : 0));
3842 }
3843
3844 int
3845 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
3846 {
3847   vcl_worker_t *wrk = vcl_worker_get_current ();
3848   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
3849   u32 i, keep_trying = 1;
3850   svm_msg_q_msg_t msg;
3851   session_event_t *e;
3852   int rv, num_ev = 0;
3853
3854   VDBG (3, "vp %p, nsids %u, wait_for_time %f", vp, n_sids, wait_for_time);
3855
3856   if (!vp)
3857     return VPPCOM_EFAULT;
3858
3859   do
3860     {
3861       vcl_session_t *session;
3862
3863       /* Dequeue all events and drop all unhandled io events */
3864       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
3865         {
3866           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
3867           vcl_handle_mq_event (wrk, e);
3868           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
3869         }
3870       vec_reset_length (wrk->unhandled_evts_vector);
3871
3872       for (i = 0; i < n_sids; i++)
3873         {
3874           session = vcl_session_get (wrk, vp[i].sh);
3875           if (!session)
3876             {
3877               vp[i].revents = POLLHUP;
3878               num_ev++;
3879               continue;
3880             }
3881
3882           vp[i].revents = 0;
3883
3884           if (POLLIN & vp[i].events)
3885             {
3886               rv = vcl_session_read_ready (session);
3887               if (rv > 0)
3888                 {
3889                   vp[i].revents |= POLLIN;
3890                   num_ev++;
3891                 }
3892               else if (rv < 0)
3893                 {
3894                   switch (rv)
3895                     {
3896                     case VPPCOM_ECONNRESET:
3897                       vp[i].revents = POLLHUP;
3898                       break;
3899
3900                     default:
3901                       vp[i].revents = POLLERR;
3902                       break;
3903                     }
3904                   num_ev++;
3905                 }
3906             }
3907
3908           if (POLLOUT & vp[i].events)
3909             {
3910               rv = vcl_session_write_ready (session);
3911               if (rv > 0)
3912                 {
3913                   vp[i].revents |= POLLOUT;
3914                   num_ev++;
3915                 }
3916               else if (rv < 0)
3917                 {
3918                   switch (rv)
3919                     {
3920                     case VPPCOM_ECONNRESET:
3921                       vp[i].revents = POLLHUP;
3922                       break;
3923
3924                     default:
3925                       vp[i].revents = POLLERR;
3926                       break;
3927                     }
3928                   num_ev++;
3929                 }
3930             }
3931
3932           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
3933             {
3934               vp[i].revents = POLLNVAL;
3935               num_ev++;
3936             }
3937         }
3938       if (wait_for_time != -1)
3939         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
3940     }
3941   while ((num_ev == 0) && keep_trying);
3942
3943   return num_ev;
3944 }
3945
3946 int
3947 vppcom_mq_epoll_fd (void)
3948 {
3949   vcl_worker_t *wrk = vcl_worker_get_current ();
3950   return wrk->mqs_epfd;
3951 }
3952
3953 int
3954 vppcom_session_index (vcl_session_handle_t session_handle)
3955 {
3956   return session_handle & 0xFFFFFF;
3957 }
3958
3959 int
3960 vppcom_session_worker (vcl_session_handle_t session_handle)
3961 {
3962   return session_handle >> 24;
3963 }
3964
3965 int
3966 vppcom_worker_register (void)
3967 {
3968   if (!vcl_worker_alloc_and_init ())
3969     return VPPCOM_EEXIST;
3970
3971   if (vcl_worker_register_with_vpp ())
3972     return VPPCOM_EEXIST;
3973
3974   return VPPCOM_OK;
3975 }
3976
3977 void
3978 vppcom_worker_unregister (void)
3979 {
3980   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
3981   vcl_set_worker_index (~0);
3982 }
3983
3984 void
3985 vppcom_worker_index_set (int index)
3986 {
3987   vcl_set_worker_index (index);
3988 }
3989
3990 int
3991 vppcom_worker_index (void)
3992 {
3993   return vcl_get_worker_index ();
3994 }
3995
3996 int
3997 vppcom_worker_mqs_epfd (void)
3998 {
3999   vcl_worker_t *wrk = vcl_worker_get_current ();
4000   if (!vcm->cfg.use_mq_eventfd)
4001     return -1;
4002   return wrk->mqs_epfd;
4003 }
4004
4005 int
4006 vppcom_session_is_connectable_listener (uint32_t session_handle)
4007 {
4008   vcl_session_t *session;
4009   vcl_worker_t *wrk = vcl_worker_get_current ();
4010   session = vcl_session_get_w_handle (wrk, session_handle);
4011   if (!session)
4012     return VPPCOM_EBADFD;
4013   return vcl_session_is_connectable_listener (wrk, session);
4014 }
4015
4016 int
4017 vppcom_session_listener (uint32_t session_handle)
4018 {
4019   vcl_worker_t *wrk = vcl_worker_get_current ();
4020   vcl_session_t *listen_session, *session;
4021   session = vcl_session_get_w_handle (wrk, session_handle);
4022   if (!session)
4023     return VPPCOM_EBADFD;
4024   if (session->listener_index == VCL_INVALID_SESSION_INDEX)
4025     return VPPCOM_EBADFD;
4026   listen_session = vcl_session_get_w_handle (wrk, session->listener_index);
4027   if (!listen_session)
4028     return VPPCOM_EBADFD;
4029   return vcl_session_handle (listen_session);
4030 }
4031
4032 int
4033 vppcom_session_n_accepted (uint32_t session_handle)
4034 {
4035   vcl_worker_t *wrk = vcl_worker_get_current ();
4036   vcl_session_t *session = vcl_session_get_w_handle (wrk, session_handle);
4037   if (!session)
4038     return VPPCOM_EBADFD;
4039   return session->n_accepted_sessions;
4040 }
4041
4042 const char *
4043 vppcom_proto_str (vppcom_proto_t proto)
4044 {
4045   char const *proto_str;
4046
4047   switch (proto)
4048     {
4049     case VPPCOM_PROTO_TCP:
4050       proto_str = "TCP";
4051       break;
4052     case VPPCOM_PROTO_UDP:
4053       proto_str = "UDP";
4054       break;
4055     case VPPCOM_PROTO_TLS:
4056       proto_str = "TLS";
4057       break;
4058     case VPPCOM_PROTO_QUIC:
4059       proto_str = "QUIC";
4060       break;
4061     case VPPCOM_PROTO_DTLS:
4062       proto_str = "DTLS";
4063       break;
4064     default:
4065       proto_str = "UNKNOWN";
4066       break;
4067     }
4068   return proto_str;
4069 }
4070
4071 const char *
4072 vppcom_retval_str (int retval)
4073 {
4074   char const *st;
4075
4076   switch (retval)
4077     {
4078     case VPPCOM_OK:
4079       st = "VPPCOM_OK";
4080       break;
4081
4082     case VPPCOM_EAGAIN:
4083       st = "VPPCOM_EAGAIN";
4084       break;
4085
4086     case VPPCOM_EFAULT:
4087       st = "VPPCOM_EFAULT";
4088       break;
4089
4090     case VPPCOM_ENOMEM:
4091       st = "VPPCOM_ENOMEM";
4092       break;
4093
4094     case VPPCOM_EINVAL:
4095       st = "VPPCOM_EINVAL";
4096       break;
4097
4098     case VPPCOM_EBADFD:
4099       st = "VPPCOM_EBADFD";
4100       break;
4101
4102     case VPPCOM_EAFNOSUPPORT:
4103       st = "VPPCOM_EAFNOSUPPORT";
4104       break;
4105
4106     case VPPCOM_ECONNABORTED:
4107       st = "VPPCOM_ECONNABORTED";
4108       break;
4109
4110     case VPPCOM_ECONNRESET:
4111       st = "VPPCOM_ECONNRESET";
4112       break;
4113
4114     case VPPCOM_ENOTCONN:
4115       st = "VPPCOM_ENOTCONN";
4116       break;
4117
4118     case VPPCOM_ECONNREFUSED:
4119       st = "VPPCOM_ECONNREFUSED";
4120       break;
4121
4122     case VPPCOM_ETIMEDOUT:
4123       st = "VPPCOM_ETIMEDOUT";
4124       break;
4125
4126     default:
4127       st = "UNKNOWN_STATE";
4128       break;
4129     }
4130
4131   return st;
4132 }
4133
4134 int
4135 vppcom_add_cert_key_pair (vppcom_cert_key_pair_t *ckpair)
4136 {
4137   if (vcm->cfg.vpp_app_socket_api)
4138     {
4139       clib_warning ("not supported");
4140       return VPPCOM_EINVAL;
4141     }
4142   return vcl_bapi_add_cert_key_pair (ckpair);
4143 }
4144
4145 int
4146 vppcom_del_cert_key_pair (uint32_t ckpair_index)
4147 {
4148   if (vcm->cfg.vpp_app_socket_api)
4149     {
4150       clib_warning ("not supported");
4151       return VPPCOM_EINVAL;
4152     }
4153   return vcl_bapi_del_cert_key_pair (ckpair_index);
4154 }
4155
4156 /*
4157  * fd.io coding-style-patch-verification: ON
4158  *
4159  * Local Variables:
4160  * eval: (c-set-style "gnu")
4161  * End:
4162  */