vcl: propagate correctly EADDRINUSE for UDP bind
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <vcl/vppcom.h>
19 #include <vcl/vcl_debug.h>
20 #include <vcl/vcl_private.h>
21 #include <svm/fifo_segment.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static inline int
26 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq, u32 n_max_msg)
27 {
28   u32 n_msgs = 0, sz, len;
29
30   while ((sz = svm_msg_q_size (mq)))
31     {
32       len = vec_len (wrk->mq_msg_vector);
33       vec_validate (wrk->mq_msg_vector, len + sz - 1);
34       svm_msg_q_sub_raw_batch (mq, wrk->mq_msg_vector + len, sz);
35       n_msgs += sz;
36     }
37   return n_msgs;
38 }
39
40
41
42 static void
43 vcl_msg_add_ext_config (vcl_session_t *s, uword *offset)
44 {
45   svm_fifo_chunk_t *c;
46
47   c = vcl_segment_alloc_chunk (vcl_vpp_worker_segment_handle (0),
48                                0 /* one slice only */, s->ext_config->len,
49                                offset);
50   if (c)
51     clib_memcpy_fast (c->data, s->ext_config, s->ext_config->len);
52 }
53
54 void
55 vcl_send_session_listen (vcl_worker_t *wrk, vcl_session_t *s)
56 {
57   app_session_evt_t _app_evt, *app_evt = &_app_evt;
58   session_listen_msg_t *mp;
59   svm_msg_q_t *mq;
60
61   mq = vcl_worker_ctrl_mq (wrk);
62   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_LISTEN);
63   mp = (session_listen_msg_t *) app_evt->evt->data;
64   memset (mp, 0, sizeof (*mp));
65   mp->client_index = wrk->api_client_handle;
66   mp->context = s->session_index;
67   mp->wrk_index = wrk->vpp_wrk_index;
68   mp->is_ip4 = s->transport.is_ip4;
69   clib_memcpy_fast (&mp->ip, &s->transport.lcl_ip, sizeof (mp->ip));
70   mp->port = s->transport.lcl_port;
71   mp->proto = s->session_type;
72   mp->vrf = s->vrf;
73   if (s->flags & VCL_SESSION_F_CONNECTED)
74     mp->flags = TRANSPORT_CFG_F_CONNECTED;
75   if (s->ext_config)
76     vcl_msg_add_ext_config (s, &mp->ext_config);
77   app_send_ctrl_evt_to_vpp (mq, app_evt);
78   if (s->ext_config)
79     {
80       clib_mem_free (s->ext_config);
81       s->ext_config = 0;
82     }
83   s->flags |= VCL_SESSION_F_PENDING_LISTEN;
84 }
85
86 static void
87 vcl_send_session_connect (vcl_worker_t * wrk, vcl_session_t * s)
88 {
89   app_session_evt_t _app_evt, *app_evt = &_app_evt;
90   session_connect_msg_t *mp;
91   svm_msg_q_t *mq;
92
93   mq = vcl_worker_ctrl_mq (wrk);
94   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_CONNECT);
95   mp = (session_connect_msg_t *) app_evt->evt->data;
96   memset (mp, 0, sizeof (*mp));
97   mp->client_index = wrk->api_client_handle;
98   mp->context = s->session_index;
99   mp->dscp = s->dscp;
100   mp->wrk_index = wrk->vpp_wrk_index;
101   mp->is_ip4 = s->transport.is_ip4;
102   mp->parent_handle = s->parent_handle;
103   clib_memcpy_fast (&mp->ip, &s->transport.rmt_ip, sizeof (mp->ip));
104   clib_memcpy_fast (&mp->lcl_ip, &s->transport.lcl_ip, sizeof (mp->lcl_ip));
105   mp->port = s->transport.rmt_port;
106   mp->lcl_port = s->transport.lcl_port;
107   mp->proto = s->session_type;
108   mp->vrf = s->vrf;
109   if (s->flags & VCL_SESSION_F_CONNECTED)
110     mp->flags |= TRANSPORT_CFG_F_CONNECTED;
111   if (s->ext_config)
112     vcl_msg_add_ext_config (s, &mp->ext_config);
113   app_send_ctrl_evt_to_vpp (mq, app_evt);
114
115   if (s->ext_config)
116     {
117       clib_mem_free (s->ext_config);
118       s->ext_config = 0;
119     }
120 }
121
122 void
123 vcl_send_session_unlisten (vcl_worker_t * wrk, vcl_session_t * s)
124 {
125   app_session_evt_t _app_evt, *app_evt = &_app_evt;
126   session_unlisten_msg_t *mp;
127   svm_msg_q_t *mq;
128
129   mq = vcl_worker_ctrl_mq (wrk);
130   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_UNLISTEN);
131   mp = (session_unlisten_msg_t *) app_evt->evt->data;
132   memset (mp, 0, sizeof (*mp));
133   mp->client_index = wrk->api_client_handle;
134   mp->wrk_index = wrk->vpp_wrk_index;
135   mp->handle = s->vpp_handle;
136   mp->context = wrk->wrk_index;
137   app_send_ctrl_evt_to_vpp (mq, app_evt);
138 }
139
140 static void
141 vcl_send_session_shutdown (vcl_worker_t *wrk, vcl_session_t *s)
142 {
143   app_session_evt_t _app_evt, *app_evt = &_app_evt;
144   session_shutdown_msg_t *mp;
145   svm_msg_q_t *mq;
146
147   /* Send to thread that owns the session */
148   mq = s->vpp_evt_q;
149   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_SHUTDOWN);
150   mp = (session_shutdown_msg_t *) app_evt->evt->data;
151   memset (mp, 0, sizeof (*mp));
152   mp->client_index = wrk->api_client_handle;
153   mp->handle = s->vpp_handle;
154   app_send_ctrl_evt_to_vpp (mq, app_evt);
155 }
156
157 static void
158 vcl_send_session_disconnect (vcl_worker_t * wrk, vcl_session_t * s)
159 {
160   app_session_evt_t _app_evt, *app_evt = &_app_evt;
161   session_disconnect_msg_t *mp;
162   svm_msg_q_t *mq;
163
164   /* Send to thread that owns the session */
165   mq = s->vpp_evt_q;
166   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_DISCONNECT);
167   mp = (session_disconnect_msg_t *) app_evt->evt->data;
168   memset (mp, 0, sizeof (*mp));
169   mp->client_index = wrk->api_client_handle;
170   mp->handle = s->vpp_handle;
171   app_send_ctrl_evt_to_vpp (mq, app_evt);
172 }
173
174 static void
175 vcl_send_app_detach (vcl_worker_t * wrk)
176 {
177   app_session_evt_t _app_evt, *app_evt = &_app_evt;
178   session_app_detach_msg_t *mp;
179   svm_msg_q_t *mq;
180
181   mq = vcl_worker_ctrl_mq (wrk);
182   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_DETACH);
183   mp = (session_app_detach_msg_t *) app_evt->evt->data;
184   memset (mp, 0, sizeof (*mp));
185   mp->client_index = wrk->api_client_handle;
186   app_send_ctrl_evt_to_vpp (mq, app_evt);
187 }
188
189 static void
190 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
191                                  session_handle_t handle, int retval)
192 {
193   app_session_evt_t _app_evt, *app_evt = &_app_evt;
194   session_accepted_reply_msg_t *rmp;
195   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
196   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
197   rmp->handle = handle;
198   rmp->context = context;
199   rmp->retval = retval;
200   app_send_ctrl_evt_to_vpp (mq, app_evt);
201 }
202
203 static void
204 vcl_send_session_disconnected_reply (vcl_worker_t * wrk, vcl_session_t * s,
205                                      int retval)
206 {
207   app_session_evt_t _app_evt, *app_evt = &_app_evt;
208   session_disconnected_reply_msg_t *rmp;
209   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
210                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
211   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
212   rmp->handle = s->vpp_handle;
213   rmp->context = wrk->api_client_handle;
214   rmp->retval = retval;
215   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
216 }
217
218 static void
219 vcl_send_session_reset_reply (vcl_worker_t * wrk, vcl_session_t * s,
220                               int retval)
221 {
222   app_session_evt_t _app_evt, *app_evt = &_app_evt;
223   session_reset_reply_msg_t *rmp;
224   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
225                              SESSION_CTRL_EVT_RESET_REPLY);
226   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
227   rmp->handle = s->vpp_handle;
228   rmp->context = wrk->api_client_handle;
229   rmp->retval = retval;
230   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
231 }
232
233 void
234 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
235                                 u32 wrk_index)
236 {
237   app_session_evt_t _app_evt, *app_evt = &_app_evt;
238   session_worker_update_msg_t *mp;
239
240   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
241                              SESSION_CTRL_EVT_WORKER_UPDATE);
242   mp = (session_worker_update_msg_t *) app_evt->evt->data;
243   mp->client_index = wrk->api_client_handle;
244   mp->handle = s->vpp_handle;
245   mp->req_wrk_index = wrk->vpp_wrk_index;
246   mp->wrk_index = wrk_index;
247   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
248 }
249
250 int
251 vcl_send_worker_rpc (u32 dst_wrk_index, void *data, u32 data_len)
252 {
253   app_session_evt_t _app_evt, *app_evt = &_app_evt;
254   session_app_wrk_rpc_msg_t *mp;
255   vcl_worker_t *dst_wrk, *wrk;
256   svm_msg_q_t *mq;
257   int ret = -1;
258
259   if (data_len > sizeof (mp->data))
260     goto done;
261
262   clib_spinlock_lock (&vcm->workers_lock);
263
264   dst_wrk = vcl_worker_get_if_valid (dst_wrk_index);
265   if (!dst_wrk)
266     goto done;
267
268   wrk = vcl_worker_get_current ();
269   mq = vcl_worker_ctrl_mq (wrk);
270   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_WRK_RPC);
271   mp = (session_app_wrk_rpc_msg_t *) app_evt->evt->data;
272   mp->client_index = wrk->api_client_handle;
273   mp->wrk_index = dst_wrk->vpp_wrk_index;
274   clib_memcpy (mp->data, data, data_len);
275   app_send_ctrl_evt_to_vpp (mq, app_evt);
276   ret = 0;
277
278 done:
279   clib_spinlock_unlock (&vcm->workers_lock);
280   return ret;
281 }
282
283 int
284 vcl_session_transport_attr (vcl_worker_t *wrk, vcl_session_t *s, u8 is_get,
285                             transport_endpt_attr_t *attr)
286 {
287   app_session_evt_t _app_evt, *app_evt = &_app_evt;
288   session_transport_attr_msg_t *mp;
289   svm_msg_q_t *mq;
290   f64 timeout;
291
292   ASSERT (!wrk->session_attr_op);
293   mq = s->vpp_evt_q;
294   if (PREDICT_FALSE (!mq))
295     {
296       /* FIXME: attribute should be stored and sent once session is
297        * bound/connected to vpp */
298       return 0;
299     }
300
301   wrk->session_attr_op = 1;
302   wrk->session_attr_op_rv = -1;
303
304   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_TRANSPORT_ATTR);
305   mp = (session_transport_attr_msg_t *) app_evt->evt->data;
306   memset (mp, 0, sizeof (*mp));
307   mp->client_index = wrk->api_client_handle;
308   mp->handle = s->vpp_handle;
309   mp->is_get = is_get;
310   mp->attr = *attr;
311   app_send_ctrl_evt_to_vpp (mq, app_evt);
312
313   timeout = clib_time_now (&wrk->clib_time) + 1;
314
315   while (wrk->session_attr_op && clib_time_now (&wrk->clib_time) < timeout)
316     vcl_flush_mq_events ();
317
318   if (!wrk->session_attr_op_rv && is_get)
319     *attr = wrk->session_attr_rv;
320
321   wrk->session_attr_op = 0;
322
323   return wrk->session_attr_op_rv;
324 }
325
326 static u32
327 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp,
328                               u32 ls_index)
329 {
330   vcl_session_t *session, *listen_session;
331   svm_msg_q_t *evt_q;
332
333   session = vcl_session_alloc (wrk);
334
335   listen_session = vcl_session_get (wrk, ls_index);
336   if (listen_session->vpp_handle != mp->listener_handle)
337     {
338       VDBG (0, "ERROR: listener handle %lu does not match session %u",
339             mp->listener_handle, ls_index);
340       goto error;
341     }
342
343   if (vcl_segment_attach_session (
344         mp->segment_handle, mp->server_rx_fifo, mp->server_tx_fifo,
345         mp->vpp_event_queue_address, mp->mq_index, 0, session))
346     {
347       VDBG (0, "session %u [0x%llx]: failed to attach fifos",
348             session->session_index, mp->handle);
349       goto error;
350     }
351
352   session->vpp_handle = mp->handle;
353   session->session_state = VCL_STATE_READY;
354   if (mp->rmt.is_ip4)
355     {
356       session->original_dst_ip4 = mp->original_dst_ip4;
357       session->original_dst_port = mp->original_dst_port;
358     }
359   session->transport.rmt_port = mp->rmt.port;
360   session->transport.is_ip4 = mp->rmt.is_ip4;
361   clib_memcpy_fast (&session->transport.rmt_ip, &mp->rmt.ip,
362                     sizeof (ip46_address_t));
363
364   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
365   session->transport.lcl_port = mp->lcl.port;
366   session->transport.lcl_ip = mp->lcl.ip;
367   session->session_type = listen_session->session_type;
368   session->is_dgram = vcl_proto_is_dgram (session->session_type);
369   if (session->is_dgram)
370     session->flags |= (listen_session->flags & VCL_SESSION_F_CONNECTED);
371   session->listener_index = listen_session->session_index;
372   listen_session->n_accepted_sessions++;
373
374   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
375
376   vcl_send_session_accepted_reply (session->vpp_evt_q, mp->context,
377                                    session->vpp_handle, 0);
378
379   return session->session_index;
380
381 error:
382   vcl_segment_attach_mq (vcl_vpp_worker_segment_handle (0),
383                          mp->vpp_event_queue_address, mp->mq_index, &evt_q);
384   vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
385                                    VNET_API_ERROR_INVALID_ARGUMENT);
386   vcl_session_free (wrk, session);
387   return VCL_INVALID_SESSION_INDEX;
388 }
389
390 static u32
391 vcl_session_connected_handler (vcl_worker_t * wrk,
392                                session_connected_msg_t * mp)
393 {
394   vcl_session_t *session = 0;
395   u32 session_index;
396
397   session_index = mp->context;
398   session = vcl_session_get (wrk, session_index);
399   if (PREDICT_FALSE (!session))
400     {
401       VERR ("vpp handle 0x%llx has no session index (%u)!", mp->handle,
402             session_index);
403       /* Should not happen but if it does, force vpp session cleanup */
404       vcl_session_t tmp_session = {
405         .vpp_handle = mp->handle,
406         .vpp_evt_q = 0,
407       };
408       vcl_segment_attach_session (
409         mp->segment_handle, mp->server_rx_fifo, mp->server_tx_fifo,
410         mp->vpp_event_queue_address, mp->mq_index, 0, session);
411       if (tmp_session.vpp_evt_q)
412         vcl_send_session_disconnect (wrk, &tmp_session);
413       return VCL_INVALID_SESSION_INDEX;
414     }
415
416   if (mp->retval)
417     {
418       VDBG (0, "session %u: connect failed! %U", session_index,
419             format_session_error, mp->retval);
420       session->session_state = VCL_STATE_DETACHED;
421       session->vpp_handle = VCL_INVALID_SESSION_HANDLE;
422       session->vpp_error = mp->retval;
423       return session_index;
424     }
425
426   session->vpp_handle = mp->handle;
427
428   /* Add to lookup table. Even if something fails, session cannot be
429    * cleaned up prior to notifying vpp and going through the cleanup
430    * "procedure" see @ref vcl_session_cleanup_handler */
431   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
432
433   if (vcl_segment_attach_session (
434         mp->segment_handle, mp->server_rx_fifo, mp->server_tx_fifo,
435         mp->vpp_event_queue_address, mp->mq_index, 0, session))
436     {
437       VDBG (0, "session %u [0x%llx]: failed to attach fifos",
438             session->session_index, session->vpp_handle);
439       session->session_state = VCL_STATE_UPDATED;
440       vcl_send_session_disconnect (wrk, session);
441       return session_index;
442     }
443
444   if (mp->ct_rx_fifo)
445     {
446       if (vcl_segment_attach_session (mp->ct_segment_handle, mp->ct_rx_fifo,
447                                       mp->ct_tx_fifo, (uword) ~0, ~0, 1,
448                                       session))
449         {
450           VDBG (0, "session %u [0x%llx]: failed to attach ct fifos",
451                 session->session_index, session->vpp_handle);
452           session->session_state = VCL_STATE_UPDATED;
453           vcl_send_session_disconnect (wrk, session);
454           return session_index;
455         }
456     }
457
458   session->transport.is_ip4 = mp->lcl.is_ip4;
459   clib_memcpy_fast (&session->transport.lcl_ip, &mp->lcl.ip,
460                     sizeof (session->transport.lcl_ip));
461   session->transport.lcl_port = mp->lcl.port;
462
463   /* Application closed session before connect reply */
464   if (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK)
465       && session->session_state == VCL_STATE_CLOSED)
466     vcl_send_session_disconnect (wrk, session);
467   else
468     session->session_state = VCL_STATE_READY;
469
470   VDBG (0, "session %u [0x%llx] connected local: %U:%u remote %U:%u",
471         session->session_index, session->vpp_handle, vcl_format_ip46_address,
472         &session->transport.lcl_ip,
473         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
474         clib_net_to_host_u16 (session->transport.lcl_port),
475         vcl_format_ip46_address, &session->transport.rmt_ip,
476         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
477         clib_net_to_host_u16 (session->transport.rmt_port));
478
479   return session_index;
480 }
481
482 static int
483 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
484 {
485   vcl_session_msg_t *accepted_msg;
486   int i;
487
488   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
489     {
490       accepted_msg = &session->accept_evts_fifo[i];
491       if (accepted_msg->accepted_msg.handle == handle)
492         {
493           accepted_msg->flags |= flags;
494           return 1;
495         }
496     }
497   return 0;
498 }
499
500 static u32
501 vcl_session_reset_handler (vcl_worker_t * wrk,
502                            session_reset_msg_t * reset_msg)
503 {
504   vcl_session_t *session;
505   u32 sid;
506
507   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
508   session = vcl_session_get (wrk, sid);
509   if (!session)
510     {
511       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
512       return VCL_INVALID_SESSION_INDEX;
513     }
514
515   /* Caught a reset before actually accepting the session */
516   if (session->session_state == VCL_STATE_LISTEN ||
517       session->session_state == VCL_STATE_LISTEN_NO_MQ)
518     {
519       if (!vcl_flag_accepted_session (session, reset_msg->handle,
520                                       VCL_ACCEPTED_F_RESET))
521         VDBG (0, "session was not accepted!");
522       return VCL_INVALID_SESSION_INDEX;
523     }
524
525   if (session->session_state != VCL_STATE_CLOSED)
526     session->session_state = VCL_STATE_DISCONNECT;
527
528   session->flags |= (VCL_SESSION_F_RD_SHUTDOWN | VCL_SESSION_F_WR_SHUTDOWN);
529   VDBG (0, "session %u [0x%llx]: reset", sid, reset_msg->handle);
530   return sid;
531 }
532
533 static u32
534 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
535 {
536   vcl_session_t *session;
537   u32 sid = mp->context;
538
539   session = vcl_session_get (wrk, sid);
540   if (mp->retval)
541     {
542       VERR ("session %u [0x%llx]: bind failed: %U", sid, mp->handle,
543             format_session_error, mp->retval);
544       if (session)
545         {
546           session->session_state = VCL_STATE_DETACHED;
547           session->vpp_handle = mp->handle;
548           session->vpp_error = mp->retval;
549           return sid;
550         }
551       else
552         {
553           VDBG (0, "session %u [0x%llx]: Invalid session index!", sid,
554                 mp->handle);
555           return VCL_INVALID_SESSION_INDEX;
556         }
557     }
558
559   session->vpp_handle = mp->handle;
560   session->transport.is_ip4 = mp->lcl_is_ip4;
561   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
562                     sizeof (ip46_address_t));
563   session->transport.lcl_port = mp->lcl_port;
564   vcl_session_table_add_listener (wrk, mp->handle, sid);
565   session->session_state = VCL_STATE_LISTEN;
566   session->flags &= ~VCL_SESSION_F_PENDING_LISTEN;
567
568   if (vcl_session_is_cl (session))
569     {
570       if (vcl_segment_attach_session (mp->segment_handle, mp->rx_fifo,
571                                       mp->tx_fifo, mp->vpp_evt_q, mp->mq_index,
572                                       0, session))
573         {
574           VDBG (0, "session %u [0x%llx]: failed to attach fifos",
575                 session->session_index, session->vpp_handle);
576           session->session_state = VCL_STATE_DETACHED;
577           return VCL_INVALID_SESSION_INDEX;
578         }
579     }
580
581   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
582   return sid;
583 }
584
585 static void
586 vcl_session_unlisten_reply_handler (vcl_worker_t * wrk, void *data)
587 {
588   session_unlisten_reply_msg_t *mp = (session_unlisten_reply_msg_t *) data;
589   vcl_session_t *s;
590
591   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
592   if (!s)
593     {
594       VDBG (0, "Unlisten reply with wrong handle %llx", mp->handle);
595       return;
596     }
597   if (s->session_state != VCL_STATE_DISCONNECT)
598     {
599       /* Connected udp listener */
600       if (s->session_type == VPPCOM_PROTO_UDP
601           && s->session_state == VCL_STATE_CLOSED)
602         return;
603
604       VDBG (0, "Unlisten session in wrong state %llx", mp->handle);
605       return;
606     }
607
608   if (mp->retval)
609     VDBG (0, "ERROR: session %u [0xllx]: unlisten failed: %U",
610           s->session_index, mp->handle, format_session_error, mp->retval);
611
612   if (mp->context != wrk->wrk_index)
613     VDBG (0, "wrong context");
614
615   vcl_session_table_del_vpp_handle (wrk, mp->handle);
616   vcl_session_free (wrk, s);
617 }
618
619 static void
620 vcl_session_migrated_handler (vcl_worker_t * wrk, void *data)
621 {
622   session_migrated_msg_t *mp = (session_migrated_msg_t *) data;
623   vcl_session_t *s;
624   u32 fs_index;
625
626   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
627   if (!s)
628     {
629       VDBG (0, "Migrated notification with wrong handle %llx", mp->handle);
630       return;
631     }
632
633   /* Only validate if a value is provided */
634   if (mp->segment_handle != SESSION_INVALID_HANDLE)
635     {
636       fs_index = vcl_segment_table_lookup (mp->segment_handle);
637       if (fs_index == VCL_INVALID_SEGMENT_INDEX)
638         {
639           VDBG (0, "segment %lx for session %u is not mounted!",
640                 mp->segment_handle, s->session_index);
641           s->session_state = VCL_STATE_DETACHED;
642           return;
643         }
644     }
645
646   s->vpp_handle = mp->new_handle;
647
648   vcl_segment_attach_mq (vcl_vpp_worker_segment_handle (0), mp->vpp_evt_q,
649                          mp->vpp_thread_index, &s->vpp_evt_q);
650
651   vcl_session_table_del_vpp_handle (wrk, mp->handle);
652   vcl_session_table_add_vpp_handle (wrk, mp->new_handle, s->session_index);
653
654   /* Generate new tx event if we have outstanding data */
655   if (svm_fifo_has_event (s->tx_fifo))
656     app_send_io_evt_to_vpp (s->vpp_evt_q,
657                             s->tx_fifo->shr->master_session_index,
658                             SESSION_IO_EVT_TX, SVM_Q_WAIT);
659
660   VDBG (0, "Migrated 0x%lx to thread %u 0x%lx", mp->handle,
661         mp->vpp_thread_index, mp->new_handle);
662 }
663
664 static vcl_session_t *
665 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
666 {
667   vcl_session_msg_t *vcl_msg;
668   vcl_session_t *session;
669
670   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
671   if (PREDICT_FALSE (session != 0))
672     VWRN ("session overlap handle %lu state %u!", msg->handle,
673           session->session_state);
674
675   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
676   if (!session)
677     {
678       VERR ("couldn't find listen session: listener handle %llx",
679             msg->listener_handle);
680       return 0;
681     }
682
683   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
684   vcl_msg->flags = 0;
685   vcl_msg->accepted_msg = *msg;
686   /* Session handle points to listener until fully accepted by app */
687   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
688
689   return session;
690 }
691
692 static vcl_session_t *
693 vcl_session_disconnected_handler (vcl_worker_t * wrk,
694                                   session_disconnected_msg_t * msg)
695 {
696   vcl_session_t *session;
697
698   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
699   if (!session)
700     {
701       VWRN ("request to disconnect unknown handle 0x%llx", msg->handle);
702       return 0;
703     }
704
705   /* Late disconnect notification on a session that has been closed */
706   if (session->session_state == VCL_STATE_CLOSED)
707     return 0;
708
709   /* Caught a disconnect before actually accepting the session */
710   if (session->session_state == VCL_STATE_LISTEN ||
711       session->session_state == VCL_STATE_LISTEN_NO_MQ)
712     {
713       if (!vcl_flag_accepted_session (session, msg->handle,
714                                       VCL_ACCEPTED_F_CLOSED))
715         VDBG (0, "session was not accepted!");
716       return 0;
717     }
718
719   /* If not already reset change state */
720   if (session->session_state != VCL_STATE_DISCONNECT)
721     session->session_state = VCL_STATE_VPP_CLOSING;
722
723   return session;
724 }
725
726 int
727 vppcom_session_shutdown (uint32_t session_handle, int how)
728 {
729   vcl_worker_t *wrk = vcl_worker_get_current ();
730   vcl_session_t *session;
731   vcl_session_state_t state;
732   u64 vpp_handle;
733
734   session = vcl_session_get_w_handle (wrk, session_handle);
735   if (PREDICT_FALSE (!session))
736     return VPPCOM_EBADFD;
737
738   vpp_handle = session->vpp_handle;
739   state = session->session_state;
740
741   VDBG (1, "session %u [0x%llx] state 0x%x (%s)", session->session_index,
742         vpp_handle, state, vcl_session_state_str (state));
743
744   if (PREDICT_FALSE (state == VCL_STATE_LISTEN))
745     {
746       VDBG (0, "ERROR: Cannot shutdown a listen socket!");
747       return VPPCOM_EBADFD;
748     }
749
750   if (how == SHUT_RD || how == SHUT_RDWR)
751     {
752       session->flags |= VCL_SESSION_F_RD_SHUTDOWN;
753       if (how == SHUT_RD)
754         return VPPCOM_OK;
755     }
756   session->flags |= VCL_SESSION_F_WR_SHUTDOWN;
757
758   if (PREDICT_TRUE (state == VCL_STATE_READY))
759     {
760       VDBG (1, "session %u [0x%llx]: sending shutdown...",
761             session->session_index, vpp_handle);
762
763       vcl_send_session_shutdown (wrk, session);
764     }
765
766   return VPPCOM_OK;
767 }
768
769 static int
770 vppcom_session_disconnect (u32 session_handle)
771 {
772   vcl_worker_t *wrk = vcl_worker_get_current ();
773   vcl_session_t *session, *listen_session;
774   vcl_session_state_t state;
775   u64 vpp_handle;
776
777   session = vcl_session_get_w_handle (wrk, session_handle);
778   if (!session)
779     return VPPCOM_EBADFD;
780
781   vpp_handle = session->vpp_handle;
782   state = session->session_state;
783
784   VDBG (1, "session %u [0x%llx]: disconnecting state (%s)",
785         session->session_index, vpp_handle, vcl_session_state_str (state));
786
787   if (PREDICT_FALSE (state == VCL_STATE_LISTEN))
788     {
789       VDBG (0, "ERROR: Cannot disconnect a listen socket!");
790       return VPPCOM_EBADFD;
791     }
792
793   if (state == VCL_STATE_VPP_CLOSING)
794     {
795       vcl_send_session_disconnected_reply (wrk, session, 0);
796       VDBG (1, "session %u [0x%llx]: sending disconnect REPLY...",
797             session->session_index, vpp_handle);
798     }
799   else
800     {
801       /* Session doesn't have an event queue yet. Probably a non-blocking
802        * connect. Wait for the reply */
803       if (PREDICT_FALSE (!session->vpp_evt_q))
804         return VPPCOM_OK;
805
806       VDBG (1, "session %u [0x%llx]: sending disconnect",
807             session->session_index, vpp_handle);
808       vcl_send_session_disconnect (wrk, session);
809     }
810
811   if (session->listener_index != VCL_INVALID_SESSION_INDEX)
812     {
813       listen_session = vcl_session_get (wrk, session->listener_index);
814       if (listen_session)
815         listen_session->n_accepted_sessions--;
816     }
817
818   return VPPCOM_OK;
819 }
820
821 static void
822 vcl_session_cleanup_handler (vcl_worker_t * wrk, void *data)
823 {
824   session_cleanup_msg_t *msg;
825   vcl_session_t *session;
826
827   msg = (session_cleanup_msg_t *) data;
828   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
829   if (!session)
830     {
831       VWRN ("disconnect confirmed for unknown handle 0x%llx", msg->handle);
832       return;
833     }
834
835   if (msg->type == SESSION_CLEANUP_TRANSPORT)
836     {
837       /* Transport was cleaned up before we confirmed close. Probably the
838        * app is still waiting for some data that cannot be delivered.
839        * Confirm close to make sure everything is cleaned up.
840        * Move to undetermined state to ensure that the session is not
841        * removed before both vpp and the app cleanup.
842        * - If the app closes first, the session is moved to CLOSED state
843        *   and the session cleanup notification from vpp removes the
844        *   session.
845        * - If vpp cleans up the session first, the session is moved to
846        *   DETACHED state lower and subsequently the close from the app
847        *   frees the session
848        */
849       if (session->session_state == VCL_STATE_VPP_CLOSING)
850         {
851           vppcom_session_disconnect (vcl_session_handle (session));
852           session->session_state = VCL_STATE_UPDATED;
853         }
854       else if (session->session_state == VCL_STATE_DISCONNECT)
855         {
856           vcl_send_session_reset_reply (wrk, session, 0);
857           session->session_state = VCL_STATE_UPDATED;
858         }
859       return;
860     }
861
862   /* VPP will reuse the handle so clean it up now */
863   vcl_session_table_del_vpp_handle (wrk, msg->handle);
864
865   /* App did not close the connection yet so don't free it. */
866   if (session->session_state != VCL_STATE_CLOSED)
867     {
868       VDBG (0, "session %u: app did not close", session->session_index);
869       session->session_state = VCL_STATE_DETACHED;
870       session->vpp_handle = VCL_INVALID_SESSION_HANDLE;
871       return;
872     }
873
874   /* Session probably tracked with epoll, disconnect not yet handled and
875    * 1) both transport and session cleanup completed 2) app closed. Wait
876    * until message is drained to free the session.
877    * See @ref vcl_handle_mq_event */
878   if (session->flags & VCL_SESSION_F_PENDING_DISCONNECT)
879     {
880       session->flags |= VCL_SESSION_F_PENDING_FREE;
881       return;
882     }
883
884   vcl_session_free (wrk, session);
885 }
886
887 static void
888 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
889 {
890   session_req_worker_update_msg_t *msg;
891   vcl_session_t *s;
892
893   msg = (session_req_worker_update_msg_t *) data;
894   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
895   if (!s)
896     return;
897
898   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
899 }
900
901 static void
902 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
903 {
904   session_worker_update_reply_msg_t *msg;
905   vcl_session_t *s;
906
907   msg = (session_worker_update_reply_msg_t *) data;
908   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
909   if (!s)
910     {
911       VDBG (0, "unknown handle 0x%llx", msg->handle);
912       return;
913     }
914
915   if (s->rx_fifo)
916     {
917       if (vcl_segment_attach_session (msg->segment_handle, msg->rx_fifo,
918                                       msg->tx_fifo, (uword) ~0, ~0, 0, s))
919         {
920           VDBG (0, "failed to attach fifos for %u", s->session_index);
921           return;
922         }
923     }
924   s->session_state = VCL_STATE_UPDATED;
925
926   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
927         s->vpp_handle, wrk->wrk_index);
928 }
929
930 static int
931 vcl_api_recv_fd (vcl_worker_t * wrk, int *fds, int n_fds)
932 {
933
934   if (vcm->cfg.vpp_app_socket_api)
935     return vcl_sapi_recv_fds (wrk, fds, n_fds);
936
937   return vcl_bapi_recv_fds (wrk, fds, n_fds);
938 }
939
940 static void
941 vcl_session_app_add_segment_handler (vcl_worker_t * wrk, void *data)
942 {
943   ssvm_segment_type_t seg_type = SSVM_SEGMENT_SHM;
944   session_app_add_segment_msg_t *msg;
945   u64 segment_handle;
946   int fd = -1;
947
948   msg = (session_app_add_segment_msg_t *) data;
949
950   if (msg->fd_flags)
951     {
952       vcl_api_recv_fd (wrk, &fd, 1);
953       seg_type = SSVM_SEGMENT_MEMFD;
954     }
955
956   segment_handle = msg->segment_handle;
957   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
958     {
959       clib_warning ("invalid segment handle");
960       return;
961     }
962
963   if (vcl_segment_attach (segment_handle, (char *) msg->segment_name,
964                           seg_type, fd))
965     {
966       VDBG (0, "vcl_segment_attach ('%s') failed", msg->segment_name);
967       return;
968     }
969
970   VDBG (1, "mapped new segment '%s' size %d", msg->segment_name,
971         msg->segment_size);
972 }
973
974 static void
975 vcl_session_app_del_segment_handler (vcl_worker_t * wrk, void *data)
976 {
977   session_app_del_segment_msg_t *msg = (session_app_del_segment_msg_t *) data;
978   vcl_segment_detach (msg->segment_handle);
979   VDBG (1, "Unmapped segment: %lx", msg->segment_handle);
980 }
981
982 static void
983 vcl_worker_rpc_handler (vcl_worker_t * wrk, void *data)
984 {
985   if (!vcm->wrk_rpc_fn)
986     return;
987
988   (vcm->wrk_rpc_fn) (((session_app_wrk_rpc_msg_t *) data)->data);
989 }
990
991 static void
992 vcl_session_transport_attr_reply_handler (vcl_worker_t *wrk, void *data)
993 {
994   session_transport_attr_reply_msg_t *mp;
995
996   if (!wrk->session_attr_op)
997     return;
998
999   mp = (session_transport_attr_reply_msg_t *) data;
1000
1001   wrk->session_attr_op_rv = mp->retval;
1002   wrk->session_attr_op = 0;
1003   wrk->session_attr_rv = mp->attr;
1004 }
1005
1006 static int
1007 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
1008 {
1009   session_disconnected_msg_t *disconnected_msg;
1010   session_connected_msg_t *connected_msg;
1011   session_reset_msg_t *reset_msg;
1012   session_event_t *ecpy;
1013   vcl_session_t *s;
1014   u32 sid;
1015
1016   switch (e->event_type)
1017     {
1018     case SESSION_IO_EVT_RX:
1019     case SESSION_IO_EVT_TX:
1020       s = vcl_session_get (wrk, e->session_index);
1021       if (!s || !vcl_session_is_open (s))
1022         break;
1023       vec_add1 (wrk->unhandled_evts_vector, *e);
1024       break;
1025     case SESSION_CTRL_EVT_BOUND:
1026       /* We can only wait for only one listen so not postponed */
1027       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
1028       break;
1029     case SESSION_CTRL_EVT_ACCEPTED:
1030       s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
1031       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1032         {
1033           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1034           *ecpy = *e;
1035           ecpy->postponed = 1;
1036           ecpy->session_index = s->session_index;
1037         }
1038       break;
1039     case SESSION_CTRL_EVT_CONNECTED:
1040       connected_msg = (session_connected_msg_t *) e->data;
1041       sid = vcl_session_connected_handler (wrk, connected_msg);
1042       if (!(s = vcl_session_get (wrk, sid)))
1043         break;
1044       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1045         {
1046           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1047           *ecpy = *e;
1048           ecpy->postponed = 1;
1049           ecpy->session_index = s->session_index;
1050         }
1051       break;
1052     case SESSION_CTRL_EVT_DISCONNECTED:
1053       disconnected_msg = (session_disconnected_msg_t *) e->data;
1054       if (!(s = vcl_session_get_w_vpp_handle (wrk, disconnected_msg->handle)))
1055         break;
1056       if (s->session_state == VCL_STATE_CLOSED)
1057         break;
1058       /* We do not postpone for blocking sessions or listen sessions because:
1059        * 1. Blocking sessions are not part of epoll instead they're used in a
1060        *    synchronous manner, such as read/write and etc.
1061        * 2. Listen sessions that have not yet been accepted can't change to
1062        *    VPP_CLOSING state instead can been marked as ACCEPTED_F_CLOSED.
1063        */
1064       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK) &&
1065           !(s->session_state == VCL_STATE_LISTEN ||
1066             s->session_state == VCL_STATE_LISTEN_NO_MQ))
1067         {
1068           s->session_state = VCL_STATE_VPP_CLOSING;
1069           s->flags |= VCL_SESSION_F_PENDING_DISCONNECT;
1070           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1071           *ecpy = *e;
1072           ecpy->postponed = 1;
1073           ecpy->session_index = s->session_index;
1074           break;
1075         }
1076       if (!(s = vcl_session_disconnected_handler (wrk, disconnected_msg)))
1077         break;
1078       VDBG (0, "disconnected session %u [0x%llx]", s->session_index,
1079             s->vpp_handle);
1080       break;
1081     case SESSION_CTRL_EVT_RESET:
1082       reset_msg = (session_reset_msg_t *) e->data;
1083       if (!(s = vcl_session_get_w_vpp_handle (wrk, reset_msg->handle)))
1084         break;
1085       if (s->session_state == VCL_STATE_CLOSED)
1086         break;
1087       /* We do not postpone for blocking sessions or listen sessions because:
1088        * 1. Blocking sessions are not part of epoll instead they're used in a
1089        *    synchronous manner, such as read/write and etc.
1090        * 2. Listen sessions that have not yet been accepted can't change to
1091        *    DISCONNECT state instead can been marked as ACCEPTED_F_RESET.
1092        */
1093       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK) &&
1094           !(s->session_state == VCL_STATE_LISTEN ||
1095             s->session_state == VCL_STATE_LISTEN_NO_MQ))
1096         {
1097           s->flags |= VCL_SESSION_F_PENDING_DISCONNECT;
1098           s->session_state = VCL_STATE_DISCONNECT;
1099           s->flags |= (VCL_SESSION_F_RD_SHUTDOWN | VCL_SESSION_F_WR_SHUTDOWN);
1100           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1101           *ecpy = *e;
1102           ecpy->postponed = 1;
1103           ecpy->session_index = s->session_index;
1104           break;
1105         }
1106       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
1107       break;
1108     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
1109       vcl_session_unlisten_reply_handler (wrk, e->data);
1110       break;
1111     case SESSION_CTRL_EVT_MIGRATED:
1112       vcl_session_migrated_handler (wrk, e->data);
1113       break;
1114     case SESSION_CTRL_EVT_CLEANUP:
1115       vcl_session_cleanup_handler (wrk, e->data);
1116       break;
1117     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
1118       vcl_session_req_worker_update_handler (wrk, e->data);
1119       break;
1120     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
1121       vcl_session_worker_update_reply_handler (wrk, e->data);
1122       break;
1123     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
1124       vcl_session_app_add_segment_handler (wrk, e->data);
1125       break;
1126     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
1127       vcl_session_app_del_segment_handler (wrk, e->data);
1128       break;
1129     case SESSION_CTRL_EVT_APP_WRK_RPC:
1130       vcl_worker_rpc_handler (wrk, e->data);
1131       break;
1132     case SESSION_CTRL_EVT_TRANSPORT_ATTR_REPLY:
1133       vcl_session_transport_attr_reply_handler (wrk, e->data);
1134       break;
1135     default:
1136       clib_warning ("unhandled %u", e->event_type);
1137     }
1138   return VPPCOM_OK;
1139 }
1140
1141 static int
1142 vppcom_wait_for_session_state_change (u32 session_index,
1143                                       vcl_session_state_t state,
1144                                       f64 wait_for_time)
1145 {
1146   vcl_worker_t *wrk = vcl_worker_get_current ();
1147   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
1148   vcl_session_t *volatile session;
1149   svm_msg_q_msg_t msg;
1150   session_event_t *e;
1151
1152   do
1153     {
1154       session = vcl_session_get (wrk, session_index);
1155       if (PREDICT_FALSE (!session))
1156         {
1157           return VPPCOM_EBADFD;
1158         }
1159       if (session->session_state == state)
1160         {
1161           return VPPCOM_OK;
1162         }
1163       if (session->session_state == VCL_STATE_DETACHED)
1164         {
1165           if (session->vpp_error == SESSION_E_ALREADY_LISTENING)
1166             return VPPCOM_EADDRINUSE;
1167           else
1168             return VPPCOM_ECONNREFUSED;
1169         }
1170
1171       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
1172         {
1173           usleep (100);
1174           continue;
1175         }
1176       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1177       vcl_handle_mq_event (wrk, e);
1178       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1179     }
1180   while (clib_time_now (&wrk->clib_time) < timeout);
1181
1182   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
1183         vcl_session_state_str (state));
1184   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
1185
1186   return VPPCOM_ETIMEDOUT;
1187 }
1188
1189 static void
1190 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
1191 {
1192   vcl_session_state_t state;
1193   vcl_session_t *s;
1194   u32 *sip;
1195
1196   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
1197     return;
1198
1199   vec_foreach (sip, wrk->pending_session_wrk_updates)
1200   {
1201     s = vcl_session_get (wrk, *sip);
1202     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
1203     state = s->session_state;
1204     vppcom_wait_for_session_state_change (s->session_index, VCL_STATE_UPDATED,
1205                                           5);
1206     s->session_state = state;
1207   }
1208   vec_reset_length (wrk->pending_session_wrk_updates);
1209 }
1210
1211 void
1212 vcl_worker_flush_mq_events (vcl_worker_t *wrk)
1213 {
1214   svm_msg_q_msg_t *msg;
1215   session_event_t *e;
1216   svm_msg_q_t *mq;
1217   int i;
1218
1219   mq = wrk->app_event_queue;
1220   vcl_mq_dequeue_batch (wrk, mq, ~0);
1221
1222   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
1223     {
1224       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
1225       e = svm_msg_q_msg_data (mq, msg);
1226       vcl_handle_mq_event (wrk, e);
1227       svm_msg_q_free_msg (mq, msg);
1228     }
1229   vec_reset_length (wrk->mq_msg_vector);
1230   vcl_handle_pending_wrk_updates (wrk);
1231 }
1232
1233 void
1234 vcl_flush_mq_events (void)
1235 {
1236   vcl_worker_flush_mq_events (vcl_worker_get_current ());
1237 }
1238
1239 static int
1240 vppcom_session_unbind (u32 session_handle)
1241 {
1242   vcl_worker_t *wrk = vcl_worker_get_current ();
1243   session_accepted_msg_t *accepted_msg;
1244   vcl_session_t *session = 0;
1245   vcl_session_msg_t *evt;
1246
1247   session = vcl_session_get_w_handle (wrk, session_handle);
1248   if (!session)
1249     return VPPCOM_EBADFD;
1250
1251   /* Flush pending accept events, if any */
1252   while (clib_fifo_elts (session->accept_evts_fifo))
1253     {
1254       clib_fifo_sub2 (session->accept_evts_fifo, evt);
1255       accepted_msg = &evt->accepted_msg;
1256       vcl_session_table_del_vpp_handle (wrk, accepted_msg->handle);
1257       vcl_send_session_accepted_reply (session->vpp_evt_q,
1258                                        accepted_msg->context,
1259                                        accepted_msg->handle, -1);
1260     }
1261   clib_fifo_free (session->accept_evts_fifo);
1262
1263   vcl_send_session_unlisten (wrk, session);
1264
1265   VDBG (0, "session %u [0x%llx]: sending unbind!", session->session_index,
1266         session->vpp_handle);
1267   vcl_evt (VCL_EVT_UNBIND, session);
1268
1269   session->vpp_handle = ~0;
1270   session->session_state = VCL_STATE_DISCONNECT;
1271
1272   return VPPCOM_OK;
1273 }
1274
1275 /**
1276  * Handle app exit
1277  *
1278  * Notify vpp of the disconnect and mark the worker as free. If we're the
1279  * last worker, do a full cleanup otherwise, since we're probably a forked
1280  * child, avoid syscalls as much as possible. We might've lost privileges.
1281  */
1282 void
1283 vppcom_app_exit (void)
1284 {
1285   if (!pool_elts (vcm->workers))
1286     return;
1287   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1288   vcl_set_worker_index (~0);
1289   vcl_elog_stop (vcm);
1290 }
1291
1292 static int
1293 vcl_api_attach (void)
1294 {
1295   if (vcm->cfg.vpp_app_socket_api)
1296     return vcl_sapi_attach ();
1297
1298   return vcl_bapi_attach ();
1299 }
1300
1301 int
1302 vcl_is_first_reattach_to_execute ()
1303 {
1304   if (vcm->reattach_count == 0)
1305     return 1;
1306
1307   return 0;
1308 }
1309
1310 void
1311 vcl_set_reattach_counter ()
1312 {
1313   ++vcm->reattach_count;
1314
1315   if (vcm->reattach_count == vec_len (vcm->workers))
1316     vcm->reattach_count = 0;
1317 }
1318
1319 /**
1320  * Reattach vcl to vpp after it has previously been disconnected.
1321  *
1322  * The logic should be:
1323  * - first worker to hit `vcl_api_retry_attach` should attach to vpp,
1324  *   to reproduce the `vcl_api_attach` in `vppcom_app_create`.
1325  * - the rest of the workers should `reproduce vcl_worker_register_with_vpp`
1326  *   from `vppcom_worker_register` since they were already allocated.
1327  */
1328
1329 static void
1330 vcl_api_retry_attach (vcl_worker_t *wrk)
1331 {
1332   vcl_session_t *s;
1333
1334   clib_spinlock_lock (&vcm->workers_lock);
1335   if (vcl_is_first_reattach_to_execute ())
1336     {
1337       if (vcl_api_attach ())
1338         {
1339           clib_spinlock_unlock (&vcm->workers_lock);
1340           return;
1341         }
1342       vcl_set_reattach_counter ();
1343       clib_spinlock_unlock (&vcm->workers_lock);
1344     }
1345   else
1346     {
1347       vcl_set_reattach_counter ();
1348       clib_spinlock_unlock (&vcm->workers_lock);
1349       vcl_worker_register_with_vpp ();
1350     }
1351
1352   /* Treat listeners as configuration that needs to be re-added to vpp */
1353   pool_foreach (s, wrk->sessions)
1354     {
1355       if (s->flags & VCL_SESSION_F_IS_VEP)
1356         continue;
1357       if (s->session_state == VCL_STATE_LISTEN_NO_MQ)
1358         vppcom_session_listen (vcl_session_handle (s), 10);
1359       else
1360         VDBG (0, "internal error: unexpected state %d", s->session_state);
1361     }
1362 }
1363
1364 static void
1365 vcl_api_handle_disconnect (vcl_worker_t *wrk)
1366 {
1367   wrk->api_client_handle = ~0;
1368   vcl_worker_detach_sessions (wrk);
1369 }
1370
1371 static void
1372 vcl_api_detach (vcl_worker_t * wrk)
1373 {
1374   if (wrk->api_client_handle == ~0)
1375     return;
1376
1377   vcl_send_app_detach (wrk);
1378
1379   if (vcm->cfg.vpp_app_socket_api)
1380     return vcl_sapi_detach (wrk);
1381
1382   return vcl_bapi_disconnect_from_vpp ();
1383 }
1384
1385 /*
1386  * VPPCOM Public API functions
1387  */
1388 int
1389 vppcom_app_create (const char *app_name)
1390 {
1391   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
1392   int rv;
1393
1394   if (vcm->is_init)
1395     {
1396       VDBG (1, "already initialized");
1397       return VPPCOM_EEXIST;
1398     }
1399
1400   vcm->is_init = 1;
1401   vppcom_cfg (&vcm->cfg);
1402   vcl_cfg = &vcm->cfg;
1403
1404   vcm->main_cpu = pthread_self ();
1405   vcm->main_pid = getpid ();
1406   vcm->app_name = format (0, "%s", app_name);
1407   fifo_segment_main_init (&vcm->segment_main, (uword) ~0,
1408                           20 /* timeout in secs */);
1409   pool_alloc (vcm->workers, vcl_cfg->max_workers);
1410   clib_spinlock_init (&vcm->workers_lock);
1411   clib_rwlock_init (&vcm->segment_table_lock);
1412   atexit (vppcom_app_exit);
1413   vcl_elog_init (vcm);
1414
1415   /* Allocate default worker */
1416   vcl_worker_alloc_and_init ();
1417
1418   if ((rv = vcl_api_attach ()))
1419     {
1420       vppcom_app_destroy ();
1421       return rv;
1422     }
1423
1424   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
1425         vcm->workers[0].api_client_handle, vcm->workers[0].api_client_handle);
1426
1427   return VPPCOM_OK;
1428 }
1429
1430 void
1431 vppcom_app_destroy (void)
1432 {
1433   vcl_worker_t *wrk, *current_wrk;
1434   void *heap;
1435
1436   if (!pool_elts (vcm->workers))
1437     return;
1438
1439   vcl_evt (VCL_EVT_DETACH, vcm);
1440
1441   current_wrk = vcl_worker_get_current ();
1442
1443   /* *INDENT-OFF* */
1444   pool_foreach (wrk, vcm->workers)  {
1445     if (current_wrk != wrk)
1446       vcl_worker_cleanup (wrk, 0 /* notify vpp */ );
1447   }
1448   /* *INDENT-ON* */
1449
1450   vcl_api_detach (current_wrk);
1451   vcl_worker_cleanup (current_wrk, 0 /* notify vpp */ );
1452   vcl_set_worker_index (~0);
1453
1454   vcl_elog_stop (vcm);
1455
1456   /*
1457    * Free the heap and fix vcm
1458    */
1459   heap = clib_mem_get_heap ();
1460   munmap (clib_mem_get_heap_base (heap), clib_mem_get_heap_size (heap));
1461
1462   vcm = &_vppcom_main;
1463   vcm->is_init = 0;
1464 }
1465
1466 int
1467 vppcom_session_create (u8 proto, u8 is_nonblocking)
1468 {
1469   vcl_worker_t *wrk = vcl_worker_get_current ();
1470   vcl_session_t *session;
1471
1472   session = vcl_session_alloc (wrk);
1473
1474   session->session_type = proto;
1475   session->session_state = VCL_STATE_CLOSED;
1476   session->vpp_handle = ~0;
1477   session->is_dgram = vcl_proto_is_dgram (proto);
1478   session->vpp_error = SESSION_E_NONE;
1479
1480   if (is_nonblocking)
1481     vcl_session_set_attr (session, VCL_SESS_ATTR_NONBLOCK);
1482
1483   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1484            is_nonblocking, session_index);
1485
1486   VDBG (0, "created session %u", session->session_index);
1487
1488   return vcl_session_handle (session);
1489 }
1490
1491 static void
1492 vcl_epoll_lt_add (vcl_worker_t *wrk, vcl_session_t *s)
1493 {
1494   vcl_session_t *cur, *prev;
1495
1496   ASSERT (s->vep.lt_next == VCL_INVALID_SESSION_INDEX);
1497
1498   if (wrk->ep_lt_current == VCL_INVALID_SESSION_INDEX)
1499     {
1500       wrk->ep_lt_current = s->session_index;
1501       s->vep.lt_next = s->session_index;
1502       s->vep.lt_prev = s->session_index;
1503       return;
1504     }
1505
1506   cur = vcl_session_get (wrk, wrk->ep_lt_current);
1507   prev = vcl_session_get (wrk, cur->vep.lt_prev);
1508
1509   prev->vep.lt_next = s->session_index;
1510   s->vep.lt_prev = prev->session_index;
1511
1512   s->vep.lt_next = cur->session_index;
1513   cur->vep.lt_prev = s->session_index;
1514 }
1515
1516 static void
1517 vcl_epoll_lt_del (vcl_worker_t *wrk, vcl_session_t *s)
1518 {
1519   vcl_session_t *prev, *next;
1520
1521   ASSERT (s->vep.lt_next != VCL_INVALID_SESSION_INDEX);
1522
1523   if (s->vep.lt_next == s->session_index)
1524     {
1525       wrk->ep_lt_current = VCL_INVALID_SESSION_INDEX;
1526       s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
1527       s->vep.lt_prev = VCL_INVALID_SESSION_INDEX;
1528       return;
1529     }
1530
1531   prev = vcl_session_get (wrk, s->vep.lt_prev);
1532   next = vcl_session_get (wrk, s->vep.lt_next);
1533
1534   prev->vep.lt_next = next->session_index;
1535   next->vep.lt_prev = prev->session_index;
1536
1537   if (s->session_index == wrk->ep_lt_current)
1538     wrk->ep_lt_current = s->vep.lt_next;
1539
1540   s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
1541   s->vep.lt_prev = VCL_INVALID_SESSION_INDEX;
1542 }
1543
1544 int
1545 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * s,
1546                      vcl_session_handle_t sh, u8 do_disconnect)
1547 {
1548   int rv = VPPCOM_OK;
1549
1550   VDBG (1, "session %u [0x%llx] closing", s->session_index, s->vpp_handle);
1551
1552   if (s->flags & VCL_SESSION_F_IS_VEP)
1553     {
1554       u32 next_sh = s->vep.next_sh;
1555       while (next_sh != ~0)
1556         {
1557           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1558           if (PREDICT_FALSE (rv < 0))
1559             VDBG (0, "vpp handle 0x%llx, sh %u: EPOLL_CTL_DEL vep_idx %u"
1560                   " failed! rv %d (%s)", s->vpp_handle, next_sh,
1561                   s->vep.vep_sh, rv, vppcom_retval_str (rv));
1562           next_sh = s->vep.next_sh;
1563         }
1564       goto free_session;
1565     }
1566
1567   if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
1568     {
1569       rv = vppcom_epoll_ctl (s->vep.vep_sh, EPOLL_CTL_DEL, sh, 0);
1570       if (rv < 0)
1571         VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1572               "failed! rv %d (%s)", s->session_index, s->vpp_handle,
1573               s->vep.vep_sh, rv, vppcom_retval_str (rv));
1574     }
1575
1576   if (!do_disconnect)
1577     {
1578       VDBG (1, "session %u [0x%llx] disconnect skipped",
1579             s->session_index, s->vpp_handle);
1580       goto cleanup;
1581     }
1582
1583   if (s->session_state == VCL_STATE_LISTEN)
1584     {
1585       rv = vppcom_session_unbind (sh);
1586       if (PREDICT_FALSE (rv < 0))
1587         VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1588               "rv %d (%s)", s->session_index, s->vpp_handle, rv,
1589               vppcom_retval_str (rv));
1590       return rv;
1591     }
1592   else if (vcl_session_is_ready (s)
1593            || (vcl_session_is_connectable_listener (wrk, s)))
1594     {
1595       rv = vppcom_session_disconnect (sh);
1596       if (PREDICT_FALSE (rv < 0))
1597         VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1598               " rv %d (%s)", s->session_index, s->vpp_handle,
1599               rv, vppcom_retval_str (rv));
1600     }
1601   else if (s->session_state == VCL_STATE_DISCONNECT)
1602     {
1603       vcl_send_session_reset_reply (wrk, s, 0);
1604     }
1605   else if (s->session_state == VCL_STATE_DETACHED)
1606     {
1607       VDBG (0, "vpp freed session %d before close", s->session_index);
1608
1609       if (!(s->flags & VCL_SESSION_F_PENDING_DISCONNECT))
1610         goto free_session;
1611
1612       /* Disconnect/reset messages pending but vpp transport and session
1613        * cleanups already done. Free only after messages drained. */
1614       s->flags |= VCL_SESSION_F_PENDING_FREE;
1615     }
1616
1617   s->session_state = VCL_STATE_CLOSED;
1618
1619   /* Session is removed only after vpp confirms the disconnect */
1620   return rv;
1621
1622 cleanup:
1623   vcl_session_table_del_vpp_handle (wrk, s->vpp_handle);
1624 free_session:
1625   vcl_session_free (wrk, s);
1626   vcl_evt (VCL_EVT_CLOSE, s, rv);
1627
1628   return rv;
1629 }
1630
1631 int
1632 vppcom_session_close (uint32_t session_handle)
1633 {
1634   vcl_worker_t *wrk = vcl_worker_get_current ();
1635   vcl_session_t *session;
1636
1637   session = vcl_session_get_w_handle (wrk, session_handle);
1638   if (!session)
1639     return VPPCOM_EBADFD;
1640   return vcl_session_cleanup (wrk, session, session_handle,
1641                               1 /* do_disconnect */ );
1642 }
1643
1644 int
1645 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1646 {
1647   vcl_worker_t *wrk = vcl_worker_get_current ();
1648   vcl_session_t *session = 0;
1649
1650   if (!ep || !ep->ip)
1651     return VPPCOM_EINVAL;
1652
1653   session = vcl_session_get_w_handle (wrk, session_handle);
1654   if (!session)
1655     return VPPCOM_EBADFD;
1656
1657   if (session->flags & VCL_SESSION_F_IS_VEP)
1658     {
1659       VDBG (0, "ERROR: cannot bind to epoll session %u!",
1660             session->session_index);
1661       return VPPCOM_EBADFD;
1662     }
1663
1664   session->transport.is_ip4 = ep->is_ip4;
1665   if (ep->is_ip4)
1666     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1667                       sizeof (ip4_address_t));
1668   else
1669     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1670                       sizeof (ip6_address_t));
1671   session->transport.lcl_port = ep->port;
1672
1673   VDBG (0,
1674         "session %u handle %u: binding to local %s address %U port %u, "
1675         "proto %s",
1676         session->session_index, session_handle,
1677         session->transport.is_ip4 ? "IPv4" : "IPv6", vcl_format_ip46_address,
1678         &session->transport.lcl_ip,
1679         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1680         clib_net_to_host_u16 (session->transport.lcl_port),
1681         vppcom_proto_str (session->session_type));
1682   vcl_evt (VCL_EVT_BIND, session);
1683
1684   if (session->session_type == VPPCOM_PROTO_UDP)
1685     return vppcom_session_listen (session_handle, 10);
1686
1687   return VPPCOM_OK;
1688 }
1689
1690 int
1691 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1692 {
1693   vcl_worker_t *wrk = vcl_worker_get_current ();
1694   vcl_session_t *listen_session = 0;
1695   u64 listen_vpp_handle;
1696   int rv;
1697
1698   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1699   if (!listen_session || (listen_session->flags & VCL_SESSION_F_IS_VEP))
1700     return VPPCOM_EBADFD;
1701
1702   listen_vpp_handle = listen_session->vpp_handle;
1703   if (listen_session->session_state == VCL_STATE_LISTEN)
1704     {
1705       VDBG (0, "session %u [0x%llx]: already in listen state!",
1706             listen_sh, listen_vpp_handle);
1707       return VPPCOM_OK;
1708     }
1709
1710   VDBG (0, "session %u: sending vpp listen request...", listen_sh);
1711
1712   /*
1713    * Send listen request to vpp and wait for reply
1714    */
1715   vcl_send_session_listen (wrk, listen_session);
1716   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1717                                              VCL_STATE_LISTEN,
1718                                              vcm->cfg.session_timeout);
1719
1720   if (PREDICT_FALSE (rv))
1721     {
1722       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1723       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1724             listen_sh, listen_session->vpp_handle, rv,
1725             vppcom_retval_str (rv));
1726       return rv;
1727     }
1728
1729   return VPPCOM_OK;
1730 }
1731
1732 int
1733 vppcom_unformat_proto (uint8_t * proto, char *proto_str)
1734 {
1735   if (!strcmp (proto_str, "TCP"))
1736     *proto = VPPCOM_PROTO_TCP;
1737   else if (!strcmp (proto_str, "tcp"))
1738     *proto = VPPCOM_PROTO_TCP;
1739   else if (!strcmp (proto_str, "UDP"))
1740     *proto = VPPCOM_PROTO_UDP;
1741   else if (!strcmp (proto_str, "udp"))
1742     *proto = VPPCOM_PROTO_UDP;
1743   else if (!strcmp (proto_str, "TLS"))
1744     *proto = VPPCOM_PROTO_TLS;
1745   else if (!strcmp (proto_str, "tls"))
1746     *proto = VPPCOM_PROTO_TLS;
1747   else if (!strcmp (proto_str, "QUIC"))
1748     *proto = VPPCOM_PROTO_QUIC;
1749   else if (!strcmp (proto_str, "quic"))
1750     *proto = VPPCOM_PROTO_QUIC;
1751   else if (!strcmp (proto_str, "DTLS"))
1752     *proto = VPPCOM_PROTO_DTLS;
1753   else if (!strcmp (proto_str, "dtls"))
1754     *proto = VPPCOM_PROTO_DTLS;
1755   else if (!strcmp (proto_str, "SRTP"))
1756     *proto = VPPCOM_PROTO_SRTP;
1757   else if (!strcmp (proto_str, "srtp"))
1758     *proto = VPPCOM_PROTO_SRTP;
1759   else
1760     return 1;
1761   return 0;
1762 }
1763
1764 int
1765 vppcom_session_accept (uint32_t ls_handle, vppcom_endpt_t *ep, uint32_t flags)
1766 {
1767   u32 client_session_index = ~0, ls_index, accept_flags = 0;
1768   vcl_worker_t *wrk = vcl_worker_get_current ();
1769   session_accepted_msg_t accepted_msg;
1770   vcl_session_t *ls, *client_session = 0;
1771   vcl_session_msg_t *evt;
1772   u8 is_nonblocking;
1773
1774 again:
1775
1776   ls = vcl_session_get_w_handle (wrk, ls_handle);
1777   if (!ls)
1778     return VPPCOM_EBADFD;
1779
1780   if ((ls->session_state != VCL_STATE_LISTEN) &&
1781       (ls->session_state != VCL_STATE_LISTEN_NO_MQ) &&
1782       (!vcl_session_is_connectable_listener (wrk, ls)))
1783     {
1784       VDBG (0, "ERROR: session [0x%llx]: not in listen state! state (%s)",
1785             ls->vpp_handle, vcl_session_state_str (ls->session_state));
1786       return VPPCOM_EBADFD;
1787     }
1788
1789   ls_index = ls->session_index;
1790
1791   if (clib_fifo_elts (ls->accept_evts_fifo))
1792     {
1793       clib_fifo_sub2 (ls->accept_evts_fifo, evt);
1794       accept_flags = evt->flags;
1795       accepted_msg = evt->accepted_msg;
1796       goto handle;
1797     }
1798
1799   is_nonblocking = vcl_session_has_attr (ls, VCL_SESS_ATTR_NONBLOCK);
1800   while (1)
1801     {
1802       if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1803         return VPPCOM_EAGAIN;
1804
1805       svm_msg_q_wait (wrk->app_event_queue, SVM_MQ_WAIT_EMPTY);
1806       vcl_worker_flush_mq_events (wrk);
1807       goto again;
1808     }
1809
1810 handle:
1811
1812   client_session_index =
1813     vcl_session_accepted_handler (wrk, &accepted_msg, ls_index);
1814   if (client_session_index == VCL_INVALID_SESSION_INDEX)
1815     return VPPCOM_ECONNABORTED;
1816
1817   ls = vcl_session_get (wrk, ls_index);
1818   client_session = vcl_session_get (wrk, client_session_index);
1819
1820   if (flags & O_NONBLOCK)
1821     vcl_session_set_attr (client_session, VCL_SESS_ATTR_NONBLOCK);
1822
1823   VDBG (1,
1824         "listener %u [0x%llx]: Got a connect request! session %u [0x%llx],"
1825         " flags %d, is_nonblocking %u",
1826         ls->session_index, ls->vpp_handle, client_session_index,
1827         client_session->vpp_handle, flags,
1828         vcl_session_has_attr (client_session, VCL_SESS_ATTR_NONBLOCK));
1829
1830   if (ep)
1831     {
1832       ep->is_ip4 = client_session->transport.is_ip4;
1833       ep->port = client_session->transport.rmt_port;
1834       if (client_session->transport.is_ip4)
1835         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1836                           sizeof (ip4_address_t));
1837       else
1838         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1839                           sizeof (ip6_address_t));
1840     }
1841
1842   VDBG (0,
1843         "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1844         "local: %U:%u",
1845         ls_handle, ls->vpp_handle, client_session_index,
1846         client_session->vpp_handle, vcl_format_ip46_address,
1847         &client_session->transport.rmt_ip,
1848         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1849         clib_net_to_host_u16 (client_session->transport.rmt_port),
1850         vcl_format_ip46_address, &client_session->transport.lcl_ip,
1851         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1852         clib_net_to_host_u16 (client_session->transport.lcl_port));
1853   vcl_evt (VCL_EVT_ACCEPT, client_session, ls, client_session_index);
1854
1855   /*
1856    * Session might have been closed already
1857    */
1858   if (accept_flags)
1859     {
1860       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1861         client_session->session_state = VCL_STATE_VPP_CLOSING;
1862       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1863         client_session->session_state = VCL_STATE_DISCONNECT;
1864     }
1865   return vcl_session_handle (client_session);
1866 }
1867
1868 int
1869 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1870 {
1871   vcl_worker_t *wrk = vcl_worker_get_current ();
1872   vcl_session_t *session = 0;
1873   u32 session_index;
1874   int rv;
1875
1876   session = vcl_session_get_w_handle (wrk, session_handle);
1877   if (!session)
1878     return VPPCOM_EBADFD;
1879   session_index = session->session_index;
1880
1881   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
1882     {
1883       VWRN ("cannot connect epoll session %u!", session->session_index);
1884       return VPPCOM_EBADFD;
1885     }
1886
1887   if (PREDICT_FALSE (vcl_session_is_ready (session)))
1888     {
1889       VDBG (0,
1890             "session %u [0x%llx]: already connected to %U:%d proto %s,"
1891             " state (%s)",
1892             session->session_index, session->vpp_handle,
1893             vcl_format_ip46_address, &session->transport.rmt_ip,
1894             session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1895             clib_net_to_host_u16 (session->transport.rmt_port),
1896             vppcom_proto_str (session->session_type),
1897             vcl_session_state_str (session->session_state));
1898       return VPPCOM_OK;
1899     }
1900
1901   /* Attempt to connect a connectionless listener */
1902   if (PREDICT_FALSE (session->session_state == VCL_STATE_LISTEN))
1903     {
1904       if (session->session_type != VPPCOM_PROTO_UDP)
1905         return VPPCOM_EINVAL;
1906       vcl_send_session_unlisten (wrk, session);
1907       session->session_state = VCL_STATE_CLOSED;
1908     }
1909
1910   session->transport.is_ip4 = server_ep->is_ip4;
1911   vcl_ip_copy_from_ep (&session->transport.rmt_ip, server_ep);
1912   session->transport.rmt_port = server_ep->port;
1913   session->parent_handle = VCL_INVALID_SESSION_HANDLE;
1914   session->flags |= VCL_SESSION_F_CONNECTED;
1915
1916   VDBG (0, "session %u: connecting to peer %U:%d proto %s",
1917         session->session_index, vcl_format_ip46_address,
1918         &session->transport.rmt_ip,
1919         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1920         clib_net_to_host_u16 (session->transport.rmt_port),
1921         vppcom_proto_str (session->session_type));
1922
1923   vcl_send_session_connect (wrk, session);
1924
1925   if (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK))
1926     {
1927       /* State set to STATE_UPDATED to ensure the session is not assumed
1928        * to be ready and to also allow the app to close it prior to vpp's
1929        * connected reply. */
1930       session->session_state = VCL_STATE_UPDATED;
1931       return VPPCOM_EINPROGRESS;
1932     }
1933
1934   /*
1935    * Wait for reply from vpp if blocking
1936    */
1937   rv = vppcom_wait_for_session_state_change (session_index, VCL_STATE_READY,
1938                                              vcm->cfg.session_timeout);
1939
1940   session = vcl_session_get (wrk, session_index);
1941   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1942         session->vpp_handle, rv ? "failed" : "succeeded");
1943
1944   return rv;
1945 }
1946
1947 int
1948 vppcom_session_stream_connect (uint32_t session_handle,
1949                                uint32_t parent_session_handle)
1950 {
1951   vcl_worker_t *wrk = vcl_worker_get_current ();
1952   vcl_session_t *session, *parent_session;
1953   u32 session_index, parent_session_index;
1954   int rv;
1955
1956   session = vcl_session_get_w_handle (wrk, session_handle);
1957   if (!session)
1958     return VPPCOM_EBADFD;
1959   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1960   if (!parent_session)
1961     return VPPCOM_EBADFD;
1962
1963   session_index = session->session_index;
1964   parent_session_index = parent_session->session_index;
1965   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
1966     {
1967       VDBG (0, "ERROR: cannot connect epoll session %u!",
1968             session->session_index);
1969       return VPPCOM_EBADFD;
1970     }
1971
1972   if (PREDICT_FALSE (vcl_session_is_ready (session)))
1973     {
1974       VDBG (0,
1975             "session handle %u [0x%llx]: session already "
1976             "connected to session %u [0x%llx] proto %s, state 0x%x (%s)",
1977             session_handle, session->vpp_handle, parent_session_handle,
1978             parent_session->vpp_handle,
1979             vppcom_proto_str (session->session_type), session->session_state,
1980             vcl_session_state_str (session->session_state));
1981       return VPPCOM_OK;
1982     }
1983
1984   /* Connect to quic session specifics */
1985   session->transport.is_ip4 = parent_session->transport.is_ip4;
1986   session->transport.rmt_ip.ip4.as_u32 = (uint32_t) 1;
1987   session->transport.rmt_port = 0;
1988   session->parent_handle = parent_session->vpp_handle;
1989
1990   VDBG (0, "session handle %u: connecting to session %u [0x%llx]",
1991         session_handle, parent_session_handle, parent_session->vpp_handle);
1992
1993   /*
1994    * Send connect request and wait for reply from vpp
1995    */
1996   vcl_send_session_connect (wrk, session);
1997   rv = vppcom_wait_for_session_state_change (session_index, VCL_STATE_READY,
1998                                              vcm->cfg.session_timeout);
1999
2000   session->listener_index = parent_session_index;
2001   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
2002   if (parent_session)
2003     parent_session->n_accepted_sessions++;
2004
2005   session = vcl_session_get (wrk, session_index);
2006   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
2007         session->vpp_handle, rv ? "failed" : "succeeded");
2008
2009   return rv;
2010 }
2011
2012 static inline int
2013 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
2014                               u8 peek)
2015 {
2016   vcl_worker_t *wrk = vcl_worker_get_current ();
2017   int rv, n_read = 0, is_nonblocking;
2018   vcl_session_t *s = 0;
2019   svm_fifo_t *rx_fifo;
2020   session_event_t *e;
2021   svm_msg_q_t *mq;
2022   u8 is_ct;
2023
2024   if (PREDICT_FALSE (!buf))
2025     return VPPCOM_EFAULT;
2026
2027   s = vcl_session_get_w_handle (wrk, session_handle);
2028   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2029     return VPPCOM_EBADFD;
2030
2031   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2032     {
2033       VDBG (0, "session %u[0x%llx] is not open! state 0x%x (%s)",
2034             s->session_index, s->vpp_handle, s->session_state,
2035             vcl_session_state_str (s->session_state));
2036       return vcl_session_closed_error (s);
2037     }
2038
2039   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_RD_SHUTDOWN))
2040     {
2041       /* Vpp would ack the incoming data and enqueue it for reading.
2042        * So even if SHUT_RD is set, we can still read() the data if
2043        * the session is ready.
2044        */
2045       if (!vcl_session_read_ready (s))
2046         {
2047           return 0;
2048         }
2049     }
2050
2051   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2052   is_ct = vcl_session_is_ct (s);
2053   mq = wrk->app_event_queue;
2054   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
2055   s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2056
2057   if (svm_fifo_is_empty_cons (rx_fifo))
2058     {
2059       if (is_ct)
2060         svm_fifo_unset_event (s->rx_fifo);
2061       svm_fifo_unset_event (rx_fifo);
2062       if (is_nonblocking)
2063         {
2064           if (vcl_session_is_closing (s))
2065             return vcl_session_closing_error (s);
2066           return VPPCOM_EWOULDBLOCK;
2067         }
2068       while (svm_fifo_is_empty_cons (rx_fifo))
2069         {
2070           if (vcl_session_is_closing (s))
2071             return vcl_session_closing_error (s);
2072
2073           if (is_ct)
2074             svm_fifo_unset_event (s->rx_fifo);
2075           svm_fifo_unset_event (rx_fifo);
2076
2077           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2078           vcl_worker_flush_mq_events (wrk);
2079         }
2080     }
2081
2082 read_again:
2083
2084   if (s->is_dgram)
2085     rv = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
2086   else
2087     rv = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
2088
2089   ASSERT (rv >= 0);
2090
2091   if (peek)
2092     return rv;
2093
2094   n_read += rv;
2095
2096   if (svm_fifo_is_empty_cons (rx_fifo))
2097     {
2098       if (is_ct)
2099         svm_fifo_unset_event (s->rx_fifo);
2100       svm_fifo_unset_event (rx_fifo);
2101       if (!svm_fifo_is_empty_cons (rx_fifo)
2102           && svm_fifo_set_event (rx_fifo) && is_nonblocking)
2103         {
2104           vec_add2 (wrk->unhandled_evts_vector, e, 1);
2105           e->event_type = SESSION_IO_EVT_RX;
2106           e->session_index = s->session_index;
2107         }
2108     }
2109   else if (PREDICT_FALSE (rv < n && !s->is_dgram))
2110     {
2111       /* More data enqueued while reading. Try to drain it
2112        * or fill the buffer. Avoid doing that for dgrams */
2113       buf += rv;
2114       n -= rv;
2115       goto read_again;
2116     }
2117
2118   if (PREDICT_FALSE (svm_fifo_needs_deq_ntf (rx_fifo, n_read)))
2119     {
2120       svm_fifo_clear_deq_ntf (rx_fifo);
2121       app_send_io_evt_to_vpp (s->vpp_evt_q,
2122                               s->rx_fifo->shr->master_session_index,
2123                               SESSION_IO_EVT_RX, SVM_Q_WAIT);
2124     }
2125
2126   VDBG (2, "session %u[0x%llx]: read %d bytes from (%p)", s->session_index,
2127         s->vpp_handle, n_read, rx_fifo);
2128
2129   return n_read;
2130 }
2131
2132 int
2133 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
2134 {
2135   return (vppcom_session_read_internal (session_handle, buf, n, 0));
2136 }
2137
2138 static int
2139 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
2140 {
2141   return (vppcom_session_read_internal (session_handle, buf, n, 1));
2142 }
2143
2144 int
2145 vppcom_session_read_segments (uint32_t session_handle,
2146                               vppcom_data_segment_t * ds, uint32_t n_segments,
2147                               uint32_t max_bytes)
2148 {
2149   vcl_worker_t *wrk = vcl_worker_get_current ();
2150   int n_read = 0, is_nonblocking;
2151   vcl_session_t *s = 0;
2152   svm_fifo_t *rx_fifo;
2153   svm_msg_q_t *mq;
2154   u8 is_ct;
2155
2156   s = vcl_session_get_w_handle (wrk, session_handle);
2157   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2158     return VPPCOM_EBADFD;
2159
2160   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2161     return vcl_session_closed_error (s);
2162
2163   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2164   is_ct = vcl_session_is_ct (s);
2165   mq = wrk->app_event_queue;
2166   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
2167   s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2168
2169   if (svm_fifo_is_empty_cons (rx_fifo))
2170     {
2171       if (is_ct)
2172         svm_fifo_unset_event (s->rx_fifo);
2173       svm_fifo_unset_event (rx_fifo);
2174       if (is_nonblocking)
2175         {
2176           if (vcl_session_is_closing (s))
2177             return vcl_session_closing_error (s);
2178           return VPPCOM_EWOULDBLOCK;
2179         }
2180       while (svm_fifo_is_empty_cons (rx_fifo))
2181         {
2182           if (vcl_session_is_closing (s))
2183             return vcl_session_closing_error (s);
2184
2185           if (is_ct)
2186             svm_fifo_unset_event (s->rx_fifo);
2187           svm_fifo_unset_event (rx_fifo);
2188
2189           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2190           vcl_worker_flush_mq_events (wrk);
2191         }
2192     }
2193
2194   n_read = svm_fifo_segments (rx_fifo, s->rx_bytes_pending,
2195                               (svm_fifo_seg_t *) ds, &n_segments, max_bytes);
2196   if (n_read < 0)
2197     return VPPCOM_EAGAIN;
2198
2199   if (svm_fifo_max_dequeue_cons (rx_fifo) == n_read)
2200     {
2201       if (is_ct)
2202         svm_fifo_unset_event (s->rx_fifo);
2203       svm_fifo_unset_event (rx_fifo);
2204       if (svm_fifo_max_dequeue_cons (rx_fifo) != n_read
2205           && svm_fifo_set_event (rx_fifo)
2206           && vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
2207         {
2208           session_event_t *e;
2209           vec_add2 (wrk->unhandled_evts_vector, e, 1);
2210           e->event_type = SESSION_IO_EVT_RX;
2211           e->session_index = s->session_index;
2212         }
2213     }
2214
2215   s->rx_bytes_pending += n_read;
2216   return n_read;
2217 }
2218
2219 void
2220 vppcom_session_free_segments (uint32_t session_handle, uint32_t n_bytes)
2221 {
2222   vcl_worker_t *wrk = vcl_worker_get_current ();
2223   vcl_session_t *s;
2224   u8 is_ct;
2225
2226   s = vcl_session_get_w_handle (wrk, session_handle);
2227   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2228     return;
2229
2230   is_ct = vcl_session_is_ct (s);
2231   svm_fifo_dequeue_drop (is_ct ? s->ct_rx_fifo : s->rx_fifo, n_bytes);
2232
2233   ASSERT (s->rx_bytes_pending >= n_bytes);
2234   s->rx_bytes_pending -= n_bytes;
2235 }
2236
2237 always_inline u8
2238 vcl_fifo_is_writeable (svm_fifo_t * f, u32 len, u8 is_dgram)
2239 {
2240   u32 max_enq = svm_fifo_max_enqueue_prod (f);
2241   if (is_dgram)
2242     return max_enq >= (sizeof (session_dgram_hdr_t) + len);
2243   else
2244     return max_enq > 0;
2245 }
2246
2247 always_inline int
2248 vppcom_session_write_inline (vcl_worker_t *wrk, vcl_session_t *s, void *buf,
2249                              size_t n, u8 is_flush, u8 is_dgram)
2250 {
2251   int n_write, is_nonblocking;
2252   session_evt_type_t et;
2253   svm_fifo_t *tx_fifo;
2254   svm_msg_q_t *mq;
2255   u8 is_ct;
2256
2257   /* Accept zero length writes but just return */
2258   if (PREDICT_FALSE (!n))
2259     return VPPCOM_OK;
2260
2261   if (PREDICT_FALSE (!buf))
2262     return VPPCOM_EFAULT;
2263
2264   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2265     {
2266       VDBG (0, "ERROR: session %u [0x%llx]: cannot write to an epoll"
2267             " session!", s->session_index, s->vpp_handle);
2268       return VPPCOM_EBADFD;
2269     }
2270
2271   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2272     {
2273       VDBG (1, "session %u [0x%llx]: is not open! state 0x%x (%s)",
2274             s->session_index, s->vpp_handle, s->session_state,
2275             vcl_session_state_str (s->session_state));
2276       return vcl_session_closed_error (s);;
2277     }
2278
2279   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_WR_SHUTDOWN))
2280     {
2281       VDBG (1, "session %u [0x%llx]: is shutdown! state 0x%x (%s)",
2282             s->session_index, s->vpp_handle, s->session_state,
2283             vcl_session_state_str (s->session_state));
2284       return VPPCOM_EPIPE;
2285     }
2286
2287   is_ct = vcl_session_is_ct (s);
2288   tx_fifo = is_ct ? s->ct_tx_fifo : s->tx_fifo;
2289   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2290
2291   mq = wrk->app_event_queue;
2292   if (!vcl_fifo_is_writeable (tx_fifo, n, is_dgram))
2293     {
2294       if (is_nonblocking)
2295         {
2296           return VPPCOM_EWOULDBLOCK;
2297         }
2298       while (!vcl_fifo_is_writeable (tx_fifo, n, is_dgram))
2299         {
2300           svm_fifo_add_want_deq_ntf (tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
2301           if (vcl_session_is_closing (s))
2302             return vcl_session_closing_error (s);
2303
2304           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2305           vcl_worker_flush_mq_events (wrk);
2306         }
2307     }
2308
2309   et = SESSION_IO_EVT_TX;
2310   if (is_flush && !is_ct)
2311     et = SESSION_IO_EVT_TX_FLUSH;
2312
2313   if (is_dgram)
2314     {
2315       et = vcl_session_dgram_tx_evt (s, et);
2316       n_write =
2317         app_send_dgram_raw_gso (tx_fifo, &s->transport, s->vpp_evt_q, buf, n,
2318                                 s->gso_size, et, 0 /* do_evt */, SVM_Q_WAIT);
2319     }
2320   else
2321     {
2322       n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
2323                                      0 /* do_evt */, SVM_Q_WAIT);
2324     }
2325
2326   if (svm_fifo_set_event (s->tx_fifo))
2327     app_send_io_evt_to_vpp (
2328       s->vpp_evt_q, s->tx_fifo->shr->master_session_index, et, SVM_Q_WAIT);
2329
2330   /* The underlying fifo segment can run out of memory */
2331   if (PREDICT_FALSE (n_write < 0))
2332     return VPPCOM_EAGAIN;
2333
2334   VDBG (2, "session %u [0x%llx]: wrote %d bytes", s->session_index,
2335         s->vpp_handle, n_write);
2336
2337   return n_write;
2338 }
2339
2340 int
2341 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
2342 {
2343   vcl_worker_t *wrk = vcl_worker_get_current ();
2344   vcl_session_t *s;
2345
2346   s = vcl_session_get_w_handle (wrk, session_handle);
2347   if (PREDICT_FALSE (!s))
2348     return VPPCOM_EBADFD;
2349
2350   return vppcom_session_write_inline (wrk, s, buf, n, 0 /* is_flush */,
2351                                       s->is_dgram ? 1 : 0);
2352 }
2353
2354 int
2355 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
2356 {
2357   vcl_worker_t *wrk = vcl_worker_get_current ();
2358   vcl_session_t *s;
2359
2360   s = vcl_session_get_w_handle (wrk, session_handle);
2361   if (PREDICT_FALSE (!s))
2362     return VPPCOM_EBADFD;
2363
2364   return vppcom_session_write_inline (wrk, s, buf, n, 1 /* is_flush */,
2365                                       s->is_dgram ? 1 : 0);
2366 }
2367
2368 #define vcl_fifo_rx_evt_valid_or_break(_s)                              \
2369 if (PREDICT_FALSE (!_s->rx_fifo))                                       \
2370   break;                                                                \
2371 if (PREDICT_FALSE (svm_fifo_is_empty (_s->rx_fifo)))                    \
2372   {                                                                     \
2373     if (!vcl_session_is_ct (_s))                                        \
2374       {                                                                 \
2375         svm_fifo_unset_event (_s->rx_fifo);                             \
2376         if (svm_fifo_is_empty (_s->rx_fifo))                            \
2377           break;                                                        \
2378       }                                                                 \
2379     else if (svm_fifo_is_empty (_s->ct_rx_fifo))                        \
2380       {                                                                 \
2381         svm_fifo_unset_event (_s->rx_fifo); /* rx evts on actual fifo*/ \
2382         if (svm_fifo_is_empty (_s->ct_rx_fifo))                         \
2383           break;                                                        \
2384       }                                                                 \
2385   }                                                                     \
2386
2387 static void
2388 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2389                             unsigned long n_bits, unsigned long *read_map,
2390                             unsigned long *write_map,
2391                             unsigned long *except_map, u32 * bits_set)
2392 {
2393   session_disconnected_msg_t *disconnected_msg;
2394   session_connected_msg_t *connected_msg;
2395   vcl_session_t *s;
2396   u32 sid;
2397
2398   switch (e->event_type)
2399     {
2400     case SESSION_IO_EVT_RX:
2401       sid = e->session_index;
2402       s = vcl_session_get (wrk, sid);
2403       if (!s || !vcl_session_is_open (s))
2404         break;
2405       vcl_fifo_rx_evt_valid_or_break (s);
2406       if (sid < n_bits && read_map)
2407         {
2408           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2409           *bits_set += 1;
2410         }
2411       break;
2412     case SESSION_IO_EVT_TX:
2413       sid = e->session_index;
2414       s = vcl_session_get (wrk, sid);
2415       if (!s || !vcl_session_is_open (s))
2416         break;
2417       if (sid < n_bits && write_map)
2418         {
2419           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2420           *bits_set += 1;
2421         }
2422       break;
2423     case SESSION_CTRL_EVT_ACCEPTED:
2424       if (!e->postponed)
2425         s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
2426       else
2427         s = vcl_session_get (wrk, e->session_index);
2428       if (!s)
2429         break;
2430       sid = s->session_index;
2431       if (sid < n_bits && read_map)
2432         {
2433           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2434           *bits_set += 1;
2435         }
2436       break;
2437     case SESSION_CTRL_EVT_CONNECTED:
2438       if (!e->postponed)
2439         {
2440           connected_msg = (session_connected_msg_t *) e->data;
2441           sid = vcl_session_connected_handler (wrk, connected_msg);
2442         }
2443       else
2444         sid = e->session_index;
2445       if (sid == VCL_INVALID_SESSION_INDEX)
2446         break;
2447       if (!(sid < n_bits && write_map))
2448         break;
2449       clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2450       *bits_set += 1;
2451       s = vcl_session_get (wrk, sid);
2452       /* We didn't have a fifo when the event was added */
2453       vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2454       break;
2455     case SESSION_CTRL_EVT_DISCONNECTED:
2456       if (!e->postponed)
2457         {
2458           disconnected_msg = (session_disconnected_msg_t *) e->data;
2459           s = vcl_session_disconnected_handler (wrk, disconnected_msg);
2460           if (!s)
2461             break;
2462         }
2463       else
2464         {
2465           s = vcl_session_get (wrk, e->session_index);
2466           s->flags &= ~VCL_SESSION_F_PENDING_DISCONNECT;
2467         }
2468       if (vcl_session_is_closed (s))
2469         {
2470           if (s && (s->flags & VCL_SESSION_F_PENDING_FREE))
2471             vcl_session_free (wrk, s);
2472           break;
2473         }
2474       sid = s->session_index;
2475       if (sid < n_bits && except_map)
2476         {
2477           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2478           *bits_set += 1;
2479         }
2480       break;
2481     case SESSION_CTRL_EVT_RESET:
2482       if (!e->postponed)
2483         {
2484           sid =
2485             vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2486           s = vcl_session_get (wrk, sid);
2487         }
2488       else
2489         {
2490           sid = e->session_index;
2491           s = vcl_session_get (wrk, sid);
2492           s->flags &= ~VCL_SESSION_F_PENDING_DISCONNECT;
2493         }
2494       if (vcl_session_is_closed (s))
2495         {
2496           if (s && (s->flags & VCL_SESSION_F_PENDING_FREE))
2497             vcl_session_free (wrk, s);
2498           break;
2499         }
2500       if (sid < n_bits && except_map)
2501         {
2502           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2503           *bits_set += 1;
2504         }
2505       break;
2506     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2507       vcl_session_unlisten_reply_handler (wrk, e->data);
2508       break;
2509     case SESSION_CTRL_EVT_MIGRATED:
2510       vcl_session_migrated_handler (wrk, e->data);
2511       break;
2512     case SESSION_CTRL_EVT_CLEANUP:
2513       vcl_session_cleanup_handler (wrk, e->data);
2514       break;
2515     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2516       vcl_session_worker_update_reply_handler (wrk, e->data);
2517       break;
2518     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2519       vcl_session_req_worker_update_handler (wrk, e->data);
2520       break;
2521     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
2522       vcl_session_app_add_segment_handler (wrk, e->data);
2523       break;
2524     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
2525       vcl_session_app_del_segment_handler (wrk, e->data);
2526       break;
2527     case SESSION_CTRL_EVT_APP_WRK_RPC:
2528       vcl_worker_rpc_handler (wrk, e->data);
2529       break;
2530     default:
2531       clib_warning ("unhandled: %u", e->event_type);
2532       break;
2533     }
2534 }
2535
2536 static int
2537 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2538                       unsigned long n_bits, unsigned long *read_map,
2539                       unsigned long *write_map, unsigned long *except_map,
2540                       double time_to_wait, u32 * bits_set)
2541 {
2542   svm_msg_q_msg_t *msg;
2543   session_event_t *e;
2544   u32 i;
2545
2546   if (svm_msg_q_is_empty (mq))
2547     {
2548       if (*bits_set)
2549         return 0;
2550
2551       if (!time_to_wait)
2552         return 0;
2553       else if (time_to_wait < 0)
2554         svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2555       else
2556         {
2557           if (svm_msg_q_timedwait (mq, time_to_wait))
2558             return 0;
2559         }
2560     }
2561   vcl_mq_dequeue_batch (wrk, mq, ~0);
2562
2563   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2564     {
2565       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2566       e = svm_msg_q_msg_data (mq, msg);
2567       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2568                                   except_map, bits_set);
2569       svm_msg_q_free_msg (mq, msg);
2570     }
2571   vec_reset_length (wrk->mq_msg_vector);
2572   vcl_handle_pending_wrk_updates (wrk);
2573   return *bits_set;
2574 }
2575
2576 static int
2577 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2578                        vcl_si_set * read_map, vcl_si_set * write_map,
2579                        vcl_si_set * except_map, double time_to_wait,
2580                        u32 * bits_set)
2581 {
2582   double wait = 0, start = 0;
2583
2584   if (!*bits_set)
2585     {
2586       wait = time_to_wait;
2587       start = clib_time_now (&wrk->clib_time);
2588     }
2589
2590   do
2591     {
2592       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2593                             write_map, except_map, wait, bits_set);
2594       if (*bits_set)
2595         return *bits_set;
2596       if (wait == -1)
2597         continue;
2598
2599       wait = wait - (clib_time_now (&wrk->clib_time) - start);
2600     }
2601   while (wait > 0);
2602
2603   return 0;
2604 }
2605
2606 static int
2607 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2608                        vcl_si_set * read_map, vcl_si_set * write_map,
2609                        vcl_si_set * except_map, double time_to_wait,
2610                        u32 * bits_set)
2611 {
2612   vcl_mq_evt_conn_t *mqc;
2613   int __clib_unused n_read;
2614   int n_mq_evts, i;
2615   u64 buf;
2616
2617   if (PREDICT_FALSE (wrk->api_client_handle == ~0))
2618     {
2619       vcl_api_retry_attach (wrk);
2620       return 0;
2621     }
2622
2623   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2624   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2625                           vec_len (wrk->mq_events), time_to_wait);
2626   for (i = 0; i < n_mq_evts; i++)
2627     {
2628       if (PREDICT_FALSE (wrk->mq_events[i].data.u32 == ~0))
2629         {
2630           vcl_api_handle_disconnect (wrk);
2631           continue;
2632         }
2633
2634       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2635       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2636       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2637                             except_map, 0, bits_set);
2638     }
2639
2640   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2641 }
2642
2643 int
2644 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2645                vcl_si_set * except_map, double time_to_wait)
2646 {
2647   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2648   vcl_worker_t *wrk = vcl_worker_get_current ();
2649   vcl_session_t *s = 0;
2650   int i;
2651
2652   if (n_bits && read_map)
2653     {
2654       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2655       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2656                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2657       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2658     }
2659   if (n_bits && write_map)
2660     {
2661       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2662       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2663                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2664       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2665     }
2666   if (n_bits && except_map)
2667     {
2668       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2669       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2670                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2671       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2672     }
2673
2674   if (!n_bits)
2675     return 0;
2676
2677   if (!write_map)
2678     goto check_rd;
2679
2680   clib_bitmap_foreach (sid, wrk->wr_bitmap)
2681     {
2682       if (!(s = vcl_session_get (wrk, sid)))
2683         {
2684           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2685           bits_set++;
2686           continue;
2687         }
2688
2689       if (vcl_session_write_ready (s))
2690         {
2691           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2692           bits_set++;
2693         }
2694       else
2695         {
2696           vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF);
2697         }
2698     }
2699
2700 check_rd:
2701   if (!read_map)
2702     goto check_mq;
2703
2704   clib_bitmap_foreach (sid, wrk->rd_bitmap)
2705     {
2706       if (!(s = vcl_session_get (wrk, sid)))
2707         {
2708           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2709           bits_set++;
2710           continue;
2711         }
2712
2713       if (vcl_session_read_ready (s))
2714         {
2715           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2716           bits_set++;
2717         }
2718     }
2719
2720 check_mq:
2721
2722   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2723     {
2724       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2725                                   read_map, write_map, except_map, &bits_set);
2726     }
2727   vec_reset_length (wrk->unhandled_evts_vector);
2728
2729   if (vcm->cfg.use_mq_eventfd)
2730     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2731                            time_to_wait, &bits_set);
2732   else
2733     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2734                            time_to_wait, &bits_set);
2735
2736   return (bits_set);
2737 }
2738
2739 static inline void
2740 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_handle)
2741 {
2742   vppcom_epoll_t *vep;
2743   u32 sh = vep_handle;
2744   vcl_session_t *s;
2745
2746   if (VPPCOM_DEBUG <= 3)
2747     return;
2748
2749   s = vcl_session_get_w_handle (wrk, vep_handle);
2750   if (PREDICT_FALSE (!s))
2751     {
2752       VDBG (0, "ERROR: Invalid vep_sh (%u)!", vep_handle);
2753       goto done;
2754     }
2755   if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP)))
2756     {
2757       VDBG (0, "ERROR: vep_sh (%u) is not a vep!", vep_handle);
2758       goto done;
2759     }
2760   vep = &s->vep;
2761   VDBG (0, "vep_sh (%u): Dumping epoll chain\n"
2762         "{\n"
2763         "   is_vep         = %u\n"
2764         "   is_vep_session = %u\n"
2765         "   next_sh        = 0x%x (%u)\n"
2766         "}\n", vep_handle, s->flags & VCL_SESSION_F_IS_VEP,
2767         s->flags & VCL_SESSION_F_IS_VEP_SESSION, vep->next_sh, vep->next_sh);
2768
2769   for (sh = vep->next_sh; sh != ~0; sh = vep->next_sh)
2770     {
2771       s = vcl_session_get_w_handle (wrk, sh);
2772       if (PREDICT_FALSE (!s))
2773         {
2774           VDBG (0, "ERROR: Invalid sh (%u)!", sh);
2775           goto done;
2776         }
2777       if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2778         {
2779           VDBG (0, "ERROR: sh (%u) is a vep!", vep_handle);
2780         }
2781       else if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2782         {
2783           VDBG (0, "ERROR: sh (%u) is not a vep session handle!", sh);
2784           goto done;
2785         }
2786       vep = &s->vep;
2787       if (PREDICT_FALSE (vep->vep_sh != vep_handle))
2788         VDBG (0, "ERROR: session (%u) vep_sh (%u) != vep_sh (%u)!",
2789               sh, s->vep.vep_sh, vep_handle);
2790       if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
2791         {
2792           VDBG (0, "vep_sh[%u]: sh 0x%x (%u)\n"
2793                 "{\n"
2794                 "   next_sh        = 0x%x (%u)\n"
2795                 "   prev_sh        = 0x%x (%u)\n"
2796                 "   vep_sh         = 0x%x (%u)\n"
2797                 "   ev.events      = 0x%x\n"
2798                 "   ev.data.u64    = 0x%llx\n"
2799                 "   et_mask        = 0x%x\n"
2800                 "}\n",
2801                 vep_handle, sh, sh, vep->next_sh, vep->next_sh, vep->prev_sh,
2802                 vep->prev_sh, vep->vep_sh, vep->vep_sh, vep->ev.events,
2803                 vep->ev.data.u64, vep->et_mask);
2804         }
2805     }
2806
2807 done:
2808   VDBG (0, "vep_sh (%u): Dump complete!\n", vep_handle);
2809 }
2810
2811 int
2812 vppcom_epoll_create (void)
2813 {
2814   vcl_worker_t *wrk = vcl_worker_get_current ();
2815   vcl_session_t *vep_session;
2816
2817   vep_session = vcl_session_alloc (wrk);
2818
2819   vep_session->flags |= VCL_SESSION_F_IS_VEP;
2820   vep_session->vep.vep_sh = ~0;
2821   vep_session->vep.next_sh = ~0;
2822   vep_session->vep.prev_sh = ~0;
2823   vep_session->vpp_handle = ~0;
2824
2825   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2826   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2827
2828   return vcl_session_handle (vep_session);
2829 }
2830
2831 static void
2832 vcl_epoll_ctl_add_unhandled_event (vcl_worker_t *wrk, vcl_session_t *s,
2833                                    u8 is_epollet, session_evt_type_t evt)
2834 {
2835   if (!is_epollet)
2836     {
2837       if (s->vep.lt_next == VCL_INVALID_SESSION_INDEX)
2838         vcl_epoll_lt_add (wrk, s);
2839       return;
2840     }
2841
2842   session_event_t e = { 0 };
2843   e.session_index = s->session_index;
2844   e.event_type = evt;
2845   if (evt == SESSION_IO_EVT_RX)
2846     s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2847   vec_add1 (wrk->unhandled_evts_vector, e);
2848 }
2849
2850 int
2851 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2852                   struct epoll_event *event)
2853 {
2854   vcl_worker_t *wrk = vcl_worker_get_current ();
2855   int rv = VPPCOM_OK, add_evt = 0;
2856   vcl_session_t *vep_session;
2857   vcl_session_t *s;
2858
2859   if (vep_handle == session_handle)
2860     {
2861       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2862       return VPPCOM_EINVAL;
2863     }
2864
2865   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2866   if (PREDICT_FALSE (!vep_session))
2867     {
2868       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2869       return VPPCOM_EBADFD;
2870     }
2871   if (PREDICT_FALSE (!(vep_session->flags & VCL_SESSION_F_IS_VEP)))
2872     {
2873       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2874       return VPPCOM_EINVAL;
2875     }
2876
2877   ASSERT (vep_session->vep.vep_sh == ~0);
2878   ASSERT (vep_session->vep.prev_sh == ~0);
2879
2880   s = vcl_session_get_w_handle (wrk, session_handle);
2881   if (PREDICT_FALSE (!s))
2882     {
2883       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2884       return VPPCOM_EBADFD;
2885     }
2886   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2887     {
2888       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2889       return VPPCOM_EINVAL;
2890     }
2891
2892   switch (op)
2893     {
2894     case EPOLL_CTL_ADD:
2895       if (PREDICT_FALSE (!event))
2896         {
2897           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2898           return VPPCOM_EINVAL;
2899         }
2900       if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
2901         {
2902           VDBG (0, "EPOLL_CTL_ADD: %u already epolled!", s->session_index);
2903           rv = VPPCOM_EEXIST;
2904           goto done;
2905         }
2906       if (vep_session->vep.next_sh != ~0)
2907         {
2908           vcl_session_t *next_session;
2909           next_session = vcl_session_get_w_handle (wrk,
2910                                                    vep_session->vep.next_sh);
2911           if (PREDICT_FALSE (!next_session))
2912             {
2913               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sh (%u) on "
2914                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2915               return VPPCOM_EBADFD;
2916             }
2917           ASSERT (next_session->vep.prev_sh == vep_handle);
2918           next_session->vep.prev_sh = session_handle;
2919         }
2920       s->vep.next_sh = vep_session->vep.next_sh;
2921       s->vep.prev_sh = vep_handle;
2922       s->vep.vep_sh = vep_handle;
2923       s->vep.et_mask = VEP_DEFAULT_ET_MASK;
2924       s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
2925       s->vep.ev = *event;
2926       s->vep.ev.events |= EPOLLHUP | EPOLLERR;
2927       s->flags &= ~VCL_SESSION_F_IS_VEP;
2928       s->flags |= VCL_SESSION_F_IS_VEP_SESSION;
2929       vep_session->vep.next_sh = session_handle;
2930
2931       if ((event->events & EPOLLOUT))
2932         {
2933           int write_ready = vcl_session_write_ready (s);
2934
2935           vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2936           if (write_ready > 0)
2937             {
2938               /* Generate EPOLLOUT if tx fifo not full */
2939               vcl_epoll_ctl_add_unhandled_event (
2940                 wrk, s, event->events & EPOLLET, SESSION_IO_EVT_TX);
2941               add_evt = 1;
2942             }
2943           else
2944             {
2945               vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF);
2946             }
2947         }
2948       /* Generate EPOLLIN if rx fifo has data */
2949       if ((event->events & EPOLLIN) && (vcl_session_read_ready (s) > 0))
2950         {
2951           vcl_epoll_ctl_add_unhandled_event (wrk, s, event->events & EPOLLET,
2952                                              SESSION_IO_EVT_RX);
2953           add_evt = 1;
2954         }
2955       if (!add_evt && vcl_session_is_closing (s))
2956         {
2957           session_event_t e = { 0 };
2958           if (s->session_state == VCL_STATE_VPP_CLOSING)
2959             e.event_type = SESSION_CTRL_EVT_DISCONNECTED;
2960           else
2961             e.event_type = SESSION_CTRL_EVT_RESET;
2962           e.session_index = s->session_index;
2963           e.postponed = 1;
2964           vec_add1 (wrk->unhandled_evts_vector, e);
2965         }
2966       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2967             vep_handle, session_handle, event->events, event->data.u64);
2968       vcl_evt (VCL_EVT_EPOLL_CTLADD, s, event->events, event->data.u64);
2969       break;
2970
2971     case EPOLL_CTL_MOD:
2972       if (PREDICT_FALSE (!event))
2973         {
2974           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2975           rv = VPPCOM_EINVAL;
2976           goto done;
2977         }
2978       else if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2979         {
2980           VDBG (0, "sh %u EPOLL_CTL_MOD: not a vep session!", session_handle);
2981           rv = VPPCOM_ENOENT;
2982           goto done;
2983         }
2984       else if (PREDICT_FALSE (s->vep.vep_sh != vep_handle))
2985         {
2986           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2987                 session_handle, s->vep.vep_sh, vep_handle);
2988           rv = VPPCOM_EINVAL;
2989           goto done;
2990         }
2991
2992       /* Generate EPOLLOUT if session write ready and event was not on */
2993       if ((event->events & EPOLLOUT) && !(s->vep.ev.events & EPOLLOUT))
2994         {
2995           /* Fifo size load acq synchronized with update store rel */
2996           int write_ready = vcl_session_write_ready (s);
2997
2998           vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2999           if (write_ready > 0)
3000             vcl_epoll_ctl_add_unhandled_event (wrk, s, event->events & EPOLLET,
3001                                                SESSION_IO_EVT_TX);
3002           else
3003             /* Request deq ntf in case dequeue happened while updating flag */
3004             vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF);
3005         }
3006       else if (!(event->events & EPOLLOUT))
3007         vcl_session_del_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
3008
3009       /* Generate EPOLLIN if session read ready and event was not on */
3010       if ((event->events & EPOLLIN) && !(s->vep.ev.events & EPOLLIN) &&
3011           (vcl_session_read_ready (s) > 0))
3012         {
3013           vcl_epoll_ctl_add_unhandled_event (wrk, s, event->events & EPOLLET,
3014                                              SESSION_IO_EVT_RX);
3015         }
3016       s->vep.et_mask = VEP_DEFAULT_ET_MASK;
3017       s->vep.ev = *event;
3018       s->vep.ev.events |= EPOLLHUP | EPOLLERR;
3019
3020       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
3021             vep_handle, session_handle, event->events, event->data.u64);
3022       break;
3023
3024     case EPOLL_CTL_DEL:
3025       if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
3026         {
3027           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
3028           rv = VPPCOM_ENOENT;
3029           goto done;
3030         }
3031       else if (PREDICT_FALSE (s->vep.vep_sh != vep_handle))
3032         {
3033           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
3034                 session_handle, s->vep.vep_sh, vep_handle);
3035           rv = VPPCOM_EINVAL;
3036           goto done;
3037         }
3038
3039       if (s->vep.prev_sh == vep_handle)
3040         vep_session->vep.next_sh = s->vep.next_sh;
3041       else
3042         {
3043           vcl_session_t *prev_session;
3044           prev_session = vcl_session_get_w_handle (wrk, s->vep.prev_sh);
3045           if (PREDICT_FALSE (!prev_session))
3046             {
3047               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sh (%u) on sh (%u)!",
3048                     s->vep.prev_sh, session_handle);
3049               return VPPCOM_EBADFD;
3050             }
3051           ASSERT (prev_session->vep.next_sh == session_handle);
3052           prev_session->vep.next_sh = s->vep.next_sh;
3053         }
3054       if (s->vep.next_sh != ~0)
3055         {
3056           vcl_session_t *next_session;
3057           next_session = vcl_session_get_w_handle (wrk, s->vep.next_sh);
3058           if (PREDICT_FALSE (!next_session))
3059             {
3060               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sh (%u) on sh (%u)!",
3061                     s->vep.next_sh, session_handle);
3062               return VPPCOM_EBADFD;
3063             }
3064           ASSERT (next_session->vep.prev_sh == session_handle);
3065           next_session->vep.prev_sh = s->vep.prev_sh;
3066         }
3067
3068       if (s->vep.lt_next != VCL_INVALID_SESSION_INDEX)
3069         vcl_epoll_lt_del (wrk, s);
3070
3071       memset (&s->vep, 0, sizeof (s->vep));
3072       s->vep.next_sh = ~0;
3073       s->vep.prev_sh = ~0;
3074       s->vep.vep_sh = ~0;
3075       s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
3076       s->flags &= ~VCL_SESSION_F_IS_VEP_SESSION;
3077
3078       if (vcl_session_is_open (s))
3079         vcl_session_del_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
3080
3081       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sh %u!", vep_handle,
3082             session_handle);
3083       vcl_evt (VCL_EVT_EPOLL_CTLDEL, s, vep_sh);
3084       break;
3085
3086     default:
3087       VDBG (0, "Invalid operation (%d)!", op);
3088       rv = VPPCOM_EINVAL;
3089     }
3090
3091   vep_verify_epoll_chain (wrk, vep_handle);
3092
3093 done:
3094   return rv;
3095 }
3096
3097 always_inline u8
3098 vcl_ep_session_needs_evt (vcl_session_t *s, u32 evt)
3099 {
3100   /* No event if not epolled / events reset on hup or level-trigger on */
3101   return ((s->vep.ev.events & evt) &&
3102           s->vep.lt_next == VCL_INVALID_SESSION_INDEX);
3103 }
3104
3105 static inline void
3106 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
3107                                 struct epoll_event *events, u32 * num_ev)
3108 {
3109   session_disconnected_msg_t *disconnected_msg;
3110   session_connected_msg_t *connected_msg;
3111   u32 sid = ~0, session_events;
3112   u64 session_evt_data = ~0;
3113   vcl_session_t *s;
3114   u8 add_event = 0;
3115
3116   switch (e->event_type)
3117     {
3118     case SESSION_IO_EVT_RX:
3119       sid = e->session_index;
3120       s = vcl_session_get (wrk, sid);
3121       if (vcl_session_is_closed (s))
3122         break;
3123       vcl_fifo_rx_evt_valid_or_break (s);
3124       if (!vcl_ep_session_needs_evt (s, EPOLLIN) ||
3125           (s->flags & VCL_SESSION_F_HAS_RX_EVT))
3126         break;
3127       session_events = s->vep.ev.events;
3128       add_event = 1;
3129       events[*num_ev].events = EPOLLIN;
3130       session_evt_data = s->vep.ev.data.u64;
3131       s->flags |= VCL_SESSION_F_HAS_RX_EVT;
3132       break;
3133     case SESSION_IO_EVT_TX:
3134       sid = e->session_index;
3135       s = vcl_session_get (wrk, sid);
3136       if (!s || !vcl_session_is_open (s))
3137         break;
3138       svm_fifo_reset_has_deq_ntf (vcl_session_is_ct (s) ? s->ct_tx_fifo :
3139                                                                 s->tx_fifo);
3140       if (!vcl_ep_session_needs_evt (s, EPOLLOUT))
3141         break;
3142       session_events = s->vep.ev.events;
3143       add_event = 1;
3144       events[*num_ev].events = EPOLLOUT;
3145       session_evt_data = s->vep.ev.data.u64;
3146       break;
3147     case SESSION_CTRL_EVT_ACCEPTED:
3148       if (!e->postponed)
3149         s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
3150       else
3151         s = vcl_session_get (wrk, e->session_index);
3152       if (!s || !vcl_ep_session_needs_evt (s, EPOLLIN))
3153         break;
3154       sid = s->session_index;
3155       session_events = s->vep.ev.events;
3156       add_event = 1;
3157       events[*num_ev].events = EPOLLIN;
3158       session_evt_data = s->vep.ev.data.u64;
3159       break;
3160     case SESSION_CTRL_EVT_CONNECTED:
3161       if (!e->postponed)
3162         {
3163           connected_msg = (session_connected_msg_t *) e->data;
3164           sid = vcl_session_connected_handler (wrk, connected_msg);
3165         }
3166       else
3167         sid = e->session_index;
3168       s = vcl_session_get (wrk, sid);
3169       if (vcl_session_is_closed (s) || !vcl_ep_session_needs_evt (s, EPOLLOUT))
3170         break;
3171       /* We didn't have a fifo when the event was added */
3172       vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
3173       add_event = 1;
3174       session_events = s->vep.ev.events;
3175       /* Generate EPOLLOUT because there's no connected event */
3176       events[*num_ev].events = EPOLLOUT;
3177       session_evt_data = s->vep.ev.data.u64;
3178       if (s->session_state == VCL_STATE_DETACHED)
3179         {
3180           events[*num_ev].events |= EPOLLHUP;
3181           s->vep.ev.events = 0;
3182         }
3183       break;
3184     case SESSION_CTRL_EVT_DISCONNECTED:
3185       if (!e->postponed)
3186         {
3187           disconnected_msg = (session_disconnected_msg_t *) e->data;
3188           s = vcl_session_disconnected_handler (wrk, disconnected_msg);
3189         }
3190       else
3191         {
3192           s = vcl_session_get (wrk, e->session_index);
3193           s->flags &= ~VCL_SESSION_F_PENDING_DISCONNECT;
3194         }
3195       if (vcl_session_is_closed (s) || !vcl_ep_session_needs_evt (s, EPOLLHUP))
3196         {
3197           if (s && (s->flags & VCL_SESSION_F_PENDING_FREE))
3198             vcl_session_free (wrk, s);
3199           break;
3200         }
3201       sid = s->session_index;
3202       session_events = s->vep.ev.events;
3203       add_event = 1;
3204       if (EPOLLRDHUP & session_events)
3205         {
3206           /* If app can distinguish between RDHUP and HUP,
3207            * we make finer control */
3208           events[*num_ev].events = EPOLLRDHUP;
3209           if (s->flags & VCL_SESSION_F_WR_SHUTDOWN)
3210             {
3211               events[*num_ev].events |= EPOLLHUP;
3212             }
3213         }
3214       else
3215         {
3216           events[*num_ev].events = EPOLLHUP;
3217         }
3218       session_evt_data = s->vep.ev.data.u64;
3219       s->vep.ev.events = 0;
3220       break;
3221     case SESSION_CTRL_EVT_BOUND:
3222       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
3223       break;
3224     case SESSION_CTRL_EVT_RESET:
3225       if (!e->postponed)
3226         {
3227           sid =
3228             vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
3229           s = vcl_session_get (wrk, sid);
3230         }
3231       else
3232         {
3233           sid = e->session_index;
3234           s = vcl_session_get (wrk, sid);
3235           s->flags &= ~VCL_SESSION_F_PENDING_DISCONNECT;
3236         }
3237       if (vcl_session_is_closed (s) || !vcl_ep_session_needs_evt (s, EPOLLHUP))
3238         {
3239           if (s && (s->flags & VCL_SESSION_F_PENDING_FREE))
3240             vcl_session_free (wrk, s);
3241           break;
3242         }
3243       session_events = s->vep.ev.events;
3244       add_event = 1;
3245       events[*num_ev].events = EPOLLERR | EPOLLHUP;
3246       if ((EPOLLRDHUP & session_events) &&
3247           (s->flags & VCL_SESSION_F_RD_SHUTDOWN))
3248         {
3249           events[*num_ev].events |= EPOLLRDHUP;
3250         }
3251       if ((EPOLLIN & session_events) && (s->flags & VCL_SESSION_F_RD_SHUTDOWN))
3252         {
3253           events[*num_ev].events |= EPOLLIN;
3254         }
3255       session_evt_data = s->vep.ev.data.u64;
3256       s->vep.ev.events = 0;
3257       break;
3258     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
3259       vcl_session_unlisten_reply_handler (wrk, e->data);
3260       break;
3261     case SESSION_CTRL_EVT_MIGRATED:
3262       vcl_session_migrated_handler (wrk, e->data);
3263       break;
3264     case SESSION_CTRL_EVT_CLEANUP:
3265       vcl_session_cleanup_handler (wrk, e->data);
3266       break;
3267     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
3268       vcl_session_req_worker_update_handler (wrk, e->data);
3269       break;
3270     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
3271       vcl_session_worker_update_reply_handler (wrk, e->data);
3272       break;
3273     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
3274       vcl_session_app_add_segment_handler (wrk, e->data);
3275       break;
3276     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
3277       vcl_session_app_del_segment_handler (wrk, e->data);
3278       break;
3279     case SESSION_CTRL_EVT_APP_WRK_RPC:
3280       vcl_worker_rpc_handler (wrk, e->data);
3281       break;
3282     default:
3283       VDBG (0, "unhandled: %u", e->event_type);
3284       break;
3285     }
3286
3287   if (add_event)
3288     {
3289       ASSERT (s->flags & VCL_SESSION_F_IS_VEP_SESSION);
3290       events[*num_ev].data.u64 = session_evt_data;
3291       if (EPOLLONESHOT & session_events)
3292         {
3293           s = vcl_session_get (wrk, sid);
3294           if (!(events[*num_ev].events & EPOLLHUP))
3295             s->vep.ev.events = EPOLLHUP | EPOLLERR;
3296         }
3297       else if (!(EPOLLET & session_events))
3298         {
3299           s = vcl_session_get (wrk, sid);
3300           if (s->vep.lt_next == VCL_INVALID_SESSION_INDEX)
3301             vcl_epoll_lt_add (wrk, s);
3302         }
3303       *num_ev += 1;
3304     }
3305 }
3306
3307 static int
3308 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
3309                           struct epoll_event *events, u32 maxevents,
3310                           double wait_for_time, u32 * num_ev)
3311 {
3312   svm_msg_q_msg_t *msg;
3313   session_event_t *e;
3314   int i;
3315
3316   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
3317     goto handle_dequeued;
3318
3319   if (svm_msg_q_is_empty (mq))
3320     {
3321       if (!wait_for_time)
3322         return 0;
3323       else if (wait_for_time < 0)
3324         svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
3325       else
3326         {
3327           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
3328             return 0;
3329         }
3330     }
3331   ASSERT (maxevents > *num_ev);
3332   vcl_mq_dequeue_batch (wrk, mq, ~0);
3333
3334 handle_dequeued:
3335   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
3336     {
3337       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
3338       e = svm_msg_q_msg_data (mq, msg);
3339       if (*num_ev < maxevents)
3340         vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
3341       else
3342         vcl_handle_mq_event (wrk, e);
3343       svm_msg_q_free_msg (mq, msg);
3344     }
3345   vec_reset_length (wrk->mq_msg_vector);
3346   vcl_handle_pending_wrk_updates (wrk);
3347   return *num_ev;
3348 }
3349
3350 static int
3351 vppcom_epoll_wait_condvar (vcl_worker_t *wrk, struct epoll_event *events,
3352                            int maxevents, u32 n_evts, double timeout_ms)
3353 {
3354   double end = -1;
3355
3356   if (!n_evts)
3357     {
3358       if (timeout_ms > 0)
3359         end = clib_time_now (&wrk->clib_time) + (timeout_ms / 1e3);
3360     }
3361
3362   do
3363     {
3364       vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events, maxevents,
3365                                 timeout_ms, &n_evts);
3366       if (n_evts || !timeout_ms)
3367         return n_evts;
3368     }
3369   while (end == -1 || clib_time_now (&wrk->clib_time) < end);
3370
3371   return 0;
3372 }
3373
3374 static int
3375 vppcom_epoll_wait_eventfd (vcl_worker_t *wrk, struct epoll_event *events,
3376                            int maxevents, u32 n_evts, double timeout_ms)
3377 {
3378   int __clib_unused n_read;
3379   vcl_mq_evt_conn_t *mqc;
3380   int n_mq_evts, i;
3381   double end = -1;
3382   u64 buf;
3383
3384   if (PREDICT_FALSE (wrk->api_client_handle == ~0))
3385     {
3386       vcl_api_retry_attach (wrk);
3387       return n_evts;
3388     }
3389
3390   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
3391   if (!n_evts)
3392     {
3393       if (timeout_ms > 0)
3394         end = clib_time_now (&wrk->clib_time) + (timeout_ms / 1e3);
3395     }
3396
3397   do
3398     {
3399       n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
3400                               vec_len (wrk->mq_events), timeout_ms);
3401       if (n_mq_evts < 0)
3402         {
3403           VDBG (0, "epoll_wait error %u", errno);
3404           return n_evts;
3405         }
3406
3407       for (i = 0; i < n_mq_evts; i++)
3408         {
3409           if (PREDICT_FALSE (wrk->mq_events[i].data.u32 == ~0))
3410             {
3411               /* api socket was closed */
3412               vcl_api_handle_disconnect (wrk);
3413               continue;
3414             }
3415
3416           mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
3417           n_read = read (mqc->mq_fd, &buf, sizeof (buf));
3418           vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0,
3419                                     &n_evts);
3420         }
3421
3422       if (n_evts || !timeout_ms)
3423         return n_evts;
3424     }
3425   while (end == -1 || clib_time_now (&wrk->clib_time) < end);
3426
3427   return 0;
3428 }
3429
3430 static void
3431 vcl_epoll_wait_handle_lt (vcl_worker_t *wrk, struct epoll_event *events,
3432                           int maxevents, u32 *n_evts)
3433 {
3434   u32 add_event = 0, evt_flags = 0, next, *to_remove = 0, *si;
3435   vcl_session_t *s;
3436   u64 evt_data;
3437   int rv;
3438
3439   ASSERT (wrk->ep_lt_current != VCL_INVALID_SESSION_INDEX);
3440   if (*n_evts >= maxevents)
3441     return;
3442
3443   next = wrk->ep_lt_current;
3444   do
3445     {
3446       s = vcl_session_get (wrk, next);
3447       next = s->vep.lt_next;
3448
3449       if (s->vep.ev.events == 0)
3450         {
3451           vec_add1 (to_remove, s->session_index);
3452           continue;
3453         }
3454       if ((s->vep.ev.events & EPOLLIN) && (rv = vcl_session_read_ready (s)))
3455         {
3456           add_event = 1;
3457           evt_flags |= rv > 0 ? EPOLLIN : EPOLLHUP | EPOLLRDHUP;
3458           evt_data = s->vep.ev.data.u64;
3459         }
3460       if ((s->vep.ev.events & EPOLLOUT) && (rv = vcl_session_write_ready (s)))
3461         {
3462           add_event = 1;
3463           evt_flags |= rv > 0 ? EPOLLOUT : EPOLLHUP | EPOLLRDHUP;
3464           evt_data = s->vep.ev.data.u64;
3465         }
3466       if (!add_event && s->session_state > VCL_STATE_READY)
3467         {
3468           add_event = 1;
3469           evt_flags |= EPOLLHUP | EPOLLRDHUP;
3470           evt_data = s->vep.ev.data.u64;
3471         }
3472       if (add_event)
3473         {
3474           events[*n_evts].events = evt_flags;
3475           events[*n_evts].data.u64 = evt_data;
3476           if (EPOLLONESHOT & s->vep.ev.events)
3477             s->vep.ev.events = EPOLLHUP | EPOLLERR;
3478           if (evt_flags & EPOLLHUP)
3479             s->vep.ev.events = 0;
3480           *n_evts += 1;
3481           add_event = 0;
3482           evt_flags = 0;
3483           if (*n_evts == maxevents)
3484             {
3485               wrk->ep_lt_current = next;
3486               break;
3487             }
3488         }
3489       else
3490         {
3491           vec_add1 (to_remove, s->session_index);
3492         }
3493     }
3494   while (next != wrk->ep_lt_current);
3495
3496   vec_foreach (si, to_remove)
3497     {
3498       s = vcl_session_get (wrk, *si);
3499       vcl_epoll_lt_del (wrk, s);
3500     }
3501   vec_free (to_remove);
3502 }
3503
3504 int
3505 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
3506                    int maxevents, double wait_for_time)
3507 {
3508   vcl_worker_t *wrk = vcl_worker_get_current ();
3509   vcl_session_t *vep_session;
3510   u32 n_evts = 0;
3511   int i;
3512
3513   if (PREDICT_FALSE (maxevents <= 0))
3514     {
3515       VDBG (0, "ERROR: Invalid maxevents (%d)!", maxevents);
3516       return VPPCOM_EINVAL;
3517     }
3518
3519   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
3520   if (!vep_session)
3521     return VPPCOM_EBADFD;
3522
3523   if (PREDICT_FALSE (!(vep_session->flags & VCL_SESSION_F_IS_VEP)))
3524     {
3525       VDBG (0, "ERROR: vep_idx (%u) is not a vep!", vep_handle);
3526       return VPPCOM_EINVAL;
3527     }
3528
3529   if (vec_len (wrk->unhandled_evts_vector))
3530     {
3531       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
3532         {
3533           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
3534                                           events, &n_evts);
3535           if (n_evts == maxevents)
3536             {
3537               vec_delete (wrk->unhandled_evts_vector, i + 1, 0);
3538               return n_evts;
3539             }
3540         }
3541       vec_reset_length (wrk->unhandled_evts_vector);
3542     }
3543
3544   if (PREDICT_FALSE (wrk->ep_lt_current != VCL_INVALID_SESSION_INDEX))
3545     vcl_epoll_wait_handle_lt (wrk, events, maxevents, &n_evts);
3546
3547   /* Request to only drain unhandled */
3548   if ((int) wait_for_time == -2)
3549     return n_evts;
3550
3551
3552   if (vcm->cfg.use_mq_eventfd)
3553     n_evts = vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
3554                                         wait_for_time);
3555   else
3556     n_evts = vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
3557                                         wait_for_time);
3558
3559   return n_evts;
3560 }
3561
3562 int
3563 vppcom_session_attr (uint32_t session_handle, uint32_t op,
3564                      void *buffer, uint32_t * buflen)
3565 {
3566   vcl_worker_t *wrk = vcl_worker_get_current ();
3567   u32 *flags = buffer;
3568   vppcom_endpt_t *ep = buffer;
3569   transport_endpt_attr_t tea;
3570   vcl_session_t *session;
3571   int rv = VPPCOM_OK;
3572
3573   session = vcl_session_get_w_handle (wrk, session_handle);
3574   if (!session)
3575     return VPPCOM_EBADFD;
3576
3577   switch (op)
3578     {
3579     case VPPCOM_ATTR_GET_NREAD:
3580       rv = vcl_session_read_ready (session);
3581       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sh %u, nread = %d", session_handle,
3582             rv);
3583       break;
3584
3585     case VPPCOM_ATTR_GET_NWRITE:
3586       rv = vcl_session_write_ready (session);
3587       VDBG (2, "VPPCOM_ATTR_GET_NWRITE: sh %u, nwrite = %d", session_handle,
3588             rv);
3589       break;
3590
3591     case VPPCOM_ATTR_GET_FLAGS:
3592       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
3593         {
3594           *flags =
3595             O_RDWR |
3596             (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK) ?
3597              O_NONBLOCK : 0);
3598           *buflen = sizeof (*flags);
3599           VDBG (2, "VPPCOM_ATTR_GET_FLAGS: sh %u, flags = 0x%08x, "
3600                 "is_nonblocking = %u", session_handle, *flags,
3601                 vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK));
3602         }
3603       else
3604         rv = VPPCOM_EINVAL;
3605       break;
3606
3607     case VPPCOM_ATTR_SET_FLAGS:
3608       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
3609         {
3610           if (*flags & O_NONBLOCK)
3611             vcl_session_set_attr (session, VCL_SESS_ATTR_NONBLOCK);
3612           else
3613             vcl_session_clear_attr (session, VCL_SESS_ATTR_NONBLOCK);
3614
3615           VDBG (2, "VPPCOM_ATTR_SET_FLAGS: sh %u, flags = 0x%08x,"
3616                 " is_nonblocking = %u", session_handle, *flags,
3617                 vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK));
3618         }
3619       else
3620         rv = VPPCOM_EINVAL;
3621       break;
3622
3623     case VPPCOM_ATTR_GET_PEER_ADDR:
3624       if (PREDICT_TRUE (buffer && buflen &&
3625                         (*buflen >= sizeof (*ep)) && ep->ip))
3626         {
3627           ep->is_ip4 = session->transport.is_ip4;
3628           ep->port = session->transport.rmt_port;
3629           if (session->transport.is_ip4)
3630             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3631                               sizeof (ip4_address_t));
3632           else
3633             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3634                               sizeof (ip6_address_t));
3635           *buflen = sizeof (*ep);
3636           VDBG (1,
3637                 "VPPCOM_ATTR_GET_PEER_ADDR: sh %u, is_ip4 = %u, "
3638                 "addr = %U, port %u",
3639                 session_handle, ep->is_ip4, vcl_format_ip46_address,
3640                 &session->transport.rmt_ip,
3641                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3642                 clib_net_to_host_u16 (ep->port));
3643         }
3644       else
3645         rv = VPPCOM_EINVAL;
3646       break;
3647
3648     case VPPCOM_ATTR_GET_LCL_ADDR:
3649       if (PREDICT_TRUE (buffer && buflen &&
3650                         (*buflen >= sizeof (*ep)) && ep->ip))
3651         {
3652           ep->is_ip4 = session->transport.is_ip4;
3653           ep->port = session->transport.lcl_port;
3654           if (session->transport.is_ip4)
3655             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
3656                               sizeof (ip4_address_t));
3657           else
3658             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
3659                               sizeof (ip6_address_t));
3660           *buflen = sizeof (*ep);
3661           VDBG (1,
3662                 "VPPCOM_ATTR_GET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
3663                 " port %d",
3664                 session_handle, ep->is_ip4, vcl_format_ip46_address,
3665                 &session->transport.lcl_ip,
3666                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3667                 clib_net_to_host_u16 (ep->port));
3668         }
3669       else
3670         rv = VPPCOM_EINVAL;
3671       break;
3672
3673     case VPPCOM_ATTR_GET_ORIGINAL_DST:
3674       if (!session->transport.is_ip4)
3675         {
3676           /* now original dst only support ipv4*/
3677           rv = VPPCOM_EAFNOSUPPORT;
3678           break;
3679         }
3680       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*ep)) &&
3681                         ep->ip))
3682         {
3683           ep->is_ip4 = session->transport.is_ip4;
3684           ep->port = session->original_dst_port;
3685           clib_memcpy_fast (ep->ip, &session->original_dst_ip4,
3686                             sizeof (ip4_address_t));
3687           *buflen = sizeof (*ep);
3688           VDBG (1,
3689                 "VPPCOM_ATTR_GET_ORIGINAL_DST: sh %u, is_ip4 = %u, addr = %U"
3690                 " port %d",
3691                 session_handle, ep->is_ip4, vcl_format_ip4_address,
3692                 (ip4_address_t *) (&session->original_dst_ip4),
3693                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3694                 clib_net_to_host_u16 (ep->port));
3695         }
3696       else
3697         rv = VPPCOM_EINVAL;
3698       break;
3699
3700     case VPPCOM_ATTR_SET_LCL_ADDR:
3701       if (PREDICT_TRUE (buffer && buflen &&
3702                         (*buflen >= sizeof (*ep)) && ep->ip))
3703         {
3704           session->transport.is_ip4 = ep->is_ip4;
3705           session->transport.lcl_port = ep->port;
3706           vcl_ip_copy_from_ep (&session->transport.lcl_ip, ep);
3707           *buflen = sizeof (*ep);
3708           VDBG (1,
3709                 "VPPCOM_ATTR_SET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
3710                 " port %d",
3711                 session_handle, ep->is_ip4, vcl_format_ip46_address,
3712                 &session->transport.lcl_ip,
3713                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3714                 clib_net_to_host_u16 (ep->port));
3715         }
3716       else
3717         rv = VPPCOM_EINVAL;
3718       break;
3719
3720     case VPPCOM_ATTR_GET_LIBC_EPFD:
3721       rv = session->libc_epfd;
3722       VDBG (2, "VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d", rv);
3723       break;
3724
3725     case VPPCOM_ATTR_SET_LIBC_EPFD:
3726       if (PREDICT_TRUE (buffer && buflen &&
3727                         (*buflen == sizeof (session->libc_epfd))))
3728         {
3729           session->libc_epfd = *(int *) buffer;
3730           *buflen = sizeof (session->libc_epfd);
3731
3732           VDBG (2, "VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, buflen %d",
3733                 session->libc_epfd, *buflen);
3734         }
3735       else
3736         rv = VPPCOM_EINVAL;
3737       break;
3738
3739     case VPPCOM_ATTR_GET_PROTOCOL:
3740       if (buffer && buflen && (*buflen >= sizeof (int)))
3741         {
3742           *(int *) buffer = session->session_type;
3743           *buflen = sizeof (int);
3744
3745           VDBG (2, "VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
3746                 *(int *) buffer, *(int *) buffer ? "UDP" : "TCP", *buflen);
3747         }
3748       else
3749         rv = VPPCOM_EINVAL;
3750       break;
3751
3752     case VPPCOM_ATTR_GET_LISTEN:
3753       if (buffer && buflen && (*buflen >= sizeof (int)))
3754         {
3755           *(int *) buffer = vcl_session_has_attr (session,
3756                                                   VCL_SESS_ATTR_LISTEN);
3757           *buflen = sizeof (int);
3758
3759           VDBG (2, "VPPCOM_ATTR_GET_LISTEN: %d, buflen %d", *(int *) buffer,
3760                 *buflen);
3761         }
3762       else
3763         rv = VPPCOM_EINVAL;
3764       break;
3765
3766     case VPPCOM_ATTR_GET_ERROR:
3767       if (buffer && buflen && (*buflen >= sizeof (int)))
3768         {
3769           *(int *) buffer = 0;
3770           *buflen = sizeof (int);
3771
3772           VDBG (2, "VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
3773                 *(int *) buffer, *buflen);
3774         }
3775       else
3776         rv = VPPCOM_EINVAL;
3777       break;
3778
3779     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
3780       if (buffer && buflen && (*buflen >= sizeof (u32)))
3781         {
3782
3783           /* VPP-TBD */
3784           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3785                                 session->tx_fifo ?
3786                                 svm_fifo_size (session->tx_fifo) :
3787                                 vcm->cfg.tx_fifo_size);
3788           *buflen = sizeof (u32);
3789
3790           VDBG (2, "VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3791                 " #VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer,
3792                 *buflen);
3793         }
3794       else
3795         rv = VPPCOM_EINVAL;
3796       break;
3797
3798     case VPPCOM_ATTR_SET_DSCP:
3799       if (buffer && buflen && (*buflen >= sizeof (u8)))
3800         {
3801           session->dscp = *(u8 *) buffer;
3802
3803           VDBG (2, "VPPCOM_ATTR_SET_DSCP: %u (0x%x), buflen %d,",
3804                 *(u8 *) buffer, *(u8 *) buffer, *buflen);
3805         }
3806       else
3807         rv = VPPCOM_EINVAL;
3808       break;
3809
3810     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3811       if (buffer && buflen && (*buflen == sizeof (u32)))
3812         {
3813           /* VPP-TBD */
3814           session->sndbuf_size = *(u32 *) buffer;
3815           VDBG (2, "VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3816                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3817                 *buflen);
3818         }
3819       else
3820         rv = VPPCOM_EINVAL;
3821       break;
3822
3823     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3824       if (buffer && buflen && (*buflen >= sizeof (u32)))
3825         {
3826
3827           /* VPP-TBD */
3828           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3829                                 session->rx_fifo ?
3830                                 svm_fifo_size (session->rx_fifo) :
3831                                 vcm->cfg.rx_fifo_size);
3832           *buflen = sizeof (u32);
3833
3834           VDBG (2, "VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), buflen %d, "
3835                 "#VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer, *buflen);
3836         }
3837       else
3838         rv = VPPCOM_EINVAL;
3839       break;
3840
3841     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3842       if (buffer && buflen && (*buflen == sizeof (u32)))
3843         {
3844           /* VPP-TBD */
3845           session->rcvbuf_size = *(u32 *) buffer;
3846           VDBG (2, "VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), buflen %d,"
3847                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3848                 *buflen);
3849         }
3850       else
3851         rv = VPPCOM_EINVAL;
3852       break;
3853
3854     case VPPCOM_ATTR_GET_REUSEADDR:
3855       if (buffer && buflen && (*buflen >= sizeof (int)))
3856         {
3857           /* VPP-TBD */
3858           *(int *) buffer = vcl_session_has_attr (session,
3859                                                   VCL_SESS_ATTR_REUSEADDR);
3860           *buflen = sizeof (int);
3861
3862           VDBG (2, "VPPCOM_ATTR_GET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3863                 *(int *) buffer, *buflen);
3864         }
3865       else
3866         rv = VPPCOM_EINVAL;
3867       break;
3868
3869     case VPPCOM_ATTR_SET_REUSEADDR:
3870       if (buffer && buflen && (*buflen == sizeof (int)) &&
3871           !vcl_session_has_attr (session, VCL_SESS_ATTR_LISTEN))
3872         {
3873           /* VPP-TBD */
3874           if (*(int *) buffer)
3875             vcl_session_set_attr (session, VCL_SESS_ATTR_REUSEADDR);
3876           else
3877             vcl_session_clear_attr (session, VCL_SESS_ATTR_REUSEADDR);
3878
3879           VDBG (2, "VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3880                 vcl_session_has_attr (session, VCL_SESS_ATTR_REUSEADDR),
3881                 *buflen);
3882         }
3883       else
3884         rv = VPPCOM_EINVAL;
3885       break;
3886
3887     case VPPCOM_ATTR_GET_REUSEPORT:
3888       if (buffer && buflen && (*buflen >= sizeof (int)))
3889         {
3890           /* VPP-TBD */
3891           *(int *) buffer = vcl_session_has_attr (session,
3892                                                   VCL_SESS_ATTR_REUSEPORT);
3893           *buflen = sizeof (int);
3894
3895           VDBG (2, "VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3896                 *(int *) buffer, *buflen);
3897         }
3898       else
3899         rv = VPPCOM_EINVAL;
3900       break;
3901
3902     case VPPCOM_ATTR_SET_REUSEPORT:
3903       if (buffer && buflen && (*buflen == sizeof (int)) &&
3904           !vcl_session_has_attr (session, VCL_SESS_ATTR_LISTEN))
3905         {
3906           /* VPP-TBD */
3907           if (*(int *) buffer)
3908             vcl_session_set_attr (session, VCL_SESS_ATTR_REUSEPORT);
3909           else
3910             vcl_session_clear_attr (session, VCL_SESS_ATTR_REUSEPORT);
3911
3912           VDBG (2, "VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3913                 vcl_session_has_attr (session, VCL_SESS_ATTR_REUSEPORT),
3914                 *buflen);
3915         }
3916       else
3917         rv = VPPCOM_EINVAL;
3918       break;
3919
3920     case VPPCOM_ATTR_GET_BROADCAST:
3921       if (buffer && buflen && (*buflen >= sizeof (int)))
3922         {
3923           /* VPP-TBD */
3924           *(int *) buffer = vcl_session_has_attr (session,
3925                                                   VCL_SESS_ATTR_BROADCAST);
3926           *buflen = sizeof (int);
3927
3928           VDBG (2, "VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3929                 *(int *) buffer, *buflen);
3930         }
3931       else
3932         rv = VPPCOM_EINVAL;
3933       break;
3934
3935     case VPPCOM_ATTR_SET_BROADCAST:
3936       if (buffer && buflen && (*buflen == sizeof (int)))
3937         {
3938           /* VPP-TBD */
3939           if (*(int *) buffer)
3940             vcl_session_set_attr (session, VCL_SESS_ATTR_BROADCAST);
3941           else
3942             vcl_session_clear_attr (session, VCL_SESS_ATTR_BROADCAST);
3943
3944           VDBG (2, "VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3945                 vcl_session_has_attr (session, VCL_SESS_ATTR_BROADCAST),
3946                 *buflen);
3947         }
3948       else
3949         rv = VPPCOM_EINVAL;
3950       break;
3951
3952     case VPPCOM_ATTR_GET_V6ONLY:
3953       if (buffer && buflen && (*buflen >= sizeof (int)))
3954         {
3955           /* VPP-TBD */
3956           *(int *) buffer = vcl_session_has_attr (session,
3957                                                   VCL_SESS_ATTR_V6ONLY);
3958           *buflen = sizeof (int);
3959
3960           VDBG (2, "VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3961                 *(int *) buffer, *buflen);
3962         }
3963       else
3964         rv = VPPCOM_EINVAL;
3965       break;
3966
3967     case VPPCOM_ATTR_SET_V6ONLY:
3968       if (buffer && buflen && (*buflen == sizeof (int)))
3969         {
3970           /* VPP-TBD */
3971           if (*(int *) buffer)
3972             vcl_session_set_attr (session, VCL_SESS_ATTR_V6ONLY);
3973           else
3974             vcl_session_clear_attr (session, VCL_SESS_ATTR_V6ONLY);
3975
3976           VDBG (2, "VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3977                 vcl_session_has_attr (session, VCL_SESS_ATTR_V6ONLY),
3978                 *buflen);
3979         }
3980       else
3981         rv = VPPCOM_EINVAL;
3982       break;
3983
3984     case VPPCOM_ATTR_GET_KEEPALIVE:
3985       if (buffer && buflen && (*buflen >= sizeof (int)))
3986         {
3987           /* VPP-TBD */
3988           *(int *) buffer = vcl_session_has_attr (session,
3989                                                   VCL_SESS_ATTR_KEEPALIVE);
3990           *buflen = sizeof (int);
3991
3992           VDBG (2, "VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3993                 *(int *) buffer, *buflen);
3994         }
3995       else
3996         rv = VPPCOM_EINVAL;
3997       break;
3998
3999     case VPPCOM_ATTR_SET_KEEPALIVE:
4000       if (buffer && buflen && (*buflen == sizeof (int)))
4001         {
4002           /* VPP-TBD */
4003           if (*(int *) buffer)
4004             vcl_session_set_attr (session, VCL_SESS_ATTR_KEEPALIVE);
4005           else
4006             vcl_session_clear_attr (session, VCL_SESS_ATTR_KEEPALIVE);
4007
4008           VDBG (2, "VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
4009                 vcl_session_has_attr (session, VCL_SESS_ATTR_KEEPALIVE),
4010                 *buflen);
4011         }
4012       else
4013         rv = VPPCOM_EINVAL;
4014       break;
4015
4016     case VPPCOM_ATTR_GET_TCP_NODELAY:
4017       if (buffer && buflen && (*buflen >= sizeof (int)))
4018         {
4019           /* VPP-TBD */
4020           *(int *) buffer = vcl_session_has_attr (session,
4021                                                   VCL_SESS_ATTR_TCP_NODELAY);
4022           *buflen = sizeof (int);
4023
4024           VDBG (2, "VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
4025                 *(int *) buffer, *buflen);
4026         }
4027       else
4028         rv = VPPCOM_EINVAL;
4029       break;
4030
4031     case VPPCOM_ATTR_SET_TCP_NODELAY:
4032       if (buffer && buflen && (*buflen == sizeof (int)))
4033         {
4034           /* VPP-TBD */
4035           if (*(int *) buffer)
4036             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_NODELAY);
4037           else
4038             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_NODELAY);
4039
4040           VDBG (2, "VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
4041                 vcl_session_has_attr (session, VCL_SESS_ATTR_TCP_NODELAY),
4042                 *buflen);
4043         }
4044       else
4045         rv = VPPCOM_EINVAL;
4046       break;
4047
4048     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
4049       if (buffer && buflen && (*buflen >= sizeof (int)))
4050         {
4051           /* VPP-TBD */
4052           *(int *) buffer = vcl_session_has_attr (session,
4053                                                   VCL_SESS_ATTR_TCP_KEEPIDLE);
4054           *buflen = sizeof (int);
4055
4056           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
4057                 *(int *) buffer, *buflen);
4058         }
4059       else
4060         rv = VPPCOM_EINVAL;
4061       break;
4062
4063     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
4064       if (buffer && buflen && (*buflen == sizeof (int)))
4065         {
4066           /* VPP-TBD */
4067           if (*(int *) buffer)
4068             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_KEEPIDLE);
4069           else
4070             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_KEEPIDLE);
4071
4072           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
4073                 vcl_session_has_attr (session,
4074                                       VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
4075         }
4076       else
4077         rv = VPPCOM_EINVAL;
4078       break;
4079
4080     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
4081       if (buffer && buflen && (*buflen >= sizeof (int)))
4082         {
4083           /* VPP-TBD */
4084           *(int *) buffer = vcl_session_has_attr (session,
4085                                                   VCL_SESS_ATTR_TCP_KEEPINTVL);
4086           *buflen = sizeof (int);
4087
4088           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
4089                 *(int *) buffer, *buflen);
4090         }
4091       else
4092         rv = VPPCOM_EINVAL;
4093       break;
4094
4095     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
4096       if (buffer && buflen && (*buflen == sizeof (int)))
4097         {
4098           /* VPP-TBD */
4099           if (*(int *) buffer)
4100             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_KEEPINTVL);
4101           else
4102             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_KEEPINTVL);
4103
4104           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
4105                 vcl_session_has_attr (session,
4106                                       VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
4107         }
4108       else
4109         rv = VPPCOM_EINVAL;
4110       break;
4111
4112     case VPPCOM_ATTR_GET_TCP_USER_MSS:
4113       if (!(buffer && buflen && (*buflen >= sizeof (u32))))
4114         {
4115           rv = VPPCOM_EINVAL;
4116           break;
4117         }
4118
4119       tea.type = TRANSPORT_ENDPT_ATTR_MSS;
4120       tea.mss = *(u32 *) buffer;
4121       if (vcl_session_transport_attr (wrk, session, 1 /* is_get */, &tea))
4122         rv = VPPCOM_ENOPROTOOPT;
4123
4124       if (!rv)
4125         {
4126           *(u32 *) buffer = tea.mss;
4127           *buflen = sizeof (int);
4128         }
4129
4130       VDBG (2, "VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d", *(int *) buffer,
4131             *buflen);
4132       break;
4133     case VPPCOM_ATTR_SET_TCP_USER_MSS:
4134       if (!(buffer && buflen && (*buflen == sizeof (u32))))
4135         {
4136           rv = VPPCOM_EINVAL;
4137           break;
4138         }
4139
4140       tea.type = TRANSPORT_ENDPT_ATTR_MSS;
4141       tea.mss = *(u32 *) buffer;
4142       if (vcl_session_transport_attr (wrk, session, 0 /* is_get */, &tea))
4143         rv = VPPCOM_ENOPROTOOPT;
4144
4145       VDBG (2, "VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d", tea.mss,
4146             *buflen);
4147       break;
4148
4149     case VPPCOM_ATTR_SET_CONNECTED:
4150       session->flags |= VCL_SESSION_F_CONNECTED;
4151       break;
4152
4153     case VPPCOM_ATTR_SET_CKPAIR:
4154       if (!(buffer && buflen && (*buflen == sizeof (int))) ||
4155           !vcl_session_has_crypto (session))
4156         {
4157           rv = VPPCOM_EINVAL;
4158           break;
4159         }
4160       if (!session->ext_config)
4161         {
4162           vcl_session_alloc_ext_cfg (session, TRANSPORT_ENDPT_EXT_CFG_CRYPTO,
4163                                      sizeof (transport_endpt_ext_cfg_t));
4164         }
4165       else if (session->ext_config->type != TRANSPORT_ENDPT_EXT_CFG_CRYPTO)
4166         {
4167           rv = VPPCOM_EINVAL;
4168           break;
4169         }
4170
4171       session->ext_config->crypto.ckpair_index = *(uint32_t *) buffer;
4172       break;
4173
4174     case VPPCOM_ATTR_SET_VRF:
4175       if (!(buffer && buflen && (*buflen == sizeof (u32))))
4176         {
4177           rv = VPPCOM_EINVAL;
4178           break;
4179         }
4180       session->vrf = *(u32 *) buffer;
4181       break;
4182
4183     case VPPCOM_ATTR_GET_VRF:
4184       if (!(buffer && buflen && (*buflen >= sizeof (u32))))
4185         {
4186           rv = VPPCOM_EINVAL;
4187           break;
4188         }
4189       *(u32 *) buffer = session->vrf;
4190       *buflen = sizeof (u32);
4191       break;
4192
4193     case VPPCOM_ATTR_GET_DOMAIN:
4194       if (!(buffer && buflen && (*buflen >= sizeof (int))))
4195         {
4196           rv = VPPCOM_EINVAL;
4197           break;
4198         }
4199
4200       if (session->transport.is_ip4)
4201         *(int *) buffer = AF_INET;
4202       else
4203         *(int *) buffer = AF_INET6;
4204       *buflen = sizeof (int);
4205
4206       VDBG (2, "VPPCOM_ATTR_GET_DOMAIN: %d, buflen %u", *(int *) buffer,
4207             *buflen);
4208       break;
4209
4210     case VPPCOM_ATTR_SET_ENDPT_EXT_CFG:
4211       if (!(buffer && buflen && (*buflen > 0)))
4212         {
4213           rv = VPPCOM_EINVAL;
4214           break;
4215         }
4216       if (session->ext_config)
4217         {
4218           rv = VPPCOM_EINVAL;
4219           break;
4220         }
4221       vcl_session_alloc_ext_cfg (session, TRANSPORT_ENDPT_EXT_CFG_NONE,
4222                                  *buflen + sizeof (u32));
4223       clib_memcpy (session->ext_config->data, buffer, *buflen);
4224       session->ext_config->len = *buflen;
4225       break;
4226     case VPPCOM_ATTR_SET_IP_PKTINFO:
4227       if (buffer && buflen && (*buflen == sizeof (int)) &&
4228           !vcl_session_has_attr (session, VCL_SESS_ATTR_IP_PKTINFO))
4229         {
4230           if (*(int *) buffer)
4231             vcl_session_set_attr (session, VCL_SESS_ATTR_IP_PKTINFO);
4232           else
4233             vcl_session_clear_attr (session, VCL_SESS_ATTR_IP_PKTINFO);
4234
4235           VDBG (2, "VCL_SESS_ATTR_IP_PKTINFO: %d, buflen %d",
4236                 vcl_session_has_attr (session, VCL_SESS_ATTR_IP_PKTINFO),
4237                 *buflen);
4238         }
4239       else
4240         rv = VPPCOM_EINVAL;
4241       break;
4242
4243     case VPPCOM_ATTR_GET_IP_PKTINFO:
4244       if (buffer && buflen && (*buflen >= sizeof (int)))
4245         {
4246           *(int *) buffer =
4247             vcl_session_has_attr (session, VCL_SESS_ATTR_IP_PKTINFO);
4248           *buflen = sizeof (int);
4249
4250           VDBG (2, "VCL_SESS_ATTR_IP_PKTINFO: %d, buflen %d", *(int *) buffer,
4251                 *buflen);
4252         }
4253       else
4254         rv = VPPCOM_EINVAL;
4255       break;
4256
4257     default:
4258       rv = VPPCOM_EINVAL;
4259       break;
4260     }
4261
4262   return rv;
4263 }
4264
4265 int
4266 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
4267                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
4268 {
4269   vcl_worker_t *wrk = vcl_worker_get_current ();
4270   vcl_session_t *session;
4271   int rv = VPPCOM_OK;
4272
4273   if (flags == 0)
4274     rv = vppcom_session_read (session_handle, buffer, buflen);
4275   else if (flags & MSG_PEEK)
4276     rv = vppcom_session_peek (session_handle, buffer, buflen);
4277   else
4278     {
4279       VDBG (0, "Unsupport flags for recvfrom %d", flags);
4280       return VPPCOM_EAFNOSUPPORT;
4281     }
4282
4283   if (ep && rv > 0)
4284     {
4285       session = vcl_session_get_w_handle (wrk, session_handle);
4286       if (session->transport.is_ip4)
4287         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
4288                           sizeof (ip4_address_t));
4289       else
4290         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
4291                           sizeof (ip6_address_t));
4292       ep->is_ip4 = session->transport.is_ip4;
4293       ep->port = session->transport.rmt_port;
4294     }
4295
4296   return rv;
4297 }
4298
4299 static void
4300 vcl_handle_ep_app_tlvs (vcl_session_t *s, vppcom_endpt_t *ep)
4301 {
4302   vppcom_endpt_tlv_t *tlv = ep->app_tlvs;
4303
4304   do
4305     {
4306       switch (tlv->data_type)
4307         {
4308         case VCL_UDP_SEGMENT:
4309           s->gso_size = *(u16 *) tlv->data;
4310           break;
4311         case VCL_IP_PKTINFO:
4312           clib_memcpy_fast (&s->transport.lcl_ip, (ip4_address_t *) tlv->data,
4313                             sizeof (ip4_address_t));
4314           break;
4315         default:
4316           VDBG (0, "Ignorning unsupported app tlv %u", tlv->data_type);
4317           break;
4318         }
4319       tlv = VCL_EP_NEXT_APP_TLV (ep, tlv);
4320     }
4321   while (tlv);
4322 }
4323
4324 int
4325 vppcom_session_sendto (uint32_t session_handle, void *buffer,
4326                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
4327 {
4328   vcl_worker_t *wrk = vcl_worker_get_current ();
4329   vcl_session_t *s;
4330
4331   s = vcl_session_get_w_handle (wrk, session_handle);
4332   if (PREDICT_FALSE (!s))
4333     return VPPCOM_EBADFD;
4334
4335   if (ep)
4336     {
4337       if (!vcl_session_is_cl (s))
4338         return VPPCOM_EINVAL;
4339
4340       s->transport.is_ip4 = ep->is_ip4;
4341       s->transport.rmt_port = ep->port;
4342       vcl_ip_copy_from_ep (&s->transport.rmt_ip, ep);
4343
4344       if (ep->app_tlvs)
4345         vcl_handle_ep_app_tlvs (s, ep);
4346
4347       /* Session not connected/bound in vpp. Create it by 'connecting' it */
4348       if (PREDICT_FALSE (s->session_state == VCL_STATE_CLOSED))
4349         {
4350           u32 session_index = s->session_index;
4351           f64 timeout = vcm->cfg.session_timeout;
4352           int rv;
4353
4354           vcl_send_session_connect (wrk, s);
4355           rv = vppcom_wait_for_session_state_change (session_index,
4356                                                      VCL_STATE_READY,
4357                                                      timeout);
4358           if (rv < 0)
4359             return rv;
4360           s = vcl_session_get (wrk, session_index);
4361         }
4362     }
4363
4364   if (flags)
4365     {
4366       // TBD check the flags and do the right thing
4367       VDBG (2, "handling flags 0x%u (%d) not implemented yet.", flags, flags);
4368     }
4369
4370   return (vppcom_session_write_inline (wrk, s, buffer, buflen, 1,
4371                                        s->is_dgram ? 1 : 0));
4372 }
4373
4374 int
4375 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
4376 {
4377   vcl_worker_t *wrk = vcl_worker_get_current ();
4378   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
4379   u32 i, keep_trying = 1;
4380   svm_msg_q_msg_t msg;
4381   session_event_t *e;
4382   int rv, num_ev = 0;
4383
4384   VDBG (3, "vp %p, nsids %u, wait_for_time %f", vp, n_sids, wait_for_time);
4385
4386   if (!vp)
4387     return VPPCOM_EFAULT;
4388
4389   do
4390     {
4391       vcl_session_t *session;
4392
4393       /* Dequeue all events and drop all unhandled io events */
4394       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
4395         {
4396           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
4397           vcl_handle_mq_event (wrk, e);
4398           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
4399         }
4400       vec_reset_length (wrk->unhandled_evts_vector);
4401
4402       for (i = 0; i < n_sids; i++)
4403         {
4404           session = vcl_session_get (wrk, vp[i].sh);
4405           if (!session)
4406             {
4407               vp[i].revents = POLLHUP;
4408               num_ev++;
4409               continue;
4410             }
4411
4412           vp[i].revents = 0;
4413
4414           if (POLLIN & vp[i].events)
4415             {
4416               rv = vcl_session_read_ready (session);
4417               if (rv > 0)
4418                 {
4419                   vp[i].revents |= POLLIN;
4420                   num_ev++;
4421                 }
4422               else if (rv < 0)
4423                 {
4424                   switch (rv)
4425                     {
4426                     case VPPCOM_ECONNRESET:
4427                       vp[i].revents = POLLHUP;
4428                       break;
4429
4430                     default:
4431                       vp[i].revents = POLLERR;
4432                       break;
4433                     }
4434                   num_ev++;
4435                 }
4436             }
4437
4438           if (POLLOUT & vp[i].events)
4439             {
4440               rv = vcl_session_write_ready (session);
4441               if (rv > 0)
4442                 {
4443                   vp[i].revents |= POLLOUT;
4444                   num_ev++;
4445                 }
4446               else if (rv < 0)
4447                 {
4448                   switch (rv)
4449                     {
4450                     case VPPCOM_ECONNRESET:
4451                       vp[i].revents = POLLHUP;
4452                       break;
4453
4454                     default:
4455                       vp[i].revents = POLLERR;
4456                       break;
4457                     }
4458                   num_ev++;
4459                 }
4460             }
4461
4462           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
4463             {
4464               vp[i].revents = POLLNVAL;
4465               num_ev++;
4466             }
4467         }
4468       if (wait_for_time != -1)
4469         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
4470     }
4471   while ((num_ev == 0) && keep_trying);
4472
4473   return num_ev;
4474 }
4475
4476 int
4477 vppcom_mq_epoll_fd (void)
4478 {
4479   vcl_worker_t *wrk = vcl_worker_get_current ();
4480   return wrk->mqs_epfd;
4481 }
4482
4483 int
4484 vppcom_session_index (vcl_session_handle_t session_handle)
4485 {
4486   return session_handle & 0xFFFFFF;
4487 }
4488
4489 int
4490 vppcom_session_worker (vcl_session_handle_t session_handle)
4491 {
4492   return session_handle >> 24;
4493 }
4494
4495 int
4496 vppcom_worker_register (void)
4497 {
4498   if (!vcl_worker_alloc_and_init ())
4499     return VPPCOM_EEXIST;
4500
4501   if (vcl_worker_register_with_vpp ())
4502     return VPPCOM_EEXIST;
4503
4504   return VPPCOM_OK;
4505 }
4506
4507 void
4508 vppcom_worker_unregister (void)
4509 {
4510   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
4511   vcl_set_worker_index (~0);
4512 }
4513
4514 void
4515 vppcom_worker_index_set (int index)
4516 {
4517   vcl_set_worker_index (index);
4518 }
4519
4520 int
4521 vppcom_worker_index (void)
4522 {
4523   return vcl_get_worker_index ();
4524 }
4525
4526 int
4527 vppcom_worker_mqs_epfd (void)
4528 {
4529   vcl_worker_t *wrk = vcl_worker_get_current ();
4530   if (!vcm->cfg.use_mq_eventfd)
4531     return -1;
4532   return wrk->mqs_epfd;
4533 }
4534
4535 int
4536 vppcom_session_is_connectable_listener (uint32_t session_handle)
4537 {
4538   vcl_session_t *session;
4539   vcl_worker_t *wrk = vcl_worker_get_current ();
4540   session = vcl_session_get_w_handle (wrk, session_handle);
4541   if (!session)
4542     return VPPCOM_EBADFD;
4543   return vcl_session_is_connectable_listener (wrk, session);
4544 }
4545
4546 int
4547 vppcom_session_listener (uint32_t session_handle)
4548 {
4549   vcl_worker_t *wrk = vcl_worker_get_current ();
4550   vcl_session_t *listen_session, *session;
4551   session = vcl_session_get_w_handle (wrk, session_handle);
4552   if (!session)
4553     return VPPCOM_EBADFD;
4554   if (session->listener_index == VCL_INVALID_SESSION_INDEX)
4555     return VPPCOM_EBADFD;
4556   listen_session = vcl_session_get_w_handle (wrk, session->listener_index);
4557   if (!listen_session)
4558     return VPPCOM_EBADFD;
4559   return vcl_session_handle (listen_session);
4560 }
4561
4562 int
4563 vppcom_session_n_accepted (uint32_t session_handle)
4564 {
4565   vcl_worker_t *wrk = vcl_worker_get_current ();
4566   vcl_session_t *session = vcl_session_get_w_handle (wrk, session_handle);
4567   if (!session)
4568     return VPPCOM_EBADFD;
4569   return session->n_accepted_sessions;
4570 }
4571
4572 const char *
4573 vppcom_proto_str (vppcom_proto_t proto)
4574 {
4575   char const *proto_str;
4576
4577   switch (proto)
4578     {
4579     case VPPCOM_PROTO_TCP:
4580       proto_str = "TCP";
4581       break;
4582     case VPPCOM_PROTO_UDP:
4583       proto_str = "UDP";
4584       break;
4585     case VPPCOM_PROTO_TLS:
4586       proto_str = "TLS";
4587       break;
4588     case VPPCOM_PROTO_QUIC:
4589       proto_str = "QUIC";
4590       break;
4591     case VPPCOM_PROTO_DTLS:
4592       proto_str = "DTLS";
4593       break;
4594     case VPPCOM_PROTO_SRTP:
4595       proto_str = "SRTP";
4596       break;
4597     default:
4598       proto_str = "UNKNOWN";
4599       break;
4600     }
4601   return proto_str;
4602 }
4603
4604 const char *
4605 vppcom_retval_str (int retval)
4606 {
4607   char const *st;
4608
4609   switch (retval)
4610     {
4611     case VPPCOM_OK:
4612       st = "VPPCOM_OK";
4613       break;
4614
4615     case VPPCOM_EAGAIN:
4616       st = "VPPCOM_EAGAIN";
4617       break;
4618
4619     case VPPCOM_EFAULT:
4620       st = "VPPCOM_EFAULT";
4621       break;
4622
4623     case VPPCOM_ENOMEM:
4624       st = "VPPCOM_ENOMEM";
4625       break;
4626
4627     case VPPCOM_EINVAL:
4628       st = "VPPCOM_EINVAL";
4629       break;
4630
4631     case VPPCOM_EBADFD:
4632       st = "VPPCOM_EBADFD";
4633       break;
4634
4635     case VPPCOM_EAFNOSUPPORT:
4636       st = "VPPCOM_EAFNOSUPPORT";
4637       break;
4638
4639     case VPPCOM_ECONNABORTED:
4640       st = "VPPCOM_ECONNABORTED";
4641       break;
4642
4643     case VPPCOM_ECONNRESET:
4644       st = "VPPCOM_ECONNRESET";
4645       break;
4646
4647     case VPPCOM_ENOTCONN:
4648       st = "VPPCOM_ENOTCONN";
4649       break;
4650
4651     case VPPCOM_ECONNREFUSED:
4652       st = "VPPCOM_ECONNREFUSED";
4653       break;
4654
4655     case VPPCOM_ETIMEDOUT:
4656       st = "VPPCOM_ETIMEDOUT";
4657       break;
4658
4659     case VPPCOM_EADDRINUSE:
4660       st = "VPPCOM_EADDRINUSE";
4661       break;
4662
4663     default:
4664       st = "UNKNOWN_STATE";
4665       break;
4666     }
4667
4668   return st;
4669 }
4670
4671 int
4672 vppcom_add_cert_key_pair (vppcom_cert_key_pair_t *ckpair)
4673 {
4674   if (vcm->cfg.vpp_app_socket_api)
4675     return vcl_sapi_add_cert_key_pair (ckpair);
4676   else
4677     return vcl_bapi_add_cert_key_pair (ckpair);
4678 }
4679
4680 int
4681 vppcom_del_cert_key_pair (uint32_t ckpair_index)
4682 {
4683   if (vcm->cfg.vpp_app_socket_api)
4684     return vcl_sapi_del_cert_key_pair (ckpair_index);
4685   else
4686     return vcl_bapi_del_cert_key_pair (ckpair_index);
4687 }
4688
4689 int
4690 vppcom_session_get_error (uint32_t session_handle)
4691 {
4692   vcl_worker_t *wrk = vcl_worker_get_current ();
4693   vcl_session_t *session = 0;
4694
4695   session = vcl_session_get_w_handle (wrk, session_handle);
4696   if (!session)
4697     return VPPCOM_EBADFD;
4698
4699   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
4700     {
4701       VWRN ("epoll session %u! will not have connect", session->session_index);
4702       return VPPCOM_EBADFD;
4703     }
4704
4705   if (session->vpp_error == SESSION_E_PORTINUSE)
4706     return VPPCOM_EADDRINUSE;
4707   else if (session->vpp_error == SESSION_E_REFUSED)
4708     return VPPCOM_ECONNREFUSED;
4709   else if (session->vpp_error != SESSION_E_NONE)
4710     return VPPCOM_EFAULT;
4711   else
4712     return VPPCOM_OK;
4713 }
4714
4715 int
4716 vppcom_worker_is_detached (void)
4717 {
4718   vcl_worker_t *wrk = vcl_worker_get_current ();
4719
4720   if (!vcm->cfg.use_mq_eventfd)
4721     return VPPCOM_ENOTSUP;
4722
4723   return wrk->api_client_handle == ~0;
4724 }
4725
4726 /*
4727  * fd.io coding-style-patch-verification: ON
4728  *
4729  * Local Variables:
4730  * eval: (c-set-style "gnu")
4731  * End:
4732  */