vcl: fix error state switch for VCL_STATE_LISTEN_NO_MQ sessions
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <vcl/vppcom.h>
19 #include <vcl/vcl_debug.h>
20 #include <vcl/vcl_private.h>
21 #include <svm/fifo_segment.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static inline int
26 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq, u32 n_max_msg)
27 {
28   u32 n_msgs = 0, sz, len;
29
30   while ((sz = svm_msg_q_size (mq)))
31     {
32       len = vec_len (wrk->mq_msg_vector);
33       vec_validate (wrk->mq_msg_vector, len + sz - 1);
34       svm_msg_q_sub_raw_batch (mq, wrk->mq_msg_vector + len, sz);
35       n_msgs += sz;
36     }
37   return n_msgs;
38 }
39
40
41
42 static void
43 vcl_msg_add_ext_config (vcl_session_t *s, uword *offset)
44 {
45   svm_fifo_chunk_t *c;
46
47   c = vcl_segment_alloc_chunk (vcl_vpp_worker_segment_handle (0),
48                                0 /* one slice only */, s->ext_config->len,
49                                offset);
50   if (c)
51     clib_memcpy_fast (c->data, s->ext_config, s->ext_config->len);
52 }
53
54 void
55 vcl_send_session_listen (vcl_worker_t *wrk, vcl_session_t *s)
56 {
57   app_session_evt_t _app_evt, *app_evt = &_app_evt;
58   session_listen_msg_t *mp;
59   svm_msg_q_t *mq;
60
61   mq = vcl_worker_ctrl_mq (wrk);
62   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_LISTEN);
63   mp = (session_listen_msg_t *) app_evt->evt->data;
64   memset (mp, 0, sizeof (*mp));
65   mp->client_index = wrk->api_client_handle;
66   mp->context = s->session_index;
67   mp->wrk_index = wrk->vpp_wrk_index;
68   mp->is_ip4 = s->transport.is_ip4;
69   clib_memcpy_fast (&mp->ip, &s->transport.lcl_ip, sizeof (mp->ip));
70   mp->port = s->transport.lcl_port;
71   mp->proto = s->session_type;
72   mp->vrf = s->vrf;
73   if (s->flags & VCL_SESSION_F_CONNECTED)
74     mp->flags = TRANSPORT_CFG_F_CONNECTED;
75   if (s->ext_config)
76     vcl_msg_add_ext_config (s, &mp->ext_config);
77   app_send_ctrl_evt_to_vpp (mq, app_evt);
78   if (s->ext_config)
79     {
80       clib_mem_free (s->ext_config);
81       s->ext_config = 0;
82     }
83   s->flags |= VCL_SESSION_F_PENDING_LISTEN;
84 }
85
86 static void
87 vcl_send_session_connect (vcl_worker_t * wrk, vcl_session_t * s)
88 {
89   app_session_evt_t _app_evt, *app_evt = &_app_evt;
90   session_connect_msg_t *mp;
91   svm_msg_q_t *mq;
92
93   mq = vcl_worker_ctrl_mq (wrk);
94   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_CONNECT);
95   mp = (session_connect_msg_t *) app_evt->evt->data;
96   memset (mp, 0, sizeof (*mp));
97   mp->client_index = wrk->api_client_handle;
98   mp->context = s->session_index;
99   mp->dscp = s->dscp;
100   mp->wrk_index = wrk->vpp_wrk_index;
101   mp->is_ip4 = s->transport.is_ip4;
102   mp->parent_handle = s->parent_handle;
103   clib_memcpy_fast (&mp->ip, &s->transport.rmt_ip, sizeof (mp->ip));
104   clib_memcpy_fast (&mp->lcl_ip, &s->transport.lcl_ip, sizeof (mp->lcl_ip));
105   mp->port = s->transport.rmt_port;
106   mp->lcl_port = s->transport.lcl_port;
107   mp->proto = s->session_type;
108   mp->vrf = s->vrf;
109   if (s->flags & VCL_SESSION_F_CONNECTED)
110     mp->flags |= TRANSPORT_CFG_F_CONNECTED;
111   if (s->ext_config)
112     vcl_msg_add_ext_config (s, &mp->ext_config);
113   app_send_ctrl_evt_to_vpp (mq, app_evt);
114
115   if (s->ext_config)
116     {
117       clib_mem_free (s->ext_config);
118       s->ext_config = 0;
119     }
120 }
121
122 void
123 vcl_send_session_unlisten (vcl_worker_t * wrk, vcl_session_t * s)
124 {
125   app_session_evt_t _app_evt, *app_evt = &_app_evt;
126   session_unlisten_msg_t *mp;
127   svm_msg_q_t *mq;
128
129   mq = vcl_worker_ctrl_mq (wrk);
130   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_UNLISTEN);
131   mp = (session_unlisten_msg_t *) app_evt->evt->data;
132   memset (mp, 0, sizeof (*mp));
133   mp->client_index = wrk->api_client_handle;
134   mp->wrk_index = wrk->vpp_wrk_index;
135   mp->handle = s->vpp_handle;
136   mp->context = wrk->wrk_index;
137   app_send_ctrl_evt_to_vpp (mq, app_evt);
138 }
139
140 static void
141 vcl_send_session_shutdown (vcl_worker_t *wrk, vcl_session_t *s)
142 {
143   app_session_evt_t _app_evt, *app_evt = &_app_evt;
144   session_shutdown_msg_t *mp;
145   svm_msg_q_t *mq;
146
147   /* Send to thread that owns the session */
148   mq = s->vpp_evt_q;
149   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_SHUTDOWN);
150   mp = (session_shutdown_msg_t *) app_evt->evt->data;
151   memset (mp, 0, sizeof (*mp));
152   mp->client_index = wrk->api_client_handle;
153   mp->handle = s->vpp_handle;
154   app_send_ctrl_evt_to_vpp (mq, app_evt);
155 }
156
157 static void
158 vcl_send_session_disconnect (vcl_worker_t * wrk, vcl_session_t * s)
159 {
160   app_session_evt_t _app_evt, *app_evt = &_app_evt;
161   session_disconnect_msg_t *mp;
162   svm_msg_q_t *mq;
163
164   /* Send to thread that owns the session */
165   mq = s->vpp_evt_q;
166   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_DISCONNECT);
167   mp = (session_disconnect_msg_t *) app_evt->evt->data;
168   memset (mp, 0, sizeof (*mp));
169   mp->client_index = wrk->api_client_handle;
170   mp->handle = s->vpp_handle;
171   app_send_ctrl_evt_to_vpp (mq, app_evt);
172 }
173
174 static void
175 vcl_send_app_detach (vcl_worker_t * wrk)
176 {
177   app_session_evt_t _app_evt, *app_evt = &_app_evt;
178   session_app_detach_msg_t *mp;
179   svm_msg_q_t *mq;
180
181   mq = vcl_worker_ctrl_mq (wrk);
182   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_DETACH);
183   mp = (session_app_detach_msg_t *) app_evt->evt->data;
184   memset (mp, 0, sizeof (*mp));
185   mp->client_index = wrk->api_client_handle;
186   app_send_ctrl_evt_to_vpp (mq, app_evt);
187 }
188
189 static void
190 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
191                                  session_handle_t handle, int retval)
192 {
193   app_session_evt_t _app_evt, *app_evt = &_app_evt;
194   session_accepted_reply_msg_t *rmp;
195   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
196   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
197   rmp->handle = handle;
198   rmp->context = context;
199   rmp->retval = retval;
200   app_send_ctrl_evt_to_vpp (mq, app_evt);
201 }
202
203 static void
204 vcl_send_session_disconnected_reply (vcl_worker_t * wrk, vcl_session_t * s,
205                                      int retval)
206 {
207   app_session_evt_t _app_evt, *app_evt = &_app_evt;
208   session_disconnected_reply_msg_t *rmp;
209   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
210                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
211   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
212   rmp->handle = s->vpp_handle;
213   rmp->context = wrk->api_client_handle;
214   rmp->retval = retval;
215   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
216 }
217
218 static void
219 vcl_send_session_reset_reply (vcl_worker_t * wrk, vcl_session_t * s,
220                               int retval)
221 {
222   app_session_evt_t _app_evt, *app_evt = &_app_evt;
223   session_reset_reply_msg_t *rmp;
224   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
225                              SESSION_CTRL_EVT_RESET_REPLY);
226   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
227   rmp->handle = s->vpp_handle;
228   rmp->context = wrk->api_client_handle;
229   rmp->retval = retval;
230   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
231 }
232
233 void
234 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
235                                 u32 wrk_index)
236 {
237   app_session_evt_t _app_evt, *app_evt = &_app_evt;
238   session_worker_update_msg_t *mp;
239
240   app_alloc_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt,
241                              SESSION_CTRL_EVT_WORKER_UPDATE);
242   mp = (session_worker_update_msg_t *) app_evt->evt->data;
243   mp->client_index = wrk->api_client_handle;
244   mp->handle = s->vpp_handle;
245   mp->req_wrk_index = wrk->vpp_wrk_index;
246   mp->wrk_index = wrk_index;
247   app_send_ctrl_evt_to_vpp (s->vpp_evt_q, app_evt);
248 }
249
250 int
251 vcl_send_worker_rpc (u32 dst_wrk_index, void *data, u32 data_len)
252 {
253   app_session_evt_t _app_evt, *app_evt = &_app_evt;
254   session_app_wrk_rpc_msg_t *mp;
255   vcl_worker_t *dst_wrk, *wrk;
256   svm_msg_q_t *mq;
257   int ret = -1;
258
259   if (data_len > sizeof (mp->data))
260     goto done;
261
262   clib_spinlock_lock (&vcm->workers_lock);
263
264   dst_wrk = vcl_worker_get_if_valid (dst_wrk_index);
265   if (!dst_wrk)
266     goto done;
267
268   wrk = vcl_worker_get_current ();
269   mq = vcl_worker_ctrl_mq (wrk);
270   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_WRK_RPC);
271   mp = (session_app_wrk_rpc_msg_t *) app_evt->evt->data;
272   mp->client_index = wrk->api_client_handle;
273   mp->wrk_index = dst_wrk->vpp_wrk_index;
274   clib_memcpy (mp->data, data, data_len);
275   app_send_ctrl_evt_to_vpp (mq, app_evt);
276   ret = 0;
277
278 done:
279   clib_spinlock_unlock (&vcm->workers_lock);
280   return ret;
281 }
282
283 int
284 vcl_session_transport_attr (vcl_worker_t *wrk, vcl_session_t *s, u8 is_get,
285                             transport_endpt_attr_t *attr)
286 {
287   app_session_evt_t _app_evt, *app_evt = &_app_evt;
288   session_transport_attr_msg_t *mp;
289   svm_msg_q_t *mq;
290   f64 timeout;
291
292   ASSERT (!wrk->session_attr_op);
293   mq = s->vpp_evt_q;
294   if (PREDICT_FALSE (!mq))
295     {
296       /* FIXME: attribute should be stored and sent once session is
297        * bound/connected to vpp */
298       return 0;
299     }
300
301   wrk->session_attr_op = 1;
302   wrk->session_attr_op_rv = -1;
303
304   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_TRANSPORT_ATTR);
305   mp = (session_transport_attr_msg_t *) app_evt->evt->data;
306   memset (mp, 0, sizeof (*mp));
307   mp->client_index = wrk->api_client_handle;
308   mp->handle = s->vpp_handle;
309   mp->is_get = is_get;
310   mp->attr = *attr;
311   app_send_ctrl_evt_to_vpp (mq, app_evt);
312
313   timeout = clib_time_now (&wrk->clib_time) + 1;
314
315   while (wrk->session_attr_op && clib_time_now (&wrk->clib_time) < timeout)
316     vcl_flush_mq_events ();
317
318   if (!wrk->session_attr_op_rv && is_get)
319     *attr = wrk->session_attr_rv;
320
321   wrk->session_attr_op = 0;
322
323   return wrk->session_attr_op_rv;
324 }
325
326 static u32
327 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp,
328                               u32 ls_index)
329 {
330   vcl_session_t *session, *listen_session;
331   svm_msg_q_t *evt_q;
332
333   session = vcl_session_alloc (wrk);
334
335   listen_session = vcl_session_get (wrk, ls_index);
336   if (listen_session->vpp_handle != mp->listener_handle)
337     {
338       VDBG (0, "ERROR: listener handle %lu does not match session %u",
339             mp->listener_handle, ls_index);
340       goto error;
341     }
342
343   if (vcl_segment_attach_session (
344         mp->segment_handle, mp->server_rx_fifo, mp->server_tx_fifo,
345         mp->vpp_event_queue_address, mp->mq_index, 0, session))
346     {
347       VDBG (0, "session %u [0x%llx]: failed to attach fifos",
348             session->session_index, mp->handle);
349       goto error;
350     }
351
352   session->vpp_handle = mp->handle;
353   session->session_state = VCL_STATE_READY;
354   if (mp->rmt.is_ip4)
355     {
356       session->original_dst_ip4 = mp->original_dst_ip4;
357       session->original_dst_port = mp->original_dst_port;
358     }
359   session->transport.rmt_port = mp->rmt.port;
360   session->transport.is_ip4 = mp->rmt.is_ip4;
361   clib_memcpy_fast (&session->transport.rmt_ip, &mp->rmt.ip,
362                     sizeof (ip46_address_t));
363
364   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
365   session->transport.lcl_port = mp->lcl.port;
366   session->transport.lcl_ip = mp->lcl.ip;
367   session->session_type = listen_session->session_type;
368   session->is_dgram = vcl_proto_is_dgram (session->session_type);
369   if (session->is_dgram)
370     session->flags |= (listen_session->flags & VCL_SESSION_F_CONNECTED);
371   session->listener_index = listen_session->session_index;
372   listen_session->n_accepted_sessions++;
373
374   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
375
376   vcl_send_session_accepted_reply (session->vpp_evt_q, mp->context,
377                                    session->vpp_handle, 0);
378
379   return session->session_index;
380
381 error:
382   vcl_segment_attach_mq (vcl_vpp_worker_segment_handle (0),
383                          mp->vpp_event_queue_address, mp->mq_index, &evt_q);
384   vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
385                                    VNET_API_ERROR_INVALID_ARGUMENT);
386   vcl_session_free (wrk, session);
387   return VCL_INVALID_SESSION_INDEX;
388 }
389
390 static u32
391 vcl_session_connected_handler (vcl_worker_t * wrk,
392                                session_connected_msg_t * mp)
393 {
394   vcl_session_t *session = 0;
395   u32 session_index;
396
397   session_index = mp->context;
398   session = vcl_session_get (wrk, session_index);
399   if (PREDICT_FALSE (!session))
400     {
401       VERR ("vpp handle 0x%llx has no session index (%u)!", mp->handle,
402             session_index);
403       /* Should not happen but if it does, force vpp session cleanup */
404       vcl_session_t tmp_session = {
405         .vpp_handle = mp->handle,
406         .vpp_evt_q = 0,
407       };
408       vcl_segment_attach_session (
409         mp->segment_handle, mp->server_rx_fifo, mp->server_tx_fifo,
410         mp->vpp_event_queue_address, mp->mq_index, 0, session);
411       if (tmp_session.vpp_evt_q)
412         vcl_send_session_disconnect (wrk, &tmp_session);
413       return VCL_INVALID_SESSION_INDEX;
414     }
415
416   if (mp->retval)
417     {
418       VDBG (0, "session %u: connect failed! %U", session_index,
419             format_session_error, mp->retval);
420       session->session_state = VCL_STATE_DETACHED;
421       session->vpp_handle = VCL_INVALID_SESSION_HANDLE;
422       session->vpp_error = mp->retval;
423       return session_index;
424     }
425
426   session->vpp_handle = mp->handle;
427
428   /* Add to lookup table. Even if something fails, session cannot be
429    * cleaned up prior to notifying vpp and going through the cleanup
430    * "procedure" see @ref vcl_session_cleanup_handler */
431   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
432
433   if (vcl_segment_attach_session (
434         mp->segment_handle, mp->server_rx_fifo, mp->server_tx_fifo,
435         mp->vpp_event_queue_address, mp->mq_index, 0, session))
436     {
437       VDBG (0, "session %u [0x%llx]: failed to attach fifos",
438             session->session_index, session->vpp_handle);
439       session->session_state = VCL_STATE_UPDATED;
440       vcl_send_session_disconnect (wrk, session);
441       return session_index;
442     }
443
444   if (mp->ct_rx_fifo)
445     {
446       if (vcl_segment_attach_session (mp->ct_segment_handle, mp->ct_rx_fifo,
447                                       mp->ct_tx_fifo, (uword) ~0, ~0, 1,
448                                       session))
449         {
450           VDBG (0, "session %u [0x%llx]: failed to attach ct fifos",
451                 session->session_index, session->vpp_handle);
452           session->session_state = VCL_STATE_UPDATED;
453           vcl_send_session_disconnect (wrk, session);
454           return session_index;
455         }
456     }
457
458   session->transport.is_ip4 = mp->lcl.is_ip4;
459   clib_memcpy_fast (&session->transport.lcl_ip, &mp->lcl.ip,
460                     sizeof (session->transport.lcl_ip));
461   session->transport.lcl_port = mp->lcl.port;
462
463   /* Application closed session before connect reply */
464   if (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK)
465       && session->session_state == VCL_STATE_CLOSED)
466     vcl_send_session_disconnect (wrk, session);
467   else
468     session->session_state = VCL_STATE_READY;
469
470   VDBG (0, "session %u [0x%llx] connected local: %U:%u remote %U:%u",
471         session->session_index, session->vpp_handle, vcl_format_ip46_address,
472         &session->transport.lcl_ip,
473         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
474         clib_net_to_host_u16 (session->transport.lcl_port),
475         vcl_format_ip46_address, &session->transport.rmt_ip,
476         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
477         clib_net_to_host_u16 (session->transport.rmt_port));
478
479   return session_index;
480 }
481
482 static int
483 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
484 {
485   vcl_session_msg_t *accepted_msg;
486   int i;
487
488   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
489     {
490       accepted_msg = &session->accept_evts_fifo[i];
491       if (accepted_msg->accepted_msg.handle == handle)
492         {
493           accepted_msg->flags |= flags;
494           return 1;
495         }
496     }
497   return 0;
498 }
499
500 static u32
501 vcl_session_reset_handler (vcl_worker_t * wrk,
502                            session_reset_msg_t * reset_msg)
503 {
504   vcl_session_t *session;
505   u32 sid;
506
507   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
508   session = vcl_session_get (wrk, sid);
509   if (!session)
510     {
511       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
512       return VCL_INVALID_SESSION_INDEX;
513     }
514
515   /* Caught a reset before actually accepting the session */
516   if (session->session_state == VCL_STATE_LISTEN ||
517       session->session_state == VCL_STATE_LISTEN_NO_MQ)
518     {
519       if (!vcl_flag_accepted_session (session, reset_msg->handle,
520                                       VCL_ACCEPTED_F_RESET))
521         VDBG (0, "session was not accepted!");
522       return VCL_INVALID_SESSION_INDEX;
523     }
524
525   if (session->session_state != VCL_STATE_CLOSED)
526     session->session_state = VCL_STATE_DISCONNECT;
527
528   session->flags |= (VCL_SESSION_F_RD_SHUTDOWN | VCL_SESSION_F_WR_SHUTDOWN);
529   VDBG (0, "session %u [0x%llx]: reset", sid, reset_msg->handle);
530   return sid;
531 }
532
533 static u32
534 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
535 {
536   vcl_session_t *session;
537   u32 sid = mp->context;
538
539   session = vcl_session_get (wrk, sid);
540   if (mp->retval)
541     {
542       VERR ("session %u [0x%llx]: bind failed: %U", sid, mp->handle,
543             format_session_error, mp->retval);
544       if (session)
545         {
546           session->session_state = VCL_STATE_DETACHED;
547           session->vpp_handle = mp->handle;
548           return sid;
549         }
550       else
551         {
552           VDBG (0, "session %u [0x%llx]: Invalid session index!", sid,
553                 mp->handle);
554           return VCL_INVALID_SESSION_INDEX;
555         }
556     }
557
558   session->vpp_handle = mp->handle;
559   session->transport.is_ip4 = mp->lcl_is_ip4;
560   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
561                     sizeof (ip46_address_t));
562   session->transport.lcl_port = mp->lcl_port;
563   vcl_session_table_add_listener (wrk, mp->handle, sid);
564   session->session_state = VCL_STATE_LISTEN;
565   session->flags &= ~VCL_SESSION_F_PENDING_LISTEN;
566
567   if (vcl_session_is_cl (session))
568     {
569       if (vcl_segment_attach_session (mp->segment_handle, mp->rx_fifo,
570                                       mp->tx_fifo, mp->vpp_evt_q, mp->mq_index,
571                                       0, session))
572         {
573           VDBG (0, "session %u [0x%llx]: failed to attach fifos",
574                 session->session_index, session->vpp_handle);
575           session->session_state = VCL_STATE_DETACHED;
576           return VCL_INVALID_SESSION_INDEX;
577         }
578     }
579
580   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
581   return sid;
582 }
583
584 static void
585 vcl_session_unlisten_reply_handler (vcl_worker_t * wrk, void *data)
586 {
587   session_unlisten_reply_msg_t *mp = (session_unlisten_reply_msg_t *) data;
588   vcl_session_t *s;
589
590   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
591   if (!s)
592     {
593       VDBG (0, "Unlisten reply with wrong handle %llx", mp->handle);
594       return;
595     }
596   if (s->session_state != VCL_STATE_DISCONNECT)
597     {
598       /* Connected udp listener */
599       if (s->session_type == VPPCOM_PROTO_UDP
600           && s->session_state == VCL_STATE_CLOSED)
601         return;
602
603       VDBG (0, "Unlisten session in wrong state %llx", mp->handle);
604       return;
605     }
606
607   if (mp->retval)
608     VDBG (0, "ERROR: session %u [0xllx]: unlisten failed: %U",
609           s->session_index, mp->handle, format_session_error, mp->retval);
610
611   if (mp->context != wrk->wrk_index)
612     VDBG (0, "wrong context");
613
614   vcl_session_table_del_vpp_handle (wrk, mp->handle);
615   vcl_session_free (wrk, s);
616 }
617
618 static void
619 vcl_session_migrated_handler (vcl_worker_t * wrk, void *data)
620 {
621   session_migrated_msg_t *mp = (session_migrated_msg_t *) data;
622   vcl_session_t *s;
623   u32 fs_index;
624
625   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
626   if (!s)
627     {
628       VDBG (0, "Migrated notification with wrong handle %llx", mp->handle);
629       return;
630     }
631
632   /* Only validate if a value is provided */
633   if (mp->segment_handle != SESSION_INVALID_HANDLE)
634     {
635       fs_index = vcl_segment_table_lookup (mp->segment_handle);
636       if (fs_index == VCL_INVALID_SEGMENT_INDEX)
637         {
638           VDBG (0, "segment %lx for session %u is not mounted!",
639                 mp->segment_handle, s->session_index);
640           s->session_state = VCL_STATE_DETACHED;
641           return;
642         }
643     }
644
645   s->vpp_handle = mp->new_handle;
646
647   vcl_segment_attach_mq (vcl_vpp_worker_segment_handle (0), mp->vpp_evt_q,
648                          mp->vpp_thread_index, &s->vpp_evt_q);
649
650   vcl_session_table_del_vpp_handle (wrk, mp->handle);
651   vcl_session_table_add_vpp_handle (wrk, mp->new_handle, s->session_index);
652
653   /* Generate new tx event if we have outstanding data */
654   if (svm_fifo_has_event (s->tx_fifo))
655     app_send_io_evt_to_vpp (s->vpp_evt_q,
656                             s->tx_fifo->shr->master_session_index,
657                             SESSION_IO_EVT_TX, SVM_Q_WAIT);
658
659   VDBG (0, "Migrated 0x%lx to thread %u 0x%lx", mp->handle,
660         mp->vpp_thread_index, mp->new_handle);
661 }
662
663 static vcl_session_t *
664 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
665 {
666   vcl_session_msg_t *vcl_msg;
667   vcl_session_t *session;
668
669   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
670   if (PREDICT_FALSE (session != 0))
671     VWRN ("session overlap handle %lu state %u!", msg->handle,
672           session->session_state);
673
674   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
675   if (!session)
676     {
677       VERR ("couldn't find listen session: listener handle %llx",
678             msg->listener_handle);
679       return 0;
680     }
681
682   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
683   vcl_msg->flags = 0;
684   vcl_msg->accepted_msg = *msg;
685   /* Session handle points to listener until fully accepted by app */
686   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
687
688   return session;
689 }
690
691 static vcl_session_t *
692 vcl_session_disconnected_handler (vcl_worker_t * wrk,
693                                   session_disconnected_msg_t * msg)
694 {
695   vcl_session_t *session;
696
697   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
698   if (!session)
699     {
700       VWRN ("request to disconnect unknown handle 0x%llx", msg->handle);
701       return 0;
702     }
703
704   /* Late disconnect notification on a session that has been closed */
705   if (session->session_state == VCL_STATE_CLOSED)
706     return 0;
707
708   /* Caught a disconnect before actually accepting the session */
709   if (session->session_state == VCL_STATE_LISTEN ||
710       session->session_state == VCL_STATE_LISTEN_NO_MQ)
711     {
712       if (!vcl_flag_accepted_session (session, msg->handle,
713                                       VCL_ACCEPTED_F_CLOSED))
714         VDBG (0, "session was not accepted!");
715       return 0;
716     }
717
718   /* If not already reset change state */
719   if (session->session_state != VCL_STATE_DISCONNECT)
720     session->session_state = VCL_STATE_VPP_CLOSING;
721
722   return session;
723 }
724
725 int
726 vppcom_session_shutdown (uint32_t session_handle, int how)
727 {
728   vcl_worker_t *wrk = vcl_worker_get_current ();
729   vcl_session_t *session;
730   vcl_session_state_t state;
731   u64 vpp_handle;
732
733   session = vcl_session_get_w_handle (wrk, session_handle);
734   if (PREDICT_FALSE (!session))
735     return VPPCOM_EBADFD;
736
737   vpp_handle = session->vpp_handle;
738   state = session->session_state;
739
740   VDBG (1, "session %u [0x%llx] state 0x%x (%s)", session->session_index,
741         vpp_handle, state, vcl_session_state_str (state));
742
743   if (PREDICT_FALSE (state == VCL_STATE_LISTEN))
744     {
745       VDBG (0, "ERROR: Cannot shutdown a listen socket!");
746       return VPPCOM_EBADFD;
747     }
748
749   if (how == SHUT_RD || how == SHUT_RDWR)
750     {
751       session->flags |= VCL_SESSION_F_RD_SHUTDOWN;
752       if (how == SHUT_RD)
753         return VPPCOM_OK;
754     }
755   session->flags |= VCL_SESSION_F_WR_SHUTDOWN;
756
757   if (PREDICT_TRUE (state == VCL_STATE_READY))
758     {
759       VDBG (1, "session %u [0x%llx]: sending shutdown...",
760             session->session_index, vpp_handle);
761
762       vcl_send_session_shutdown (wrk, session);
763     }
764
765   return VPPCOM_OK;
766 }
767
768 static int
769 vppcom_session_disconnect (u32 session_handle)
770 {
771   vcl_worker_t *wrk = vcl_worker_get_current ();
772   vcl_session_t *session, *listen_session;
773   vcl_session_state_t state;
774   u64 vpp_handle;
775
776   session = vcl_session_get_w_handle (wrk, session_handle);
777   if (!session)
778     return VPPCOM_EBADFD;
779
780   vpp_handle = session->vpp_handle;
781   state = session->session_state;
782
783   VDBG (1, "session %u [0x%llx]: disconnecting state (%s)",
784         session->session_index, vpp_handle, vcl_session_state_str (state));
785
786   if (PREDICT_FALSE (state == VCL_STATE_LISTEN))
787     {
788       VDBG (0, "ERROR: Cannot disconnect a listen socket!");
789       return VPPCOM_EBADFD;
790     }
791
792   if (state == VCL_STATE_VPP_CLOSING)
793     {
794       vcl_send_session_disconnected_reply (wrk, session, 0);
795       VDBG (1, "session %u [0x%llx]: sending disconnect REPLY...",
796             session->session_index, vpp_handle);
797     }
798   else
799     {
800       /* Session doesn't have an event queue yet. Probably a non-blocking
801        * connect. Wait for the reply */
802       if (PREDICT_FALSE (!session->vpp_evt_q))
803         return VPPCOM_OK;
804
805       VDBG (1, "session %u [0x%llx]: sending disconnect",
806             session->session_index, vpp_handle);
807       vcl_send_session_disconnect (wrk, session);
808     }
809
810   if (session->listener_index != VCL_INVALID_SESSION_INDEX)
811     {
812       listen_session = vcl_session_get (wrk, session->listener_index);
813       if (listen_session)
814         listen_session->n_accepted_sessions--;
815     }
816
817   return VPPCOM_OK;
818 }
819
820 static void
821 vcl_session_cleanup_handler (vcl_worker_t * wrk, void *data)
822 {
823   session_cleanup_msg_t *msg;
824   vcl_session_t *session;
825
826   msg = (session_cleanup_msg_t *) data;
827   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
828   if (!session)
829     {
830       VWRN ("disconnect confirmed for unknown handle 0x%llx", msg->handle);
831       return;
832     }
833
834   if (msg->type == SESSION_CLEANUP_TRANSPORT)
835     {
836       /* Transport was cleaned up before we confirmed close. Probably the
837        * app is still waiting for some data that cannot be delivered.
838        * Confirm close to make sure everything is cleaned up.
839        * Move to undetermined state to ensure that the session is not
840        * removed before both vpp and the app cleanup.
841        * - If the app closes first, the session is moved to CLOSED state
842        *   and the session cleanup notification from vpp removes the
843        *   session.
844        * - If vpp cleans up the session first, the session is moved to
845        *   DETACHED state lower and subsequently the close from the app
846        *   frees the session
847        */
848       if (session->session_state == VCL_STATE_VPP_CLOSING)
849         {
850           vppcom_session_disconnect (vcl_session_handle (session));
851           session->session_state = VCL_STATE_UPDATED;
852         }
853       else if (session->session_state == VCL_STATE_DISCONNECT)
854         {
855           vcl_send_session_reset_reply (wrk, session, 0);
856           session->session_state = VCL_STATE_UPDATED;
857         }
858       return;
859     }
860
861   /* VPP will reuse the handle so clean it up now */
862   vcl_session_table_del_vpp_handle (wrk, msg->handle);
863
864   /* App did not close the connection yet so don't free it. */
865   if (session->session_state != VCL_STATE_CLOSED)
866     {
867       VDBG (0, "session %u: app did not close", session->session_index);
868       session->session_state = VCL_STATE_DETACHED;
869       session->vpp_handle = VCL_INVALID_SESSION_HANDLE;
870       return;
871     }
872
873   /* Session probably tracked with epoll, disconnect not yet handled and
874    * 1) both transport and session cleanup completed 2) app closed. Wait
875    * until message is drained to free the session.
876    * See @ref vcl_handle_mq_event */
877   if (session->flags & VCL_SESSION_F_PENDING_DISCONNECT)
878     {
879       session->flags |= VCL_SESSION_F_PENDING_FREE;
880       return;
881     }
882
883   vcl_session_free (wrk, session);
884 }
885
886 static void
887 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
888 {
889   session_req_worker_update_msg_t *msg;
890   vcl_session_t *s;
891
892   msg = (session_req_worker_update_msg_t *) data;
893   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
894   if (!s)
895     return;
896
897   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
898 }
899
900 static void
901 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
902 {
903   session_worker_update_reply_msg_t *msg;
904   vcl_session_t *s;
905
906   msg = (session_worker_update_reply_msg_t *) data;
907   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
908   if (!s)
909     {
910       VDBG (0, "unknown handle 0x%llx", msg->handle);
911       return;
912     }
913
914   if (s->rx_fifo)
915     {
916       if (vcl_segment_attach_session (msg->segment_handle, msg->rx_fifo,
917                                       msg->tx_fifo, (uword) ~0, ~0, 0, s))
918         {
919           VDBG (0, "failed to attach fifos for %u", s->session_index);
920           return;
921         }
922     }
923   s->session_state = VCL_STATE_UPDATED;
924
925   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
926         s->vpp_handle, wrk->wrk_index);
927 }
928
929 static int
930 vcl_api_recv_fd (vcl_worker_t * wrk, int *fds, int n_fds)
931 {
932
933   if (vcm->cfg.vpp_app_socket_api)
934     return vcl_sapi_recv_fds (wrk, fds, n_fds);
935
936   return vcl_bapi_recv_fds (wrk, fds, n_fds);
937 }
938
939 static void
940 vcl_session_app_add_segment_handler (vcl_worker_t * wrk, void *data)
941 {
942   ssvm_segment_type_t seg_type = SSVM_SEGMENT_SHM;
943   session_app_add_segment_msg_t *msg;
944   u64 segment_handle;
945   int fd = -1;
946
947   msg = (session_app_add_segment_msg_t *) data;
948
949   if (msg->fd_flags)
950     {
951       vcl_api_recv_fd (wrk, &fd, 1);
952       seg_type = SSVM_SEGMENT_MEMFD;
953     }
954
955   segment_handle = msg->segment_handle;
956   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
957     {
958       clib_warning ("invalid segment handle");
959       return;
960     }
961
962   if (vcl_segment_attach (segment_handle, (char *) msg->segment_name,
963                           seg_type, fd))
964     {
965       VDBG (0, "vcl_segment_attach ('%s') failed", msg->segment_name);
966       return;
967     }
968
969   VDBG (1, "mapped new segment '%s' size %d", msg->segment_name,
970         msg->segment_size);
971 }
972
973 static void
974 vcl_session_app_del_segment_handler (vcl_worker_t * wrk, void *data)
975 {
976   session_app_del_segment_msg_t *msg = (session_app_del_segment_msg_t *) data;
977   vcl_segment_detach (msg->segment_handle);
978   VDBG (1, "Unmapped segment: %lx", msg->segment_handle);
979 }
980
981 static void
982 vcl_worker_rpc_handler (vcl_worker_t * wrk, void *data)
983 {
984   if (!vcm->wrk_rpc_fn)
985     return;
986
987   (vcm->wrk_rpc_fn) (((session_app_wrk_rpc_msg_t *) data)->data);
988 }
989
990 static void
991 vcl_session_transport_attr_reply_handler (vcl_worker_t *wrk, void *data)
992 {
993   session_transport_attr_reply_msg_t *mp;
994
995   if (!wrk->session_attr_op)
996     return;
997
998   mp = (session_transport_attr_reply_msg_t *) data;
999
1000   wrk->session_attr_op_rv = mp->retval;
1001   wrk->session_attr_op = 0;
1002   wrk->session_attr_rv = mp->attr;
1003 }
1004
1005 static int
1006 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
1007 {
1008   session_disconnected_msg_t *disconnected_msg;
1009   session_connected_msg_t *connected_msg;
1010   session_reset_msg_t *reset_msg;
1011   session_event_t *ecpy;
1012   vcl_session_t *s;
1013   u32 sid;
1014
1015   switch (e->event_type)
1016     {
1017     case SESSION_IO_EVT_RX:
1018     case SESSION_IO_EVT_TX:
1019       s = vcl_session_get (wrk, e->session_index);
1020       if (!s || !vcl_session_is_open (s))
1021         break;
1022       vec_add1 (wrk->unhandled_evts_vector, *e);
1023       break;
1024     case SESSION_CTRL_EVT_BOUND:
1025       /* We can only wait for only one listen so not postponed */
1026       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
1027       break;
1028     case SESSION_CTRL_EVT_ACCEPTED:
1029       s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
1030       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1031         {
1032           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1033           *ecpy = *e;
1034           ecpy->postponed = 1;
1035           ecpy->session_index = s->session_index;
1036         }
1037       break;
1038     case SESSION_CTRL_EVT_CONNECTED:
1039       connected_msg = (session_connected_msg_t *) e->data;
1040       sid = vcl_session_connected_handler (wrk, connected_msg);
1041       if (!(s = vcl_session_get (wrk, sid)))
1042         break;
1043       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1044         {
1045           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1046           *ecpy = *e;
1047           ecpy->postponed = 1;
1048           ecpy->session_index = s->session_index;
1049         }
1050       break;
1051     case SESSION_CTRL_EVT_DISCONNECTED:
1052       disconnected_msg = (session_disconnected_msg_t *) e->data;
1053       if (!(s = vcl_session_get_w_vpp_handle (wrk, disconnected_msg->handle)))
1054         break;
1055       if (s->session_state == VCL_STATE_CLOSED)
1056         break;
1057       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1058         {
1059           s->session_state = VCL_STATE_VPP_CLOSING;
1060           s->flags |= VCL_SESSION_F_PENDING_DISCONNECT;
1061           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1062           *ecpy = *e;
1063           ecpy->postponed = 1;
1064           ecpy->session_index = s->session_index;
1065           break;
1066         }
1067       if (!(s = vcl_session_disconnected_handler (wrk, disconnected_msg)))
1068         break;
1069       VDBG (0, "disconnected session %u [0x%llx]", s->session_index,
1070             s->vpp_handle);
1071       break;
1072     case SESSION_CTRL_EVT_RESET:
1073       reset_msg = (session_reset_msg_t *) e->data;
1074       if (!(s = vcl_session_get_w_vpp_handle (wrk, reset_msg->handle)))
1075         break;
1076       if (s->session_state == VCL_STATE_CLOSED)
1077         break;
1078       if (vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
1079         {
1080           s->flags |= VCL_SESSION_F_PENDING_DISCONNECT;
1081           s->session_state = VCL_STATE_DISCONNECT;
1082           s->flags |= (VCL_SESSION_F_RD_SHUTDOWN | VCL_SESSION_F_WR_SHUTDOWN);
1083           vec_add2 (wrk->unhandled_evts_vector, ecpy, 1);
1084           *ecpy = *e;
1085           ecpy->postponed = 1;
1086           ecpy->session_index = s->session_index;
1087           break;
1088         }
1089       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
1090       break;
1091     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
1092       vcl_session_unlisten_reply_handler (wrk, e->data);
1093       break;
1094     case SESSION_CTRL_EVT_MIGRATED:
1095       vcl_session_migrated_handler (wrk, e->data);
1096       break;
1097     case SESSION_CTRL_EVT_CLEANUP:
1098       vcl_session_cleanup_handler (wrk, e->data);
1099       break;
1100     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
1101       vcl_session_req_worker_update_handler (wrk, e->data);
1102       break;
1103     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
1104       vcl_session_worker_update_reply_handler (wrk, e->data);
1105       break;
1106     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
1107       vcl_session_app_add_segment_handler (wrk, e->data);
1108       break;
1109     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
1110       vcl_session_app_del_segment_handler (wrk, e->data);
1111       break;
1112     case SESSION_CTRL_EVT_APP_WRK_RPC:
1113       vcl_worker_rpc_handler (wrk, e->data);
1114       break;
1115     case SESSION_CTRL_EVT_TRANSPORT_ATTR_REPLY:
1116       vcl_session_transport_attr_reply_handler (wrk, e->data);
1117       break;
1118     default:
1119       clib_warning ("unhandled %u", e->event_type);
1120     }
1121   return VPPCOM_OK;
1122 }
1123
1124 static int
1125 vppcom_wait_for_session_state_change (u32 session_index,
1126                                       vcl_session_state_t state,
1127                                       f64 wait_for_time)
1128 {
1129   vcl_worker_t *wrk = vcl_worker_get_current ();
1130   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
1131   vcl_session_t *volatile session;
1132   svm_msg_q_msg_t msg;
1133   session_event_t *e;
1134
1135   do
1136     {
1137       session = vcl_session_get (wrk, session_index);
1138       if (PREDICT_FALSE (!session))
1139         {
1140           return VPPCOM_EBADFD;
1141         }
1142       if (session->session_state == state)
1143         {
1144           return VPPCOM_OK;
1145         }
1146       if (session->session_state == VCL_STATE_DETACHED)
1147         {
1148           return VPPCOM_ECONNREFUSED;
1149         }
1150
1151       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
1152         {
1153           usleep (100);
1154           continue;
1155         }
1156       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1157       vcl_handle_mq_event (wrk, e);
1158       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1159     }
1160   while (clib_time_now (&wrk->clib_time) < timeout);
1161
1162   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
1163         vcl_session_state_str (state));
1164   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
1165
1166   return VPPCOM_ETIMEDOUT;
1167 }
1168
1169 static void
1170 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
1171 {
1172   vcl_session_state_t state;
1173   vcl_session_t *s;
1174   u32 *sip;
1175
1176   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
1177     return;
1178
1179   vec_foreach (sip, wrk->pending_session_wrk_updates)
1180   {
1181     s = vcl_session_get (wrk, *sip);
1182     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
1183     state = s->session_state;
1184     vppcom_wait_for_session_state_change (s->session_index, VCL_STATE_UPDATED,
1185                                           5);
1186     s->session_state = state;
1187   }
1188   vec_reset_length (wrk->pending_session_wrk_updates);
1189 }
1190
1191 void
1192 vcl_worker_flush_mq_events (vcl_worker_t *wrk)
1193 {
1194   svm_msg_q_msg_t *msg;
1195   session_event_t *e;
1196   svm_msg_q_t *mq;
1197   int i;
1198
1199   mq = wrk->app_event_queue;
1200   vcl_mq_dequeue_batch (wrk, mq, ~0);
1201
1202   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
1203     {
1204       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
1205       e = svm_msg_q_msg_data (mq, msg);
1206       vcl_handle_mq_event (wrk, e);
1207       svm_msg_q_free_msg (mq, msg);
1208     }
1209   vec_reset_length (wrk->mq_msg_vector);
1210   vcl_handle_pending_wrk_updates (wrk);
1211 }
1212
1213 void
1214 vcl_flush_mq_events (void)
1215 {
1216   vcl_worker_flush_mq_events (vcl_worker_get_current ());
1217 }
1218
1219 static int
1220 vppcom_session_unbind (u32 session_handle)
1221 {
1222   vcl_worker_t *wrk = vcl_worker_get_current ();
1223   session_accepted_msg_t *accepted_msg;
1224   vcl_session_t *session = 0;
1225   vcl_session_msg_t *evt;
1226
1227   session = vcl_session_get_w_handle (wrk, session_handle);
1228   if (!session)
1229     return VPPCOM_EBADFD;
1230
1231   /* Flush pending accept events, if any */
1232   while (clib_fifo_elts (session->accept_evts_fifo))
1233     {
1234       clib_fifo_sub2 (session->accept_evts_fifo, evt);
1235       accepted_msg = &evt->accepted_msg;
1236       vcl_session_table_del_vpp_handle (wrk, accepted_msg->handle);
1237       vcl_send_session_accepted_reply (session->vpp_evt_q,
1238                                        accepted_msg->context,
1239                                        accepted_msg->handle, -1);
1240     }
1241   clib_fifo_free (session->accept_evts_fifo);
1242
1243   vcl_send_session_unlisten (wrk, session);
1244
1245   VDBG (0, "session %u [0x%llx]: sending unbind!", session->session_index,
1246         session->vpp_handle);
1247   vcl_evt (VCL_EVT_UNBIND, session);
1248
1249   session->vpp_handle = ~0;
1250   session->session_state = VCL_STATE_DISCONNECT;
1251
1252   return VPPCOM_OK;
1253 }
1254
1255 /**
1256  * Handle app exit
1257  *
1258  * Notify vpp of the disconnect and mark the worker as free. If we're the
1259  * last worker, do a full cleanup otherwise, since we're probably a forked
1260  * child, avoid syscalls as much as possible. We might've lost privileges.
1261  */
1262 void
1263 vppcom_app_exit (void)
1264 {
1265   if (!pool_elts (vcm->workers))
1266     return;
1267   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1268   vcl_set_worker_index (~0);
1269   vcl_elog_stop (vcm);
1270 }
1271
1272 static int
1273 vcl_api_attach (void)
1274 {
1275   if (vcm->cfg.vpp_app_socket_api)
1276     return vcl_sapi_attach ();
1277
1278   return vcl_bapi_attach ();
1279 }
1280
1281 int
1282 vcl_is_first_reattach_to_execute ()
1283 {
1284   if (vcm->reattach_count == 0)
1285     return 1;
1286
1287   return 0;
1288 }
1289
1290 void
1291 vcl_set_reattach_counter ()
1292 {
1293   ++vcm->reattach_count;
1294
1295   if (vcm->reattach_count == vec_len (vcm->workers))
1296     vcm->reattach_count = 0;
1297 }
1298
1299 /**
1300  * Reattach vcl to vpp after it has previously been disconnected.
1301  *
1302  * The logic should be:
1303  * - first worker to hit `vcl_api_retry_attach` should attach to vpp,
1304  *   to reproduce the `vcl_api_attach` in `vppcom_app_create`.
1305  * - the rest of the workers should `reproduce vcl_worker_register_with_vpp`
1306  *   from `vppcom_worker_register` since they were already allocated.
1307  */
1308
1309 static void
1310 vcl_api_retry_attach (vcl_worker_t *wrk)
1311 {
1312   vcl_session_t *s;
1313
1314   clib_spinlock_lock (&vcm->workers_lock);
1315   if (vcl_is_first_reattach_to_execute ())
1316     {
1317       if (vcl_api_attach ())
1318         {
1319           clib_spinlock_unlock (&vcm->workers_lock);
1320           return;
1321         }
1322       vcl_set_reattach_counter ();
1323       clib_spinlock_unlock (&vcm->workers_lock);
1324     }
1325   else
1326     {
1327       vcl_set_reattach_counter ();
1328       clib_spinlock_unlock (&vcm->workers_lock);
1329       vcl_worker_register_with_vpp ();
1330     }
1331
1332   /* Treat listeners as configuration that needs to be re-added to vpp */
1333   pool_foreach (s, wrk->sessions)
1334     {
1335       if (s->flags & VCL_SESSION_F_IS_VEP)
1336         continue;
1337       if (s->session_state == VCL_STATE_LISTEN_NO_MQ)
1338         vppcom_session_listen (vcl_session_handle (s), 10);
1339       else
1340         VDBG (0, "internal error: unexpected state %d", s->session_state);
1341     }
1342 }
1343
1344 static void
1345 vcl_api_handle_disconnect (vcl_worker_t *wrk)
1346 {
1347   wrk->api_client_handle = ~0;
1348   vcl_worker_detach_sessions (wrk);
1349 }
1350
1351 static void
1352 vcl_api_detach (vcl_worker_t * wrk)
1353 {
1354   if (wrk->api_client_handle == ~0)
1355     return;
1356
1357   vcl_send_app_detach (wrk);
1358
1359   if (vcm->cfg.vpp_app_socket_api)
1360     return vcl_sapi_detach (wrk);
1361
1362   return vcl_bapi_disconnect_from_vpp ();
1363 }
1364
1365 /*
1366  * VPPCOM Public API functions
1367  */
1368 int
1369 vppcom_app_create (const char *app_name)
1370 {
1371   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
1372   int rv;
1373
1374   if (vcm->is_init)
1375     {
1376       VDBG (1, "already initialized");
1377       return VPPCOM_EEXIST;
1378     }
1379
1380   vcm->is_init = 1;
1381   vppcom_cfg (&vcm->cfg);
1382   vcl_cfg = &vcm->cfg;
1383
1384   vcm->main_cpu = pthread_self ();
1385   vcm->main_pid = getpid ();
1386   vcm->app_name = format (0, "%s", app_name);
1387   fifo_segment_main_init (&vcm->segment_main, (uword) ~0,
1388                           20 /* timeout in secs */);
1389   pool_alloc (vcm->workers, vcl_cfg->max_workers);
1390   clib_spinlock_init (&vcm->workers_lock);
1391   clib_rwlock_init (&vcm->segment_table_lock);
1392   atexit (vppcom_app_exit);
1393   vcl_elog_init (vcm);
1394
1395   /* Allocate default worker */
1396   vcl_worker_alloc_and_init ();
1397
1398   if ((rv = vcl_api_attach ()))
1399     {
1400       vppcom_app_destroy ();
1401       return rv;
1402     }
1403
1404   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
1405         vcm->workers[0].api_client_handle, vcm->workers[0].api_client_handle);
1406
1407   return VPPCOM_OK;
1408 }
1409
1410 void
1411 vppcom_app_destroy (void)
1412 {
1413   vcl_worker_t *wrk, *current_wrk;
1414   void *heap;
1415
1416   if (!pool_elts (vcm->workers))
1417     return;
1418
1419   vcl_evt (VCL_EVT_DETACH, vcm);
1420
1421   current_wrk = vcl_worker_get_current ();
1422
1423   /* *INDENT-OFF* */
1424   pool_foreach (wrk, vcm->workers)  {
1425     if (current_wrk != wrk)
1426       vcl_worker_cleanup (wrk, 0 /* notify vpp */ );
1427   }
1428   /* *INDENT-ON* */
1429
1430   vcl_api_detach (current_wrk);
1431   vcl_worker_cleanup (current_wrk, 0 /* notify vpp */ );
1432   vcl_set_worker_index (~0);
1433
1434   vcl_elog_stop (vcm);
1435
1436   /*
1437    * Free the heap and fix vcm
1438    */
1439   heap = clib_mem_get_heap ();
1440   munmap (clib_mem_get_heap_base (heap), clib_mem_get_heap_size (heap));
1441
1442   vcm = &_vppcom_main;
1443   vcm->is_init = 0;
1444 }
1445
1446 int
1447 vppcom_session_create (u8 proto, u8 is_nonblocking)
1448 {
1449   vcl_worker_t *wrk = vcl_worker_get_current ();
1450   vcl_session_t *session;
1451
1452   session = vcl_session_alloc (wrk);
1453
1454   session->session_type = proto;
1455   session->session_state = VCL_STATE_CLOSED;
1456   session->vpp_handle = ~0;
1457   session->is_dgram = vcl_proto_is_dgram (proto);
1458   session->vpp_error = SESSION_E_NONE;
1459
1460   if (is_nonblocking)
1461     vcl_session_set_attr (session, VCL_SESS_ATTR_NONBLOCK);
1462
1463   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1464            is_nonblocking, session_index);
1465
1466   VDBG (0, "created session %u", session->session_index);
1467
1468   return vcl_session_handle (session);
1469 }
1470
1471 static void
1472 vcl_epoll_lt_add (vcl_worker_t *wrk, vcl_session_t *s)
1473 {
1474   vcl_session_t *cur, *prev;
1475
1476   ASSERT (s->vep.lt_next == VCL_INVALID_SESSION_INDEX);
1477
1478   if (wrk->ep_lt_current == VCL_INVALID_SESSION_INDEX)
1479     {
1480       wrk->ep_lt_current = s->session_index;
1481       s->vep.lt_next = s->session_index;
1482       s->vep.lt_prev = s->session_index;
1483       return;
1484     }
1485
1486   cur = vcl_session_get (wrk, wrk->ep_lt_current);
1487   prev = vcl_session_get (wrk, cur->vep.lt_prev);
1488
1489   prev->vep.lt_next = s->session_index;
1490   s->vep.lt_prev = prev->session_index;
1491
1492   s->vep.lt_next = cur->session_index;
1493   cur->vep.lt_prev = s->session_index;
1494 }
1495
1496 static void
1497 vcl_epoll_lt_del (vcl_worker_t *wrk, vcl_session_t *s)
1498 {
1499   vcl_session_t *prev, *next;
1500
1501   ASSERT (s->vep.lt_next != VCL_INVALID_SESSION_INDEX);
1502
1503   if (s->vep.lt_next == s->session_index)
1504     {
1505       wrk->ep_lt_current = VCL_INVALID_SESSION_INDEX;
1506       s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
1507       s->vep.lt_prev = VCL_INVALID_SESSION_INDEX;
1508       return;
1509     }
1510
1511   prev = vcl_session_get (wrk, s->vep.lt_prev);
1512   next = vcl_session_get (wrk, s->vep.lt_next);
1513
1514   prev->vep.lt_next = next->session_index;
1515   next->vep.lt_prev = prev->session_index;
1516
1517   if (s->session_index == wrk->ep_lt_current)
1518     wrk->ep_lt_current = s->vep.lt_next;
1519
1520   s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
1521   s->vep.lt_prev = VCL_INVALID_SESSION_INDEX;
1522 }
1523
1524 int
1525 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * s,
1526                      vcl_session_handle_t sh, u8 do_disconnect)
1527 {
1528   int rv = VPPCOM_OK;
1529
1530   VDBG (1, "session %u [0x%llx] closing", s->session_index, s->vpp_handle);
1531
1532   if (s->flags & VCL_SESSION_F_IS_VEP)
1533     {
1534       u32 next_sh = s->vep.next_sh;
1535       while (next_sh != ~0)
1536         {
1537           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1538           if (PREDICT_FALSE (rv < 0))
1539             VDBG (0, "vpp handle 0x%llx, sh %u: EPOLL_CTL_DEL vep_idx %u"
1540                   " failed! rv %d (%s)", s->vpp_handle, next_sh,
1541                   s->vep.vep_sh, rv, vppcom_retval_str (rv));
1542           next_sh = s->vep.next_sh;
1543         }
1544       goto free_session;
1545     }
1546
1547   if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
1548     {
1549       rv = vppcom_epoll_ctl (s->vep.vep_sh, EPOLL_CTL_DEL, sh, 0);
1550       if (rv < 0)
1551         VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1552               "failed! rv %d (%s)", s->session_index, s->vpp_handle,
1553               s->vep.vep_sh, rv, vppcom_retval_str (rv));
1554     }
1555
1556   if (!do_disconnect)
1557     {
1558       VDBG (1, "session %u [0x%llx] disconnect skipped",
1559             s->session_index, s->vpp_handle);
1560       goto cleanup;
1561     }
1562
1563   if (s->session_state == VCL_STATE_LISTEN)
1564     {
1565       rv = vppcom_session_unbind (sh);
1566       if (PREDICT_FALSE (rv < 0))
1567         VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1568               "rv %d (%s)", s->session_index, s->vpp_handle, rv,
1569               vppcom_retval_str (rv));
1570       return rv;
1571     }
1572   else if (vcl_session_is_ready (s)
1573            || (vcl_session_is_connectable_listener (wrk, s)))
1574     {
1575       rv = vppcom_session_disconnect (sh);
1576       if (PREDICT_FALSE (rv < 0))
1577         VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1578               " rv %d (%s)", s->session_index, s->vpp_handle,
1579               rv, vppcom_retval_str (rv));
1580     }
1581   else if (s->session_state == VCL_STATE_DISCONNECT)
1582     {
1583       vcl_send_session_reset_reply (wrk, s, 0);
1584     }
1585   else if (s->session_state == VCL_STATE_DETACHED)
1586     {
1587       VDBG (0, "vpp freed session %d before close", s->session_index);
1588
1589       if (!(s->flags & VCL_SESSION_F_PENDING_DISCONNECT))
1590         goto free_session;
1591
1592       /* Disconnect/reset messages pending but vpp transport and session
1593        * cleanups already done. Free only after messages drained. */
1594       s->flags |= VCL_SESSION_F_PENDING_FREE;
1595     }
1596
1597   s->session_state = VCL_STATE_CLOSED;
1598
1599   /* Session is removed only after vpp confirms the disconnect */
1600   return rv;
1601
1602 cleanup:
1603   vcl_session_table_del_vpp_handle (wrk, s->vpp_handle);
1604 free_session:
1605   vcl_session_free (wrk, s);
1606   vcl_evt (VCL_EVT_CLOSE, s, rv);
1607
1608   return rv;
1609 }
1610
1611 int
1612 vppcom_session_close (uint32_t session_handle)
1613 {
1614   vcl_worker_t *wrk = vcl_worker_get_current ();
1615   vcl_session_t *session;
1616
1617   session = vcl_session_get_w_handle (wrk, session_handle);
1618   if (!session)
1619     return VPPCOM_EBADFD;
1620   return vcl_session_cleanup (wrk, session, session_handle,
1621                               1 /* do_disconnect */ );
1622 }
1623
1624 int
1625 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1626 {
1627   vcl_worker_t *wrk = vcl_worker_get_current ();
1628   vcl_session_t *session = 0;
1629
1630   if (!ep || !ep->ip)
1631     return VPPCOM_EINVAL;
1632
1633   session = vcl_session_get_w_handle (wrk, session_handle);
1634   if (!session)
1635     return VPPCOM_EBADFD;
1636
1637   if (session->flags & VCL_SESSION_F_IS_VEP)
1638     {
1639       VDBG (0, "ERROR: cannot bind to epoll session %u!",
1640             session->session_index);
1641       return VPPCOM_EBADFD;
1642     }
1643
1644   session->transport.is_ip4 = ep->is_ip4;
1645   if (ep->is_ip4)
1646     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1647                       sizeof (ip4_address_t));
1648   else
1649     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1650                       sizeof (ip6_address_t));
1651   session->transport.lcl_port = ep->port;
1652
1653   VDBG (0,
1654         "session %u handle %u: binding to local %s address %U port %u, "
1655         "proto %s",
1656         session->session_index, session_handle,
1657         session->transport.is_ip4 ? "IPv4" : "IPv6", vcl_format_ip46_address,
1658         &session->transport.lcl_ip,
1659         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1660         clib_net_to_host_u16 (session->transport.lcl_port),
1661         vppcom_proto_str (session->session_type));
1662   vcl_evt (VCL_EVT_BIND, session);
1663
1664   if (session->session_type == VPPCOM_PROTO_UDP)
1665     vppcom_session_listen (session_handle, 10);
1666
1667   return VPPCOM_OK;
1668 }
1669
1670 int
1671 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1672 {
1673   vcl_worker_t *wrk = vcl_worker_get_current ();
1674   vcl_session_t *listen_session = 0;
1675   u64 listen_vpp_handle;
1676   int rv;
1677
1678   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1679   if (!listen_session || (listen_session->flags & VCL_SESSION_F_IS_VEP))
1680     return VPPCOM_EBADFD;
1681
1682   listen_vpp_handle = listen_session->vpp_handle;
1683   if (listen_session->session_state == VCL_STATE_LISTEN)
1684     {
1685       VDBG (0, "session %u [0x%llx]: already in listen state!",
1686             listen_sh, listen_vpp_handle);
1687       return VPPCOM_OK;
1688     }
1689
1690   VDBG (0, "session %u: sending vpp listen request...", listen_sh);
1691
1692   /*
1693    * Send listen request to vpp and wait for reply
1694    */
1695   vcl_send_session_listen (wrk, listen_session);
1696   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1697                                              VCL_STATE_LISTEN,
1698                                              vcm->cfg.session_timeout);
1699
1700   if (PREDICT_FALSE (rv))
1701     {
1702       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1703       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1704             listen_sh, listen_session->vpp_handle, rv,
1705             vppcom_retval_str (rv));
1706       return rv;
1707     }
1708
1709   return VPPCOM_OK;
1710 }
1711
1712 int
1713 vppcom_unformat_proto (uint8_t * proto, char *proto_str)
1714 {
1715   if (!strcmp (proto_str, "TCP"))
1716     *proto = VPPCOM_PROTO_TCP;
1717   else if (!strcmp (proto_str, "tcp"))
1718     *proto = VPPCOM_PROTO_TCP;
1719   else if (!strcmp (proto_str, "UDP"))
1720     *proto = VPPCOM_PROTO_UDP;
1721   else if (!strcmp (proto_str, "udp"))
1722     *proto = VPPCOM_PROTO_UDP;
1723   else if (!strcmp (proto_str, "TLS"))
1724     *proto = VPPCOM_PROTO_TLS;
1725   else if (!strcmp (proto_str, "tls"))
1726     *proto = VPPCOM_PROTO_TLS;
1727   else if (!strcmp (proto_str, "QUIC"))
1728     *proto = VPPCOM_PROTO_QUIC;
1729   else if (!strcmp (proto_str, "quic"))
1730     *proto = VPPCOM_PROTO_QUIC;
1731   else if (!strcmp (proto_str, "DTLS"))
1732     *proto = VPPCOM_PROTO_DTLS;
1733   else if (!strcmp (proto_str, "dtls"))
1734     *proto = VPPCOM_PROTO_DTLS;
1735   else if (!strcmp (proto_str, "SRTP"))
1736     *proto = VPPCOM_PROTO_SRTP;
1737   else if (!strcmp (proto_str, "srtp"))
1738     *proto = VPPCOM_PROTO_SRTP;
1739   else
1740     return 1;
1741   return 0;
1742 }
1743
1744 int
1745 vppcom_session_accept (uint32_t ls_handle, vppcom_endpt_t *ep, uint32_t flags)
1746 {
1747   u32 client_session_index = ~0, ls_index, accept_flags = 0;
1748   vcl_worker_t *wrk = vcl_worker_get_current ();
1749   session_accepted_msg_t accepted_msg;
1750   vcl_session_t *ls, *client_session = 0;
1751   vcl_session_msg_t *evt;
1752   u8 is_nonblocking;
1753
1754 again:
1755
1756   ls = vcl_session_get_w_handle (wrk, ls_handle);
1757   if (!ls)
1758     return VPPCOM_EBADFD;
1759
1760   if ((ls->session_state != VCL_STATE_LISTEN) &&
1761       (ls->session_state != VCL_STATE_LISTEN_NO_MQ) &&
1762       (!vcl_session_is_connectable_listener (wrk, ls)))
1763     {
1764       VDBG (0, "ERROR: session [0x%llx]: not in listen state! state (%s)",
1765             ls->vpp_handle, vcl_session_state_str (ls->session_state));
1766       return VPPCOM_EBADFD;
1767     }
1768
1769   ls_index = ls->session_index;
1770
1771   if (clib_fifo_elts (ls->accept_evts_fifo))
1772     {
1773       clib_fifo_sub2 (ls->accept_evts_fifo, evt);
1774       accept_flags = evt->flags;
1775       accepted_msg = evt->accepted_msg;
1776       goto handle;
1777     }
1778
1779   is_nonblocking = vcl_session_has_attr (ls, VCL_SESS_ATTR_NONBLOCK);
1780   while (1)
1781     {
1782       if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1783         return VPPCOM_EAGAIN;
1784
1785       svm_msg_q_wait (wrk->app_event_queue, SVM_MQ_WAIT_EMPTY);
1786       vcl_worker_flush_mq_events (wrk);
1787       goto again;
1788     }
1789
1790 handle:
1791
1792   client_session_index =
1793     vcl_session_accepted_handler (wrk, &accepted_msg, ls_index);
1794   if (client_session_index == VCL_INVALID_SESSION_INDEX)
1795     return VPPCOM_ECONNABORTED;
1796
1797   ls = vcl_session_get (wrk, ls_index);
1798   client_session = vcl_session_get (wrk, client_session_index);
1799
1800   if (flags & O_NONBLOCK)
1801     vcl_session_set_attr (client_session, VCL_SESS_ATTR_NONBLOCK);
1802
1803   VDBG (1,
1804         "listener %u [0x%llx]: Got a connect request! session %u [0x%llx],"
1805         " flags %d, is_nonblocking %u",
1806         ls->session_index, ls->vpp_handle, client_session_index,
1807         client_session->vpp_handle, flags,
1808         vcl_session_has_attr (client_session, VCL_SESS_ATTR_NONBLOCK));
1809
1810   if (ep)
1811     {
1812       ep->is_ip4 = client_session->transport.is_ip4;
1813       ep->port = client_session->transport.rmt_port;
1814       if (client_session->transport.is_ip4)
1815         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1816                           sizeof (ip4_address_t));
1817       else
1818         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1819                           sizeof (ip6_address_t));
1820     }
1821
1822   VDBG (0,
1823         "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1824         "local: %U:%u",
1825         ls_handle, ls->vpp_handle, client_session_index,
1826         client_session->vpp_handle, vcl_format_ip46_address,
1827         &client_session->transport.rmt_ip,
1828         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1829         clib_net_to_host_u16 (client_session->transport.rmt_port),
1830         vcl_format_ip46_address, &client_session->transport.lcl_ip,
1831         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1832         clib_net_to_host_u16 (client_session->transport.lcl_port));
1833   vcl_evt (VCL_EVT_ACCEPT, client_session, ls, client_session_index);
1834
1835   /*
1836    * Session might have been closed already
1837    */
1838   if (accept_flags)
1839     {
1840       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1841         client_session->session_state = VCL_STATE_VPP_CLOSING;
1842       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1843         client_session->session_state = VCL_STATE_DISCONNECT;
1844     }
1845   return vcl_session_handle (client_session);
1846 }
1847
1848 int
1849 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1850 {
1851   vcl_worker_t *wrk = vcl_worker_get_current ();
1852   vcl_session_t *session = 0;
1853   u32 session_index;
1854   int rv;
1855
1856   session = vcl_session_get_w_handle (wrk, session_handle);
1857   if (!session)
1858     return VPPCOM_EBADFD;
1859   session_index = session->session_index;
1860
1861   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
1862     {
1863       VWRN ("cannot connect epoll session %u!", session->session_index);
1864       return VPPCOM_EBADFD;
1865     }
1866
1867   if (PREDICT_FALSE (vcl_session_is_ready (session)))
1868     {
1869       VDBG (0,
1870             "session %u [0x%llx]: already connected to %U:%d proto %s,"
1871             " state (%s)",
1872             session->session_index, session->vpp_handle,
1873             vcl_format_ip46_address, &session->transport.rmt_ip,
1874             session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1875             clib_net_to_host_u16 (session->transport.rmt_port),
1876             vppcom_proto_str (session->session_type),
1877             vcl_session_state_str (session->session_state));
1878       return VPPCOM_OK;
1879     }
1880
1881   /* Attempt to connect a connectionless listener */
1882   if (PREDICT_FALSE (session->session_state == VCL_STATE_LISTEN))
1883     {
1884       if (session->session_type != VPPCOM_PROTO_UDP)
1885         return VPPCOM_EINVAL;
1886       vcl_send_session_unlisten (wrk, session);
1887       session->session_state = VCL_STATE_CLOSED;
1888     }
1889
1890   session->transport.is_ip4 = server_ep->is_ip4;
1891   vcl_ip_copy_from_ep (&session->transport.rmt_ip, server_ep);
1892   session->transport.rmt_port = server_ep->port;
1893   session->parent_handle = VCL_INVALID_SESSION_HANDLE;
1894   session->flags |= VCL_SESSION_F_CONNECTED;
1895
1896   VDBG (0, "session %u: connecting to peer %U:%d proto %s",
1897         session->session_index, vcl_format_ip46_address,
1898         &session->transport.rmt_ip,
1899         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1900         clib_net_to_host_u16 (session->transport.rmt_port),
1901         vppcom_proto_str (session->session_type));
1902
1903   vcl_send_session_connect (wrk, session);
1904
1905   if (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK))
1906     {
1907       /* State set to STATE_UPDATED to ensure the session is not assumed
1908        * to be ready and to also allow the app to close it prior to vpp's
1909        * connected reply. */
1910       session->session_state = VCL_STATE_UPDATED;
1911       return VPPCOM_EINPROGRESS;
1912     }
1913
1914   /*
1915    * Wait for reply from vpp if blocking
1916    */
1917   rv = vppcom_wait_for_session_state_change (session_index, VCL_STATE_READY,
1918                                              vcm->cfg.session_timeout);
1919
1920   session = vcl_session_get (wrk, session_index);
1921   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1922         session->vpp_handle, rv ? "failed" : "succeeded");
1923
1924   return rv;
1925 }
1926
1927 int
1928 vppcom_session_stream_connect (uint32_t session_handle,
1929                                uint32_t parent_session_handle)
1930 {
1931   vcl_worker_t *wrk = vcl_worker_get_current ();
1932   vcl_session_t *session, *parent_session;
1933   u32 session_index, parent_session_index;
1934   int rv;
1935
1936   session = vcl_session_get_w_handle (wrk, session_handle);
1937   if (!session)
1938     return VPPCOM_EBADFD;
1939   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1940   if (!parent_session)
1941     return VPPCOM_EBADFD;
1942
1943   session_index = session->session_index;
1944   parent_session_index = parent_session->session_index;
1945   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
1946     {
1947       VDBG (0, "ERROR: cannot connect epoll session %u!",
1948             session->session_index);
1949       return VPPCOM_EBADFD;
1950     }
1951
1952   if (PREDICT_FALSE (vcl_session_is_ready (session)))
1953     {
1954       VDBG (0,
1955             "session handle %u [0x%llx]: session already "
1956             "connected to session %u [0x%llx] proto %s, state 0x%x (%s)",
1957             session_handle, session->vpp_handle, parent_session_handle,
1958             parent_session->vpp_handle,
1959             vppcom_proto_str (session->session_type), session->session_state,
1960             vcl_session_state_str (session->session_state));
1961       return VPPCOM_OK;
1962     }
1963
1964   /* Connect to quic session specifics */
1965   session->transport.is_ip4 = parent_session->transport.is_ip4;
1966   session->transport.rmt_ip.ip4.as_u32 = (uint32_t) 1;
1967   session->transport.rmt_port = 0;
1968   session->parent_handle = parent_session->vpp_handle;
1969
1970   VDBG (0, "session handle %u: connecting to session %u [0x%llx]",
1971         session_handle, parent_session_handle, parent_session->vpp_handle);
1972
1973   /*
1974    * Send connect request and wait for reply from vpp
1975    */
1976   vcl_send_session_connect (wrk, session);
1977   rv = vppcom_wait_for_session_state_change (session_index, VCL_STATE_READY,
1978                                              vcm->cfg.session_timeout);
1979
1980   session->listener_index = parent_session_index;
1981   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1982   if (parent_session)
1983     parent_session->n_accepted_sessions++;
1984
1985   session = vcl_session_get (wrk, session_index);
1986   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1987         session->vpp_handle, rv ? "failed" : "succeeded");
1988
1989   return rv;
1990 }
1991
1992 static inline int
1993 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
1994                               u8 peek)
1995 {
1996   vcl_worker_t *wrk = vcl_worker_get_current ();
1997   int rv, n_read = 0, is_nonblocking;
1998   vcl_session_t *s = 0;
1999   svm_fifo_t *rx_fifo;
2000   session_event_t *e;
2001   svm_msg_q_t *mq;
2002   u8 is_ct;
2003
2004   if (PREDICT_FALSE (!buf))
2005     return VPPCOM_EFAULT;
2006
2007   s = vcl_session_get_w_handle (wrk, session_handle);
2008   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2009     return VPPCOM_EBADFD;
2010
2011   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2012     {
2013       VDBG (0, "session %u[0x%llx] is not open! state 0x%x (%s)",
2014             s->session_index, s->vpp_handle, s->session_state,
2015             vcl_session_state_str (s->session_state));
2016       return vcl_session_closed_error (s);
2017     }
2018
2019   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_RD_SHUTDOWN))
2020     {
2021       /* Vpp would ack the incoming data and enqueue it for reading.
2022        * So even if SHUT_RD is set, we can still read() the data if
2023        * the session is ready.
2024        */
2025       if (!vcl_session_read_ready (s))
2026         {
2027           return 0;
2028         }
2029     }
2030
2031   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2032   is_ct = vcl_session_is_ct (s);
2033   mq = wrk->app_event_queue;
2034   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
2035   s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2036
2037   if (svm_fifo_is_empty_cons (rx_fifo))
2038     {
2039       if (is_nonblocking)
2040         {
2041           if (vcl_session_is_closing (s))
2042             return vcl_session_closing_error (s);
2043           if (is_ct)
2044             svm_fifo_unset_event (s->rx_fifo);
2045           svm_fifo_unset_event (rx_fifo);
2046           return VPPCOM_EWOULDBLOCK;
2047         }
2048       while (svm_fifo_is_empty_cons (rx_fifo))
2049         {
2050           if (vcl_session_is_closing (s))
2051             return vcl_session_closing_error (s);
2052
2053           if (is_ct)
2054             svm_fifo_unset_event (s->rx_fifo);
2055           svm_fifo_unset_event (rx_fifo);
2056
2057           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2058           vcl_worker_flush_mq_events (wrk);
2059         }
2060     }
2061
2062 read_again:
2063
2064   if (s->is_dgram)
2065     rv = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
2066   else
2067     rv = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
2068
2069   ASSERT (rv >= 0);
2070
2071   if (peek)
2072     return rv;
2073
2074   n_read += rv;
2075
2076   if (svm_fifo_is_empty_cons (rx_fifo))
2077     {
2078       if (is_ct)
2079         svm_fifo_unset_event (s->rx_fifo);
2080       svm_fifo_unset_event (rx_fifo);
2081       if (!svm_fifo_is_empty_cons (rx_fifo)
2082           && svm_fifo_set_event (rx_fifo) && is_nonblocking)
2083         {
2084           vec_add2 (wrk->unhandled_evts_vector, e, 1);
2085           e->event_type = SESSION_IO_EVT_RX;
2086           e->session_index = s->session_index;
2087         }
2088     }
2089   else if (PREDICT_FALSE (rv < n && !s->is_dgram))
2090     {
2091       /* More data enqueued while reading. Try to drain it
2092        * or fill the buffer. Avoid doing that for dgrams */
2093       buf += rv;
2094       n -= rv;
2095       goto read_again;
2096     }
2097
2098   if (PREDICT_FALSE (svm_fifo_needs_deq_ntf (rx_fifo, n_read)))
2099     {
2100       svm_fifo_clear_deq_ntf (rx_fifo);
2101       app_send_io_evt_to_vpp (s->vpp_evt_q,
2102                               s->rx_fifo->shr->master_session_index,
2103                               SESSION_IO_EVT_RX, SVM_Q_WAIT);
2104     }
2105
2106   VDBG (2, "session %u[0x%llx]: read %d bytes from (%p)", s->session_index,
2107         s->vpp_handle, n_read, rx_fifo);
2108
2109   return n_read;
2110 }
2111
2112 int
2113 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
2114 {
2115   return (vppcom_session_read_internal (session_handle, buf, n, 0));
2116 }
2117
2118 static int
2119 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
2120 {
2121   return (vppcom_session_read_internal (session_handle, buf, n, 1));
2122 }
2123
2124 int
2125 vppcom_session_read_segments (uint32_t session_handle,
2126                               vppcom_data_segment_t * ds, uint32_t n_segments,
2127                               uint32_t max_bytes)
2128 {
2129   vcl_worker_t *wrk = vcl_worker_get_current ();
2130   int n_read = 0, is_nonblocking;
2131   vcl_session_t *s = 0;
2132   svm_fifo_t *rx_fifo;
2133   svm_msg_q_t *mq;
2134   u8 is_ct;
2135
2136   s = vcl_session_get_w_handle (wrk, session_handle);
2137   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2138     return VPPCOM_EBADFD;
2139
2140   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2141     return vcl_session_closed_error (s);
2142
2143   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2144   is_ct = vcl_session_is_ct (s);
2145   mq = wrk->app_event_queue;
2146   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
2147   s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2148
2149   if (svm_fifo_is_empty_cons (rx_fifo))
2150     {
2151       if (is_nonblocking)
2152         {
2153           if (is_ct)
2154             svm_fifo_unset_event (s->rx_fifo);
2155           svm_fifo_unset_event (rx_fifo);
2156           return VPPCOM_EWOULDBLOCK;
2157         }
2158       while (svm_fifo_is_empty_cons (rx_fifo))
2159         {
2160           if (vcl_session_is_closing (s))
2161             return vcl_session_closing_error (s);
2162
2163           if (is_ct)
2164             svm_fifo_unset_event (s->rx_fifo);
2165           svm_fifo_unset_event (rx_fifo);
2166
2167           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2168           vcl_worker_flush_mq_events (wrk);
2169         }
2170     }
2171
2172   n_read = svm_fifo_segments (rx_fifo, s->rx_bytes_pending,
2173                               (svm_fifo_seg_t *) ds, &n_segments, max_bytes);
2174   if (n_read < 0)
2175     return VPPCOM_EAGAIN;
2176
2177   if (svm_fifo_max_dequeue_cons (rx_fifo) == n_read)
2178     {
2179       if (is_ct)
2180         svm_fifo_unset_event (s->rx_fifo);
2181       svm_fifo_unset_event (rx_fifo);
2182       if (svm_fifo_max_dequeue_cons (rx_fifo) != n_read
2183           && svm_fifo_set_event (rx_fifo)
2184           && vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK))
2185         {
2186           session_event_t *e;
2187           vec_add2 (wrk->unhandled_evts_vector, e, 1);
2188           e->event_type = SESSION_IO_EVT_RX;
2189           e->session_index = s->session_index;
2190         }
2191     }
2192
2193   s->rx_bytes_pending += n_read;
2194   return n_read;
2195 }
2196
2197 void
2198 vppcom_session_free_segments (uint32_t session_handle, uint32_t n_bytes)
2199 {
2200   vcl_worker_t *wrk = vcl_worker_get_current ();
2201   vcl_session_t *s;
2202   u8 is_ct;
2203
2204   s = vcl_session_get_w_handle (wrk, session_handle);
2205   if (PREDICT_FALSE (!s || (s->flags & VCL_SESSION_F_IS_VEP)))
2206     return;
2207
2208   is_ct = vcl_session_is_ct (s);
2209   svm_fifo_dequeue_drop (is_ct ? s->ct_rx_fifo : s->rx_fifo, n_bytes);
2210
2211   ASSERT (s->rx_bytes_pending >= n_bytes);
2212   s->rx_bytes_pending -= n_bytes;
2213 }
2214
2215 always_inline u8
2216 vcl_fifo_is_writeable (svm_fifo_t * f, u32 len, u8 is_dgram)
2217 {
2218   u32 max_enq = svm_fifo_max_enqueue_prod (f);
2219   if (is_dgram)
2220     return max_enq >= (sizeof (session_dgram_hdr_t) + len);
2221   else
2222     return max_enq > 0;
2223 }
2224
2225 always_inline int
2226 vppcom_session_write_inline (vcl_worker_t *wrk, vcl_session_t *s, void *buf,
2227                              size_t n, u8 is_flush, u8 is_dgram)
2228 {
2229   int n_write, is_nonblocking;
2230   session_evt_type_t et;
2231   svm_fifo_t *tx_fifo;
2232   svm_msg_q_t *mq;
2233   u8 is_ct;
2234
2235   /* Accept zero length writes but just return */
2236   if (PREDICT_FALSE (!n))
2237     return VPPCOM_OK;
2238
2239   if (PREDICT_FALSE (!buf))
2240     return VPPCOM_EFAULT;
2241
2242   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2243     {
2244       VDBG (0, "ERROR: session %u [0x%llx]: cannot write to an epoll"
2245             " session!", s->session_index, s->vpp_handle);
2246       return VPPCOM_EBADFD;
2247     }
2248
2249   if (PREDICT_FALSE (!vcl_session_is_open (s)))
2250     {
2251       VDBG (1, "session %u [0x%llx]: is not open! state 0x%x (%s)",
2252             s->session_index, s->vpp_handle, s->session_state,
2253             vcl_session_state_str (s->session_state));
2254       return vcl_session_closed_error (s);;
2255     }
2256
2257   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_WR_SHUTDOWN))
2258     {
2259       VDBG (1, "session %u [0x%llx]: is shutdown! state 0x%x (%s)",
2260             s->session_index, s->vpp_handle, s->session_state,
2261             vcl_session_state_str (s->session_state));
2262       return VPPCOM_EPIPE;
2263     }
2264
2265   is_ct = vcl_session_is_ct (s);
2266   tx_fifo = is_ct ? s->ct_tx_fifo : s->tx_fifo;
2267   is_nonblocking = vcl_session_has_attr (s, VCL_SESS_ATTR_NONBLOCK);
2268
2269   mq = wrk->app_event_queue;
2270   if (!vcl_fifo_is_writeable (tx_fifo, n, is_dgram))
2271     {
2272       if (is_nonblocking)
2273         {
2274           return VPPCOM_EWOULDBLOCK;
2275         }
2276       while (!vcl_fifo_is_writeable (tx_fifo, n, is_dgram))
2277         {
2278           svm_fifo_add_want_deq_ntf (tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
2279           if (vcl_session_is_closing (s))
2280             return vcl_session_closing_error (s);
2281
2282           svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2283           vcl_worker_flush_mq_events (wrk);
2284         }
2285     }
2286
2287   et = SESSION_IO_EVT_TX;
2288   if (is_flush && !is_ct)
2289     et = SESSION_IO_EVT_TX_FLUSH;
2290
2291   if (is_dgram)
2292     {
2293       et = vcl_session_dgram_tx_evt (s, et);
2294       n_write =
2295         app_send_dgram_raw_gso (tx_fifo, &s->transport, s->vpp_evt_q, buf, n,
2296                                 s->gso_size, et, 0 /* do_evt */, SVM_Q_WAIT);
2297     }
2298   else
2299     {
2300       n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
2301                                      0 /* do_evt */, SVM_Q_WAIT);
2302     }
2303
2304   if (svm_fifo_set_event (s->tx_fifo))
2305     app_send_io_evt_to_vpp (
2306       s->vpp_evt_q, s->tx_fifo->shr->master_session_index, et, SVM_Q_WAIT);
2307
2308   /* The underlying fifo segment can run out of memory */
2309   if (PREDICT_FALSE (n_write < 0))
2310     return VPPCOM_EAGAIN;
2311
2312   VDBG (2, "session %u [0x%llx]: wrote %d bytes", s->session_index,
2313         s->vpp_handle, n_write);
2314
2315   return n_write;
2316 }
2317
2318 int
2319 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
2320 {
2321   vcl_worker_t *wrk = vcl_worker_get_current ();
2322   vcl_session_t *s;
2323
2324   s = vcl_session_get_w_handle (wrk, session_handle);
2325   if (PREDICT_FALSE (!s))
2326     return VPPCOM_EBADFD;
2327
2328   return vppcom_session_write_inline (wrk, s, buf, n, 0 /* is_flush */,
2329                                       s->is_dgram ? 1 : 0);
2330 }
2331
2332 int
2333 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
2334 {
2335   vcl_worker_t *wrk = vcl_worker_get_current ();
2336   vcl_session_t *s;
2337
2338   s = vcl_session_get_w_handle (wrk, session_handle);
2339   if (PREDICT_FALSE (!s))
2340     return VPPCOM_EBADFD;
2341
2342   return vppcom_session_write_inline (wrk, s, buf, n, 1 /* is_flush */,
2343                                       s->is_dgram ? 1 : 0);
2344 }
2345
2346 #define vcl_fifo_rx_evt_valid_or_break(_s)                              \
2347 if (PREDICT_FALSE (!_s->rx_fifo))                                       \
2348   break;                                                                \
2349 if (PREDICT_FALSE (svm_fifo_is_empty (_s->rx_fifo)))                    \
2350   {                                                                     \
2351     if (!vcl_session_is_ct (_s))                                        \
2352       {                                                                 \
2353         svm_fifo_unset_event (_s->rx_fifo);                             \
2354         if (svm_fifo_is_empty (_s->rx_fifo))                            \
2355           break;                                                        \
2356       }                                                                 \
2357     else if (svm_fifo_is_empty (_s->ct_rx_fifo))                        \
2358       {                                                                 \
2359         svm_fifo_unset_event (_s->rx_fifo); /* rx evts on actual fifo*/ \
2360         if (svm_fifo_is_empty (_s->ct_rx_fifo))                         \
2361           break;                                                        \
2362       }                                                                 \
2363   }                                                                     \
2364
2365 static void
2366 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2367                             unsigned long n_bits, unsigned long *read_map,
2368                             unsigned long *write_map,
2369                             unsigned long *except_map, u32 * bits_set)
2370 {
2371   session_disconnected_msg_t *disconnected_msg;
2372   session_connected_msg_t *connected_msg;
2373   vcl_session_t *s;
2374   u32 sid;
2375
2376   switch (e->event_type)
2377     {
2378     case SESSION_IO_EVT_RX:
2379       sid = e->session_index;
2380       s = vcl_session_get (wrk, sid);
2381       if (!s || !vcl_session_is_open (s))
2382         break;
2383       vcl_fifo_rx_evt_valid_or_break (s);
2384       if (sid < n_bits && read_map)
2385         {
2386           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2387           *bits_set += 1;
2388         }
2389       break;
2390     case SESSION_IO_EVT_TX:
2391       sid = e->session_index;
2392       s = vcl_session_get (wrk, sid);
2393       if (!s || !vcl_session_is_open (s))
2394         break;
2395       if (sid < n_bits && write_map)
2396         {
2397           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2398           *bits_set += 1;
2399         }
2400       break;
2401     case SESSION_CTRL_EVT_ACCEPTED:
2402       if (!e->postponed)
2403         s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
2404       else
2405         s = vcl_session_get (wrk, e->session_index);
2406       if (!s)
2407         break;
2408       sid = s->session_index;
2409       if (sid < n_bits && read_map)
2410         {
2411           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2412           *bits_set += 1;
2413         }
2414       break;
2415     case SESSION_CTRL_EVT_CONNECTED:
2416       if (!e->postponed)
2417         {
2418           connected_msg = (session_connected_msg_t *) e->data;
2419           sid = vcl_session_connected_handler (wrk, connected_msg);
2420         }
2421       else
2422         sid = e->session_index;
2423       if (sid == VCL_INVALID_SESSION_INDEX)
2424         break;
2425       if (!(sid < n_bits && write_map))
2426         break;
2427       clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2428       *bits_set += 1;
2429       s = vcl_session_get (wrk, sid);
2430       /* We didn't have a fifo when the event was added */
2431       vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2432       break;
2433     case SESSION_CTRL_EVT_DISCONNECTED:
2434       disconnected_msg = (session_disconnected_msg_t *) e->data;
2435       s = vcl_session_disconnected_handler (wrk, disconnected_msg);
2436       if (!s)
2437         break;
2438       sid = s->session_index;
2439       if (sid < n_bits && except_map)
2440         {
2441           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2442           *bits_set += 1;
2443         }
2444       break;
2445     case SESSION_CTRL_EVT_RESET:
2446       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2447       if (sid < n_bits && except_map)
2448         {
2449           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2450           *bits_set += 1;
2451         }
2452       break;
2453     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2454       vcl_session_unlisten_reply_handler (wrk, e->data);
2455       break;
2456     case SESSION_CTRL_EVT_MIGRATED:
2457       vcl_session_migrated_handler (wrk, e->data);
2458       break;
2459     case SESSION_CTRL_EVT_CLEANUP:
2460       vcl_session_cleanup_handler (wrk, e->data);
2461       break;
2462     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2463       vcl_session_worker_update_reply_handler (wrk, e->data);
2464       break;
2465     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2466       vcl_session_req_worker_update_handler (wrk, e->data);
2467       break;
2468     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
2469       vcl_session_app_add_segment_handler (wrk, e->data);
2470       break;
2471     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
2472       vcl_session_app_del_segment_handler (wrk, e->data);
2473       break;
2474     case SESSION_CTRL_EVT_APP_WRK_RPC:
2475       vcl_worker_rpc_handler (wrk, e->data);
2476       break;
2477     default:
2478       clib_warning ("unhandled: %u", e->event_type);
2479       break;
2480     }
2481 }
2482
2483 static int
2484 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2485                       unsigned long n_bits, unsigned long *read_map,
2486                       unsigned long *write_map, unsigned long *except_map,
2487                       double time_to_wait, u32 * bits_set)
2488 {
2489   svm_msg_q_msg_t *msg;
2490   session_event_t *e;
2491   u32 i;
2492
2493   if (svm_msg_q_is_empty (mq))
2494     {
2495       if (*bits_set)
2496         return 0;
2497
2498       if (!time_to_wait)
2499         return 0;
2500       else if (time_to_wait < 0)
2501         svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
2502       else
2503         {
2504           if (svm_msg_q_timedwait (mq, time_to_wait))
2505             return 0;
2506         }
2507     }
2508   vcl_mq_dequeue_batch (wrk, mq, ~0);
2509
2510   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2511     {
2512       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2513       e = svm_msg_q_msg_data (mq, msg);
2514       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2515                                   except_map, bits_set);
2516       svm_msg_q_free_msg (mq, msg);
2517     }
2518   vec_reset_length (wrk->mq_msg_vector);
2519   vcl_handle_pending_wrk_updates (wrk);
2520   return *bits_set;
2521 }
2522
2523 static int
2524 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2525                        vcl_si_set * read_map, vcl_si_set * write_map,
2526                        vcl_si_set * except_map, double time_to_wait,
2527                        u32 * bits_set)
2528 {
2529   double wait = 0, start = 0;
2530
2531   if (!*bits_set)
2532     {
2533       wait = time_to_wait;
2534       start = clib_time_now (&wrk->clib_time);
2535     }
2536
2537   do
2538     {
2539       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2540                             write_map, except_map, wait, bits_set);
2541       if (*bits_set)
2542         return *bits_set;
2543       if (wait == -1)
2544         continue;
2545
2546       wait = wait - (clib_time_now (&wrk->clib_time) - start);
2547     }
2548   while (wait > 0);
2549
2550   return 0;
2551 }
2552
2553 static int
2554 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2555                        vcl_si_set * read_map, vcl_si_set * write_map,
2556                        vcl_si_set * except_map, double time_to_wait,
2557                        u32 * bits_set)
2558 {
2559   vcl_mq_evt_conn_t *mqc;
2560   int __clib_unused n_read;
2561   int n_mq_evts, i;
2562   u64 buf;
2563
2564   if (PREDICT_FALSE (wrk->api_client_handle == ~0))
2565     {
2566       vcl_api_retry_attach (wrk);
2567       return 0;
2568     }
2569
2570   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2571   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2572                           vec_len (wrk->mq_events), time_to_wait);
2573   for (i = 0; i < n_mq_evts; i++)
2574     {
2575       if (PREDICT_FALSE (wrk->mq_events[i].data.u32 == ~0))
2576         {
2577           vcl_api_handle_disconnect (wrk);
2578           continue;
2579         }
2580
2581       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2582       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2583       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2584                             except_map, 0, bits_set);
2585     }
2586
2587   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2588 }
2589
2590 int
2591 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2592                vcl_si_set * except_map, double time_to_wait)
2593 {
2594   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2595   vcl_worker_t *wrk = vcl_worker_get_current ();
2596   vcl_session_t *s = 0;
2597   int i;
2598
2599   if (n_bits && read_map)
2600     {
2601       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2602       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2603                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2604       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2605     }
2606   if (n_bits && write_map)
2607     {
2608       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2609       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2610                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2611       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2612     }
2613   if (n_bits && except_map)
2614     {
2615       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2616       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2617                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2618       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2619     }
2620
2621   if (!n_bits)
2622     return 0;
2623
2624   if (!write_map)
2625     goto check_rd;
2626
2627   clib_bitmap_foreach (sid, wrk->wr_bitmap)
2628     {
2629       if (!(s = vcl_session_get (wrk, sid)))
2630         {
2631           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2632           bits_set++;
2633           continue;
2634         }
2635
2636       if (vcl_session_write_ready (s))
2637         {
2638           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2639           bits_set++;
2640         }
2641       else
2642         {
2643           vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF);
2644         }
2645     }
2646
2647 check_rd:
2648   if (!read_map)
2649     goto check_mq;
2650
2651   clib_bitmap_foreach (sid, wrk->rd_bitmap)
2652     {
2653       if (!(s = vcl_session_get (wrk, sid)))
2654         {
2655           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2656           bits_set++;
2657           continue;
2658         }
2659
2660       if (vcl_session_read_ready (s))
2661         {
2662           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2663           bits_set++;
2664         }
2665     }
2666
2667 check_mq:
2668
2669   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2670     {
2671       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2672                                   read_map, write_map, except_map, &bits_set);
2673     }
2674   vec_reset_length (wrk->unhandled_evts_vector);
2675
2676   if (vcm->cfg.use_mq_eventfd)
2677     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2678                            time_to_wait, &bits_set);
2679   else
2680     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2681                            time_to_wait, &bits_set);
2682
2683   return (bits_set);
2684 }
2685
2686 static inline void
2687 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_handle)
2688 {
2689   vppcom_epoll_t *vep;
2690   u32 sh = vep_handle;
2691   vcl_session_t *s;
2692
2693   if (VPPCOM_DEBUG <= 3)
2694     return;
2695
2696   s = vcl_session_get_w_handle (wrk, vep_handle);
2697   if (PREDICT_FALSE (!s))
2698     {
2699       VDBG (0, "ERROR: Invalid vep_sh (%u)!", vep_handle);
2700       goto done;
2701     }
2702   if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP)))
2703     {
2704       VDBG (0, "ERROR: vep_sh (%u) is not a vep!", vep_handle);
2705       goto done;
2706     }
2707   vep = &s->vep;
2708   VDBG (0, "vep_sh (%u): Dumping epoll chain\n"
2709         "{\n"
2710         "   is_vep         = %u\n"
2711         "   is_vep_session = %u\n"
2712         "   next_sh        = 0x%x (%u)\n"
2713         "}\n", vep_handle, s->flags & VCL_SESSION_F_IS_VEP,
2714         s->flags & VCL_SESSION_F_IS_VEP_SESSION, vep->next_sh, vep->next_sh);
2715
2716   for (sh = vep->next_sh; sh != ~0; sh = vep->next_sh)
2717     {
2718       s = vcl_session_get_w_handle (wrk, sh);
2719       if (PREDICT_FALSE (!s))
2720         {
2721           VDBG (0, "ERROR: Invalid sh (%u)!", sh);
2722           goto done;
2723         }
2724       if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2725         {
2726           VDBG (0, "ERROR: sh (%u) is a vep!", vep_handle);
2727         }
2728       else if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2729         {
2730           VDBG (0, "ERROR: sh (%u) is not a vep session handle!", sh);
2731           goto done;
2732         }
2733       vep = &s->vep;
2734       if (PREDICT_FALSE (vep->vep_sh != vep_handle))
2735         VDBG (0, "ERROR: session (%u) vep_sh (%u) != vep_sh (%u)!",
2736               sh, s->vep.vep_sh, vep_handle);
2737       if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
2738         {
2739           VDBG (0, "vep_sh[%u]: sh 0x%x (%u)\n"
2740                 "{\n"
2741                 "   next_sh        = 0x%x (%u)\n"
2742                 "   prev_sh        = 0x%x (%u)\n"
2743                 "   vep_sh         = 0x%x (%u)\n"
2744                 "   ev.events      = 0x%x\n"
2745                 "   ev.data.u64    = 0x%llx\n"
2746                 "   et_mask        = 0x%x\n"
2747                 "}\n",
2748                 vep_handle, sh, sh, vep->next_sh, vep->next_sh, vep->prev_sh,
2749                 vep->prev_sh, vep->vep_sh, vep->vep_sh, vep->ev.events,
2750                 vep->ev.data.u64, vep->et_mask);
2751         }
2752     }
2753
2754 done:
2755   VDBG (0, "vep_sh (%u): Dump complete!\n", vep_handle);
2756 }
2757
2758 int
2759 vppcom_epoll_create (void)
2760 {
2761   vcl_worker_t *wrk = vcl_worker_get_current ();
2762   vcl_session_t *vep_session;
2763
2764   vep_session = vcl_session_alloc (wrk);
2765
2766   vep_session->flags |= VCL_SESSION_F_IS_VEP;
2767   vep_session->vep.vep_sh = ~0;
2768   vep_session->vep.next_sh = ~0;
2769   vep_session->vep.prev_sh = ~0;
2770   vep_session->vpp_handle = ~0;
2771
2772   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2773   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2774
2775   return vcl_session_handle (vep_session);
2776 }
2777
2778 static void
2779 vcl_epoll_ctl_add_unhandled_event (vcl_worker_t *wrk, vcl_session_t *s,
2780                                    u8 is_epollet, session_evt_type_t evt)
2781 {
2782   if (!is_epollet)
2783     {
2784       if (s->vep.lt_next == VCL_INVALID_SESSION_INDEX)
2785         vcl_epoll_lt_add (wrk, s);
2786       return;
2787     }
2788
2789   session_event_t e = { 0 };
2790   e.session_index = s->session_index;
2791   e.event_type = evt;
2792   if (evt == SESSION_IO_EVT_RX)
2793     s->flags &= ~VCL_SESSION_F_HAS_RX_EVT;
2794   vec_add1 (wrk->unhandled_evts_vector, e);
2795 }
2796
2797 int
2798 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2799                   struct epoll_event *event)
2800 {
2801   vcl_worker_t *wrk = vcl_worker_get_current ();
2802   int rv = VPPCOM_OK, add_evt = 0;
2803   vcl_session_t *vep_session;
2804   vcl_session_t *s;
2805
2806   if (vep_handle == session_handle)
2807     {
2808       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2809       return VPPCOM_EINVAL;
2810     }
2811
2812   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2813   if (PREDICT_FALSE (!vep_session))
2814     {
2815       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2816       return VPPCOM_EBADFD;
2817     }
2818   if (PREDICT_FALSE (!(vep_session->flags & VCL_SESSION_F_IS_VEP)))
2819     {
2820       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2821       return VPPCOM_EINVAL;
2822     }
2823
2824   ASSERT (vep_session->vep.vep_sh == ~0);
2825   ASSERT (vep_session->vep.prev_sh == ~0);
2826
2827   s = vcl_session_get_w_handle (wrk, session_handle);
2828   if (PREDICT_FALSE (!s))
2829     {
2830       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2831       return VPPCOM_EBADFD;
2832     }
2833   if (PREDICT_FALSE (s->flags & VCL_SESSION_F_IS_VEP))
2834     {
2835       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2836       return VPPCOM_EINVAL;
2837     }
2838
2839   switch (op)
2840     {
2841     case EPOLL_CTL_ADD:
2842       if (PREDICT_FALSE (!event))
2843         {
2844           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2845           return VPPCOM_EINVAL;
2846         }
2847       if (s->flags & VCL_SESSION_F_IS_VEP_SESSION)
2848         {
2849           VDBG (0, "EPOLL_CTL_ADD: %u already epolled!", s->session_index);
2850           rv = VPPCOM_EEXIST;
2851           goto done;
2852         }
2853       if (vep_session->vep.next_sh != ~0)
2854         {
2855           vcl_session_t *next_session;
2856           next_session = vcl_session_get_w_handle (wrk,
2857                                                    vep_session->vep.next_sh);
2858           if (PREDICT_FALSE (!next_session))
2859             {
2860               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sh (%u) on "
2861                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2862               return VPPCOM_EBADFD;
2863             }
2864           ASSERT (next_session->vep.prev_sh == vep_handle);
2865           next_session->vep.prev_sh = session_handle;
2866         }
2867       s->vep.next_sh = vep_session->vep.next_sh;
2868       s->vep.prev_sh = vep_handle;
2869       s->vep.vep_sh = vep_handle;
2870       s->vep.et_mask = VEP_DEFAULT_ET_MASK;
2871       s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
2872       s->vep.ev = *event;
2873       s->vep.ev.events |= EPOLLHUP | EPOLLERR;
2874       s->flags &= ~VCL_SESSION_F_IS_VEP;
2875       s->flags |= VCL_SESSION_F_IS_VEP_SESSION;
2876       vep_session->vep.next_sh = session_handle;
2877
2878       if ((event->events & EPOLLOUT))
2879         {
2880           int write_ready = vcl_session_write_ready (s);
2881
2882           vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2883           if (write_ready > 0)
2884             {
2885               /* Generate EPOLLOUT if tx fifo not full */
2886               vcl_epoll_ctl_add_unhandled_event (
2887                 wrk, s, event->events & EPOLLET, SESSION_IO_EVT_TX);
2888               add_evt = 1;
2889             }
2890           else
2891             {
2892               vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF);
2893             }
2894         }
2895       /* Generate EPOLLIN if rx fifo has data */
2896       if ((event->events & EPOLLIN) && (vcl_session_read_ready (s) > 0))
2897         {
2898           vcl_epoll_ctl_add_unhandled_event (wrk, s, event->events & EPOLLET,
2899                                              SESSION_IO_EVT_RX);
2900           add_evt = 1;
2901         }
2902       if (!add_evt && vcl_session_is_closing (s))
2903         {
2904           session_event_t e = { 0 };
2905           if (s->session_state == VCL_STATE_VPP_CLOSING)
2906             e.event_type = SESSION_CTRL_EVT_DISCONNECTED;
2907           else
2908             e.event_type = SESSION_CTRL_EVT_RESET;
2909           e.session_index = s->session_index;
2910           e.postponed = 1;
2911           vec_add1 (wrk->unhandled_evts_vector, e);
2912         }
2913       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2914             vep_handle, session_handle, event->events, event->data.u64);
2915       vcl_evt (VCL_EVT_EPOLL_CTLADD, s, event->events, event->data.u64);
2916       break;
2917
2918     case EPOLL_CTL_MOD:
2919       if (PREDICT_FALSE (!event))
2920         {
2921           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2922           rv = VPPCOM_EINVAL;
2923           goto done;
2924         }
2925       else if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2926         {
2927           VDBG (0, "sh %u EPOLL_CTL_MOD: not a vep session!", session_handle);
2928           rv = VPPCOM_ENOENT;
2929           goto done;
2930         }
2931       else if (PREDICT_FALSE (s->vep.vep_sh != vep_handle))
2932         {
2933           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2934                 session_handle, s->vep.vep_sh, vep_handle);
2935           rv = VPPCOM_EINVAL;
2936           goto done;
2937         }
2938
2939       /* Generate EPOLLOUT if session write ready and event was not on */
2940       if ((event->events & EPOLLOUT) && !(s->vep.ev.events & EPOLLOUT))
2941         {
2942           /* Fifo size load acq synchronized with update store rel */
2943           int write_ready = vcl_session_write_ready (s);
2944
2945           vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2946           if (write_ready > 0)
2947             vcl_epoll_ctl_add_unhandled_event (wrk, s, event->events & EPOLLET,
2948                                                SESSION_IO_EVT_TX);
2949           else
2950             /* Request deq ntf in case dequeue happened while updating flag */
2951             vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF);
2952         }
2953       else if (!(event->events & EPOLLOUT))
2954         vcl_session_del_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2955
2956       /* Generate EPOLLIN if session read ready and event was not on */
2957       if ((event->events & EPOLLIN) && !(s->vep.ev.events & EPOLLIN) &&
2958           (vcl_session_read_ready (s) > 0))
2959         {
2960           vcl_epoll_ctl_add_unhandled_event (wrk, s, event->events & EPOLLET,
2961                                              SESSION_IO_EVT_RX);
2962         }
2963       s->vep.et_mask = VEP_DEFAULT_ET_MASK;
2964       s->vep.ev = *event;
2965       s->vep.ev.events |= EPOLLHUP | EPOLLERR;
2966
2967       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2968             vep_handle, session_handle, event->events, event->data.u64);
2969       break;
2970
2971     case EPOLL_CTL_DEL:
2972       if (PREDICT_FALSE (!(s->flags & VCL_SESSION_F_IS_VEP_SESSION)))
2973         {
2974           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
2975           rv = VPPCOM_ENOENT;
2976           goto done;
2977         }
2978       else if (PREDICT_FALSE (s->vep.vep_sh != vep_handle))
2979         {
2980           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
2981                 session_handle, s->vep.vep_sh, vep_handle);
2982           rv = VPPCOM_EINVAL;
2983           goto done;
2984         }
2985
2986       if (s->vep.prev_sh == vep_handle)
2987         vep_session->vep.next_sh = s->vep.next_sh;
2988       else
2989         {
2990           vcl_session_t *prev_session;
2991           prev_session = vcl_session_get_w_handle (wrk, s->vep.prev_sh);
2992           if (PREDICT_FALSE (!prev_session))
2993             {
2994               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sh (%u) on sh (%u)!",
2995                     s->vep.prev_sh, session_handle);
2996               return VPPCOM_EBADFD;
2997             }
2998           ASSERT (prev_session->vep.next_sh == session_handle);
2999           prev_session->vep.next_sh = s->vep.next_sh;
3000         }
3001       if (s->vep.next_sh != ~0)
3002         {
3003           vcl_session_t *next_session;
3004           next_session = vcl_session_get_w_handle (wrk, s->vep.next_sh);
3005           if (PREDICT_FALSE (!next_session))
3006             {
3007               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sh (%u) on sh (%u)!",
3008                     s->vep.next_sh, session_handle);
3009               return VPPCOM_EBADFD;
3010             }
3011           ASSERT (next_session->vep.prev_sh == session_handle);
3012           next_session->vep.prev_sh = s->vep.prev_sh;
3013         }
3014
3015       if (s->vep.lt_next != VCL_INVALID_SESSION_INDEX)
3016         vcl_epoll_lt_del (wrk, s);
3017
3018       memset (&s->vep, 0, sizeof (s->vep));
3019       s->vep.next_sh = ~0;
3020       s->vep.prev_sh = ~0;
3021       s->vep.vep_sh = ~0;
3022       s->vep.lt_next = VCL_INVALID_SESSION_INDEX;
3023       s->flags &= ~VCL_SESSION_F_IS_VEP_SESSION;
3024
3025       if (vcl_session_is_open (s))
3026         vcl_session_del_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
3027
3028       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sh %u!", vep_handle,
3029             session_handle);
3030       vcl_evt (VCL_EVT_EPOLL_CTLDEL, s, vep_sh);
3031       break;
3032
3033     default:
3034       VDBG (0, "Invalid operation (%d)!", op);
3035       rv = VPPCOM_EINVAL;
3036     }
3037
3038   vep_verify_epoll_chain (wrk, vep_handle);
3039
3040 done:
3041   return rv;
3042 }
3043
3044 always_inline u8
3045 vcl_ep_session_needs_evt (vcl_session_t *s, u32 evt)
3046 {
3047   /* No event if not epolled / events reset on hup or level-trigger on */
3048   return ((s->vep.ev.events & evt) &&
3049           s->vep.lt_next == VCL_INVALID_SESSION_INDEX);
3050 }
3051
3052 static inline void
3053 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
3054                                 struct epoll_event *events, u32 * num_ev)
3055 {
3056   session_disconnected_msg_t *disconnected_msg;
3057   session_connected_msg_t *connected_msg;
3058   u32 sid = ~0, session_events;
3059   u64 session_evt_data = ~0;
3060   vcl_session_t *s;
3061   u8 add_event = 0;
3062
3063   switch (e->event_type)
3064     {
3065     case SESSION_IO_EVT_RX:
3066       sid = e->session_index;
3067       s = vcl_session_get (wrk, sid);
3068       if (vcl_session_is_closed (s))
3069         break;
3070       vcl_fifo_rx_evt_valid_or_break (s);
3071       if (!vcl_ep_session_needs_evt (s, EPOLLIN) ||
3072           (s->flags & VCL_SESSION_F_HAS_RX_EVT))
3073         break;
3074       session_events = s->vep.ev.events;
3075       add_event = 1;
3076       events[*num_ev].events = EPOLLIN;
3077       session_evt_data = s->vep.ev.data.u64;
3078       s->flags |= VCL_SESSION_F_HAS_RX_EVT;
3079       break;
3080     case SESSION_IO_EVT_TX:
3081       sid = e->session_index;
3082       s = vcl_session_get (wrk, sid);
3083       if (!s || !vcl_session_is_open (s))
3084         break;
3085       svm_fifo_reset_has_deq_ntf (vcl_session_is_ct (s) ? s->ct_tx_fifo :
3086                                                                 s->tx_fifo);
3087       if (!vcl_ep_session_needs_evt (s, EPOLLOUT))
3088         break;
3089       session_events = s->vep.ev.events;
3090       add_event = 1;
3091       events[*num_ev].events = EPOLLOUT;
3092       session_evt_data = s->vep.ev.data.u64;
3093       break;
3094     case SESSION_CTRL_EVT_ACCEPTED:
3095       if (!e->postponed)
3096         s = vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
3097       else
3098         s = vcl_session_get (wrk, e->session_index);
3099       if (!s || !vcl_ep_session_needs_evt (s, EPOLLIN))
3100         break;
3101       sid = s->session_index;
3102       session_events = s->vep.ev.events;
3103       add_event = 1;
3104       events[*num_ev].events = EPOLLIN;
3105       session_evt_data = s->vep.ev.data.u64;
3106       break;
3107     case SESSION_CTRL_EVT_CONNECTED:
3108       if (!e->postponed)
3109         {
3110           connected_msg = (session_connected_msg_t *) e->data;
3111           sid = vcl_session_connected_handler (wrk, connected_msg);
3112         }
3113       else
3114         sid = e->session_index;
3115       s = vcl_session_get (wrk, sid);
3116       if (vcl_session_is_closed (s) || !vcl_ep_session_needs_evt (s, EPOLLOUT))
3117         break;
3118       /* We didn't have a fifo when the event was added */
3119       vcl_session_add_want_deq_ntf (s, SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
3120       add_event = 1;
3121       session_events = s->vep.ev.events;
3122       /* Generate EPOLLOUT because there's no connected event */
3123       events[*num_ev].events = EPOLLOUT;
3124       session_evt_data = s->vep.ev.data.u64;
3125       if (s->session_state == VCL_STATE_DETACHED)
3126         {
3127           events[*num_ev].events |= EPOLLHUP;
3128           s->vep.ev.events = 0;
3129         }
3130       break;
3131     case SESSION_CTRL_EVT_DISCONNECTED:
3132       if (!e->postponed)
3133         {
3134           disconnected_msg = (session_disconnected_msg_t *) e->data;
3135           s = vcl_session_disconnected_handler (wrk, disconnected_msg);
3136         }
3137       else
3138         {
3139           s = vcl_session_get (wrk, e->session_index);
3140           s->flags &= ~VCL_SESSION_F_PENDING_DISCONNECT;
3141         }
3142       if (vcl_session_is_closed (s) || !vcl_ep_session_needs_evt (s, EPOLLHUP))
3143         {
3144           if (s && (s->flags & VCL_SESSION_F_PENDING_FREE))
3145             vcl_session_free (wrk, s);
3146           break;
3147         }
3148       sid = s->session_index;
3149       session_events = s->vep.ev.events;
3150       add_event = 1;
3151       if (EPOLLRDHUP & session_events)
3152         {
3153           /* If app can distinguish between RDHUP and HUP,
3154            * we make finer control */
3155           events[*num_ev].events = EPOLLRDHUP;
3156           if (s->flags & VCL_SESSION_F_WR_SHUTDOWN)
3157             {
3158               events[*num_ev].events |= EPOLLHUP;
3159             }
3160         }
3161       else
3162         {
3163           events[*num_ev].events = EPOLLHUP;
3164         }
3165       session_evt_data = s->vep.ev.data.u64;
3166       s->vep.ev.events = 0;
3167       break;
3168     case SESSION_CTRL_EVT_BOUND:
3169       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
3170       break;
3171     case SESSION_CTRL_EVT_RESET:
3172       if (!e->postponed)
3173         {
3174           sid =
3175             vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
3176           s = vcl_session_get (wrk, sid);
3177         }
3178       else
3179         {
3180           sid = e->session_index;
3181           s = vcl_session_get (wrk, sid);
3182           s->flags &= ~VCL_SESSION_F_PENDING_DISCONNECT;
3183         }
3184       if (vcl_session_is_closed (s) || !vcl_ep_session_needs_evt (s, EPOLLHUP))
3185         {
3186           if (s && (s->flags & VCL_SESSION_F_PENDING_FREE))
3187             vcl_session_free (wrk, s);
3188           break;
3189         }
3190       session_events = s->vep.ev.events;
3191       add_event = 1;
3192       events[*num_ev].events = EPOLLERR | EPOLLHUP;
3193       if ((EPOLLRDHUP & session_events) &&
3194           (s->flags & VCL_SESSION_F_RD_SHUTDOWN))
3195         {
3196           events[*num_ev].events |= EPOLLRDHUP;
3197         }
3198       if ((EPOLLIN & session_events) && (s->flags & VCL_SESSION_F_RD_SHUTDOWN))
3199         {
3200           events[*num_ev].events |= EPOLLIN;
3201         }
3202       session_evt_data = s->vep.ev.data.u64;
3203       s->vep.ev.events = 0;
3204       break;
3205     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
3206       vcl_session_unlisten_reply_handler (wrk, e->data);
3207       break;
3208     case SESSION_CTRL_EVT_MIGRATED:
3209       vcl_session_migrated_handler (wrk, e->data);
3210       break;
3211     case SESSION_CTRL_EVT_CLEANUP:
3212       vcl_session_cleanup_handler (wrk, e->data);
3213       break;
3214     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
3215       vcl_session_req_worker_update_handler (wrk, e->data);
3216       break;
3217     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
3218       vcl_session_worker_update_reply_handler (wrk, e->data);
3219       break;
3220     case SESSION_CTRL_EVT_APP_ADD_SEGMENT:
3221       vcl_session_app_add_segment_handler (wrk, e->data);
3222       break;
3223     case SESSION_CTRL_EVT_APP_DEL_SEGMENT:
3224       vcl_session_app_del_segment_handler (wrk, e->data);
3225       break;
3226     case SESSION_CTRL_EVT_APP_WRK_RPC:
3227       vcl_worker_rpc_handler (wrk, e->data);
3228       break;
3229     default:
3230       VDBG (0, "unhandled: %u", e->event_type);
3231       break;
3232     }
3233
3234   if (add_event)
3235     {
3236       ASSERT (s->flags & VCL_SESSION_F_IS_VEP_SESSION);
3237       events[*num_ev].data.u64 = session_evt_data;
3238       if (EPOLLONESHOT & session_events)
3239         {
3240           s = vcl_session_get (wrk, sid);
3241           if (!(events[*num_ev].events & EPOLLHUP))
3242             s->vep.ev.events = EPOLLHUP | EPOLLERR;
3243         }
3244       else if (!(EPOLLET & session_events))
3245         {
3246           s = vcl_session_get (wrk, sid);
3247           if (s->vep.lt_next == VCL_INVALID_SESSION_INDEX)
3248             vcl_epoll_lt_add (wrk, s);
3249         }
3250       *num_ev += 1;
3251     }
3252 }
3253
3254 static int
3255 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
3256                           struct epoll_event *events, u32 maxevents,
3257                           double wait_for_time, u32 * num_ev)
3258 {
3259   svm_msg_q_msg_t *msg;
3260   session_event_t *e;
3261   int i;
3262
3263   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
3264     goto handle_dequeued;
3265
3266   if (svm_msg_q_is_empty (mq))
3267     {
3268       if (!wait_for_time)
3269         return 0;
3270       else if (wait_for_time < 0)
3271         svm_msg_q_wait (mq, SVM_MQ_WAIT_EMPTY);
3272       else
3273         {
3274           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
3275             return 0;
3276         }
3277     }
3278   ASSERT (maxevents > *num_ev);
3279   vcl_mq_dequeue_batch (wrk, mq, ~0);
3280
3281 handle_dequeued:
3282   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
3283     {
3284       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
3285       e = svm_msg_q_msg_data (mq, msg);
3286       if (*num_ev < maxevents)
3287         vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
3288       else
3289         vcl_handle_mq_event (wrk, e);
3290       svm_msg_q_free_msg (mq, msg);
3291     }
3292   vec_reset_length (wrk->mq_msg_vector);
3293   vcl_handle_pending_wrk_updates (wrk);
3294   return *num_ev;
3295 }
3296
3297 static int
3298 vppcom_epoll_wait_condvar (vcl_worker_t *wrk, struct epoll_event *events,
3299                            int maxevents, u32 n_evts, double timeout_ms)
3300 {
3301   double end = -1;
3302
3303   if (!n_evts)
3304     {
3305       if (timeout_ms > 0)
3306         end = clib_time_now (&wrk->clib_time) + (timeout_ms / 1e3);
3307     }
3308
3309   do
3310     {
3311       vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events, maxevents,
3312                                 timeout_ms, &n_evts);
3313       if (n_evts || !timeout_ms)
3314         return n_evts;
3315     }
3316   while (end == -1 || clib_time_now (&wrk->clib_time) < end);
3317
3318   return 0;
3319 }
3320
3321 static int
3322 vppcom_epoll_wait_eventfd (vcl_worker_t *wrk, struct epoll_event *events,
3323                            int maxevents, u32 n_evts, double timeout_ms)
3324 {
3325   int __clib_unused n_read;
3326   vcl_mq_evt_conn_t *mqc;
3327   int n_mq_evts, i;
3328   double end = -1;
3329   u64 buf;
3330
3331   if (PREDICT_FALSE (wrk->api_client_handle == ~0))
3332     {
3333       vcl_api_retry_attach (wrk);
3334       return n_evts;
3335     }
3336
3337   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
3338   if (!n_evts)
3339     {
3340       if (timeout_ms > 0)
3341         end = clib_time_now (&wrk->clib_time) + (timeout_ms / 1e3);
3342     }
3343
3344   do
3345     {
3346       n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
3347                               vec_len (wrk->mq_events), timeout_ms);
3348       if (n_mq_evts < 0)
3349         {
3350           VDBG (0, "epoll_wait error %u", errno);
3351           return n_evts;
3352         }
3353
3354       for (i = 0; i < n_mq_evts; i++)
3355         {
3356           if (PREDICT_FALSE (wrk->mq_events[i].data.u32 == ~0))
3357             {
3358               /* api socket was closed */
3359               vcl_api_handle_disconnect (wrk);
3360               continue;
3361             }
3362
3363           mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
3364           n_read = read (mqc->mq_fd, &buf, sizeof (buf));
3365           vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0,
3366                                     &n_evts);
3367         }
3368
3369       if (n_evts || !timeout_ms)
3370         return n_evts;
3371     }
3372   while (end == -1 || clib_time_now (&wrk->clib_time) < end);
3373
3374   return 0;
3375 }
3376
3377 static void
3378 vcl_epoll_wait_handle_lt (vcl_worker_t *wrk, struct epoll_event *events,
3379                           int maxevents, u32 *n_evts)
3380 {
3381   u32 add_event = 0, evt_flags = 0, next, *to_remove = 0, *si;
3382   vcl_session_t *s;
3383   u64 evt_data;
3384   int rv;
3385
3386   ASSERT (wrk->ep_lt_current != VCL_INVALID_SESSION_INDEX);
3387   if (*n_evts >= maxevents)
3388     return;
3389
3390   next = wrk->ep_lt_current;
3391   do
3392     {
3393       s = vcl_session_get (wrk, next);
3394       next = s->vep.lt_next;
3395
3396       if (s->vep.ev.events == 0)
3397         {
3398           vec_add1 (to_remove, s->session_index);
3399           continue;
3400         }
3401       if ((s->vep.ev.events & EPOLLIN) && (rv = vcl_session_read_ready (s)))
3402         {
3403           add_event = 1;
3404           evt_flags |= rv > 0 ? EPOLLIN : EPOLLHUP | EPOLLRDHUP;
3405           evt_data = s->vep.ev.data.u64;
3406         }
3407       if ((s->vep.ev.events & EPOLLOUT) && (rv = vcl_session_write_ready (s)))
3408         {
3409           add_event = 1;
3410           evt_flags |= rv > 0 ? EPOLLOUT : EPOLLHUP | EPOLLRDHUP;
3411           evt_data = s->vep.ev.data.u64;
3412         }
3413       if (!add_event && s->session_state > VCL_STATE_READY)
3414         {
3415           add_event = 1;
3416           evt_flags |= EPOLLHUP | EPOLLRDHUP;
3417           evt_data = s->vep.ev.data.u64;
3418         }
3419       if (add_event)
3420         {
3421           events[*n_evts].events = evt_flags;
3422           events[*n_evts].data.u64 = evt_data;
3423           if (EPOLLONESHOT & s->vep.ev.events)
3424             s->vep.ev.events = EPOLLHUP | EPOLLERR;
3425           if (evt_flags & EPOLLHUP)
3426             s->vep.ev.events = 0;
3427           *n_evts += 1;
3428           add_event = 0;
3429           evt_flags = 0;
3430           if (*n_evts == maxevents)
3431             {
3432               wrk->ep_lt_current = next;
3433               break;
3434             }
3435         }
3436       else
3437         {
3438           vec_add1 (to_remove, s->session_index);
3439         }
3440     }
3441   while (next != wrk->ep_lt_current);
3442
3443   vec_foreach (si, to_remove)
3444     {
3445       s = vcl_session_get (wrk, *si);
3446       vcl_epoll_lt_del (wrk, s);
3447     }
3448   vec_free (to_remove);
3449 }
3450
3451 int
3452 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
3453                    int maxevents, double wait_for_time)
3454 {
3455   vcl_worker_t *wrk = vcl_worker_get_current ();
3456   vcl_session_t *vep_session;
3457   u32 n_evts = 0;
3458   int i;
3459
3460   if (PREDICT_FALSE (maxevents <= 0))
3461     {
3462       VDBG (0, "ERROR: Invalid maxevents (%d)!", maxevents);
3463       return VPPCOM_EINVAL;
3464     }
3465
3466   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
3467   if (!vep_session)
3468     return VPPCOM_EBADFD;
3469
3470   if (PREDICT_FALSE (!(vep_session->flags & VCL_SESSION_F_IS_VEP)))
3471     {
3472       VDBG (0, "ERROR: vep_idx (%u) is not a vep!", vep_handle);
3473       return VPPCOM_EINVAL;
3474     }
3475
3476   if (vec_len (wrk->unhandled_evts_vector))
3477     {
3478       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
3479         {
3480           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
3481                                           events, &n_evts);
3482           if (n_evts == maxevents)
3483             {
3484               vec_delete (wrk->unhandled_evts_vector, i + 1, 0);
3485               return n_evts;
3486             }
3487         }
3488       vec_reset_length (wrk->unhandled_evts_vector);
3489     }
3490
3491   if (PREDICT_FALSE (wrk->ep_lt_current != VCL_INVALID_SESSION_INDEX))
3492     vcl_epoll_wait_handle_lt (wrk, events, maxevents, &n_evts);
3493
3494   /* Request to only drain unhandled */
3495   if ((int) wait_for_time == -2)
3496     return n_evts;
3497
3498
3499   if (vcm->cfg.use_mq_eventfd)
3500     n_evts = vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
3501                                         wait_for_time);
3502   else
3503     n_evts = vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
3504                                         wait_for_time);
3505
3506   return n_evts;
3507 }
3508
3509 int
3510 vppcom_session_attr (uint32_t session_handle, uint32_t op,
3511                      void *buffer, uint32_t * buflen)
3512 {
3513   vcl_worker_t *wrk = vcl_worker_get_current ();
3514   u32 *flags = buffer;
3515   vppcom_endpt_t *ep = buffer;
3516   transport_endpt_attr_t tea;
3517   vcl_session_t *session;
3518   int rv = VPPCOM_OK;
3519
3520   session = vcl_session_get_w_handle (wrk, session_handle);
3521   if (!session)
3522     return VPPCOM_EBADFD;
3523
3524   switch (op)
3525     {
3526     case VPPCOM_ATTR_GET_NREAD:
3527       rv = vcl_session_read_ready (session);
3528       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sh %u, nread = %d", session_handle,
3529             rv);
3530       break;
3531
3532     case VPPCOM_ATTR_GET_NWRITE:
3533       rv = vcl_session_write_ready (session);
3534       VDBG (2, "VPPCOM_ATTR_GET_NWRITE: sh %u, nwrite = %d", session_handle,
3535             rv);
3536       break;
3537
3538     case VPPCOM_ATTR_GET_FLAGS:
3539       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
3540         {
3541           *flags =
3542             O_RDWR |
3543             (vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK) ?
3544              O_NONBLOCK : 0);
3545           *buflen = sizeof (*flags);
3546           VDBG (2, "VPPCOM_ATTR_GET_FLAGS: sh %u, flags = 0x%08x, "
3547                 "is_nonblocking = %u", session_handle, *flags,
3548                 vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK));
3549         }
3550       else
3551         rv = VPPCOM_EINVAL;
3552       break;
3553
3554     case VPPCOM_ATTR_SET_FLAGS:
3555       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
3556         {
3557           if (*flags & O_NONBLOCK)
3558             vcl_session_set_attr (session, VCL_SESS_ATTR_NONBLOCK);
3559           else
3560             vcl_session_clear_attr (session, VCL_SESS_ATTR_NONBLOCK);
3561
3562           VDBG (2, "VPPCOM_ATTR_SET_FLAGS: sh %u, flags = 0x%08x,"
3563                 " is_nonblocking = %u", session_handle, *flags,
3564                 vcl_session_has_attr (session, VCL_SESS_ATTR_NONBLOCK));
3565         }
3566       else
3567         rv = VPPCOM_EINVAL;
3568       break;
3569
3570     case VPPCOM_ATTR_GET_PEER_ADDR:
3571       if (PREDICT_TRUE (buffer && buflen &&
3572                         (*buflen >= sizeof (*ep)) && ep->ip))
3573         {
3574           ep->is_ip4 = session->transport.is_ip4;
3575           ep->port = session->transport.rmt_port;
3576           if (session->transport.is_ip4)
3577             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3578                               sizeof (ip4_address_t));
3579           else
3580             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3581                               sizeof (ip6_address_t));
3582           *buflen = sizeof (*ep);
3583           VDBG (1,
3584                 "VPPCOM_ATTR_GET_PEER_ADDR: sh %u, is_ip4 = %u, "
3585                 "addr = %U, port %u",
3586                 session_handle, ep->is_ip4, vcl_format_ip46_address,
3587                 &session->transport.rmt_ip,
3588                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3589                 clib_net_to_host_u16 (ep->port));
3590         }
3591       else
3592         rv = VPPCOM_EINVAL;
3593       break;
3594
3595     case VPPCOM_ATTR_GET_LCL_ADDR:
3596       if (PREDICT_TRUE (buffer && buflen &&
3597                         (*buflen >= sizeof (*ep)) && ep->ip))
3598         {
3599           ep->is_ip4 = session->transport.is_ip4;
3600           ep->port = session->transport.lcl_port;
3601           if (session->transport.is_ip4)
3602             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
3603                               sizeof (ip4_address_t));
3604           else
3605             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
3606                               sizeof (ip6_address_t));
3607           *buflen = sizeof (*ep);
3608           VDBG (1,
3609                 "VPPCOM_ATTR_GET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
3610                 " port %d",
3611                 session_handle, ep->is_ip4, vcl_format_ip46_address,
3612                 &session->transport.lcl_ip,
3613                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3614                 clib_net_to_host_u16 (ep->port));
3615         }
3616       else
3617         rv = VPPCOM_EINVAL;
3618       break;
3619
3620     case VPPCOM_ATTR_GET_ORIGINAL_DST:
3621       if (!session->transport.is_ip4)
3622         {
3623           /* now original dst only support ipv4*/
3624           rv = VPPCOM_EAFNOSUPPORT;
3625           break;
3626         }
3627       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*ep)) &&
3628                         ep->ip))
3629         {
3630           ep->is_ip4 = session->transport.is_ip4;
3631           ep->port = session->original_dst_port;
3632           clib_memcpy_fast (ep->ip, &session->original_dst_ip4,
3633                             sizeof (ip4_address_t));
3634           *buflen = sizeof (*ep);
3635           VDBG (1,
3636                 "VPPCOM_ATTR_GET_ORIGINAL_DST: sh %u, is_ip4 = %u, addr = %U"
3637                 " port %d",
3638                 session_handle, ep->is_ip4, vcl_format_ip4_address,
3639                 (ip4_address_t *) (&session->original_dst_ip4),
3640                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3641                 clib_net_to_host_u16 (ep->port));
3642         }
3643       else
3644         rv = VPPCOM_EINVAL;
3645       break;
3646
3647     case VPPCOM_ATTR_SET_LCL_ADDR:
3648       if (PREDICT_TRUE (buffer && buflen &&
3649                         (*buflen >= sizeof (*ep)) && ep->ip))
3650         {
3651           session->transport.is_ip4 = ep->is_ip4;
3652           session->transport.lcl_port = ep->port;
3653           vcl_ip_copy_from_ep (&session->transport.lcl_ip, ep);
3654           *buflen = sizeof (*ep);
3655           VDBG (1,
3656                 "VPPCOM_ATTR_SET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
3657                 " port %d",
3658                 session_handle, ep->is_ip4, vcl_format_ip46_address,
3659                 &session->transport.lcl_ip,
3660                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
3661                 clib_net_to_host_u16 (ep->port));
3662         }
3663       else
3664         rv = VPPCOM_EINVAL;
3665       break;
3666
3667     case VPPCOM_ATTR_GET_LIBC_EPFD:
3668       rv = session->libc_epfd;
3669       VDBG (2, "VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d", rv);
3670       break;
3671
3672     case VPPCOM_ATTR_SET_LIBC_EPFD:
3673       if (PREDICT_TRUE (buffer && buflen &&
3674                         (*buflen == sizeof (session->libc_epfd))))
3675         {
3676           session->libc_epfd = *(int *) buffer;
3677           *buflen = sizeof (session->libc_epfd);
3678
3679           VDBG (2, "VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, buflen %d",
3680                 session->libc_epfd, *buflen);
3681         }
3682       else
3683         rv = VPPCOM_EINVAL;
3684       break;
3685
3686     case VPPCOM_ATTR_GET_PROTOCOL:
3687       if (buffer && buflen && (*buflen >= sizeof (int)))
3688         {
3689           *(int *) buffer = session->session_type;
3690           *buflen = sizeof (int);
3691
3692           VDBG (2, "VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
3693                 *(int *) buffer, *(int *) buffer ? "UDP" : "TCP", *buflen);
3694         }
3695       else
3696         rv = VPPCOM_EINVAL;
3697       break;
3698
3699     case VPPCOM_ATTR_GET_LISTEN:
3700       if (buffer && buflen && (*buflen >= sizeof (int)))
3701         {
3702           *(int *) buffer = vcl_session_has_attr (session,
3703                                                   VCL_SESS_ATTR_LISTEN);
3704           *buflen = sizeof (int);
3705
3706           VDBG (2, "VPPCOM_ATTR_GET_LISTEN: %d, buflen %d", *(int *) buffer,
3707                 *buflen);
3708         }
3709       else
3710         rv = VPPCOM_EINVAL;
3711       break;
3712
3713     case VPPCOM_ATTR_GET_ERROR:
3714       if (buffer && buflen && (*buflen >= sizeof (int)))
3715         {
3716           *(int *) buffer = 0;
3717           *buflen = sizeof (int);
3718
3719           VDBG (2, "VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
3720                 *(int *) buffer, *buflen);
3721         }
3722       else
3723         rv = VPPCOM_EINVAL;
3724       break;
3725
3726     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
3727       if (buffer && buflen && (*buflen >= sizeof (u32)))
3728         {
3729
3730           /* VPP-TBD */
3731           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3732                                 session->tx_fifo ?
3733                                 svm_fifo_size (session->tx_fifo) :
3734                                 vcm->cfg.tx_fifo_size);
3735           *buflen = sizeof (u32);
3736
3737           VDBG (2, "VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3738                 " #VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer,
3739                 *buflen);
3740         }
3741       else
3742         rv = VPPCOM_EINVAL;
3743       break;
3744
3745     case VPPCOM_ATTR_SET_DSCP:
3746       if (buffer && buflen && (*buflen >= sizeof (u8)))
3747         {
3748           session->dscp = *(u8 *) buffer;
3749
3750           VDBG (2, "VPPCOM_ATTR_SET_DSCP: %u (0x%x), buflen %d,",
3751                 *(u8 *) buffer, *(u8 *) buffer, *buflen);
3752         }
3753       else
3754         rv = VPPCOM_EINVAL;
3755       break;
3756
3757     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3758       if (buffer && buflen && (*buflen == sizeof (u32)))
3759         {
3760           /* VPP-TBD */
3761           session->sndbuf_size = *(u32 *) buffer;
3762           VDBG (2, "VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3763                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3764                 *buflen);
3765         }
3766       else
3767         rv = VPPCOM_EINVAL;
3768       break;
3769
3770     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3771       if (buffer && buflen && (*buflen >= sizeof (u32)))
3772         {
3773
3774           /* VPP-TBD */
3775           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3776                                 session->rx_fifo ?
3777                                 svm_fifo_size (session->rx_fifo) :
3778                                 vcm->cfg.rx_fifo_size);
3779           *buflen = sizeof (u32);
3780
3781           VDBG (2, "VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), buflen %d, "
3782                 "#VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer, *buflen);
3783         }
3784       else
3785         rv = VPPCOM_EINVAL;
3786       break;
3787
3788     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3789       if (buffer && buflen && (*buflen == sizeof (u32)))
3790         {
3791           /* VPP-TBD */
3792           session->rcvbuf_size = *(u32 *) buffer;
3793           VDBG (2, "VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), buflen %d,"
3794                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3795                 *buflen);
3796         }
3797       else
3798         rv = VPPCOM_EINVAL;
3799       break;
3800
3801     case VPPCOM_ATTR_GET_REUSEADDR:
3802       if (buffer && buflen && (*buflen >= sizeof (int)))
3803         {
3804           /* VPP-TBD */
3805           *(int *) buffer = vcl_session_has_attr (session,
3806                                                   VCL_SESS_ATTR_REUSEADDR);
3807           *buflen = sizeof (int);
3808
3809           VDBG (2, "VPPCOM_ATTR_GET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3810                 *(int *) buffer, *buflen);
3811         }
3812       else
3813         rv = VPPCOM_EINVAL;
3814       break;
3815
3816     case VPPCOM_ATTR_SET_REUSEADDR:
3817       if (buffer && buflen && (*buflen == sizeof (int)) &&
3818           !vcl_session_has_attr (session, VCL_SESS_ATTR_LISTEN))
3819         {
3820           /* VPP-TBD */
3821           if (*(int *) buffer)
3822             vcl_session_set_attr (session, VCL_SESS_ATTR_REUSEADDR);
3823           else
3824             vcl_session_clear_attr (session, VCL_SESS_ATTR_REUSEADDR);
3825
3826           VDBG (2, "VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3827                 vcl_session_has_attr (session, VCL_SESS_ATTR_REUSEADDR),
3828                 *buflen);
3829         }
3830       else
3831         rv = VPPCOM_EINVAL;
3832       break;
3833
3834     case VPPCOM_ATTR_GET_REUSEPORT:
3835       if (buffer && buflen && (*buflen >= sizeof (int)))
3836         {
3837           /* VPP-TBD */
3838           *(int *) buffer = vcl_session_has_attr (session,
3839                                                   VCL_SESS_ATTR_REUSEPORT);
3840           *buflen = sizeof (int);
3841
3842           VDBG (2, "VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3843                 *(int *) buffer, *buflen);
3844         }
3845       else
3846         rv = VPPCOM_EINVAL;
3847       break;
3848
3849     case VPPCOM_ATTR_SET_REUSEPORT:
3850       if (buffer && buflen && (*buflen == sizeof (int)) &&
3851           !vcl_session_has_attr (session, VCL_SESS_ATTR_LISTEN))
3852         {
3853           /* VPP-TBD */
3854           if (*(int *) buffer)
3855             vcl_session_set_attr (session, VCL_SESS_ATTR_REUSEPORT);
3856           else
3857             vcl_session_clear_attr (session, VCL_SESS_ATTR_REUSEPORT);
3858
3859           VDBG (2, "VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3860                 vcl_session_has_attr (session, VCL_SESS_ATTR_REUSEPORT),
3861                 *buflen);
3862         }
3863       else
3864         rv = VPPCOM_EINVAL;
3865       break;
3866
3867     case VPPCOM_ATTR_GET_BROADCAST:
3868       if (buffer && buflen && (*buflen >= sizeof (int)))
3869         {
3870           /* VPP-TBD */
3871           *(int *) buffer = vcl_session_has_attr (session,
3872                                                   VCL_SESS_ATTR_BROADCAST);
3873           *buflen = sizeof (int);
3874
3875           VDBG (2, "VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3876                 *(int *) buffer, *buflen);
3877         }
3878       else
3879         rv = VPPCOM_EINVAL;
3880       break;
3881
3882     case VPPCOM_ATTR_SET_BROADCAST:
3883       if (buffer && buflen && (*buflen == sizeof (int)))
3884         {
3885           /* VPP-TBD */
3886           if (*(int *) buffer)
3887             vcl_session_set_attr (session, VCL_SESS_ATTR_BROADCAST);
3888           else
3889             vcl_session_clear_attr (session, VCL_SESS_ATTR_BROADCAST);
3890
3891           VDBG (2, "VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3892                 vcl_session_has_attr (session, VCL_SESS_ATTR_BROADCAST),
3893                 *buflen);
3894         }
3895       else
3896         rv = VPPCOM_EINVAL;
3897       break;
3898
3899     case VPPCOM_ATTR_GET_V6ONLY:
3900       if (buffer && buflen && (*buflen >= sizeof (int)))
3901         {
3902           /* VPP-TBD */
3903           *(int *) buffer = vcl_session_has_attr (session,
3904                                                   VCL_SESS_ATTR_V6ONLY);
3905           *buflen = sizeof (int);
3906
3907           VDBG (2, "VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3908                 *(int *) buffer, *buflen);
3909         }
3910       else
3911         rv = VPPCOM_EINVAL;
3912       break;
3913
3914     case VPPCOM_ATTR_SET_V6ONLY:
3915       if (buffer && buflen && (*buflen == sizeof (int)))
3916         {
3917           /* VPP-TBD */
3918           if (*(int *) buffer)
3919             vcl_session_set_attr (session, VCL_SESS_ATTR_V6ONLY);
3920           else
3921             vcl_session_clear_attr (session, VCL_SESS_ATTR_V6ONLY);
3922
3923           VDBG (2, "VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3924                 vcl_session_has_attr (session, VCL_SESS_ATTR_V6ONLY),
3925                 *buflen);
3926         }
3927       else
3928         rv = VPPCOM_EINVAL;
3929       break;
3930
3931     case VPPCOM_ATTR_GET_KEEPALIVE:
3932       if (buffer && buflen && (*buflen >= sizeof (int)))
3933         {
3934           /* VPP-TBD */
3935           *(int *) buffer = vcl_session_has_attr (session,
3936                                                   VCL_SESS_ATTR_KEEPALIVE);
3937           *buflen = sizeof (int);
3938
3939           VDBG (2, "VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3940                 *(int *) buffer, *buflen);
3941         }
3942       else
3943         rv = VPPCOM_EINVAL;
3944       break;
3945
3946     case VPPCOM_ATTR_SET_KEEPALIVE:
3947       if (buffer && buflen && (*buflen == sizeof (int)))
3948         {
3949           /* VPP-TBD */
3950           if (*(int *) buffer)
3951             vcl_session_set_attr (session, VCL_SESS_ATTR_KEEPALIVE);
3952           else
3953             vcl_session_clear_attr (session, VCL_SESS_ATTR_KEEPALIVE);
3954
3955           VDBG (2, "VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3956                 vcl_session_has_attr (session, VCL_SESS_ATTR_KEEPALIVE),
3957                 *buflen);
3958         }
3959       else
3960         rv = VPPCOM_EINVAL;
3961       break;
3962
3963     case VPPCOM_ATTR_GET_TCP_NODELAY:
3964       if (buffer && buflen && (*buflen >= sizeof (int)))
3965         {
3966           /* VPP-TBD */
3967           *(int *) buffer = vcl_session_has_attr (session,
3968                                                   VCL_SESS_ATTR_TCP_NODELAY);
3969           *buflen = sizeof (int);
3970
3971           VDBG (2, "VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3972                 *(int *) buffer, *buflen);
3973         }
3974       else
3975         rv = VPPCOM_EINVAL;
3976       break;
3977
3978     case VPPCOM_ATTR_SET_TCP_NODELAY:
3979       if (buffer && buflen && (*buflen == sizeof (int)))
3980         {
3981           /* VPP-TBD */
3982           if (*(int *) buffer)
3983             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_NODELAY);
3984           else
3985             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_NODELAY);
3986
3987           VDBG (2, "VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3988                 vcl_session_has_attr (session, VCL_SESS_ATTR_TCP_NODELAY),
3989                 *buflen);
3990         }
3991       else
3992         rv = VPPCOM_EINVAL;
3993       break;
3994
3995     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
3996       if (buffer && buflen && (*buflen >= sizeof (int)))
3997         {
3998           /* VPP-TBD */
3999           *(int *) buffer = vcl_session_has_attr (session,
4000                                                   VCL_SESS_ATTR_TCP_KEEPIDLE);
4001           *buflen = sizeof (int);
4002
4003           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
4004                 *(int *) buffer, *buflen);
4005         }
4006       else
4007         rv = VPPCOM_EINVAL;
4008       break;
4009
4010     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
4011       if (buffer && buflen && (*buflen == sizeof (int)))
4012         {
4013           /* VPP-TBD */
4014           if (*(int *) buffer)
4015             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_KEEPIDLE);
4016           else
4017             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_KEEPIDLE);
4018
4019           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
4020                 vcl_session_has_attr (session,
4021                                       VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
4022         }
4023       else
4024         rv = VPPCOM_EINVAL;
4025       break;
4026
4027     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
4028       if (buffer && buflen && (*buflen >= sizeof (int)))
4029         {
4030           /* VPP-TBD */
4031           *(int *) buffer = vcl_session_has_attr (session,
4032                                                   VCL_SESS_ATTR_TCP_KEEPINTVL);
4033           *buflen = sizeof (int);
4034
4035           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
4036                 *(int *) buffer, *buflen);
4037         }
4038       else
4039         rv = VPPCOM_EINVAL;
4040       break;
4041
4042     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
4043       if (buffer && buflen && (*buflen == sizeof (int)))
4044         {
4045           /* VPP-TBD */
4046           if (*(int *) buffer)
4047             vcl_session_set_attr (session, VCL_SESS_ATTR_TCP_KEEPINTVL);
4048           else
4049             vcl_session_clear_attr (session, VCL_SESS_ATTR_TCP_KEEPINTVL);
4050
4051           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
4052                 vcl_session_has_attr (session,
4053                                       VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
4054         }
4055       else
4056         rv = VPPCOM_EINVAL;
4057       break;
4058
4059     case VPPCOM_ATTR_GET_TCP_USER_MSS:
4060       if (!(buffer && buflen && (*buflen >= sizeof (u32))))
4061         {
4062           rv = VPPCOM_EINVAL;
4063           break;
4064         }
4065
4066       tea.type = TRANSPORT_ENDPT_ATTR_MSS;
4067       tea.mss = *(u32 *) buffer;
4068       if (vcl_session_transport_attr (wrk, session, 1 /* is_get */, &tea))
4069         rv = VPPCOM_ENOPROTOOPT;
4070
4071       if (!rv)
4072         {
4073           *(u32 *) buffer = tea.mss;
4074           *buflen = sizeof (int);
4075         }
4076
4077       VDBG (2, "VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d", *(int *) buffer,
4078             *buflen);
4079       break;
4080     case VPPCOM_ATTR_SET_TCP_USER_MSS:
4081       if (!(buffer && buflen && (*buflen == sizeof (u32))))
4082         {
4083           rv = VPPCOM_EINVAL;
4084           break;
4085         }
4086
4087       tea.type = TRANSPORT_ENDPT_ATTR_MSS;
4088       tea.mss = *(u32 *) buffer;
4089       if (vcl_session_transport_attr (wrk, session, 0 /* is_get */, &tea))
4090         rv = VPPCOM_ENOPROTOOPT;
4091
4092       VDBG (2, "VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d", tea.mss,
4093             *buflen);
4094       break;
4095
4096     case VPPCOM_ATTR_SET_CONNECTED:
4097       session->flags |= VCL_SESSION_F_CONNECTED;
4098       break;
4099
4100     case VPPCOM_ATTR_SET_CKPAIR:
4101       if (!(buffer && buflen && (*buflen == sizeof (int))) ||
4102           !vcl_session_has_crypto (session))
4103         {
4104           rv = VPPCOM_EINVAL;
4105           break;
4106         }
4107       if (!session->ext_config)
4108         {
4109           vcl_session_alloc_ext_cfg (session, TRANSPORT_ENDPT_EXT_CFG_CRYPTO,
4110                                      sizeof (transport_endpt_ext_cfg_t));
4111         }
4112       else if (session->ext_config->type != TRANSPORT_ENDPT_EXT_CFG_CRYPTO)
4113         {
4114           rv = VPPCOM_EINVAL;
4115           break;
4116         }
4117
4118       session->ext_config->crypto.ckpair_index = *(uint32_t *) buffer;
4119       break;
4120
4121     case VPPCOM_ATTR_SET_VRF:
4122       if (!(buffer && buflen && (*buflen == sizeof (u32))))
4123         {
4124           rv = VPPCOM_EINVAL;
4125           break;
4126         }
4127       session->vrf = *(u32 *) buffer;
4128       break;
4129
4130     case VPPCOM_ATTR_GET_VRF:
4131       if (!(buffer && buflen && (*buflen >= sizeof (u32))))
4132         {
4133           rv = VPPCOM_EINVAL;
4134           break;
4135         }
4136       *(u32 *) buffer = session->vrf;
4137       *buflen = sizeof (u32);
4138       break;
4139
4140     case VPPCOM_ATTR_GET_DOMAIN:
4141       if (!(buffer && buflen && (*buflen >= sizeof (int))))
4142         {
4143           rv = VPPCOM_EINVAL;
4144           break;
4145         }
4146
4147       if (session->transport.is_ip4)
4148         *(int *) buffer = AF_INET;
4149       else
4150         *(int *) buffer = AF_INET6;
4151       *buflen = sizeof (int);
4152
4153       VDBG (2, "VPPCOM_ATTR_GET_DOMAIN: %d, buflen %u", *(int *) buffer,
4154             *buflen);
4155       break;
4156
4157     case VPPCOM_ATTR_SET_ENDPT_EXT_CFG:
4158       if (!(buffer && buflen && (*buflen > 0)))
4159         {
4160           rv = VPPCOM_EINVAL;
4161           break;
4162         }
4163       if (session->ext_config)
4164         {
4165           rv = VPPCOM_EINVAL;
4166           break;
4167         }
4168       vcl_session_alloc_ext_cfg (session, TRANSPORT_ENDPT_EXT_CFG_NONE,
4169                                  *buflen + sizeof (u32));
4170       clib_memcpy (session->ext_config->data, buffer, *buflen);
4171       session->ext_config->len = *buflen;
4172       break;
4173     case VPPCOM_ATTR_SET_IP_PKTINFO:
4174       if (buffer && buflen && (*buflen == sizeof (int)) &&
4175           !vcl_session_has_attr (session, VCL_SESS_ATTR_IP_PKTINFO))
4176         {
4177           if (*(int *) buffer)
4178             vcl_session_set_attr (session, VCL_SESS_ATTR_IP_PKTINFO);
4179           else
4180             vcl_session_clear_attr (session, VCL_SESS_ATTR_IP_PKTINFO);
4181
4182           VDBG (2, "VCL_SESS_ATTR_IP_PKTINFO: %d, buflen %d",
4183                 vcl_session_has_attr (session, VCL_SESS_ATTR_IP_PKTINFO),
4184                 *buflen);
4185         }
4186       else
4187         rv = VPPCOM_EINVAL;
4188       break;
4189
4190     case VPPCOM_ATTR_GET_IP_PKTINFO:
4191       if (buffer && buflen && (*buflen >= sizeof (int)))
4192         {
4193           *(int *) buffer =
4194             vcl_session_has_attr (session, VCL_SESS_ATTR_IP_PKTINFO);
4195           *buflen = sizeof (int);
4196
4197           VDBG (2, "VCL_SESS_ATTR_IP_PKTINFO: %d, buflen %d", *(int *) buffer,
4198                 *buflen);
4199         }
4200       else
4201         rv = VPPCOM_EINVAL;
4202       break;
4203
4204     default:
4205       rv = VPPCOM_EINVAL;
4206       break;
4207     }
4208
4209   return rv;
4210 }
4211
4212 int
4213 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
4214                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
4215 {
4216   vcl_worker_t *wrk = vcl_worker_get_current ();
4217   vcl_session_t *session;
4218   int rv = VPPCOM_OK;
4219
4220   if (flags == 0)
4221     rv = vppcom_session_read (session_handle, buffer, buflen);
4222   else if (flags & MSG_PEEK)
4223     rv = vppcom_session_peek (session_handle, buffer, buflen);
4224   else
4225     {
4226       VDBG (0, "Unsupport flags for recvfrom %d", flags);
4227       return VPPCOM_EAFNOSUPPORT;
4228     }
4229
4230   if (ep && rv > 0)
4231     {
4232       session = vcl_session_get_w_handle (wrk, session_handle);
4233       if (session->transport.is_ip4)
4234         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
4235                           sizeof (ip4_address_t));
4236       else
4237         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
4238                           sizeof (ip6_address_t));
4239       ep->is_ip4 = session->transport.is_ip4;
4240       ep->port = session->transport.rmt_port;
4241     }
4242
4243   return rv;
4244 }
4245
4246 static void
4247 vcl_handle_ep_app_tlvs (vcl_session_t *s, vppcom_endpt_t *ep)
4248 {
4249   vppcom_endpt_tlv_t *tlv = ep->app_tlvs;
4250
4251   do
4252     {
4253       switch (tlv->data_type)
4254         {
4255         case VCL_UDP_SEGMENT:
4256           s->gso_size = *(u16 *) tlv->data;
4257           break;
4258         case VCL_IP_PKTINFO:
4259           clib_memcpy_fast (&s->transport.lcl_ip, (ip4_address_t *) tlv->data,
4260                             sizeof (ip4_address_t));
4261           break;
4262         default:
4263           VDBG (0, "Ignorning unsupported app tlv %u", tlv->data_type);
4264           break;
4265         }
4266       tlv = VCL_EP_NEXT_APP_TLV (ep, tlv);
4267     }
4268   while (tlv);
4269 }
4270
4271 int
4272 vppcom_session_sendto (uint32_t session_handle, void *buffer,
4273                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
4274 {
4275   vcl_worker_t *wrk = vcl_worker_get_current ();
4276   vcl_session_t *s;
4277
4278   s = vcl_session_get_w_handle (wrk, session_handle);
4279   if (PREDICT_FALSE (!s))
4280     return VPPCOM_EBADFD;
4281
4282   if (ep)
4283     {
4284       if (!vcl_session_is_cl (s))
4285         return VPPCOM_EINVAL;
4286
4287       s->transport.is_ip4 = ep->is_ip4;
4288       s->transport.rmt_port = ep->port;
4289       vcl_ip_copy_from_ep (&s->transport.rmt_ip, ep);
4290
4291       if (ep->app_tlvs)
4292         vcl_handle_ep_app_tlvs (s, ep);
4293
4294       /* Session not connected/bound in vpp. Create it by 'connecting' it */
4295       if (PREDICT_FALSE (s->session_state == VCL_STATE_CLOSED))
4296         {
4297           u32 session_index = s->session_index;
4298           f64 timeout = vcm->cfg.session_timeout;
4299           int rv;
4300
4301           vcl_send_session_connect (wrk, s);
4302           rv = vppcom_wait_for_session_state_change (session_index,
4303                                                      VCL_STATE_READY,
4304                                                      timeout);
4305           if (rv < 0)
4306             return rv;
4307           s = vcl_session_get (wrk, session_index);
4308         }
4309     }
4310
4311   if (flags)
4312     {
4313       // TBD check the flags and do the right thing
4314       VDBG (2, "handling flags 0x%u (%d) not implemented yet.", flags, flags);
4315     }
4316
4317   return (vppcom_session_write_inline (wrk, s, buffer, buflen, 1,
4318                                        s->is_dgram ? 1 : 0));
4319 }
4320
4321 int
4322 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
4323 {
4324   vcl_worker_t *wrk = vcl_worker_get_current ();
4325   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
4326   u32 i, keep_trying = 1;
4327   svm_msg_q_msg_t msg;
4328   session_event_t *e;
4329   int rv, num_ev = 0;
4330
4331   VDBG (3, "vp %p, nsids %u, wait_for_time %f", vp, n_sids, wait_for_time);
4332
4333   if (!vp)
4334     return VPPCOM_EFAULT;
4335
4336   do
4337     {
4338       vcl_session_t *session;
4339
4340       /* Dequeue all events and drop all unhandled io events */
4341       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
4342         {
4343           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
4344           vcl_handle_mq_event (wrk, e);
4345           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
4346         }
4347       vec_reset_length (wrk->unhandled_evts_vector);
4348
4349       for (i = 0; i < n_sids; i++)
4350         {
4351           session = vcl_session_get (wrk, vp[i].sh);
4352           if (!session)
4353             {
4354               vp[i].revents = POLLHUP;
4355               num_ev++;
4356               continue;
4357             }
4358
4359           vp[i].revents = 0;
4360
4361           if (POLLIN & vp[i].events)
4362             {
4363               rv = vcl_session_read_ready (session);
4364               if (rv > 0)
4365                 {
4366                   vp[i].revents |= POLLIN;
4367                   num_ev++;
4368                 }
4369               else if (rv < 0)
4370                 {
4371                   switch (rv)
4372                     {
4373                     case VPPCOM_ECONNRESET:
4374                       vp[i].revents = POLLHUP;
4375                       break;
4376
4377                     default:
4378                       vp[i].revents = POLLERR;
4379                       break;
4380                     }
4381                   num_ev++;
4382                 }
4383             }
4384
4385           if (POLLOUT & vp[i].events)
4386             {
4387               rv = vcl_session_write_ready (session);
4388               if (rv > 0)
4389                 {
4390                   vp[i].revents |= POLLOUT;
4391                   num_ev++;
4392                 }
4393               else if (rv < 0)
4394                 {
4395                   switch (rv)
4396                     {
4397                     case VPPCOM_ECONNRESET:
4398                       vp[i].revents = POLLHUP;
4399                       break;
4400
4401                     default:
4402                       vp[i].revents = POLLERR;
4403                       break;
4404                     }
4405                   num_ev++;
4406                 }
4407             }
4408
4409           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
4410             {
4411               vp[i].revents = POLLNVAL;
4412               num_ev++;
4413             }
4414         }
4415       if (wait_for_time != -1)
4416         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
4417     }
4418   while ((num_ev == 0) && keep_trying);
4419
4420   return num_ev;
4421 }
4422
4423 int
4424 vppcom_mq_epoll_fd (void)
4425 {
4426   vcl_worker_t *wrk = vcl_worker_get_current ();
4427   return wrk->mqs_epfd;
4428 }
4429
4430 int
4431 vppcom_session_index (vcl_session_handle_t session_handle)
4432 {
4433   return session_handle & 0xFFFFFF;
4434 }
4435
4436 int
4437 vppcom_session_worker (vcl_session_handle_t session_handle)
4438 {
4439   return session_handle >> 24;
4440 }
4441
4442 int
4443 vppcom_worker_register (void)
4444 {
4445   if (!vcl_worker_alloc_and_init ())
4446     return VPPCOM_EEXIST;
4447
4448   if (vcl_worker_register_with_vpp ())
4449     return VPPCOM_EEXIST;
4450
4451   return VPPCOM_OK;
4452 }
4453
4454 void
4455 vppcom_worker_unregister (void)
4456 {
4457   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
4458   vcl_set_worker_index (~0);
4459 }
4460
4461 void
4462 vppcom_worker_index_set (int index)
4463 {
4464   vcl_set_worker_index (index);
4465 }
4466
4467 int
4468 vppcom_worker_index (void)
4469 {
4470   return vcl_get_worker_index ();
4471 }
4472
4473 int
4474 vppcom_worker_mqs_epfd (void)
4475 {
4476   vcl_worker_t *wrk = vcl_worker_get_current ();
4477   if (!vcm->cfg.use_mq_eventfd)
4478     return -1;
4479   return wrk->mqs_epfd;
4480 }
4481
4482 int
4483 vppcom_session_is_connectable_listener (uint32_t session_handle)
4484 {
4485   vcl_session_t *session;
4486   vcl_worker_t *wrk = vcl_worker_get_current ();
4487   session = vcl_session_get_w_handle (wrk, session_handle);
4488   if (!session)
4489     return VPPCOM_EBADFD;
4490   return vcl_session_is_connectable_listener (wrk, session);
4491 }
4492
4493 int
4494 vppcom_session_listener (uint32_t session_handle)
4495 {
4496   vcl_worker_t *wrk = vcl_worker_get_current ();
4497   vcl_session_t *listen_session, *session;
4498   session = vcl_session_get_w_handle (wrk, session_handle);
4499   if (!session)
4500     return VPPCOM_EBADFD;
4501   if (session->listener_index == VCL_INVALID_SESSION_INDEX)
4502     return VPPCOM_EBADFD;
4503   listen_session = vcl_session_get_w_handle (wrk, session->listener_index);
4504   if (!listen_session)
4505     return VPPCOM_EBADFD;
4506   return vcl_session_handle (listen_session);
4507 }
4508
4509 int
4510 vppcom_session_n_accepted (uint32_t session_handle)
4511 {
4512   vcl_worker_t *wrk = vcl_worker_get_current ();
4513   vcl_session_t *session = vcl_session_get_w_handle (wrk, session_handle);
4514   if (!session)
4515     return VPPCOM_EBADFD;
4516   return session->n_accepted_sessions;
4517 }
4518
4519 const char *
4520 vppcom_proto_str (vppcom_proto_t proto)
4521 {
4522   char const *proto_str;
4523
4524   switch (proto)
4525     {
4526     case VPPCOM_PROTO_TCP:
4527       proto_str = "TCP";
4528       break;
4529     case VPPCOM_PROTO_UDP:
4530       proto_str = "UDP";
4531       break;
4532     case VPPCOM_PROTO_TLS:
4533       proto_str = "TLS";
4534       break;
4535     case VPPCOM_PROTO_QUIC:
4536       proto_str = "QUIC";
4537       break;
4538     case VPPCOM_PROTO_DTLS:
4539       proto_str = "DTLS";
4540       break;
4541     case VPPCOM_PROTO_SRTP:
4542       proto_str = "SRTP";
4543       break;
4544     default:
4545       proto_str = "UNKNOWN";
4546       break;
4547     }
4548   return proto_str;
4549 }
4550
4551 const char *
4552 vppcom_retval_str (int retval)
4553 {
4554   char const *st;
4555
4556   switch (retval)
4557     {
4558     case VPPCOM_OK:
4559       st = "VPPCOM_OK";
4560       break;
4561
4562     case VPPCOM_EAGAIN:
4563       st = "VPPCOM_EAGAIN";
4564       break;
4565
4566     case VPPCOM_EFAULT:
4567       st = "VPPCOM_EFAULT";
4568       break;
4569
4570     case VPPCOM_ENOMEM:
4571       st = "VPPCOM_ENOMEM";
4572       break;
4573
4574     case VPPCOM_EINVAL:
4575       st = "VPPCOM_EINVAL";
4576       break;
4577
4578     case VPPCOM_EBADFD:
4579       st = "VPPCOM_EBADFD";
4580       break;
4581
4582     case VPPCOM_EAFNOSUPPORT:
4583       st = "VPPCOM_EAFNOSUPPORT";
4584       break;
4585
4586     case VPPCOM_ECONNABORTED:
4587       st = "VPPCOM_ECONNABORTED";
4588       break;
4589
4590     case VPPCOM_ECONNRESET:
4591       st = "VPPCOM_ECONNRESET";
4592       break;
4593
4594     case VPPCOM_ENOTCONN:
4595       st = "VPPCOM_ENOTCONN";
4596       break;
4597
4598     case VPPCOM_ECONNREFUSED:
4599       st = "VPPCOM_ECONNREFUSED";
4600       break;
4601
4602     case VPPCOM_ETIMEDOUT:
4603       st = "VPPCOM_ETIMEDOUT";
4604       break;
4605
4606     case VPPCOM_EADDRINUSE:
4607       st = "VPPCOM_EADDRINUSE";
4608       break;
4609
4610     default:
4611       st = "UNKNOWN_STATE";
4612       break;
4613     }
4614
4615   return st;
4616 }
4617
4618 int
4619 vppcom_add_cert_key_pair (vppcom_cert_key_pair_t *ckpair)
4620 {
4621   if (vcm->cfg.vpp_app_socket_api)
4622     return vcl_sapi_add_cert_key_pair (ckpair);
4623   else
4624     return vcl_bapi_add_cert_key_pair (ckpair);
4625 }
4626
4627 int
4628 vppcom_del_cert_key_pair (uint32_t ckpair_index)
4629 {
4630   if (vcm->cfg.vpp_app_socket_api)
4631     return vcl_sapi_del_cert_key_pair (ckpair_index);
4632   else
4633     return vcl_bapi_del_cert_key_pair (ckpair_index);
4634 }
4635
4636 int
4637 vppcom_session_get_error (uint32_t session_handle)
4638 {
4639   vcl_worker_t *wrk = vcl_worker_get_current ();
4640   vcl_session_t *session = 0;
4641
4642   session = vcl_session_get_w_handle (wrk, session_handle);
4643   if (!session)
4644     return VPPCOM_EBADFD;
4645
4646   if (PREDICT_FALSE (session->flags & VCL_SESSION_F_IS_VEP))
4647     {
4648       VWRN ("epoll session %u! will not have connect", session->session_index);
4649       return VPPCOM_EBADFD;
4650     }
4651
4652   if (session->vpp_error == SESSION_E_PORTINUSE)
4653     return VPPCOM_EADDRINUSE;
4654   else if (session->vpp_error == SESSION_E_REFUSED)
4655     return VPPCOM_ECONNREFUSED;
4656   else if (session->vpp_error != SESSION_E_NONE)
4657     return VPPCOM_EFAULT;
4658   else
4659     return VPPCOM_OK;
4660 }
4661
4662 int
4663 vppcom_worker_is_detached (void)
4664 {
4665   vcl_worker_t *wrk = vcl_worker_get_current ();
4666
4667   if (!vcm->cfg.use_mq_eventfd)
4668     return VPPCOM_ENOTSUP;
4669
4670   return wrk->api_client_handle == ~0;
4671 }
4672
4673 /*
4674  * fd.io coding-style-patch-verification: ON
4675  *
4676  * Local Variables:
4677  * eval: (c-set-style "gnu")
4678  * End:
4679  */