vcl: fix nonblocking accept with >1 event in the queue
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <vcl/vppcom.h>
19 #include <vcl/vcl_debug.h>
20 #include <vcl/vcl_private.h>
21 #include <svm/fifo_segment.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static int
26 vcl_wait_for_segment (u64 segment_handle)
27 {
28   vcl_worker_t *wrk = vcl_worker_get_current ();
29   u32 wait_for_seconds = 10, segment_index;
30   f64 timeout;
31
32   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
33     return 0;
34
35   timeout = clib_time_now (&wrk->clib_time) + wait_for_seconds;
36   while (clib_time_now (&wrk->clib_time) < timeout)
37     {
38       segment_index = vcl_segment_table_lookup (segment_handle);
39       if (segment_index != VCL_INVALID_SEGMENT_INDEX)
40         return 0;
41       usleep (10);
42     }
43   return 1;
44 }
45
46 static inline int
47 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq, u32 n_max_msg)
48 {
49   svm_msg_q_msg_t *msg;
50   u32 n_msgs;
51   int i;
52
53   n_msgs = clib_min (svm_msg_q_size (mq), n_max_msg);
54   for (i = 0; i < n_msgs; i++)
55     {
56       vec_add2 (wrk->mq_msg_vector, msg, 1);
57       svm_msg_q_sub_w_lock (mq, msg);
58     }
59   return n_msgs;
60 }
61
62 const char *
63 vppcom_session_state_str (vcl_session_state_t state)
64 {
65   char *st;
66
67   switch (state)
68     {
69     case STATE_START:
70       st = "STATE_START";
71       break;
72
73     case STATE_CONNECT:
74       st = "STATE_CONNECT";
75       break;
76
77     case STATE_LISTEN:
78       st = "STATE_LISTEN";
79       break;
80
81     case STATE_ACCEPT:
82       st = "STATE_ACCEPT";
83       break;
84
85     case STATE_VPP_CLOSING:
86       st = "STATE_VPP_CLOSING";
87       break;
88
89     case STATE_DISCONNECT:
90       st = "STATE_DISCONNECT";
91       break;
92
93     case STATE_FAILED:
94       st = "STATE_FAILED";
95       break;
96
97     case STATE_UPDATED:
98       st = "STATE_UPDATED";
99       break;
100
101     case STATE_LISTEN_NO_MQ:
102       st = "STATE_LISTEN_NO_MQ";
103       break;
104
105     default:
106       st = "UNKNOWN_STATE";
107       break;
108     }
109
110   return st;
111 }
112
113 u8 *
114 format_ip4_address (u8 * s, va_list * args)
115 {
116   u8 *a = va_arg (*args, u8 *);
117   return format (s, "%d.%d.%d.%d", a[0], a[1], a[2], a[3]);
118 }
119
120 u8 *
121 format_ip6_address (u8 * s, va_list * args)
122 {
123   ip6_address_t *a = va_arg (*args, ip6_address_t *);
124   u32 i, i_max_n_zero, max_n_zeros, i_first_zero, n_zeros, last_double_colon;
125
126   i_max_n_zero = ARRAY_LEN (a->as_u16);
127   max_n_zeros = 0;
128   i_first_zero = i_max_n_zero;
129   n_zeros = 0;
130   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
131     {
132       u32 is_zero = a->as_u16[i] == 0;
133       if (is_zero && i_first_zero >= ARRAY_LEN (a->as_u16))
134         {
135           i_first_zero = i;
136           n_zeros = 0;
137         }
138       n_zeros += is_zero;
139       if ((!is_zero && n_zeros > max_n_zeros)
140           || (i + 1 >= ARRAY_LEN (a->as_u16) && n_zeros > max_n_zeros))
141         {
142           i_max_n_zero = i_first_zero;
143           max_n_zeros = n_zeros;
144           i_first_zero = ARRAY_LEN (a->as_u16);
145           n_zeros = 0;
146         }
147     }
148
149   last_double_colon = 0;
150   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
151     {
152       if (i == i_max_n_zero && max_n_zeros > 1)
153         {
154           s = format (s, "::");
155           i += max_n_zeros - 1;
156           last_double_colon = 1;
157         }
158       else
159         {
160           s = format (s, "%s%x",
161                       (last_double_colon || i == 0) ? "" : ":",
162                       clib_net_to_host_u16 (a->as_u16[i]));
163           last_double_colon = 0;
164         }
165     }
166
167   return s;
168 }
169
170 /* Format an IP46 address. */
171 u8 *
172 format_ip46_address (u8 * s, va_list * args)
173 {
174   ip46_address_t *ip46 = va_arg (*args, ip46_address_t *);
175   ip46_type_t type = va_arg (*args, ip46_type_t);
176   int is_ip4 = 1;
177
178   switch (type)
179     {
180     case IP46_TYPE_ANY:
181       is_ip4 = ip46_address_is_ip4 (ip46);
182       break;
183     case IP46_TYPE_IP4:
184       is_ip4 = 1;
185       break;
186     case IP46_TYPE_IP6:
187       is_ip4 = 0;
188       break;
189     }
190
191   return is_ip4 ?
192     format (s, "%U", format_ip4_address, &ip46->ip4) :
193     format (s, "%U", format_ip6_address, &ip46->ip6);
194 }
195
196 /*
197  * VPPCOM Utility Functions
198  */
199
200 static void
201 vcl_send_session_listen (vcl_worker_t * wrk, vcl_session_t * s)
202 {
203   app_session_evt_t _app_evt, *app_evt = &_app_evt;
204   session_listen_msg_t *mp;
205   svm_msg_q_t *mq;
206
207   mq = vcl_worker_ctrl_mq (wrk);
208   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_LISTEN);
209   mp = (session_listen_msg_t *) app_evt->evt->data;
210   memset (mp, 0, sizeof (*mp));
211   mp->client_index = wrk->my_client_index;
212   mp->context = s->session_index;
213   mp->wrk_index = wrk->vpp_wrk_index;
214   mp->is_ip4 = s->transport.is_ip4;
215   clib_memcpy_fast (&mp->ip, &s->transport.lcl_ip, sizeof (mp->ip));
216   mp->port = s->transport.lcl_port;
217   mp->proto = s->session_type;
218   app_send_ctrl_evt_to_vpp (mq, app_evt);
219 }
220
221 static void
222 vcl_send_session_connect (vcl_worker_t * wrk, vcl_session_t * s)
223 {
224   app_session_evt_t _app_evt, *app_evt = &_app_evt;
225   session_connect_msg_t *mp;
226   svm_msg_q_t *mq;
227
228   mq = vcl_worker_ctrl_mq (wrk);
229   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_CONNECT);
230   mp = (session_connect_msg_t *) app_evt->evt->data;
231   memset (mp, 0, sizeof (*mp));
232   mp->client_index = wrk->my_client_index;
233   mp->context = s->session_index;
234   mp->wrk_index = wrk->vpp_wrk_index;
235   mp->is_ip4 = s->transport.is_ip4;
236   mp->parent_handle = s->parent_handle;
237   clib_memcpy_fast (&mp->ip, &s->transport.rmt_ip, sizeof (mp->ip));
238   clib_memcpy_fast (&mp->lcl_ip, &s->transport.lcl_ip, sizeof (mp->lcl_ip));
239   mp->port = s->transport.rmt_port;
240   mp->proto = s->session_type;
241   app_send_ctrl_evt_to_vpp (mq, app_evt);
242 }
243
244 void
245 vcl_send_session_unlisten (vcl_worker_t * wrk, vcl_session_t * s)
246 {
247   app_session_evt_t _app_evt, *app_evt = &_app_evt;
248   session_unlisten_msg_t *mp;
249   svm_msg_q_t *mq;
250
251   mq = vcl_worker_ctrl_mq (wrk);
252   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_UNLISTEN);
253   mp = (session_unlisten_msg_t *) app_evt->evt->data;
254   memset (mp, 0, sizeof (*mp));
255   mp->client_index = wrk->my_client_index;
256   mp->wrk_index = wrk->vpp_wrk_index;
257   mp->handle = s->vpp_handle;
258   mp->context = wrk->wrk_index;
259   app_send_ctrl_evt_to_vpp (mq, app_evt);
260 }
261
262 static void
263 vcl_send_session_disconnect (vcl_worker_t * wrk, vcl_session_t * s)
264 {
265   app_session_evt_t _app_evt, *app_evt = &_app_evt;
266   session_disconnect_msg_t *mp;
267   svm_msg_q_t *mq;
268
269   /* Send to thread that owns the session */
270   mq = s->vpp_evt_q;
271   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_DISCONNECT);
272   mp = (session_disconnect_msg_t *) app_evt->evt->data;
273   memset (mp, 0, sizeof (*mp));
274   mp->client_index = wrk->my_client_index;
275   mp->handle = s->vpp_handle;
276   app_send_ctrl_evt_to_vpp (mq, app_evt);
277 }
278
279 static void
280 vcl_send_app_detach (vcl_worker_t * wrk)
281 {
282   app_session_evt_t _app_evt, *app_evt = &_app_evt;
283   session_app_detach_msg_t *mp;
284   svm_msg_q_t *mq;
285
286   mq = vcl_worker_ctrl_mq (wrk);
287   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_DETACH);
288   mp = (session_app_detach_msg_t *) app_evt->evt->data;
289   memset (mp, 0, sizeof (*mp));
290   mp->client_index = wrk->my_client_index;
291   app_send_ctrl_evt_to_vpp (mq, app_evt);
292 }
293
294 static void
295 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
296                                  session_handle_t handle, int retval)
297 {
298   app_session_evt_t _app_evt, *app_evt = &_app_evt;
299   session_accepted_reply_msg_t *rmp;
300   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
301   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
302   rmp->handle = handle;
303   rmp->context = context;
304   rmp->retval = retval;
305   app_send_ctrl_evt_to_vpp (mq, app_evt);
306 }
307
308 static void
309 vcl_send_session_disconnected_reply (svm_msg_q_t * mq, u32 context,
310                                      session_handle_t handle, int retval)
311 {
312   app_session_evt_t _app_evt, *app_evt = &_app_evt;
313   session_disconnected_reply_msg_t *rmp;
314   app_alloc_ctrl_evt_to_vpp (mq, app_evt,
315                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
316   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
317   rmp->handle = handle;
318   rmp->context = context;
319   rmp->retval = retval;
320   app_send_ctrl_evt_to_vpp (mq, app_evt);
321 }
322
323 static void
324 vcl_send_session_reset_reply (svm_msg_q_t * mq, u32 context,
325                               session_handle_t handle, int retval)
326 {
327   app_session_evt_t _app_evt, *app_evt = &_app_evt;
328   session_reset_reply_msg_t *rmp;
329   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_RESET_REPLY);
330   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
331   rmp->handle = handle;
332   rmp->context = context;
333   rmp->retval = retval;
334   app_send_ctrl_evt_to_vpp (mq, app_evt);
335 }
336
337 void
338 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
339                                 u32 wrk_index)
340 {
341   app_session_evt_t _app_evt, *app_evt = &_app_evt;
342   session_worker_update_msg_t *mp;
343   svm_msg_q_t *mq;
344
345   mq = vcl_session_vpp_evt_q (wrk, s);
346   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_WORKER_UPDATE);
347   mp = (session_worker_update_msg_t *) app_evt->evt->data;
348   mp->client_index = wrk->my_client_index;
349   mp->handle = s->vpp_handle;
350   mp->req_wrk_index = wrk->vpp_wrk_index;
351   mp->wrk_index = wrk_index;
352   app_send_ctrl_evt_to_vpp (mq, app_evt);
353 }
354
355 static u32
356 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp,
357                               u32 ls_index)
358 {
359   vcl_session_t *session, *listen_session;
360   svm_fifo_t *rx_fifo, *tx_fifo;
361   u32 vpp_wrk_index;
362   svm_msg_q_t *evt_q;
363
364   session = vcl_session_alloc (wrk);
365
366   listen_session = vcl_session_get (wrk, ls_index);
367   if (listen_session->vpp_handle != mp->listener_handle)
368     {
369       VDBG (0, "ERROR: listener handle %lu does not match session %u",
370             mp->listener_handle, ls_index);
371       goto error;
372     }
373
374   if (vcl_wait_for_segment (mp->segment_handle))
375     {
376       VDBG (0, "ERROR: segment for session %u couldn't be mounted!",
377             session->session_index);
378       goto error;
379     }
380
381   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
382   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
383   session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
384                                          svm_msg_q_t *);
385   rx_fifo->client_session_index = session->session_index;
386   tx_fifo->client_session_index = session->session_index;
387   rx_fifo->client_thread_index = vcl_get_worker_index ();
388   tx_fifo->client_thread_index = vcl_get_worker_index ();
389   vpp_wrk_index = tx_fifo->master_thread_index;
390   vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
391   wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
392
393   session->vpp_handle = mp->handle;
394   session->vpp_thread_index = rx_fifo->master_thread_index;
395   session->rx_fifo = rx_fifo;
396   session->tx_fifo = tx_fifo;
397
398   session->session_state = STATE_ACCEPT;
399   session->transport.rmt_port = mp->rmt.port;
400   session->transport.is_ip4 = mp->rmt.is_ip4;
401   clib_memcpy_fast (&session->transport.rmt_ip, &mp->rmt.ip,
402                     sizeof (ip46_address_t));
403
404   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
405   session->transport.lcl_port = listen_session->transport.lcl_port;
406   session->transport.lcl_ip = listen_session->transport.lcl_ip;
407   session->session_type = listen_session->session_type;
408   session->is_dgram = vcl_proto_is_dgram (session->session_type);
409   session->listener_index = listen_session->session_index;
410   listen_session->n_accepted_sessions++;
411
412   VDBG (1, "session %u [0x%llx]: client accept request from %s address %U"
413         " port %d queue %p!", session->session_index, mp->handle,
414         mp->rmt.is_ip4 ? "IPv4" : "IPv6", format_ip46_address, &mp->rmt.ip,
415         mp->rmt.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
416         clib_net_to_host_u16 (mp->rmt.port), session->vpp_evt_q);
417   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
418
419   vcl_send_session_accepted_reply (session->vpp_evt_q, mp->context,
420                                    session->vpp_handle, 0);
421
422   return session->session_index;
423
424 error:
425   evt_q = uword_to_pointer (mp->vpp_event_queue_address, svm_msg_q_t *);
426   vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
427                                    VNET_API_ERROR_INVALID_ARGUMENT);
428   vcl_session_free (wrk, session);
429   return VCL_INVALID_SESSION_INDEX;
430 }
431
432 static u32
433 vcl_session_connected_handler (vcl_worker_t * wrk,
434                                session_connected_msg_t * mp)
435 {
436   u32 session_index, vpp_wrk_index;
437   svm_fifo_t *rx_fifo, *tx_fifo;
438   vcl_session_t *session = 0;
439
440   session_index = mp->context;
441   session = vcl_session_get (wrk, session_index);
442   if (!session)
443     {
444       VDBG (0, "ERROR: vpp handle 0x%llx has no session index (%u)!",
445             mp->handle, session_index);
446       return VCL_INVALID_SESSION_INDEX;
447     }
448   if (mp->retval)
449     {
450       VDBG (0, "ERROR: session index %u: connect failed! %U",
451             session_index, format_api_error, ntohl (mp->retval));
452       session->session_state = STATE_FAILED | STATE_DISCONNECT;
453       session->vpp_handle = mp->handle;
454       return session_index;
455     }
456
457   session->vpp_handle = mp->handle;
458   session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
459                                          svm_msg_q_t *);
460   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
461   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
462   if (vcl_wait_for_segment (mp->segment_handle))
463     {
464       VDBG (0, "segment for session %u couldn't be mounted!",
465             session->session_index);
466       session->session_state = STATE_FAILED | STATE_DISCONNECT;
467       vcl_send_session_disconnect (wrk, session);
468       return session_index;
469     }
470
471   rx_fifo->client_session_index = session_index;
472   tx_fifo->client_session_index = session_index;
473   rx_fifo->client_thread_index = vcl_get_worker_index ();
474   tx_fifo->client_thread_index = vcl_get_worker_index ();
475
476   vpp_wrk_index = tx_fifo->master_thread_index;
477   vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
478   wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
479
480   if (mp->ct_rx_fifo)
481     {
482       session->ct_rx_fifo = uword_to_pointer (mp->ct_rx_fifo, svm_fifo_t *);
483       session->ct_tx_fifo = uword_to_pointer (mp->ct_tx_fifo, svm_fifo_t *);
484       if (vcl_wait_for_segment (mp->ct_segment_handle))
485         {
486           VDBG (0, "ct segment for session %u couldn't be mounted!",
487                 session->session_index);
488           session->session_state = STATE_FAILED | STATE_DISCONNECT;
489           vcl_send_session_disconnect (wrk, session);
490           return session_index;
491         }
492     }
493
494   session->rx_fifo = rx_fifo;
495   session->tx_fifo = tx_fifo;
496   session->vpp_thread_index = rx_fifo->master_thread_index;
497   session->transport.is_ip4 = mp->lcl.is_ip4;
498   clib_memcpy_fast (&session->transport.lcl_ip, &mp->lcl.ip,
499                     sizeof (session->transport.lcl_ip));
500   session->transport.lcl_port = mp->lcl.port;
501   session->session_state = STATE_CONNECT;
502
503   /* Add it to lookup table */
504   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
505
506   VDBG (1, "session %u [0x%llx] connected! rx_fifo %p, refcnt %d, tx_fifo %p,"
507         " refcnt %d", session_index, mp->handle, session->rx_fifo,
508         session->rx_fifo->refcnt, session->tx_fifo, session->tx_fifo->refcnt);
509
510   return session_index;
511 }
512
513 static int
514 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
515 {
516   vcl_session_msg_t *accepted_msg;
517   int i;
518
519   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
520     {
521       accepted_msg = &session->accept_evts_fifo[i];
522       if (accepted_msg->accepted_msg.handle == handle)
523         {
524           accepted_msg->flags |= flags;
525           return 1;
526         }
527     }
528   return 0;
529 }
530
531 static u32
532 vcl_session_reset_handler (vcl_worker_t * wrk,
533                            session_reset_msg_t * reset_msg)
534 {
535   vcl_session_t *session;
536   u32 sid;
537
538   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
539   session = vcl_session_get (wrk, sid);
540   if (!session)
541     {
542       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
543       return VCL_INVALID_SESSION_INDEX;
544     }
545
546   /* Caught a reset before actually accepting the session */
547   if (session->session_state == STATE_LISTEN)
548     {
549
550       if (!vcl_flag_accepted_session (session, reset_msg->handle,
551                                       VCL_ACCEPTED_F_RESET))
552         VDBG (0, "session was not accepted!");
553       return VCL_INVALID_SESSION_INDEX;
554     }
555
556   session->session_state = STATE_DISCONNECT;
557   VDBG (0, "reset session %u [0x%llx]", sid, reset_msg->handle);
558   return sid;
559 }
560
561 static u32
562 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
563 {
564   vcl_session_t *session;
565   u32 sid = mp->context;
566
567   session = vcl_session_get (wrk, sid);
568   if (mp->retval)
569     {
570       VERR ("session %u [0x%llx]: bind failed: %U", sid, mp->handle,
571             format_api_error, mp->retval);
572       if (session)
573         {
574           session->session_state = STATE_FAILED;
575           session->vpp_handle = mp->handle;
576           return sid;
577         }
578       else
579         {
580           VDBG (0, "ERROR: session %u [0x%llx]: Invalid session index!",
581                 sid, mp->handle);
582           return VCL_INVALID_SESSION_INDEX;
583         }
584     }
585
586   session->vpp_handle = mp->handle;
587   session->transport.is_ip4 = mp->lcl_is_ip4;
588   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
589                     sizeof (ip46_address_t));
590   session->transport.lcl_port = mp->lcl_port;
591   vcl_session_table_add_listener (wrk, mp->handle, sid);
592   session->session_state = STATE_LISTEN;
593
594   session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
595   vec_validate (wrk->vpp_event_queues, 0);
596   wrk->vpp_event_queues[0] = session->vpp_evt_q;
597
598   if (session->is_dgram)
599     {
600       svm_fifo_t *rx_fifo, *tx_fifo;
601       session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
602       rx_fifo = uword_to_pointer (mp->rx_fifo, svm_fifo_t *);
603       rx_fifo->client_session_index = sid;
604       tx_fifo = uword_to_pointer (mp->tx_fifo, svm_fifo_t *);
605       tx_fifo->client_session_index = sid;
606       session->rx_fifo = rx_fifo;
607       session->tx_fifo = tx_fifo;
608     }
609
610   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
611   return sid;
612 }
613
614 static void
615 vcl_session_unlisten_reply_handler (vcl_worker_t * wrk, void *data)
616 {
617   session_unlisten_reply_msg_t *mp = (session_unlisten_reply_msg_t *) data;
618   vcl_session_t *s;
619
620   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
621   if (!s || s->session_state != STATE_DISCONNECT)
622     {
623       VDBG (0, "Unlisten reply with wrong handle %llx", mp->handle);
624       return;
625     }
626
627   if (mp->retval)
628     VDBG (0, "ERROR: session %u [0xllx]: unlisten failed: %U",
629           s->session_index, mp->handle, format_api_error, ntohl (mp->retval));
630
631   if (mp->context != wrk->wrk_index)
632     VDBG (0, "wrong context");
633
634   vcl_session_table_del_vpp_handle (wrk, mp->handle);
635   vcl_session_free (wrk, s);
636 }
637
638 static vcl_session_t *
639 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
640 {
641   vcl_session_msg_t *vcl_msg;
642   vcl_session_t *session;
643
644   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
645   if (PREDICT_FALSE (session != 0))
646     VWRN ("session overlap handle %lu state %u!", msg->handle,
647           session->session_state);
648
649   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
650   if (!session)
651     {
652       VERR ("couldn't find listen session: listener handle %llx",
653             msg->listener_handle);
654       return 0;
655     }
656
657   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
658   vcl_msg->accepted_msg = *msg;
659   /* Session handle points to listener until fully accepted by app */
660   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
661
662   return session;
663 }
664
665 static vcl_session_t *
666 vcl_session_disconnected_handler (vcl_worker_t * wrk,
667                                   session_disconnected_msg_t * msg)
668 {
669   vcl_session_t *session;
670
671   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
672   if (!session)
673     {
674       VDBG (0, "request to disconnect unknown handle 0x%llx", msg->handle);
675       return 0;
676     }
677
678   /* Caught a disconnect before actually accepting the session */
679   if (session->session_state == STATE_LISTEN)
680     {
681       if (!vcl_flag_accepted_session (session, msg->handle,
682                                       VCL_ACCEPTED_F_CLOSED))
683         VDBG (0, "session was not accepted!");
684       return 0;
685     }
686
687   session->session_state = STATE_VPP_CLOSING;
688   return session;
689 }
690
691 static void
692 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
693 {
694   session_req_worker_update_msg_t *msg;
695   vcl_session_t *s;
696
697   msg = (session_req_worker_update_msg_t *) data;
698   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
699   if (!s)
700     return;
701
702   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
703 }
704
705 static void
706 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
707 {
708   session_worker_update_reply_msg_t *msg;
709   vcl_session_t *s;
710
711   msg = (session_worker_update_reply_msg_t *) data;
712   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
713   if (!s)
714     {
715       VDBG (0, "unknown handle 0x%llx", msg->handle);
716       return;
717     }
718   if (vcl_wait_for_segment (msg->segment_handle))
719     {
720       clib_warning ("segment for session %u couldn't be mounted!",
721                     s->session_index);
722       return;
723     }
724
725   if (s->rx_fifo)
726     {
727       s->rx_fifo = uword_to_pointer (msg->rx_fifo, svm_fifo_t *);
728       s->tx_fifo = uword_to_pointer (msg->tx_fifo, svm_fifo_t *);
729       s->rx_fifo->client_session_index = s->session_index;
730       s->tx_fifo->client_session_index = s->session_index;
731       s->rx_fifo->client_thread_index = wrk->wrk_index;
732       s->tx_fifo->client_thread_index = wrk->wrk_index;
733     }
734   s->session_state = STATE_UPDATED;
735
736   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
737         s->vpp_handle, wrk->wrk_index);
738 }
739
740 static int
741 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
742 {
743   session_disconnected_msg_t *disconnected_msg;
744   vcl_session_t *session;
745
746   switch (e->event_type)
747     {
748     case SESSION_IO_EVT_RX:
749     case SESSION_IO_EVT_TX:
750       session = vcl_session_get (wrk, e->session_index);
751       if (!session || !(session->session_state & STATE_OPEN))
752         break;
753       vec_add1 (wrk->unhandled_evts_vector, *e);
754       break;
755     case SESSION_CTRL_EVT_ACCEPTED:
756       vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
757       break;
758     case SESSION_CTRL_EVT_CONNECTED:
759       vcl_session_connected_handler (wrk,
760                                      (session_connected_msg_t *) e->data);
761       break;
762     case SESSION_CTRL_EVT_DISCONNECTED:
763       disconnected_msg = (session_disconnected_msg_t *) e->data;
764       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
765       if (!session)
766         break;
767       VDBG (0, "disconnected session %u [0x%llx]", session->session_index,
768             session->vpp_handle);
769       break;
770     case SESSION_CTRL_EVT_RESET:
771       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
772       break;
773     case SESSION_CTRL_EVT_BOUND:
774       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
775       break;
776     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
777       vcl_session_unlisten_reply_handler (wrk, e->data);
778       break;
779     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
780       vcl_session_req_worker_update_handler (wrk, e->data);
781       break;
782     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
783       vcl_session_worker_update_reply_handler (wrk, e->data);
784       break;
785     default:
786       clib_warning ("unhandled %u", e->event_type);
787     }
788   return VPPCOM_OK;
789 }
790
791 static int
792 vppcom_wait_for_session_state_change (u32 session_index,
793                                       vcl_session_state_t state,
794                                       f64 wait_for_time)
795 {
796   vcl_worker_t *wrk = vcl_worker_get_current ();
797   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
798   vcl_session_t *volatile session;
799   svm_msg_q_msg_t msg;
800   session_event_t *e;
801
802   do
803     {
804       session = vcl_session_get (wrk, session_index);
805       if (PREDICT_FALSE (!session))
806         {
807           return VPPCOM_EBADFD;
808         }
809       if (session->session_state & state)
810         {
811           return VPPCOM_OK;
812         }
813       if (session->session_state & STATE_FAILED)
814         {
815           return VPPCOM_ECONNREFUSED;
816         }
817
818       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
819         {
820           usleep (100);
821           continue;
822         }
823       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
824       vcl_handle_mq_event (wrk, e);
825       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
826     }
827   while (clib_time_now (&wrk->clib_time) < timeout);
828
829   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
830         vppcom_session_state_str (state));
831   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
832
833   return VPPCOM_ETIMEDOUT;
834 }
835
836 static void
837 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
838 {
839   vcl_session_state_t state;
840   vcl_session_t *s;
841   u32 *sip;
842
843   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
844     return;
845
846   vec_foreach (sip, wrk->pending_session_wrk_updates)
847   {
848     s = vcl_session_get (wrk, *sip);
849     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
850     state = s->session_state;
851     vppcom_wait_for_session_state_change (s->session_index, STATE_UPDATED, 5);
852     s->session_state = state;
853   }
854   vec_reset_length (wrk->pending_session_wrk_updates);
855 }
856
857 void
858 vcl_flush_mq_events (void)
859 {
860   vcl_worker_t *wrk = vcl_worker_get_current ();
861   svm_msg_q_msg_t *msg;
862   session_event_t *e;
863   svm_msg_q_t *mq;
864   int i;
865
866   mq = wrk->app_event_queue;
867   svm_msg_q_lock (mq);
868   vcl_mq_dequeue_batch (wrk, mq, ~0);
869   svm_msg_q_unlock (mq);
870
871   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
872     {
873       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
874       e = svm_msg_q_msg_data (mq, msg);
875       vcl_handle_mq_event (wrk, e);
876       svm_msg_q_free_msg (mq, msg);
877     }
878   vec_reset_length (wrk->mq_msg_vector);
879   vcl_handle_pending_wrk_updates (wrk);
880 }
881
882 static int
883 vppcom_app_session_enable (void)
884 {
885   int rv;
886
887   if (vcm->app_state != STATE_APP_ENABLED)
888     {
889       vppcom_send_session_enable_disable (1 /* is_enabled == TRUE */ );
890       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
891       if (PREDICT_FALSE (rv))
892         {
893           VDBG (0, "application session enable timed out! returning %d (%s)",
894                 rv, vppcom_retval_str (rv));
895           return rv;
896         }
897     }
898   return VPPCOM_OK;
899 }
900
901 static int
902 vppcom_app_attach (void)
903 {
904   int rv;
905
906   vppcom_app_send_attach ();
907   rv = vcl_wait_for_app_state_change (STATE_APP_ATTACHED);
908   if (PREDICT_FALSE (rv))
909     {
910       VDBG (0, "application attach timed out! returning %d (%s)", rv,
911             vppcom_retval_str (rv));
912       return rv;
913     }
914
915   return VPPCOM_OK;
916 }
917
918 static int
919 vppcom_session_unbind (u32 session_handle)
920 {
921   vcl_worker_t *wrk = vcl_worker_get_current ();
922   session_accepted_msg_t *accepted_msg;
923   vcl_session_t *session = 0;
924   vcl_session_msg_t *evt;
925
926   session = vcl_session_get_w_handle (wrk, session_handle);
927   if (!session)
928     return VPPCOM_EBADFD;
929
930   /* Flush pending accept events, if any */
931   while (clib_fifo_elts (session->accept_evts_fifo))
932     {
933       clib_fifo_sub2 (session->accept_evts_fifo, evt);
934       accepted_msg = &evt->accepted_msg;
935       vcl_session_table_del_vpp_handle (wrk, accepted_msg->handle);
936       vcl_send_session_accepted_reply (session->vpp_evt_q,
937                                        accepted_msg->context,
938                                        session->vpp_handle, -1);
939     }
940   clib_fifo_free (session->accept_evts_fifo);
941
942   vcl_send_session_unlisten (wrk, session);
943
944   VDBG (1, "session %u [0x%llx]: sending unbind!", session->session_index,
945         session->vpp_handle);
946   vcl_evt (VCL_EVT_UNBIND, session);
947
948   session->vpp_handle = ~0;
949   session->session_state = STATE_DISCONNECT;
950
951   return VPPCOM_OK;
952 }
953
954 static int
955 vppcom_session_disconnect (u32 session_handle)
956 {
957   vcl_worker_t *wrk = vcl_worker_get_current ();
958   svm_msg_q_t *vpp_evt_q;
959   vcl_session_t *session, *listen_session;
960   vcl_session_state_t state;
961   u64 vpp_handle;
962
963   session = vcl_session_get_w_handle (wrk, session_handle);
964   if (!session)
965     return VPPCOM_EBADFD;
966
967   vpp_handle = session->vpp_handle;
968   state = session->session_state;
969
970   VDBG (1, "session %u [0x%llx] state 0x%x (%s)", session->session_index,
971         vpp_handle, state, vppcom_session_state_str (state));
972
973   if (PREDICT_FALSE (state & STATE_LISTEN))
974     {
975       VDBG (0, "ERROR: Cannot disconnect a listen socket!");
976       return VPPCOM_EBADFD;
977     }
978
979   if (state & STATE_VPP_CLOSING)
980     {
981       vpp_evt_q = vcl_session_vpp_evt_q (wrk, session);
982       vcl_send_session_disconnected_reply (vpp_evt_q, wrk->my_client_index,
983                                            vpp_handle, 0);
984       VDBG (1, "session %u [0x%llx]: sending disconnect REPLY...",
985             session->session_index, vpp_handle);
986     }
987   else
988     {
989       VDBG (1, "session %u [0x%llx]: sending disconnect...",
990             session->session_index, vpp_handle);
991       vcl_send_session_disconnect (wrk, session);
992     }
993
994   if (session->listener_index != VCL_INVALID_SESSION_INDEX)
995     {
996       listen_session = vcl_session_get (wrk, session->listener_index);
997       listen_session->n_accepted_sessions--;
998     }
999
1000   return VPPCOM_OK;
1001 }
1002
1003 /**
1004  * Handle app exit
1005  *
1006  * Notify vpp of the disconnect and mark the worker as free. If we're the
1007  * last worker, do a full cleanup otherwise, since we're probably a forked
1008  * child, avoid syscalls as much as possible. We might've lost privileges.
1009  */
1010 void
1011 vppcom_app_exit (void)
1012 {
1013   if (!pool_elts (vcm->workers))
1014     return;
1015   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1016   vcl_set_worker_index (~0);
1017   vcl_elog_stop (vcm);
1018   if (vec_len (vcm->workers) == 1)
1019     vppcom_disconnect_from_vpp ();
1020   else
1021     vl_client_send_disconnect (1 /* vpp should cleanup */ );
1022 }
1023
1024 /*
1025  * VPPCOM Public API functions
1026  */
1027 int
1028 vppcom_app_create (char *app_name)
1029 {
1030   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
1031   int rv;
1032
1033   if (vcm->is_init)
1034     {
1035       VDBG (1, "already initialized");
1036       return VPPCOM_EEXIST;
1037     }
1038
1039   vcm->is_init = 1;
1040   vppcom_cfg (&vcm->cfg);
1041   vcl_cfg = &vcm->cfg;
1042
1043   vcm->main_cpu = pthread_self ();
1044   vcm->main_pid = getpid ();
1045   vcm->app_name = format (0, "%s", app_name);
1046   vppcom_init_error_string_table ();
1047   fifo_segment_main_init (&vcm->segment_main, vcl_cfg->segment_baseva,
1048                           20 /* timeout in secs */ );
1049   pool_alloc (vcm->workers, vcl_cfg->max_workers);
1050   clib_spinlock_init (&vcm->workers_lock);
1051   clib_rwlock_init (&vcm->segment_table_lock);
1052   atexit (vppcom_app_exit);
1053
1054   /* Allocate default worker */
1055   vcl_worker_alloc_and_init ();
1056
1057   /* API hookup and connect to VPP */
1058   vppcom_api_hookup ();
1059   vcl_elog_init (vcm);
1060   vcm->app_state = STATE_APP_START;
1061   rv = vppcom_connect_to_vpp (app_name);
1062   if (rv)
1063     {
1064       VERR ("couldn't connect to VPP!");
1065       return rv;
1066     }
1067   VDBG (0, "sending session enable");
1068   rv = vppcom_app_session_enable ();
1069   if (rv)
1070     {
1071       VERR ("vppcom_app_session_enable() failed!");
1072       return rv;
1073     }
1074
1075   VDBG (0, "sending app attach");
1076   rv = vppcom_app_attach ();
1077   if (rv)
1078     {
1079       VERR ("vppcom_app_attach() failed!");
1080       return rv;
1081     }
1082
1083   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
1084         vcm->workers[0].my_client_index, vcm->workers[0].my_client_index);
1085
1086   return VPPCOM_OK;
1087 }
1088
1089 void
1090 vppcom_app_destroy (void)
1091 {
1092   int rv;
1093   f64 orig_app_timeout;
1094
1095   if (!pool_elts (vcm->workers))
1096     return;
1097
1098   vcl_evt (VCL_EVT_DETACH, vcm);
1099
1100   if (pool_elts (vcm->workers) == 1)
1101     {
1102       vcl_send_app_detach (vcl_worker_get_current ());
1103       orig_app_timeout = vcm->cfg.app_timeout;
1104       vcm->cfg.app_timeout = 2.0;
1105       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
1106       vcm->cfg.app_timeout = orig_app_timeout;
1107       if (PREDICT_FALSE (rv))
1108         VDBG (0, "application detach timed out! returning %d (%s)", rv,
1109               vppcom_retval_str (rv));
1110       vec_free (vcm->app_name);
1111       vcl_worker_cleanup (vcl_worker_get_current (), 0 /* notify vpp */ );
1112     }
1113   else
1114     {
1115       vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1116     }
1117
1118   vcl_set_worker_index (~0);
1119   vcl_elog_stop (vcm);
1120   vl_client_disconnect_from_vlib ();
1121 }
1122
1123 int
1124 vppcom_session_create (u8 proto, u8 is_nonblocking)
1125 {
1126   vcl_worker_t *wrk = vcl_worker_get_current ();
1127   vcl_session_t *session;
1128
1129   session = vcl_session_alloc (wrk);
1130
1131   session->session_type = proto;
1132   session->session_state = STATE_START;
1133   session->vpp_handle = ~0;
1134   session->is_dgram = vcl_proto_is_dgram (proto);
1135
1136   if (is_nonblocking)
1137     VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
1138
1139   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1140            is_nonblocking, session_index);
1141
1142   VDBG (0, "created session %u", session->session_index);
1143
1144   return vcl_session_handle (session);
1145 }
1146
1147 int
1148 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * session,
1149                      vcl_session_handle_t sh, u8 do_disconnect)
1150 {
1151   vcl_session_state_t state;
1152   u32 next_sh, vep_sh;
1153   int rv = VPPCOM_OK;
1154   u64 vpp_handle;
1155   u8 is_vep;
1156
1157   is_vep = session->is_vep;
1158   next_sh = session->vep.next_sh;
1159   vep_sh = session->vep.vep_sh;
1160   state = session->session_state;
1161   vpp_handle = session->vpp_handle;
1162
1163   VDBG (1, "session %u [0x%llx] closing", session->session_index, vpp_handle);
1164
1165   if (is_vep)
1166     {
1167       while (next_sh != ~0)
1168         {
1169           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1170           if (PREDICT_FALSE (rv < 0))
1171             VDBG (0, "vpp handle 0x%llx, sh %u: EPOLL_CTL_DEL vep_idx %u"
1172                   " failed! rv %d (%s)", vpp_handle, next_sh, vep_sh, rv,
1173                   vppcom_retval_str (rv));
1174
1175           next_sh = session->vep.next_sh;
1176         }
1177     }
1178   else
1179     {
1180       if (session->is_vep_session)
1181         {
1182           rv = vppcom_epoll_ctl (vep_sh, EPOLL_CTL_DEL, sh, 0);
1183           if (rv < 0)
1184             VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1185                   "failed! rv %d (%s)", session->session_index, vpp_handle,
1186                   vep_sh, rv, vppcom_retval_str (rv));
1187         }
1188
1189       if (!do_disconnect)
1190         {
1191           VDBG (1, "session %u [0x%llx] disconnect skipped",
1192                 session->session_index, vpp_handle);
1193           goto cleanup;
1194         }
1195
1196       if (state & STATE_LISTEN)
1197         {
1198           rv = vppcom_session_unbind (sh);
1199           if (PREDICT_FALSE (rv < 0))
1200             VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1201                   "rv %d (%s)", session->session_index, vpp_handle, rv,
1202                   vppcom_retval_str (rv));
1203           return rv;
1204         }
1205       else if ((state & STATE_OPEN)
1206                || (vcl_session_is_connectable_listener (wrk, session)))
1207         {
1208           rv = vppcom_session_disconnect (sh);
1209           if (PREDICT_FALSE (rv < 0))
1210             VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1211                   " rv %d (%s)", session->session_index, vpp_handle,
1212                   rv, vppcom_retval_str (rv));
1213         }
1214       else if (state == STATE_DISCONNECT)
1215         {
1216           svm_msg_q_t *mq = vcl_session_vpp_evt_q (wrk, session);
1217           vcl_send_session_reset_reply (mq, wrk->my_client_index,
1218                                         session->vpp_handle, 0);
1219         }
1220     }
1221
1222   VDBG (0, "session %u [0x%llx] removed", session->session_index, vpp_handle);
1223
1224 cleanup:
1225   vcl_session_table_del_vpp_handle (wrk, vpp_handle);
1226   vcl_session_free (wrk, session);
1227   vcl_evt (VCL_EVT_CLOSE, session, rv);
1228
1229   return rv;
1230 }
1231
1232 int
1233 vppcom_session_close (uint32_t session_handle)
1234 {
1235   vcl_worker_t *wrk = vcl_worker_get_current ();
1236   vcl_session_t *session;
1237
1238   session = vcl_session_get_w_handle (wrk, session_handle);
1239   if (!session)
1240     return VPPCOM_EBADFD;
1241   return vcl_session_cleanup (wrk, session, session_handle,
1242                               1 /* do_disconnect */ );
1243 }
1244
1245 int
1246 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1247 {
1248   vcl_worker_t *wrk = vcl_worker_get_current ();
1249   vcl_session_t *session = 0;
1250
1251   if (!ep || !ep->ip)
1252     return VPPCOM_EINVAL;
1253
1254   session = vcl_session_get_w_handle (wrk, session_handle);
1255   if (!session)
1256     return VPPCOM_EBADFD;
1257
1258   if (session->is_vep)
1259     {
1260       VDBG (0, "ERROR: cannot bind to epoll session %u!",
1261             session->session_index);
1262       return VPPCOM_EBADFD;
1263     }
1264
1265   session->transport.is_ip4 = ep->is_ip4;
1266   if (ep->is_ip4)
1267     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1268                       sizeof (ip4_address_t));
1269   else
1270     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1271                       sizeof (ip6_address_t));
1272   session->transport.lcl_port = ep->port;
1273
1274   VDBG (0, "session %u handle %u: binding to local %s address %U port %u, "
1275         "proto %s", session->session_index, session_handle,
1276         session->transport.is_ip4 ? "IPv4" : "IPv6",
1277         format_ip46_address, &session->transport.lcl_ip,
1278         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1279         clib_net_to_host_u16 (session->transport.lcl_port),
1280         vppcom_proto_str (session->session_type));
1281   vcl_evt (VCL_EVT_BIND, session);
1282
1283   if (session->session_type == VPPCOM_PROTO_UDP)
1284     vppcom_session_listen (session_handle, 10);
1285
1286   return VPPCOM_OK;
1287 }
1288
1289 int
1290 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1291 {
1292   vcl_worker_t *wrk = vcl_worker_get_current ();
1293   vcl_session_t *listen_session = 0;
1294   u64 listen_vpp_handle;
1295   int rv;
1296
1297   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1298   if (!listen_session || listen_session->is_vep)
1299     return VPPCOM_EBADFD;
1300
1301   if (q_len == 0 || q_len == ~0)
1302     q_len = vcm->cfg.listen_queue_size;
1303
1304   listen_vpp_handle = listen_session->vpp_handle;
1305   if (listen_session->session_state & STATE_LISTEN)
1306     {
1307       VDBG (0, "session %u [0x%llx]: already in listen state!",
1308             listen_sh, listen_vpp_handle);
1309       return VPPCOM_OK;
1310     }
1311
1312   VDBG (0, "session %u: sending vpp listen request...", listen_sh);
1313
1314   /*
1315    * Send listen request to vpp and wait for reply
1316    */
1317   vcl_send_session_listen (wrk, listen_session);
1318   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1319                                              STATE_LISTEN,
1320                                              vcm->cfg.session_timeout);
1321
1322   if (PREDICT_FALSE (rv))
1323     {
1324       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1325       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1326             listen_sh, listen_session->vpp_handle, rv,
1327             vppcom_retval_str (rv));
1328       return rv;
1329     }
1330
1331   return VPPCOM_OK;
1332 }
1333
1334 int
1335 vppcom_session_tls_add_cert (uint32_t session_handle, char *cert,
1336                              uint32_t cert_len)
1337 {
1338
1339   vcl_worker_t *wrk = vcl_worker_get_current ();
1340   vcl_session_t *session = 0;
1341
1342   session = vcl_session_get_w_handle (wrk, session_handle);
1343   if (!session)
1344     return VPPCOM_EBADFD;
1345
1346   if (cert_len == 0 || cert_len == ~0)
1347     return VPPCOM_EBADFD;
1348
1349   /*
1350    * Send listen request to vpp and wait for reply
1351    */
1352   vppcom_send_application_tls_cert_add (session, cert, cert_len);
1353   vcm->app_state = STATE_APP_ADDING_TLS_DATA;
1354   vcl_wait_for_app_state_change (STATE_APP_READY);
1355   return VPPCOM_OK;
1356
1357 }
1358
1359 int
1360 vppcom_session_tls_add_key (uint32_t session_handle, char *key,
1361                             uint32_t key_len)
1362 {
1363
1364   vcl_worker_t *wrk = vcl_worker_get_current ();
1365   vcl_session_t *session = 0;
1366
1367   session = vcl_session_get_w_handle (wrk, session_handle);
1368   if (!session)
1369     return VPPCOM_EBADFD;
1370
1371   if (key_len == 0 || key_len == ~0)
1372     return VPPCOM_EBADFD;
1373
1374   vppcom_send_application_tls_key_add (session, key, key_len);
1375   vcm->app_state = STATE_APP_ADDING_TLS_DATA;
1376   vcl_wait_for_app_state_change (STATE_APP_READY);
1377   return VPPCOM_OK;
1378 }
1379
1380 static int
1381 validate_args_session_accept_ (vcl_worker_t * wrk, vcl_session_t * ls)
1382 {
1383   if (ls->is_vep)
1384     {
1385       VDBG (0, "ERROR: cannot accept on epoll session %u!",
1386             ls->session_index);
1387       return VPPCOM_EBADFD;
1388     }
1389
1390   if ((ls->session_state != STATE_LISTEN)
1391       && (!vcl_session_is_connectable_listener (wrk, ls)))
1392     {
1393       VDBG (0,
1394             "ERROR: session [0x%llx]: not in listen state! state 0x%x"
1395             " (%s)", ls->vpp_handle, ls->session_state,
1396             vppcom_session_state_str (ls->session_state));
1397       return VPPCOM_EBADFD;
1398     }
1399   return VPPCOM_OK;
1400 }
1401
1402 int
1403 vppcom_unformat_proto (uint8_t * proto, char *proto_str)
1404 {
1405   if (!strcmp (proto_str, "TCP"))
1406     *proto = VPPCOM_PROTO_TCP;
1407   else if (!strcmp (proto_str, "tcp"))
1408     *proto = VPPCOM_PROTO_TCP;
1409   else if (!strcmp (proto_str, "UDP"))
1410     *proto = VPPCOM_PROTO_UDP;
1411   else if (!strcmp (proto_str, "udp"))
1412     *proto = VPPCOM_PROTO_UDP;
1413   else if (!strcmp (proto_str, "UDPC"))
1414     *proto = VPPCOM_PROTO_UDPC;
1415   else if (!strcmp (proto_str, "udpc"))
1416     *proto = VPPCOM_PROTO_UDPC;
1417   else if (!strcmp (proto_str, "SCTP"))
1418     *proto = VPPCOM_PROTO_SCTP;
1419   else if (!strcmp (proto_str, "sctp"))
1420     *proto = VPPCOM_PROTO_SCTP;
1421   else if (!strcmp (proto_str, "TLS"))
1422     *proto = VPPCOM_PROTO_TLS;
1423   else if (!strcmp (proto_str, "tls"))
1424     *proto = VPPCOM_PROTO_TLS;
1425   else if (!strcmp (proto_str, "QUIC"))
1426     *proto = VPPCOM_PROTO_QUIC;
1427   else if (!strcmp (proto_str, "quic"))
1428     *proto = VPPCOM_PROTO_QUIC;
1429   else
1430     return 1;
1431   return 0;
1432 }
1433
1434 int
1435 vppcom_session_accept (uint32_t listen_session_handle, vppcom_endpt_t * ep,
1436                        uint32_t flags)
1437 {
1438   u32 client_session_index = ~0, listen_session_index, accept_flags = 0;
1439   vcl_worker_t *wrk = vcl_worker_get_current ();
1440   session_accepted_msg_t accepted_msg;
1441   vcl_session_t *listen_session = 0;
1442   vcl_session_t *client_session = 0;
1443   vcl_session_msg_t *evt;
1444   svm_msg_q_msg_t msg;
1445   session_event_t *e;
1446   u8 is_nonblocking;
1447   int rv;
1448
1449   listen_session = vcl_session_get_w_handle (wrk, listen_session_handle);
1450   if (!listen_session)
1451     return VPPCOM_EBADFD;
1452
1453   listen_session_index = listen_session->session_index;
1454   if ((rv = validate_args_session_accept_ (wrk, listen_session)))
1455     return rv;
1456
1457   if (clib_fifo_elts (listen_session->accept_evts_fifo))
1458     {
1459       clib_fifo_sub2 (listen_session->accept_evts_fifo, evt);
1460       accept_flags = evt->flags;
1461       accepted_msg = evt->accepted_msg;
1462       goto handle;
1463     }
1464
1465   is_nonblocking = VCL_SESS_ATTR_TEST (listen_session->attr,
1466                                        VCL_SESS_ATTR_NONBLOCK);
1467   while (1)
1468     {
1469       if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1470         return VPPCOM_EAGAIN;
1471
1472       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_WAIT, 0))
1473         return VPPCOM_EAGAIN;
1474
1475       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1476       if (e->event_type != SESSION_CTRL_EVT_ACCEPTED)
1477         {
1478           VDBG (0, "discarded event: %u", e->event_type);
1479           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1480           continue;
1481         }
1482       clib_memcpy_fast (&accepted_msg, e->data, sizeof (accepted_msg));
1483       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1484       break;
1485     }
1486
1487 handle:
1488
1489   client_session_index = vcl_session_accepted_handler (wrk, &accepted_msg,
1490                                                        listen_session_index);
1491   if (client_session_index == VCL_INVALID_SESSION_INDEX)
1492     return VPPCOM_ECONNABORTED;
1493
1494   listen_session = vcl_session_get (wrk, listen_session_index);
1495   client_session = vcl_session_get (wrk, client_session_index);
1496
1497   if (flags & O_NONBLOCK)
1498     VCL_SESS_ATTR_SET (client_session->attr, VCL_SESS_ATTR_NONBLOCK);
1499
1500   VDBG (1, "listener %u [0x%llx]: Got a connect request! session %u [0x%llx],"
1501         " flags %d, is_nonblocking %u", listen_session->session_index,
1502         listen_session->vpp_handle, client_session_index,
1503         client_session->vpp_handle, flags,
1504         VCL_SESS_ATTR_TEST (client_session->attr, VCL_SESS_ATTR_NONBLOCK));
1505
1506   if (ep)
1507     {
1508       ep->is_ip4 = client_session->transport.is_ip4;
1509       ep->port = client_session->transport.rmt_port;
1510       if (client_session->transport.is_ip4)
1511         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1512                           sizeof (ip4_address_t));
1513       else
1514         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1515                           sizeof (ip6_address_t));
1516     }
1517
1518   VDBG (0, "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1519         "local: %U:%u", listen_session_handle, listen_session->vpp_handle,
1520         client_session_index, client_session->vpp_handle,
1521         format_ip46_address, &client_session->transport.rmt_ip,
1522         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1523         clib_net_to_host_u16 (client_session->transport.rmt_port),
1524         format_ip46_address, &client_session->transport.lcl_ip,
1525         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1526         clib_net_to_host_u16 (client_session->transport.lcl_port));
1527   vcl_evt (VCL_EVT_ACCEPT, client_session, listen_session,
1528            client_session_index);
1529
1530   /*
1531    * Session might have been closed already
1532    */
1533   if (accept_flags)
1534     {
1535       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1536         client_session->session_state = STATE_VPP_CLOSING;
1537       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1538         client_session->session_state = STATE_DISCONNECT;
1539     }
1540   return vcl_session_handle (client_session);
1541 }
1542
1543 static void
1544 vcl_ip_copy_from_ep (ip46_address_t * ip, vppcom_endpt_t * ep)
1545 {
1546   if (ep->is_ip4)
1547     clib_memcpy_fast (&ip->ip4, ep->ip, sizeof (ip4_address_t));
1548   else
1549     clib_memcpy_fast (&ip->ip6, ep->ip, sizeof (ip6_address_t));
1550 }
1551
1552 void
1553 vcl_ip_copy_to_ep (ip46_address_t * ip, vppcom_endpt_t * ep, u8 is_ip4)
1554 {
1555   ep->is_ip4 = is_ip4;
1556   if (is_ip4)
1557     clib_memcpy_fast (ep->ip, &ip->ip4, sizeof (ip4_address_t));
1558   else
1559     clib_memcpy_fast (ep->ip, &ip->ip6, sizeof (ip6_address_t));
1560 }
1561
1562 int
1563 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1564 {
1565   vcl_worker_t *wrk = vcl_worker_get_current ();
1566   vcl_session_t *session = 0;
1567   u32 session_index;
1568   int rv;
1569
1570   session = vcl_session_get_w_handle (wrk, session_handle);
1571   if (!session)
1572     return VPPCOM_EBADFD;
1573   session_index = session->session_index;
1574
1575   if (PREDICT_FALSE (session->is_vep))
1576     {
1577       VDBG (0, "ERROR: cannot connect epoll session %u!",
1578             session->session_index);
1579       return VPPCOM_EBADFD;
1580     }
1581
1582   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1583     {
1584       VDBG (0, "session handle %u [0x%llx]: session already "
1585             "connected to %s %U port %d proto %s, state 0x%x (%s)",
1586             session_handle, session->vpp_handle,
1587             session->transport.is_ip4 ? "IPv4" : "IPv6", format_ip46_address,
1588             &session->transport.rmt_ip, session->transport.is_ip4 ?
1589             IP46_TYPE_IP4 : IP46_TYPE_IP6,
1590             clib_net_to_host_u16 (session->transport.rmt_port),
1591             vppcom_proto_str (session->session_type), session->session_state,
1592             vppcom_session_state_str (session->session_state));
1593       return VPPCOM_OK;
1594     }
1595
1596   session->transport.is_ip4 = server_ep->is_ip4;
1597   vcl_ip_copy_from_ep (&session->transport.rmt_ip, server_ep);
1598   session->transport.rmt_port = server_ep->port;
1599   session->parent_handle = VCL_INVALID_SESSION_HANDLE;
1600
1601   VDBG (0, "session handle %u: connecting to server %s %U "
1602         "port %d proto %s", session_handle,
1603         session->transport.is_ip4 ? "IPv4" : "IPv6",
1604         format_ip46_address,
1605         &session->transport.rmt_ip, session->transport.is_ip4 ?
1606         IP46_TYPE_IP4 : IP46_TYPE_IP6,
1607         clib_net_to_host_u16 (session->transport.rmt_port),
1608         vppcom_proto_str (session->session_type));
1609
1610   vcl_send_session_connect (wrk, session);
1611
1612   if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK))
1613     return VPPCOM_EINPROGRESS;
1614
1615   /*
1616    * Wait for reply from vpp if blocking
1617    */
1618   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1619                                              vcm->cfg.session_timeout);
1620
1621   session = vcl_session_get (wrk, session_index);
1622   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1623         session->vpp_handle, rv ? "failed" : "succeeded");
1624
1625   return rv;
1626 }
1627
1628 int
1629 vppcom_session_stream_connect (uint32_t session_handle,
1630                                uint32_t parent_session_handle)
1631 {
1632   vcl_worker_t *wrk = vcl_worker_get_current ();
1633   vcl_session_t *session, *parent_session;
1634   u32 session_index, parent_session_index;
1635   int rv;
1636
1637   session = vcl_session_get_w_handle (wrk, session_handle);
1638   if (!session)
1639     return VPPCOM_EBADFD;
1640   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1641   if (!parent_session)
1642     return VPPCOM_EBADFD;
1643
1644   session_index = session->session_index;
1645   parent_session_index = parent_session->session_index;
1646   if (PREDICT_FALSE (session->is_vep))
1647     {
1648       VDBG (0, "ERROR: cannot connect epoll session %u!",
1649             session->session_index);
1650       return VPPCOM_EBADFD;
1651     }
1652
1653   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1654     {
1655       VDBG (0, "session handle %u [0x%llx]: session already "
1656             "connected to session %u [0x%llx] proto %s, state 0x%x (%s)",
1657             session_handle, session->vpp_handle,
1658             parent_session_handle, parent_session->vpp_handle,
1659             vppcom_proto_str (session->session_type), session->session_state,
1660             vppcom_session_state_str (session->session_state));
1661       return VPPCOM_OK;
1662     }
1663
1664   /* Connect to quic session specifics */
1665   session->transport.is_ip4 = parent_session->transport.is_ip4;
1666   session->transport.rmt_ip.ip4.as_u32 = (uint32_t) 1;
1667   session->transport.rmt_port = 0;
1668   session->parent_handle = parent_session->vpp_handle;
1669
1670   VDBG (0, "session handle %u: connecting to session %u [0x%llx]",
1671         session_handle, parent_session_handle, parent_session->vpp_handle);
1672
1673   /*
1674    * Send connect request and wait for reply from vpp
1675    */
1676   vcl_send_session_connect (wrk, session);
1677   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1678                                              vcm->cfg.session_timeout);
1679
1680   session->listener_index = parent_session_index;
1681   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1682   if (parent_session)
1683     parent_session->n_accepted_sessions++;
1684
1685   session = vcl_session_get (wrk, session_index);
1686   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1687         session->vpp_handle, rv ? "failed" : "succeeded");
1688
1689   return rv;
1690 }
1691
1692 static u8
1693 vcl_is_rx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1694 {
1695   return (e->event_type == SESSION_IO_EVT_RX && e->session_index == sid);
1696 }
1697
1698 static inline int
1699 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
1700                               u8 peek)
1701 {
1702   vcl_worker_t *wrk = vcl_worker_get_current ();
1703   int n_read = 0, is_nonblocking;
1704   vcl_session_t *s = 0;
1705   svm_fifo_t *rx_fifo;
1706   svm_msg_q_msg_t msg;
1707   session_event_t *e;
1708   svm_msg_q_t *mq;
1709   u8 is_ct;
1710
1711   if (PREDICT_FALSE (!buf))
1712     return VPPCOM_EINVAL;
1713
1714   s = vcl_session_get_w_handle (wrk, session_handle);
1715   if (PREDICT_FALSE (!s || s->is_vep))
1716     return VPPCOM_EBADFD;
1717
1718   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1719     {
1720       VDBG (0, "session %u[0x%llx] is not open! state 0x%x (%s)",
1721             s->session_index, s->vpp_handle, s->session_state,
1722             vppcom_session_state_str (s->session_state));
1723       return vcl_session_closed_error (s);
1724     }
1725
1726   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1727   is_ct = vcl_session_is_ct (s);
1728   mq = wrk->app_event_queue;
1729   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
1730   s->has_rx_evt = 0;
1731
1732   if (svm_fifo_is_empty_cons (rx_fifo))
1733     {
1734       if (is_nonblocking)
1735         {
1736           svm_fifo_unset_event (s->rx_fifo);
1737           return VPPCOM_EWOULDBLOCK;
1738         }
1739       while (svm_fifo_is_empty_cons (rx_fifo))
1740         {
1741           if (vcl_session_is_closing (s))
1742             return vcl_session_closing_error (s);
1743
1744           svm_fifo_unset_event (s->rx_fifo);
1745           svm_msg_q_lock (mq);
1746           if (svm_msg_q_is_empty (mq))
1747             svm_msg_q_wait (mq);
1748
1749           svm_msg_q_sub_w_lock (mq, &msg);
1750           e = svm_msg_q_msg_data (mq, &msg);
1751           svm_msg_q_unlock (mq);
1752           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1753             vcl_handle_mq_event (wrk, e);
1754           svm_msg_q_free_msg (mq, &msg);
1755         }
1756     }
1757
1758   if (s->is_dgram)
1759     n_read = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
1760   else
1761     n_read = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
1762
1763   if (svm_fifo_is_empty_cons (rx_fifo))
1764     svm_fifo_unset_event (s->rx_fifo);
1765
1766   /* Cut-through sessions might request tx notifications on rx fifos */
1767   if (PREDICT_FALSE (rx_fifo->want_deq_ntf))
1768     {
1769       app_send_io_evt_to_vpp (s->vpp_evt_q, s->rx_fifo->master_session_index,
1770                               SESSION_IO_EVT_RX, SVM_Q_WAIT);
1771       svm_fifo_reset_has_deq_ntf (s->rx_fifo);
1772     }
1773
1774   VDBG (2, "session %u[0x%llx]: read %d bytes from (%p)", s->session_index,
1775         s->vpp_handle, n_read, rx_fifo);
1776
1777   return n_read;
1778 }
1779
1780 int
1781 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
1782 {
1783   return (vppcom_session_read_internal (session_handle, buf, n, 0));
1784 }
1785
1786 static int
1787 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
1788 {
1789   return (vppcom_session_read_internal (session_handle, buf, n, 1));
1790 }
1791
1792 int
1793 vppcom_session_read_segments (uint32_t session_handle,
1794                               vppcom_data_segments_t ds)
1795 {
1796   vcl_worker_t *wrk = vcl_worker_get_current ();
1797   int n_read = 0, is_nonblocking;
1798   vcl_session_t *s = 0;
1799   svm_fifo_t *rx_fifo;
1800   svm_msg_q_msg_t msg;
1801   session_event_t *e;
1802   svm_msg_q_t *mq;
1803   u8 is_ct;
1804
1805   s = vcl_session_get_w_handle (wrk, session_handle);
1806   if (PREDICT_FALSE (!s || s->is_vep))
1807     return VPPCOM_EBADFD;
1808
1809   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1810     return vcl_session_closed_error (s);
1811
1812   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1813   is_ct = vcl_session_is_ct (s);
1814   mq = is_ct ? s->our_evt_q : wrk->app_event_queue;
1815   rx_fifo = s->rx_fifo;
1816   s->has_rx_evt = 0;
1817
1818   if (is_ct)
1819     svm_fifo_unset_event (s->rx_fifo);
1820
1821   if (svm_fifo_is_empty_cons (rx_fifo))
1822     {
1823       if (is_nonblocking)
1824         {
1825           svm_fifo_unset_event (rx_fifo);
1826           return VPPCOM_EWOULDBLOCK;
1827         }
1828       while (svm_fifo_is_empty_cons (rx_fifo))
1829         {
1830           if (vcl_session_is_closing (s))
1831             return vcl_session_closing_error (s);
1832
1833           svm_fifo_unset_event (rx_fifo);
1834           svm_msg_q_lock (mq);
1835           if (svm_msg_q_is_empty (mq))
1836             svm_msg_q_wait (mq);
1837
1838           svm_msg_q_sub_w_lock (mq, &msg);
1839           e = svm_msg_q_msg_data (mq, &msg);
1840           svm_msg_q_unlock (mq);
1841           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1842             vcl_handle_mq_event (wrk, e);
1843           svm_msg_q_free_msg (mq, &msg);
1844         }
1845     }
1846
1847   n_read = svm_fifo_segments (rx_fifo, (svm_fifo_seg_t *) ds);
1848   svm_fifo_unset_event (rx_fifo);
1849
1850   return n_read;
1851 }
1852
1853 void
1854 vppcom_session_free_segments (uint32_t session_handle,
1855                               vppcom_data_segments_t ds)
1856 {
1857   vcl_worker_t *wrk = vcl_worker_get_current ();
1858   vcl_session_t *s;
1859
1860   s = vcl_session_get_w_handle (wrk, session_handle);
1861   if (PREDICT_FALSE (!s || s->is_vep))
1862     return;
1863
1864   svm_fifo_segments_free (s->rx_fifo, (svm_fifo_seg_t *) ds);
1865 }
1866
1867 int
1868 vppcom_data_segment_copy (void *buf, vppcom_data_segments_t ds, u32 max_bytes)
1869 {
1870   u32 first_copy = clib_min (ds[0].len, max_bytes);
1871   clib_memcpy_fast (buf, ds[0].data, first_copy);
1872   if (first_copy < max_bytes)
1873     {
1874       clib_memcpy_fast (buf + first_copy, ds[1].data,
1875                         clib_min (ds[1].len, max_bytes - first_copy));
1876     }
1877   return 0;
1878 }
1879
1880 static u8
1881 vcl_is_tx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1882 {
1883   return (e->event_type == SESSION_IO_EVT_TX && e->session_index == sid);
1884 }
1885
1886 static inline int
1887 vppcom_session_write_inline (uint32_t session_handle, void *buf, size_t n,
1888                              u8 is_flush)
1889 {
1890   vcl_worker_t *wrk = vcl_worker_get_current ();
1891   int n_write, is_nonblocking;
1892   vcl_session_t *s = 0;
1893   session_evt_type_t et;
1894   svm_msg_q_msg_t msg;
1895   svm_fifo_t *tx_fifo;
1896   session_event_t *e;
1897   svm_msg_q_t *mq;
1898   u8 is_ct;
1899
1900   if (PREDICT_FALSE (!buf))
1901     return VPPCOM_EINVAL;
1902
1903   s = vcl_session_get_w_handle (wrk, session_handle);
1904   if (PREDICT_FALSE (!s))
1905     return VPPCOM_EBADFD;
1906
1907   if (PREDICT_FALSE (s->is_vep))
1908     {
1909       VDBG (0, "ERROR: session %u [0x%llx]: cannot write to an epoll"
1910             " session!", s->session_index, s->vpp_handle);
1911       return VPPCOM_EBADFD;
1912     }
1913
1914   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1915     {
1916       VDBG (1, "session %u [0x%llx]: is not open! state 0x%x (%s)",
1917             s->session_index, s->vpp_handle, s->session_state,
1918             vppcom_session_state_str (s->session_state));
1919       return vcl_session_closed_error (s);;
1920     }
1921
1922   is_ct = vcl_session_is_ct (s);
1923   tx_fifo = is_ct ? s->ct_tx_fifo : s->tx_fifo;
1924   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1925
1926   mq = wrk->app_event_queue;
1927   if (svm_fifo_is_full_prod (tx_fifo))
1928     {
1929       if (is_nonblocking)
1930         {
1931           return VPPCOM_EWOULDBLOCK;
1932         }
1933       while (svm_fifo_is_full_prod (tx_fifo))
1934         {
1935           svm_fifo_add_want_deq_ntf (tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
1936           if (vcl_session_is_closing (s))
1937             return vcl_session_closing_error (s);
1938           svm_msg_q_lock (mq);
1939           if (svm_msg_q_is_empty (mq))
1940             svm_msg_q_wait (mq);
1941
1942           svm_msg_q_sub_w_lock (mq, &msg);
1943           e = svm_msg_q_msg_data (mq, &msg);
1944           svm_msg_q_unlock (mq);
1945
1946           if (!vcl_is_tx_evt_for_session (e, s->session_index, is_ct))
1947             vcl_handle_mq_event (wrk, e);
1948           svm_msg_q_free_msg (mq, &msg);
1949         }
1950     }
1951
1952   et = SESSION_IO_EVT_TX;
1953   if (is_flush && !is_ct)
1954     et = SESSION_IO_EVT_TX_FLUSH;
1955
1956   if (s->is_dgram)
1957     n_write = app_send_dgram_raw (tx_fifo, &s->transport,
1958                                   s->vpp_evt_q, buf, n, et,
1959                                   0 /* do_evt */ , SVM_Q_WAIT);
1960   else
1961     n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
1962                                    0 /* do_evt */ , SVM_Q_WAIT);
1963
1964   if (svm_fifo_set_event (s->tx_fifo))
1965     app_send_io_evt_to_vpp (s->vpp_evt_q, s->tx_fifo->master_session_index,
1966                             et, SVM_Q_WAIT);
1967
1968   ASSERT (n_write > 0);
1969
1970   VDBG (2, "session %u [0x%llx]: wrote %d bytes", s->session_index,
1971         s->vpp_handle, n_write);
1972
1973   return n_write;
1974 }
1975
1976 int
1977 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
1978 {
1979   return vppcom_session_write_inline (session_handle, buf, n,
1980                                       0 /* is_flush */ );
1981 }
1982
1983 int
1984 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
1985 {
1986   return vppcom_session_write_inline (session_handle, buf, n,
1987                                       1 /* is_flush */ );
1988 }
1989
1990 #define vcl_fifo_rx_evt_valid_or_break(_s)                              \
1991 if (PREDICT_FALSE (!_s->rx_fifo))                                       \
1992   break;                                                                \
1993 if (PREDICT_FALSE (svm_fifo_is_empty (_s->rx_fifo)))                    \
1994   {                                                                     \
1995     if (!vcl_session_is_ct (_s))                                        \
1996       {                                                                 \
1997         svm_fifo_unset_event (_s->rx_fifo);                             \
1998         if (svm_fifo_is_empty (_s->rx_fifo))                            \
1999           break;                                                        \
2000       }                                                                 \
2001     else if (svm_fifo_is_empty (_s->ct_rx_fifo))                        \
2002       {                                                                 \
2003         svm_fifo_unset_event (_s->ct_rx_fifo);                          \
2004         if (svm_fifo_is_empty (_s->ct_rx_fifo))                         \
2005           break;                                                        \
2006       }                                                                 \
2007   }                                                                     \
2008
2009 static void
2010 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2011                             unsigned long n_bits, unsigned long *read_map,
2012                             unsigned long *write_map,
2013                             unsigned long *except_map, u32 * bits_set)
2014 {
2015   session_disconnected_msg_t *disconnected_msg;
2016   session_connected_msg_t *connected_msg;
2017   vcl_session_t *session;
2018   u32 sid;
2019
2020   switch (e->event_type)
2021     {
2022     case SESSION_IO_EVT_RX:
2023       sid = e->session_index;
2024       session = vcl_session_get (wrk, sid);
2025       if (!session)
2026         break;
2027       vcl_fifo_rx_evt_valid_or_break (session);
2028       if (sid < n_bits && read_map)
2029         {
2030           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2031           *bits_set += 1;
2032         }
2033       break;
2034     case SESSION_IO_EVT_TX:
2035       sid = e->session_index;
2036       session = vcl_session_get (wrk, sid);
2037       if (!session)
2038         break;
2039       if (sid < n_bits && write_map)
2040         {
2041           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2042           *bits_set += 1;
2043         }
2044       break;
2045     case SESSION_CTRL_EVT_ACCEPTED:
2046       session = vcl_session_accepted (wrk,
2047                                       (session_accepted_msg_t *) e->data);
2048       if (!session)
2049         break;
2050       sid = session->session_index;
2051       if (sid < n_bits && read_map)
2052         {
2053           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2054           *bits_set += 1;
2055         }
2056       break;
2057     case SESSION_CTRL_EVT_CONNECTED:
2058       connected_msg = (session_connected_msg_t *) e->data;
2059       sid = vcl_session_connected_handler (wrk, connected_msg);
2060       if (sid == VCL_INVALID_SESSION_INDEX)
2061         break;
2062       if (sid < n_bits && write_map)
2063         {
2064           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2065           *bits_set += 1;
2066         }
2067       break;
2068     case SESSION_CTRL_EVT_DISCONNECTED:
2069       disconnected_msg = (session_disconnected_msg_t *) e->data;
2070       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2071       if (!session)
2072         break;
2073       sid = session->session_index;
2074       if (sid < n_bits && except_map)
2075         {
2076           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2077           *bits_set += 1;
2078         }
2079       break;
2080     case SESSION_CTRL_EVT_RESET:
2081       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2082       if (sid < n_bits && except_map)
2083         {
2084           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2085           *bits_set += 1;
2086         }
2087       break;
2088     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2089       vcl_session_unlisten_reply_handler (wrk, e->data);
2090       break;
2091     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2092       vcl_session_worker_update_reply_handler (wrk, e->data);
2093       break;
2094     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2095       vcl_session_req_worker_update_handler (wrk, e->data);
2096       break;
2097     default:
2098       clib_warning ("unhandled: %u", e->event_type);
2099       break;
2100     }
2101 }
2102
2103 static int
2104 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2105                       unsigned long n_bits, unsigned long *read_map,
2106                       unsigned long *write_map, unsigned long *except_map,
2107                       double time_to_wait, u32 * bits_set)
2108 {
2109   svm_msg_q_msg_t *msg;
2110   session_event_t *e;
2111   u32 i;
2112
2113   svm_msg_q_lock (mq);
2114   if (svm_msg_q_is_empty (mq))
2115     {
2116       if (*bits_set)
2117         {
2118           svm_msg_q_unlock (mq);
2119           return 0;
2120         }
2121
2122       if (!time_to_wait)
2123         {
2124           svm_msg_q_unlock (mq);
2125           return 0;
2126         }
2127       else if (time_to_wait < 0)
2128         {
2129           svm_msg_q_wait (mq);
2130         }
2131       else
2132         {
2133           if (svm_msg_q_timedwait (mq, time_to_wait))
2134             {
2135               svm_msg_q_unlock (mq);
2136               return 0;
2137             }
2138         }
2139     }
2140   vcl_mq_dequeue_batch (wrk, mq, ~0);
2141   svm_msg_q_unlock (mq);
2142
2143   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2144     {
2145       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2146       e = svm_msg_q_msg_data (mq, msg);
2147       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2148                                   except_map, bits_set);
2149       svm_msg_q_free_msg (mq, msg);
2150     }
2151   vec_reset_length (wrk->mq_msg_vector);
2152   vcl_handle_pending_wrk_updates (wrk);
2153   return *bits_set;
2154 }
2155
2156 static int
2157 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2158                        vcl_si_set * read_map, vcl_si_set * write_map,
2159                        vcl_si_set * except_map, double time_to_wait,
2160                        u32 * bits_set)
2161 {
2162   double wait = 0, start = 0;
2163
2164   if (!*bits_set)
2165     {
2166       wait = time_to_wait;
2167       start = clib_time_now (&wrk->clib_time);
2168     }
2169
2170   do
2171     {
2172       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2173                             write_map, except_map, wait, bits_set);
2174       if (*bits_set)
2175         return *bits_set;
2176       if (wait == -1)
2177         continue;
2178
2179       wait = wait - (clib_time_now (&wrk->clib_time) - start);
2180     }
2181   while (wait > 0);
2182
2183   return 0;
2184 }
2185
2186 static int
2187 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2188                        vcl_si_set * read_map, vcl_si_set * write_map,
2189                        vcl_si_set * except_map, double time_to_wait,
2190                        u32 * bits_set)
2191 {
2192   vcl_mq_evt_conn_t *mqc;
2193   int __clib_unused n_read;
2194   int n_mq_evts, i;
2195   u64 buf;
2196
2197   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2198   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2199                           vec_len (wrk->mq_events), time_to_wait);
2200   for (i = 0; i < n_mq_evts; i++)
2201     {
2202       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2203       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2204       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2205                             except_map, 0, bits_set);
2206     }
2207
2208   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2209 }
2210
2211 int
2212 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2213                vcl_si_set * except_map, double time_to_wait)
2214 {
2215   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2216   vcl_worker_t *wrk = vcl_worker_get_current ();
2217   vcl_session_t *session = 0;
2218   int rv, i;
2219
2220   if (n_bits && read_map)
2221     {
2222       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2223       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2224                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2225       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2226     }
2227   if (n_bits && write_map)
2228     {
2229       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2230       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2231                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2232       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2233     }
2234   if (n_bits && except_map)
2235     {
2236       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2237       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2238                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2239       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2240     }
2241
2242   if (!n_bits)
2243     return 0;
2244
2245   if (!write_map)
2246     goto check_rd;
2247
2248   /* *INDENT-OFF* */
2249   clib_bitmap_foreach (sid, wrk->wr_bitmap, ({
2250     if (!(session = vcl_session_get (wrk, sid)))
2251       {
2252         if (except_map && sid < minbits)
2253           clib_bitmap_set_no_check (except_map, sid, 1);
2254         continue;
2255       }
2256
2257     rv = svm_fifo_is_full_prod (session->tx_fifo);
2258     if (!rv)
2259       {
2260         clib_bitmap_set_no_check ((uword*)write_map, sid, 1);
2261         bits_set++;
2262       }
2263     else
2264       svm_fifo_add_want_deq_ntf (session->tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
2265   }));
2266
2267 check_rd:
2268   if (!read_map)
2269     goto check_mq;
2270
2271   clib_bitmap_foreach (sid, wrk->rd_bitmap, ({
2272     if (!(session = vcl_session_get (wrk, sid)))
2273       {
2274         if (except_map && sid < minbits)
2275           clib_bitmap_set_no_check (except_map, sid, 1);
2276         continue;
2277       }
2278
2279     rv = vcl_session_read_ready (session);
2280     if (rv)
2281       {
2282         clib_bitmap_set_no_check ((uword*)read_map, sid, 1);
2283         bits_set++;
2284       }
2285   }));
2286   /* *INDENT-ON* */
2287
2288 check_mq:
2289
2290   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2291     {
2292       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2293                                   read_map, write_map, except_map, &bits_set);
2294     }
2295   vec_reset_length (wrk->unhandled_evts_vector);
2296
2297   if (vcm->cfg.use_mq_eventfd)
2298     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2299                            time_to_wait, &bits_set);
2300   else
2301     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2302                            time_to_wait, &bits_set);
2303
2304   return (bits_set);
2305 }
2306
2307 static inline void
2308 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_handle)
2309 {
2310   vcl_session_t *session;
2311   vppcom_epoll_t *vep;
2312   u32 sh = vep_handle;
2313
2314   if (VPPCOM_DEBUG <= 2)
2315     return;
2316
2317   session = vcl_session_get_w_handle (wrk, vep_handle);
2318   if (PREDICT_FALSE (!session))
2319     {
2320       VDBG (0, "ERROR: Invalid vep_sh (%u)!", vep_handle);
2321       goto done;
2322     }
2323   if (PREDICT_FALSE (!session->is_vep))
2324     {
2325       VDBG (0, "ERROR: vep_sh (%u) is not a vep!", vep_handle);
2326       goto done;
2327     }
2328   vep = &session->vep;
2329   VDBG (0, "vep_sh (%u): Dumping epoll chain\n"
2330         "{\n"
2331         "   is_vep         = %u\n"
2332         "   is_vep_session = %u\n"
2333         "   next_sh        = 0x%x (%u)\n"
2334         "}\n", vep_handle, session->is_vep, session->is_vep_session,
2335         vep->next_sh, vep->next_sh);
2336
2337   for (sh = vep->next_sh; sh != ~0; sh = vep->next_sh)
2338     {
2339       session = vcl_session_get_w_handle (wrk, sh);
2340       if (PREDICT_FALSE (!session))
2341         {
2342           VDBG (0, "ERROR: Invalid sh (%u)!", sh);
2343           goto done;
2344         }
2345       if (PREDICT_FALSE (session->is_vep))
2346         {
2347           VDBG (0, "ERROR: sh (%u) is a vep!", vep_handle);
2348         }
2349       else if (PREDICT_FALSE (!session->is_vep_session))
2350         {
2351           VDBG (0, "ERROR: sh (%u) is not a vep session handle!", sh);
2352           goto done;
2353         }
2354       vep = &session->vep;
2355       if (PREDICT_FALSE (vep->vep_sh != vep_handle))
2356         VDBG (0, "ERROR: session (%u) vep_sh (%u) != vep_sh (%u)!",
2357               sh, session->vep.vep_sh, vep_handle);
2358       if (session->is_vep_session)
2359         {
2360           VDBG (0, "vep_sh[%u]: sh 0x%x (%u)\n"
2361                 "{\n"
2362                 "   next_sh        = 0x%x (%u)\n"
2363                 "   prev_sh        = 0x%x (%u)\n"
2364                 "   vep_sh         = 0x%x (%u)\n"
2365                 "   ev.events      = 0x%x\n"
2366                 "   ev.data.u64    = 0x%llx\n"
2367                 "   et_mask        = 0x%x\n"
2368                 "}\n",
2369                 vep_handle, sh, sh, vep->next_sh, vep->next_sh, vep->prev_sh,
2370                 vep->prev_sh, vep->vep_sh, vep->vep_sh, vep->ev.events,
2371                 vep->ev.data.u64, vep->et_mask);
2372         }
2373     }
2374
2375 done:
2376   VDBG (0, "vep_sh (%u): Dump complete!\n", vep_handle);
2377 }
2378
2379 int
2380 vppcom_epoll_create (void)
2381 {
2382   vcl_worker_t *wrk = vcl_worker_get_current ();
2383   vcl_session_t *vep_session;
2384
2385   vep_session = vcl_session_alloc (wrk);
2386
2387   vep_session->is_vep = 1;
2388   vep_session->vep.vep_sh = ~0;
2389   vep_session->vep.next_sh = ~0;
2390   vep_session->vep.prev_sh = ~0;
2391   vep_session->vpp_handle = ~0;
2392
2393   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2394   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2395
2396   return vcl_session_handle (vep_session);
2397 }
2398
2399 int
2400 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2401                   struct epoll_event *event)
2402 {
2403   vcl_worker_t *wrk = vcl_worker_get_current ();
2404   vcl_session_t *vep_session;
2405   vcl_session_t *session;
2406   int rv = VPPCOM_OK;
2407
2408   if (vep_handle == session_handle)
2409     {
2410       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2411       return VPPCOM_EINVAL;
2412     }
2413
2414   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2415   if (PREDICT_FALSE (!vep_session))
2416     {
2417       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2418       return VPPCOM_EBADFD;
2419     }
2420   if (PREDICT_FALSE (!vep_session->is_vep))
2421     {
2422       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2423       return VPPCOM_EINVAL;
2424     }
2425
2426   ASSERT (vep_session->vep.vep_sh == ~0);
2427   ASSERT (vep_session->vep.prev_sh == ~0);
2428
2429   session = vcl_session_get_w_handle (wrk, session_handle);
2430   if (PREDICT_FALSE (!session))
2431     {
2432       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2433       return VPPCOM_EBADFD;
2434     }
2435   if (PREDICT_FALSE (session->is_vep))
2436     {
2437       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2438       return VPPCOM_EINVAL;
2439     }
2440
2441   switch (op)
2442     {
2443     case EPOLL_CTL_ADD:
2444       if (PREDICT_FALSE (!event))
2445         {
2446           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2447           return VPPCOM_EINVAL;
2448         }
2449       if (vep_session->vep.next_sh != ~0)
2450         {
2451           vcl_session_t *next_session;
2452           next_session = vcl_session_get_w_handle (wrk,
2453                                                    vep_session->vep.next_sh);
2454           if (PREDICT_FALSE (!next_session))
2455             {
2456               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sh (%u) on "
2457                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2458               return VPPCOM_EBADFD;
2459             }
2460           ASSERT (next_session->vep.prev_sh == vep_handle);
2461           next_session->vep.prev_sh = session_handle;
2462         }
2463       session->vep.next_sh = vep_session->vep.next_sh;
2464       session->vep.prev_sh = vep_handle;
2465       session->vep.vep_sh = vep_handle;
2466       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2467       session->vep.ev = *event;
2468       session->is_vep = 0;
2469       session->is_vep_session = 1;
2470       vep_session->vep.next_sh = session_handle;
2471
2472       if (session->tx_fifo)
2473         svm_fifo_add_want_deq_ntf (session->tx_fifo,
2474                                    SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2475
2476       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2477             vep_handle, session_handle, event->events, event->data.u64);
2478       vcl_evt (VCL_EVT_EPOLL_CTLADD, session, event->events, event->data.u64);
2479       break;
2480
2481     case EPOLL_CTL_MOD:
2482       if (PREDICT_FALSE (!event))
2483         {
2484           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2485           rv = VPPCOM_EINVAL;
2486           goto done;
2487         }
2488       else if (PREDICT_FALSE (!session->is_vep_session))
2489         {
2490           VDBG (0, "sh %u EPOLL_CTL_MOD: not a vep session!", session_handle);
2491           rv = VPPCOM_EINVAL;
2492           goto done;
2493         }
2494       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2495         {
2496           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2497                 session_handle, session->vep.vep_sh, vep_handle);
2498           rv = VPPCOM_EINVAL;
2499           goto done;
2500         }
2501       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2502       session->vep.ev = *event;
2503       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2504             vep_handle, session_handle, event->events, event->data.u64);
2505       break;
2506
2507     case EPOLL_CTL_DEL:
2508       if (PREDICT_FALSE (!session->is_vep_session))
2509         {
2510           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
2511           rv = VPPCOM_EINVAL;
2512           goto done;
2513         }
2514       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2515         {
2516           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
2517                 session_handle, session->vep.vep_sh, vep_handle);
2518           rv = VPPCOM_EINVAL;
2519           goto done;
2520         }
2521
2522       if (session->vep.prev_sh == vep_handle)
2523         vep_session->vep.next_sh = session->vep.next_sh;
2524       else
2525         {
2526           vcl_session_t *prev_session;
2527           prev_session = vcl_session_get_w_handle (wrk, session->vep.prev_sh);
2528           if (PREDICT_FALSE (!prev_session))
2529             {
2530               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sh (%u) on sh (%u)!",
2531                     session->vep.prev_sh, session_handle);
2532               return VPPCOM_EBADFD;
2533             }
2534           ASSERT (prev_session->vep.next_sh == session_handle);
2535           prev_session->vep.next_sh = session->vep.next_sh;
2536         }
2537       if (session->vep.next_sh != ~0)
2538         {
2539           vcl_session_t *next_session;
2540           next_session = vcl_session_get_w_handle (wrk, session->vep.next_sh);
2541           if (PREDICT_FALSE (!next_session))
2542             {
2543               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sh (%u) on sh (%u)!",
2544                     session->vep.next_sh, session_handle);
2545               return VPPCOM_EBADFD;
2546             }
2547           ASSERT (next_session->vep.prev_sh == session_handle);
2548           next_session->vep.prev_sh = session->vep.prev_sh;
2549         }
2550
2551       memset (&session->vep, 0, sizeof (session->vep));
2552       session->vep.next_sh = ~0;
2553       session->vep.prev_sh = ~0;
2554       session->vep.vep_sh = ~0;
2555       session->is_vep_session = 0;
2556
2557       if (session->tx_fifo)
2558         svm_fifo_del_want_deq_ntf (session->tx_fifo, SVM_FIFO_NO_DEQ_NOTIF);
2559
2560       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sh %u!", vep_handle,
2561             session_handle);
2562       vcl_evt (VCL_EVT_EPOLL_CTLDEL, session, vep_sh);
2563       break;
2564
2565     default:
2566       VDBG (0, "Invalid operation (%d)!", op);
2567       rv = VPPCOM_EINVAL;
2568     }
2569
2570   vep_verify_epoll_chain (wrk, vep_handle);
2571
2572 done:
2573   return rv;
2574 }
2575
2576 static inline void
2577 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2578                                 struct epoll_event *events, u32 * num_ev)
2579 {
2580   session_disconnected_msg_t *disconnected_msg;
2581   session_connected_msg_t *connected_msg;
2582   u32 sid = ~0, session_events;
2583   u64 session_evt_data = ~0;
2584   vcl_session_t *session;
2585   u8 add_event = 0;
2586
2587   switch (e->event_type)
2588     {
2589     case SESSION_IO_EVT_RX:
2590       sid = e->session_index;
2591       if (!(session = vcl_session_get (wrk, sid)))
2592         break;
2593       vcl_fifo_rx_evt_valid_or_break (session);
2594       session_events = session->vep.ev.events;
2595       if (!(EPOLLIN & session->vep.ev.events) || session->has_rx_evt)
2596         break;
2597       add_event = 1;
2598       events[*num_ev].events |= EPOLLIN;
2599       session_evt_data = session->vep.ev.data.u64;
2600       session->has_rx_evt = 1;
2601       break;
2602     case SESSION_IO_EVT_TX:
2603       sid = e->session_index;
2604       if (!(session = vcl_session_get (wrk, sid)))
2605         break;
2606       session_events = session->vep.ev.events;
2607       if (!(EPOLLOUT & session_events))
2608         break;
2609       add_event = 1;
2610       events[*num_ev].events |= EPOLLOUT;
2611       session_evt_data = session->vep.ev.data.u64;
2612       svm_fifo_reset_has_deq_ntf (session->tx_fifo);
2613       break;
2614     case SESSION_CTRL_EVT_ACCEPTED:
2615       session = vcl_session_accepted (wrk,
2616                                       (session_accepted_msg_t *) e->data);
2617       if (!session)
2618         break;
2619
2620       session_events = session->vep.ev.events;
2621       if (!(EPOLLIN & session_events))
2622         break;
2623
2624       add_event = 1;
2625       events[*num_ev].events |= EPOLLIN;
2626       session_evt_data = session->vep.ev.data.u64;
2627       break;
2628     case SESSION_CTRL_EVT_CONNECTED:
2629       connected_msg = (session_connected_msg_t *) e->data;
2630       sid = vcl_session_connected_handler (wrk, connected_msg);
2631       /* Generate EPOLLOUT because there's no connected event */
2632       if (!(session = vcl_session_get (wrk, sid)))
2633         break;
2634       session_events = session->vep.ev.events;
2635       if (!(EPOLLOUT & session_events))
2636         break;
2637       add_event = 1;
2638       events[*num_ev].events |= EPOLLOUT;
2639       session_evt_data = session->vep.ev.data.u64;
2640       if (session->session_state & STATE_FAILED)
2641         events[*num_ev].events |= EPOLLHUP;
2642       break;
2643     case SESSION_CTRL_EVT_DISCONNECTED:
2644       disconnected_msg = (session_disconnected_msg_t *) e->data;
2645       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2646       if (!session)
2647         break;
2648       session_events = session->vep.ev.events;
2649       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2650         break;
2651       add_event = 1;
2652       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2653       session_evt_data = session->vep.ev.data.u64;
2654       break;
2655     case SESSION_CTRL_EVT_RESET:
2656       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2657       if (!(session = vcl_session_get (wrk, sid)))
2658         break;
2659       session_events = session->vep.ev.events;
2660       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2661         break;
2662       add_event = 1;
2663       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2664       session_evt_data = session->vep.ev.data.u64;
2665       break;
2666     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2667       vcl_session_unlisten_reply_handler (wrk, e->data);
2668       break;
2669     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2670       vcl_session_req_worker_update_handler (wrk, e->data);
2671       break;
2672     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2673       vcl_session_worker_update_reply_handler (wrk, e->data);
2674       break;
2675     default:
2676       VDBG (0, "unhandled: %u", e->event_type);
2677       break;
2678     }
2679
2680   if (add_event)
2681     {
2682       events[*num_ev].data.u64 = session_evt_data;
2683       if (EPOLLONESHOT & session_events)
2684         {
2685           session = vcl_session_get (wrk, sid);
2686           session->vep.ev.events = 0;
2687         }
2688       *num_ev += 1;
2689     }
2690 }
2691
2692 static int
2693 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2694                           struct epoll_event *events, u32 maxevents,
2695                           double wait_for_time, u32 * num_ev)
2696 {
2697   svm_msg_q_msg_t *msg;
2698   session_event_t *e;
2699   int i;
2700
2701   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
2702     goto handle_dequeued;
2703
2704   svm_msg_q_lock (mq);
2705   if (svm_msg_q_is_empty (mq))
2706     {
2707       if (!wait_for_time)
2708         {
2709           svm_msg_q_unlock (mq);
2710           return 0;
2711         }
2712       else if (wait_for_time < 0)
2713         {
2714           svm_msg_q_wait (mq);
2715         }
2716       else
2717         {
2718           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
2719             {
2720               svm_msg_q_unlock (mq);
2721               return 0;
2722             }
2723         }
2724     }
2725   ASSERT (maxevents > *num_ev);
2726   vcl_mq_dequeue_batch (wrk, mq, maxevents - *num_ev);
2727   svm_msg_q_unlock (mq);
2728
2729 handle_dequeued:
2730   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2731     {
2732       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2733       e = svm_msg_q_msg_data (mq, msg);
2734       vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
2735       svm_msg_q_free_msg (mq, msg);
2736     }
2737   vec_reset_length (wrk->mq_msg_vector);
2738   vcl_handle_pending_wrk_updates (wrk);
2739   return *num_ev;
2740 }
2741
2742 static int
2743 vppcom_epoll_wait_condvar (vcl_worker_t * wrk, struct epoll_event *events,
2744                            int maxevents, u32 n_evts, double wait_for_time)
2745 {
2746   double wait = 0, start = 0, now;
2747
2748   if (!n_evts)
2749     {
2750       wait = wait_for_time;
2751       start = clib_time_now (&wrk->clib_time);
2752     }
2753
2754   do
2755     {
2756       vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events, maxevents,
2757                                 wait, &n_evts);
2758       if (n_evts)
2759         return n_evts;
2760       if (wait == -1)
2761         continue;
2762
2763       now = clib_time_now (&wrk->clib_time);
2764       wait -= now - start;
2765       start = now;
2766     }
2767   while (wait > 0);
2768
2769   return 0;
2770 }
2771
2772 static int
2773 vppcom_epoll_wait_eventfd (vcl_worker_t * wrk, struct epoll_event *events,
2774                            int maxevents, u32 n_evts, double wait_for_time)
2775 {
2776   vcl_mq_evt_conn_t *mqc;
2777   int __clib_unused n_read;
2778   int n_mq_evts, i;
2779   u64 buf;
2780
2781   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2782 again:
2783   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2784                           vec_len (wrk->mq_events), wait_for_time);
2785   for (i = 0; i < n_mq_evts; i++)
2786     {
2787       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2788       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2789       vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0, &n_evts);
2790     }
2791   if (!n_evts && n_mq_evts > 0)
2792     goto again;
2793
2794   return (int) n_evts;
2795 }
2796
2797 int
2798 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
2799                    int maxevents, double wait_for_time)
2800 {
2801   vcl_worker_t *wrk = vcl_worker_get_current ();
2802   vcl_session_t *vep_session;
2803   u32 n_evts = 0;
2804   int i;
2805
2806   if (PREDICT_FALSE (maxevents <= 0))
2807     {
2808       VDBG (0, "ERROR: Invalid maxevents (%d)!", maxevents);
2809       return VPPCOM_EINVAL;
2810     }
2811
2812   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2813   if (!vep_session)
2814     return VPPCOM_EBADFD;
2815
2816   if (PREDICT_FALSE (!vep_session->is_vep))
2817     {
2818       VDBG (0, "ERROR: vep_idx (%u) is not a vep!", vep_handle);
2819       return VPPCOM_EINVAL;
2820     }
2821
2822   memset (events, 0, sizeof (*events) * maxevents);
2823
2824   if (vec_len (wrk->unhandled_evts_vector))
2825     {
2826       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2827         {
2828           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
2829                                           events, &n_evts);
2830           if (n_evts == maxevents)
2831             {
2832               vec_delete (wrk->unhandled_evts_vector, i + 1, 0);
2833               return n_evts;
2834             }
2835         }
2836       vec_reset_length (wrk->unhandled_evts_vector);
2837     }
2838
2839   if (vcm->cfg.use_mq_eventfd)
2840     return vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
2841                                       wait_for_time);
2842
2843   return vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
2844                                     wait_for_time);
2845 }
2846
2847 int
2848 vppcom_session_attr (uint32_t session_handle, uint32_t op,
2849                      void *buffer, uint32_t * buflen)
2850 {
2851   vcl_worker_t *wrk = vcl_worker_get_current ();
2852   vcl_session_t *session;
2853   int rv = VPPCOM_OK;
2854   u32 *flags = buffer, tmp_flags = 0;
2855   vppcom_endpt_t *ep = buffer;
2856
2857   session = vcl_session_get_w_handle (wrk, session_handle);
2858   if (!session)
2859     return VPPCOM_EBADFD;
2860
2861   switch (op)
2862     {
2863     case VPPCOM_ATTR_GET_NREAD:
2864       rv = vcl_session_read_ready (session);
2865       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sh %u, nread = %d", session_handle,
2866             rv);
2867       break;
2868
2869     case VPPCOM_ATTR_GET_NWRITE:
2870       rv = vcl_session_write_ready (session);
2871       VDBG (2, "VPPCOM_ATTR_GET_NWRITE: sh %u, nwrite = %d", session_handle,
2872             rv);
2873       break;
2874
2875     case VPPCOM_ATTR_GET_FLAGS:
2876       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
2877         {
2878           *flags = O_RDWR | (VCL_SESS_ATTR_TEST (session->attr,
2879                                                  VCL_SESS_ATTR_NONBLOCK));
2880           *buflen = sizeof (*flags);
2881           VDBG (2, "VPPCOM_ATTR_GET_FLAGS: sh %u, flags = 0x%08x, "
2882                 "is_nonblocking = %u", session_handle, *flags,
2883                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2884         }
2885       else
2886         rv = VPPCOM_EINVAL;
2887       break;
2888
2889     case VPPCOM_ATTR_SET_FLAGS:
2890       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
2891         {
2892           if (*flags & O_NONBLOCK)
2893             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
2894           else
2895             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_NONBLOCK);
2896
2897           VDBG (2, "VPPCOM_ATTR_SET_FLAGS: sh %u, flags = 0x%08x,"
2898                 " is_nonblocking = %u", session_handle, *flags,
2899                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2900         }
2901       else
2902         rv = VPPCOM_EINVAL;
2903       break;
2904
2905     case VPPCOM_ATTR_GET_PEER_ADDR:
2906       if (PREDICT_TRUE (buffer && buflen &&
2907                         (*buflen >= sizeof (*ep)) && ep->ip))
2908         {
2909           ep->is_ip4 = session->transport.is_ip4;
2910           ep->port = session->transport.rmt_port;
2911           if (session->transport.is_ip4)
2912             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
2913                               sizeof (ip4_address_t));
2914           else
2915             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
2916                               sizeof (ip6_address_t));
2917           *buflen = sizeof (*ep);
2918           VDBG (1, "VPPCOM_ATTR_GET_PEER_ADDR: sh %u, is_ip4 = %u, "
2919                 "addr = %U, port %u", session_handle, ep->is_ip4,
2920                 format_ip46_address, &session->transport.rmt_ip,
2921                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2922                 clib_net_to_host_u16 (ep->port));
2923         }
2924       else
2925         rv = VPPCOM_EINVAL;
2926       break;
2927
2928     case VPPCOM_ATTR_GET_LCL_ADDR:
2929       if (PREDICT_TRUE (buffer && buflen &&
2930                         (*buflen >= sizeof (*ep)) && ep->ip))
2931         {
2932           ep->is_ip4 = session->transport.is_ip4;
2933           ep->port = session->transport.lcl_port;
2934           if (session->transport.is_ip4)
2935             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
2936                               sizeof (ip4_address_t));
2937           else
2938             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
2939                               sizeof (ip6_address_t));
2940           *buflen = sizeof (*ep);
2941           VDBG (1, "VPPCOM_ATTR_GET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
2942                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
2943                 &session->transport.lcl_ip,
2944                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2945                 clib_net_to_host_u16 (ep->port));
2946         }
2947       else
2948         rv = VPPCOM_EINVAL;
2949       break;
2950
2951     case VPPCOM_ATTR_SET_LCL_ADDR:
2952       if (PREDICT_TRUE (buffer && buflen &&
2953                         (*buflen >= sizeof (*ep)) && ep->ip))
2954         {
2955           session->transport.is_ip4 = ep->is_ip4;
2956           session->transport.lcl_port = ep->port;
2957           vcl_ip_copy_from_ep (&session->transport.lcl_ip, ep);
2958           *buflen = sizeof (*ep);
2959           VDBG (1, "VPPCOM_ATTR_SET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
2960                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
2961                 &session->transport.lcl_ip,
2962                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2963                 clib_net_to_host_u16 (ep->port));
2964         }
2965       else
2966         rv = VPPCOM_EINVAL;
2967       break;
2968
2969     case VPPCOM_ATTR_GET_LIBC_EPFD:
2970       rv = session->libc_epfd;
2971       VDBG (2, "VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d", rv);
2972       break;
2973
2974     case VPPCOM_ATTR_SET_LIBC_EPFD:
2975       if (PREDICT_TRUE (buffer && buflen &&
2976                         (*buflen == sizeof (session->libc_epfd))))
2977         {
2978           session->libc_epfd = *(int *) buffer;
2979           *buflen = sizeof (session->libc_epfd);
2980
2981           VDBG (2, "VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, buflen %d",
2982                 session->libc_epfd, *buflen);
2983         }
2984       else
2985         rv = VPPCOM_EINVAL;
2986       break;
2987
2988     case VPPCOM_ATTR_GET_PROTOCOL:
2989       if (buffer && buflen && (*buflen >= sizeof (int)))
2990         {
2991           *(int *) buffer = session->session_type;
2992           *buflen = sizeof (int);
2993
2994           VDBG (2, "VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
2995                 *(int *) buffer, *(int *) buffer ? "UDP" : "TCP", *buflen);
2996         }
2997       else
2998         rv = VPPCOM_EINVAL;
2999       break;
3000
3001     case VPPCOM_ATTR_GET_LISTEN:
3002       if (buffer && buflen && (*buflen >= sizeof (int)))
3003         {
3004           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3005                                                 VCL_SESS_ATTR_LISTEN);
3006           *buflen = sizeof (int);
3007
3008           VDBG (2, "VPPCOM_ATTR_GET_LISTEN: %d, buflen %d", *(int *) buffer,
3009                 *buflen);
3010         }
3011       else
3012         rv = VPPCOM_EINVAL;
3013       break;
3014
3015     case VPPCOM_ATTR_GET_ERROR:
3016       if (buffer && buflen && (*buflen >= sizeof (int)))
3017         {
3018           *(int *) buffer = 0;
3019           *buflen = sizeof (int);
3020
3021           VDBG (2, "VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
3022                 *(int *) buffer, *buflen);
3023         }
3024       else
3025         rv = VPPCOM_EINVAL;
3026       break;
3027
3028     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
3029       if (buffer && buflen && (*buflen >= sizeof (u32)))
3030         {
3031
3032           /* VPP-TBD */
3033           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3034                                 session->tx_fifo ? session->tx_fifo->nitems :
3035                                 vcm->cfg.tx_fifo_size);
3036           *buflen = sizeof (u32);
3037
3038           VDBG (2, "VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3039                 " #VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer,
3040                 *buflen);
3041         }
3042       else
3043         rv = VPPCOM_EINVAL;
3044       break;
3045
3046     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3047       if (buffer && buflen && (*buflen == sizeof (u32)))
3048         {
3049           /* VPP-TBD */
3050           session->sndbuf_size = *(u32 *) buffer;
3051           VDBG (2, "VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3052                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3053                 *buflen);
3054         }
3055       else
3056         rv = VPPCOM_EINVAL;
3057       break;
3058
3059     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3060       if (buffer && buflen && (*buflen >= sizeof (u32)))
3061         {
3062
3063           /* VPP-TBD */
3064           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3065                                 session->rx_fifo ? session->rx_fifo->nitems :
3066                                 vcm->cfg.rx_fifo_size);
3067           *buflen = sizeof (u32);
3068
3069           VDBG (2, "VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), buflen %d, "
3070                 "#VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer, *buflen);
3071         }
3072       else
3073         rv = VPPCOM_EINVAL;
3074       break;
3075
3076     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3077       if (buffer && buflen && (*buflen == sizeof (u32)))
3078         {
3079           /* VPP-TBD */
3080           session->rcvbuf_size = *(u32 *) buffer;
3081           VDBG (2, "VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), buflen %d,"
3082                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3083                 *buflen);
3084         }
3085       else
3086         rv = VPPCOM_EINVAL;
3087       break;
3088
3089     case VPPCOM_ATTR_GET_REUSEADDR:
3090       if (buffer && buflen && (*buflen >= sizeof (int)))
3091         {
3092           /* VPP-TBD */
3093           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3094                                                 VCL_SESS_ATTR_REUSEADDR);
3095           *buflen = sizeof (int);
3096
3097           VDBG (2, "VPPCOM_ATTR_GET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3098                 *(int *) buffer, *buflen);
3099         }
3100       else
3101         rv = VPPCOM_EINVAL;
3102       break;
3103
3104     case VPPCOM_ATTR_SET_REUSEADDR:
3105       if (buffer && buflen && (*buflen == sizeof (int)) &&
3106           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3107         {
3108           /* VPP-TBD */
3109           if (*(int *) buffer)
3110             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEADDR);
3111           else
3112             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEADDR);
3113
3114           VDBG (2, "VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3115                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_REUSEADDR),
3116                 *buflen);
3117         }
3118       else
3119         rv = VPPCOM_EINVAL;
3120       break;
3121
3122     case VPPCOM_ATTR_GET_REUSEPORT:
3123       if (buffer && buflen && (*buflen >= sizeof (int)))
3124         {
3125           /* VPP-TBD */
3126           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3127                                                 VCL_SESS_ATTR_REUSEPORT);
3128           *buflen = sizeof (int);
3129
3130           VDBG (2, "VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3131                 *(int *) buffer, *buflen);
3132         }
3133       else
3134         rv = VPPCOM_EINVAL;
3135       break;
3136
3137     case VPPCOM_ATTR_SET_REUSEPORT:
3138       if (buffer && buflen && (*buflen == sizeof (int)) &&
3139           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3140         {
3141           /* VPP-TBD */
3142           if (*(int *) buffer)
3143             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEPORT);
3144           else
3145             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEPORT);
3146
3147           VDBG (2, "VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3148                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_REUSEPORT),
3149                 *buflen);
3150         }
3151       else
3152         rv = VPPCOM_EINVAL;
3153       break;
3154
3155     case VPPCOM_ATTR_GET_BROADCAST:
3156       if (buffer && buflen && (*buflen >= sizeof (int)))
3157         {
3158           /* VPP-TBD */
3159           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3160                                                 VCL_SESS_ATTR_BROADCAST);
3161           *buflen = sizeof (int);
3162
3163           VDBG (2, "VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3164                 *(int *) buffer, *buflen);
3165         }
3166       else
3167         rv = VPPCOM_EINVAL;
3168       break;
3169
3170     case VPPCOM_ATTR_SET_BROADCAST:
3171       if (buffer && buflen && (*buflen == sizeof (int)))
3172         {
3173           /* VPP-TBD */
3174           if (*(int *) buffer)
3175             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_BROADCAST);
3176           else
3177             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_BROADCAST);
3178
3179           VDBG (2, "VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3180                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_BROADCAST),
3181                 *buflen);
3182         }
3183       else
3184         rv = VPPCOM_EINVAL;
3185       break;
3186
3187     case VPPCOM_ATTR_GET_V6ONLY:
3188       if (buffer && buflen && (*buflen >= sizeof (int)))
3189         {
3190           /* VPP-TBD */
3191           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3192                                                 VCL_SESS_ATTR_V6ONLY);
3193           *buflen = sizeof (int);
3194
3195           VDBG (2, "VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3196                 *(int *) buffer, *buflen);
3197         }
3198       else
3199         rv = VPPCOM_EINVAL;
3200       break;
3201
3202     case VPPCOM_ATTR_SET_V6ONLY:
3203       if (buffer && buflen && (*buflen == sizeof (int)))
3204         {
3205           /* VPP-TBD */
3206           if (*(int *) buffer)
3207             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_V6ONLY);
3208           else
3209             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_V6ONLY);
3210
3211           VDBG (2, "VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3212                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_V6ONLY),
3213                 *buflen);
3214         }
3215       else
3216         rv = VPPCOM_EINVAL;
3217       break;
3218
3219     case VPPCOM_ATTR_GET_KEEPALIVE:
3220       if (buffer && buflen && (*buflen >= sizeof (int)))
3221         {
3222           /* VPP-TBD */
3223           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3224                                                 VCL_SESS_ATTR_KEEPALIVE);
3225           *buflen = sizeof (int);
3226
3227           VDBG (2, "VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3228                 *(int *) buffer, *buflen);
3229         }
3230       else
3231         rv = VPPCOM_EINVAL;
3232       break;
3233
3234     case VPPCOM_ATTR_SET_KEEPALIVE:
3235       if (buffer && buflen && (*buflen == sizeof (int)))
3236         {
3237           /* VPP-TBD */
3238           if (*(int *) buffer)
3239             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3240           else
3241             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3242
3243           VDBG (2, "VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3244                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_KEEPALIVE),
3245                 *buflen);
3246         }
3247       else
3248         rv = VPPCOM_EINVAL;
3249       break;
3250
3251     case VPPCOM_ATTR_GET_TCP_NODELAY:
3252       if (buffer && buflen && (*buflen >= sizeof (int)))
3253         {
3254           /* VPP-TBD */
3255           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3256                                                 VCL_SESS_ATTR_TCP_NODELAY);
3257           *buflen = sizeof (int);
3258
3259           VDBG (2, "VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3260                 *(int *) buffer, *buflen);
3261         }
3262       else
3263         rv = VPPCOM_EINVAL;
3264       break;
3265
3266     case VPPCOM_ATTR_SET_TCP_NODELAY:
3267       if (buffer && buflen && (*buflen == sizeof (int)))
3268         {
3269           /* VPP-TBD */
3270           if (*(int *) buffer)
3271             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3272           else
3273             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3274
3275           VDBG (2, "VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3276                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_TCP_NODELAY),
3277                 *buflen);
3278         }
3279       else
3280         rv = VPPCOM_EINVAL;
3281       break;
3282
3283     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
3284       if (buffer && buflen && (*buflen >= sizeof (int)))
3285         {
3286           /* VPP-TBD */
3287           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3288                                                 VCL_SESS_ATTR_TCP_KEEPIDLE);
3289           *buflen = sizeof (int);
3290
3291           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3292                 *(int *) buffer, *buflen);
3293         }
3294       else
3295         rv = VPPCOM_EINVAL;
3296       break;
3297
3298     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
3299       if (buffer && buflen && (*buflen == sizeof (int)))
3300         {
3301           /* VPP-TBD */
3302           if (*(int *) buffer)
3303             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3304           else
3305             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3306
3307           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3308                 VCL_SESS_ATTR_TEST (session->attr,
3309                                     VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
3310         }
3311       else
3312         rv = VPPCOM_EINVAL;
3313       break;
3314
3315     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
3316       if (buffer && buflen && (*buflen >= sizeof (int)))
3317         {
3318           /* VPP-TBD */
3319           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3320                                                 VCL_SESS_ATTR_TCP_KEEPINTVL);
3321           *buflen = sizeof (int);
3322
3323           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3324                 *(int *) buffer, *buflen);
3325         }
3326       else
3327         rv = VPPCOM_EINVAL;
3328       break;
3329
3330     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
3331       if (buffer && buflen && (*buflen == sizeof (int)))
3332         {
3333           /* VPP-TBD */
3334           if (*(int *) buffer)
3335             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3336           else
3337             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3338
3339           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3340                 VCL_SESS_ATTR_TEST (session->attr,
3341                                     VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
3342         }
3343       else
3344         rv = VPPCOM_EINVAL;
3345       break;
3346
3347     case VPPCOM_ATTR_GET_TCP_USER_MSS:
3348       if (buffer && buflen && (*buflen >= sizeof (u32)))
3349         {
3350           /* VPP-TBD */
3351           *(u32 *) buffer = session->user_mss;
3352           *buflen = sizeof (int);
3353
3354           VDBG (2, "VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d, #VPP-TBD#",
3355                 *(int *) buffer, *buflen);
3356         }
3357       else
3358         rv = VPPCOM_EINVAL;
3359       break;
3360
3361     case VPPCOM_ATTR_SET_TCP_USER_MSS:
3362       if (buffer && buflen && (*buflen == sizeof (u32)))
3363         {
3364           /* VPP-TBD */
3365           session->user_mss = *(u32 *) buffer;
3366
3367           VDBG (2, "VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d, #VPP-TBD#",
3368                 session->user_mss, *buflen);
3369         }
3370       else
3371         rv = VPPCOM_EINVAL;
3372       break;
3373
3374     case VPPCOM_ATTR_SET_SHUT:
3375       if (*flags == SHUT_RD || *flags == SHUT_RDWR)
3376         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_RD);
3377       if (*flags == SHUT_WR || *flags == SHUT_RDWR)
3378         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_WR);
3379       break;
3380
3381     case VPPCOM_ATTR_GET_SHUT:
3382       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_RD))
3383         tmp_flags = 1;
3384       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_WR))
3385         tmp_flags |= 2;
3386       if (tmp_flags == 1)
3387         *(int *) buffer = SHUT_RD;
3388       else if (tmp_flags == 2)
3389         *(int *) buffer = SHUT_WR;
3390       else if (tmp_flags == 3)
3391         *(int *) buffer = SHUT_RDWR;
3392       *buflen = sizeof (int);
3393       break;
3394     default:
3395       rv = VPPCOM_EINVAL;
3396       break;
3397     }
3398
3399   return rv;
3400 }
3401
3402 int
3403 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
3404                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
3405 {
3406   vcl_worker_t *wrk = vcl_worker_get_current ();
3407   int rv = VPPCOM_OK;
3408   vcl_session_t *session = 0;
3409
3410   if (ep)
3411     {
3412       session = vcl_session_get_w_handle (wrk, session_handle);
3413       if (PREDICT_FALSE (!session))
3414         {
3415           VDBG (0, "sh 0x%llx is closed!", session_handle);
3416           return VPPCOM_EBADFD;
3417         }
3418       ep->is_ip4 = session->transport.is_ip4;
3419       ep->port = session->transport.rmt_port;
3420     }
3421
3422   if (flags == 0)
3423     rv = vppcom_session_read (session_handle, buffer, buflen);
3424   else if (flags & MSG_PEEK)
3425     rv = vppcom_session_peek (session_handle, buffer, buflen);
3426   else
3427     {
3428       VDBG (0, "Unsupport flags for recvfrom %d", flags);
3429       return VPPCOM_EAFNOSUPPORT;
3430     }
3431
3432   if (ep)
3433     {
3434       if (session->transport.is_ip4)
3435         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3436                           sizeof (ip4_address_t));
3437       else
3438         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3439                           sizeof (ip6_address_t));
3440     }
3441
3442   return rv;
3443 }
3444
3445 int
3446 vppcom_session_sendto (uint32_t session_handle, void *buffer,
3447                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
3448 {
3449   if (!buffer)
3450     return VPPCOM_EINVAL;
3451
3452   if (ep)
3453     {
3454       // TBD
3455       return VPPCOM_EINVAL;
3456     }
3457
3458   if (flags)
3459     {
3460       // TBD check the flags and do the right thing
3461       VDBG (2, "handling flags 0x%u (%d) not implemented yet.", flags, flags);
3462     }
3463
3464   return (vppcom_session_write_inline (session_handle, buffer, buflen, 1));
3465 }
3466
3467 int
3468 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
3469 {
3470   vcl_worker_t *wrk = vcl_worker_get_current ();
3471   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
3472   u32 i, keep_trying = 1;
3473   svm_msg_q_msg_t msg;
3474   session_event_t *e;
3475   int rv, num_ev = 0;
3476
3477   VDBG (3, "vp %p, nsids %u, wait_for_time %f", vp, n_sids, wait_for_time);
3478
3479   if (!vp)
3480     return VPPCOM_EFAULT;
3481
3482   do
3483     {
3484       vcl_session_t *session;
3485
3486       /* Dequeue all events and drop all unhandled io events */
3487       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
3488         {
3489           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
3490           vcl_handle_mq_event (wrk, e);
3491           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
3492         }
3493       vec_reset_length (wrk->unhandled_evts_vector);
3494
3495       for (i = 0; i < n_sids; i++)
3496         {
3497           session = vcl_session_get (wrk, vp[i].sh);
3498           if (!session)
3499             {
3500               vp[i].revents = POLLHUP;
3501               num_ev++;
3502               continue;
3503             }
3504
3505           vp[i].revents = 0;
3506
3507           if (POLLIN & vp[i].events)
3508             {
3509               rv = vcl_session_read_ready (session);
3510               if (rv > 0)
3511                 {
3512                   vp[i].revents |= POLLIN;
3513                   num_ev++;
3514                 }
3515               else if (rv < 0)
3516                 {
3517                   switch (rv)
3518                     {
3519                     case VPPCOM_ECONNRESET:
3520                       vp[i].revents = POLLHUP;
3521                       break;
3522
3523                     default:
3524                       vp[i].revents = POLLERR;
3525                       break;
3526                     }
3527                   num_ev++;
3528                 }
3529             }
3530
3531           if (POLLOUT & vp[i].events)
3532             {
3533               rv = vcl_session_write_ready (session);
3534               if (rv > 0)
3535                 {
3536                   vp[i].revents |= POLLOUT;
3537                   num_ev++;
3538                 }
3539               else if (rv < 0)
3540                 {
3541                   switch (rv)
3542                     {
3543                     case VPPCOM_ECONNRESET:
3544                       vp[i].revents = POLLHUP;
3545                       break;
3546
3547                     default:
3548                       vp[i].revents = POLLERR;
3549                       break;
3550                     }
3551                   num_ev++;
3552                 }
3553             }
3554
3555           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
3556             {
3557               vp[i].revents = POLLNVAL;
3558               num_ev++;
3559             }
3560         }
3561       if (wait_for_time != -1)
3562         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
3563     }
3564   while ((num_ev == 0) && keep_trying);
3565
3566   return num_ev;
3567 }
3568
3569 int
3570 vppcom_mq_epoll_fd (void)
3571 {
3572   vcl_worker_t *wrk = vcl_worker_get_current ();
3573   return wrk->mqs_epfd;
3574 }
3575
3576 int
3577 vppcom_session_index (vcl_session_handle_t session_handle)
3578 {
3579   return session_handle & 0xFFFFFF;
3580 }
3581
3582 int
3583 vppcom_session_worker (vcl_session_handle_t session_handle)
3584 {
3585   return session_handle >> 24;
3586 }
3587
3588 int
3589 vppcom_worker_register (void)
3590 {
3591   if (!vcl_worker_alloc_and_init ())
3592     return VPPCOM_EEXIST;
3593
3594   if (vcl_worker_set_bapi ())
3595     return VPPCOM_EEXIST;
3596
3597   if (vcl_worker_register_with_vpp ())
3598     return VPPCOM_EEXIST;
3599
3600   return VPPCOM_OK;
3601 }
3602
3603 void
3604 vppcom_worker_unregister (void)
3605 {
3606   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
3607   vcl_set_worker_index (~0);
3608 }
3609
3610 int
3611 vppcom_worker_index (void)
3612 {
3613   return vcl_get_worker_index ();
3614 }
3615
3616 int
3617 vppcom_worker_mqs_epfd (void)
3618 {
3619   vcl_worker_t *wrk = vcl_worker_get_current ();
3620   if (!vcm->cfg.use_mq_eventfd)
3621     return -1;
3622   return wrk->mqs_epfd;
3623 }
3624
3625 int
3626 vppcom_session_is_connectable_listener (uint32_t session_handle)
3627 {
3628   vcl_session_t *session;
3629   vcl_worker_t *wrk = vcl_worker_get_current ();
3630   session = vcl_session_get_w_handle (wrk, session_handle);
3631   if (!session)
3632     return VPPCOM_EBADFD;
3633   return vcl_session_is_connectable_listener (wrk, session);
3634 }
3635
3636 int
3637 vppcom_session_listener (uint32_t session_handle)
3638 {
3639   vcl_worker_t *wrk = vcl_worker_get_current ();
3640   vcl_session_t *listen_session, *session;
3641   session = vcl_session_get_w_handle (wrk, session_handle);
3642   if (!session)
3643     return VPPCOM_EBADFD;
3644   if (session->listener_index == VCL_INVALID_SESSION_INDEX)
3645     return VPPCOM_EBADFD;
3646   listen_session = vcl_session_get_w_handle (wrk, session->listener_index);
3647   if (!listen_session)
3648     return VPPCOM_EBADFD;
3649   return vcl_session_handle (listen_session);
3650 }
3651
3652 int
3653 vppcom_session_n_accepted (uint32_t session_handle)
3654 {
3655   vcl_worker_t *wrk = vcl_worker_get_current ();
3656   vcl_session_t *session = vcl_session_get_w_handle (wrk, session_handle);
3657   if (!session)
3658     return VPPCOM_EBADFD;
3659   return session->n_accepted_sessions;
3660 }
3661
3662 /*
3663  * fd.io coding-style-patch-verification: ON
3664  *
3665  * Local Variables:
3666  * eval: (c-set-style "gnu")
3667  * End:
3668  */