vcl: handle segment map errors
[vpp.git] / src / vcl / vppcom.c
1 /*
2  * Copyright (c) 2017-2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <stdio.h>
17 #include <stdlib.h>
18 #include <vcl/vppcom.h>
19 #include <vcl/vcl_debug.h>
20 #include <vcl/vcl_private.h>
21 #include <svm/fifo_segment.h>
22
23 __thread uword __vcl_worker_index = ~0;
24
25 static int
26 vcl_wait_for_segment (u64 segment_handle)
27 {
28   vcl_worker_t *wrk = vcl_worker_get_current ();
29   u32 wait_for_seconds = 10, segment_index;
30   f64 timeout;
31
32   if (segment_handle == VCL_INVALID_SEGMENT_HANDLE)
33     return 0;
34
35   timeout = clib_time_now (&wrk->clib_time) + wait_for_seconds;
36   while (clib_time_now (&wrk->clib_time) < timeout)
37     {
38       segment_index = vcl_segment_table_lookup (segment_handle);
39       if (segment_index != VCL_INVALID_SEGMENT_INDEX)
40         return 0;
41       usleep (10);
42     }
43   return 1;
44 }
45
46 static inline int
47 vcl_mq_dequeue_batch (vcl_worker_t * wrk, svm_msg_q_t * mq, u32 n_max_msg)
48 {
49   svm_msg_q_msg_t *msg;
50   u32 n_msgs;
51   int i;
52
53   n_msgs = clib_min (svm_msg_q_size (mq), n_max_msg);
54   for (i = 0; i < n_msgs; i++)
55     {
56       vec_add2 (wrk->mq_msg_vector, msg, 1);
57       svm_msg_q_sub_w_lock (mq, msg);
58     }
59   return n_msgs;
60 }
61
62 const char *
63 vppcom_session_state_str (vcl_session_state_t state)
64 {
65   char *st;
66
67   switch (state)
68     {
69     case STATE_START:
70       st = "STATE_START";
71       break;
72
73     case STATE_CONNECT:
74       st = "STATE_CONNECT";
75       break;
76
77     case STATE_LISTEN:
78       st = "STATE_LISTEN";
79       break;
80
81     case STATE_ACCEPT:
82       st = "STATE_ACCEPT";
83       break;
84
85     case STATE_VPP_CLOSING:
86       st = "STATE_VPP_CLOSING";
87       break;
88
89     case STATE_DISCONNECT:
90       st = "STATE_DISCONNECT";
91       break;
92
93     case STATE_FAILED:
94       st = "STATE_FAILED";
95       break;
96
97     case STATE_UPDATED:
98       st = "STATE_UPDATED";
99       break;
100
101     case STATE_LISTEN_NO_MQ:
102       st = "STATE_LISTEN_NO_MQ";
103       break;
104
105     default:
106       st = "UNKNOWN_STATE";
107       break;
108     }
109
110   return st;
111 }
112
113 u8 *
114 format_ip4_address (u8 * s, va_list * args)
115 {
116   u8 *a = va_arg (*args, u8 *);
117   return format (s, "%d.%d.%d.%d", a[0], a[1], a[2], a[3]);
118 }
119
120 u8 *
121 format_ip6_address (u8 * s, va_list * args)
122 {
123   ip6_address_t *a = va_arg (*args, ip6_address_t *);
124   u32 i, i_max_n_zero, max_n_zeros, i_first_zero, n_zeros, last_double_colon;
125
126   i_max_n_zero = ARRAY_LEN (a->as_u16);
127   max_n_zeros = 0;
128   i_first_zero = i_max_n_zero;
129   n_zeros = 0;
130   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
131     {
132       u32 is_zero = a->as_u16[i] == 0;
133       if (is_zero && i_first_zero >= ARRAY_LEN (a->as_u16))
134         {
135           i_first_zero = i;
136           n_zeros = 0;
137         }
138       n_zeros += is_zero;
139       if ((!is_zero && n_zeros > max_n_zeros)
140           || (i + 1 >= ARRAY_LEN (a->as_u16) && n_zeros > max_n_zeros))
141         {
142           i_max_n_zero = i_first_zero;
143           max_n_zeros = n_zeros;
144           i_first_zero = ARRAY_LEN (a->as_u16);
145           n_zeros = 0;
146         }
147     }
148
149   last_double_colon = 0;
150   for (i = 0; i < ARRAY_LEN (a->as_u16); i++)
151     {
152       if (i == i_max_n_zero && max_n_zeros > 1)
153         {
154           s = format (s, "::");
155           i += max_n_zeros - 1;
156           last_double_colon = 1;
157         }
158       else
159         {
160           s = format (s, "%s%x",
161                       (last_double_colon || i == 0) ? "" : ":",
162                       clib_net_to_host_u16 (a->as_u16[i]));
163           last_double_colon = 0;
164         }
165     }
166
167   return s;
168 }
169
170 /* Format an IP46 address. */
171 u8 *
172 format_ip46_address (u8 * s, va_list * args)
173 {
174   ip46_address_t *ip46 = va_arg (*args, ip46_address_t *);
175   ip46_type_t type = va_arg (*args, ip46_type_t);
176   int is_ip4 = 1;
177
178   switch (type)
179     {
180     case IP46_TYPE_ANY:
181       is_ip4 = ip46_address_is_ip4 (ip46);
182       break;
183     case IP46_TYPE_IP4:
184       is_ip4 = 1;
185       break;
186     case IP46_TYPE_IP6:
187       is_ip4 = 0;
188       break;
189     }
190
191   return is_ip4 ?
192     format (s, "%U", format_ip4_address, &ip46->ip4) :
193     format (s, "%U", format_ip6_address, &ip46->ip6);
194 }
195
196 /*
197  * VPPCOM Utility Functions
198  */
199
200 static void
201 vcl_send_session_listen (vcl_worker_t * wrk, vcl_session_t * s)
202 {
203   app_session_evt_t _app_evt, *app_evt = &_app_evt;
204   session_listen_msg_t *mp;
205   svm_msg_q_t *mq;
206
207   mq = vcl_worker_ctrl_mq (wrk);
208   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_LISTEN);
209   mp = (session_listen_msg_t *) app_evt->evt->data;
210   memset (mp, 0, sizeof (*mp));
211   mp->client_index = wrk->my_client_index;
212   mp->context = s->session_index;
213   mp->wrk_index = wrk->vpp_wrk_index;
214   mp->is_ip4 = s->transport.is_ip4;
215   clib_memcpy_fast (&mp->ip, &s->transport.lcl_ip, sizeof (mp->ip));
216   mp->port = s->transport.lcl_port;
217   mp->proto = s->session_type;
218   app_send_ctrl_evt_to_vpp (mq, app_evt);
219 }
220
221 static void
222 vcl_send_session_connect (vcl_worker_t * wrk, vcl_session_t * s)
223 {
224   app_session_evt_t _app_evt, *app_evt = &_app_evt;
225   session_connect_msg_t *mp;
226   svm_msg_q_t *mq;
227
228   mq = vcl_worker_ctrl_mq (wrk);
229   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_CONNECT);
230   mp = (session_connect_msg_t *) app_evt->evt->data;
231   memset (mp, 0, sizeof (*mp));
232   mp->client_index = wrk->my_client_index;
233   mp->context = s->session_index;
234   mp->wrk_index = wrk->vpp_wrk_index;
235   mp->is_ip4 = s->transport.is_ip4;
236   mp->parent_handle = s->parent_handle;
237   clib_memcpy_fast (&mp->ip, &s->transport.rmt_ip, sizeof (mp->ip));
238   clib_memcpy_fast (&mp->lcl_ip, &s->transport.lcl_ip, sizeof (mp->lcl_ip));
239   mp->port = s->transport.rmt_port;
240   mp->proto = s->session_type;
241   app_send_ctrl_evt_to_vpp (mq, app_evt);
242 }
243
244 void
245 vcl_send_session_unlisten (vcl_worker_t * wrk, vcl_session_t * s)
246 {
247   app_session_evt_t _app_evt, *app_evt = &_app_evt;
248   session_unlisten_msg_t *mp;
249   svm_msg_q_t *mq;
250
251   mq = vcl_worker_ctrl_mq (wrk);
252   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_UNLISTEN);
253   mp = (session_unlisten_msg_t *) app_evt->evt->data;
254   memset (mp, 0, sizeof (*mp));
255   mp->client_index = wrk->my_client_index;
256   mp->wrk_index = wrk->vpp_wrk_index;
257   mp->handle = s->vpp_handle;
258   mp->context = wrk->wrk_index;
259   app_send_ctrl_evt_to_vpp (mq, app_evt);
260 }
261
262 static void
263 vcl_send_session_disconnect (vcl_worker_t * wrk, vcl_session_t * s)
264 {
265   app_session_evt_t _app_evt, *app_evt = &_app_evt;
266   session_disconnect_msg_t *mp;
267   svm_msg_q_t *mq;
268
269   /* Send to thread that owns the session */
270   mq = s->vpp_evt_q;
271   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_DISCONNECT);
272   mp = (session_disconnect_msg_t *) app_evt->evt->data;
273   memset (mp, 0, sizeof (*mp));
274   mp->client_index = wrk->my_client_index;
275   mp->handle = s->vpp_handle;
276   app_send_ctrl_evt_to_vpp (mq, app_evt);
277 }
278
279 static void
280 vcl_send_app_detach (vcl_worker_t * wrk)
281 {
282   app_session_evt_t _app_evt, *app_evt = &_app_evt;
283   session_app_detach_msg_t *mp;
284   svm_msg_q_t *mq;
285
286   mq = vcl_worker_ctrl_mq (wrk);
287   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_APP_DETACH);
288   mp = (session_app_detach_msg_t *) app_evt->evt->data;
289   memset (mp, 0, sizeof (*mp));
290   mp->client_index = wrk->my_client_index;
291   app_send_ctrl_evt_to_vpp (mq, app_evt);
292 }
293
294 static void
295 vcl_send_session_accepted_reply (svm_msg_q_t * mq, u32 context,
296                                  session_handle_t handle, int retval)
297 {
298   app_session_evt_t _app_evt, *app_evt = &_app_evt;
299   session_accepted_reply_msg_t *rmp;
300   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_ACCEPTED_REPLY);
301   rmp = (session_accepted_reply_msg_t *) app_evt->evt->data;
302   rmp->handle = handle;
303   rmp->context = context;
304   rmp->retval = retval;
305   app_send_ctrl_evt_to_vpp (mq, app_evt);
306 }
307
308 static void
309 vcl_send_session_disconnected_reply (svm_msg_q_t * mq, u32 context,
310                                      session_handle_t handle, int retval)
311 {
312   app_session_evt_t _app_evt, *app_evt = &_app_evt;
313   session_disconnected_reply_msg_t *rmp;
314   app_alloc_ctrl_evt_to_vpp (mq, app_evt,
315                              SESSION_CTRL_EVT_DISCONNECTED_REPLY);
316   rmp = (session_disconnected_reply_msg_t *) app_evt->evt->data;
317   rmp->handle = handle;
318   rmp->context = context;
319   rmp->retval = retval;
320   app_send_ctrl_evt_to_vpp (mq, app_evt);
321 }
322
323 static void
324 vcl_send_session_reset_reply (svm_msg_q_t * mq, u32 context,
325                               session_handle_t handle, int retval)
326 {
327   app_session_evt_t _app_evt, *app_evt = &_app_evt;
328   session_reset_reply_msg_t *rmp;
329   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_RESET_REPLY);
330   rmp = (session_reset_reply_msg_t *) app_evt->evt->data;
331   rmp->handle = handle;
332   rmp->context = context;
333   rmp->retval = retval;
334   app_send_ctrl_evt_to_vpp (mq, app_evt);
335 }
336
337 void
338 vcl_send_session_worker_update (vcl_worker_t * wrk, vcl_session_t * s,
339                                 u32 wrk_index)
340 {
341   app_session_evt_t _app_evt, *app_evt = &_app_evt;
342   session_worker_update_msg_t *mp;
343   svm_msg_q_t *mq;
344
345   mq = vcl_session_vpp_evt_q (wrk, s);
346   app_alloc_ctrl_evt_to_vpp (mq, app_evt, SESSION_CTRL_EVT_WORKER_UPDATE);
347   mp = (session_worker_update_msg_t *) app_evt->evt->data;
348   mp->client_index = wrk->my_client_index;
349   mp->handle = s->vpp_handle;
350   mp->req_wrk_index = wrk->vpp_wrk_index;
351   mp->wrk_index = wrk_index;
352   app_send_ctrl_evt_to_vpp (mq, app_evt);
353 }
354
355 static u32
356 vcl_session_accepted_handler (vcl_worker_t * wrk, session_accepted_msg_t * mp,
357                               u32 ls_index)
358 {
359   vcl_session_t *session, *listen_session;
360   svm_fifo_t *rx_fifo, *tx_fifo;
361   u32 vpp_wrk_index;
362   svm_msg_q_t *evt_q;
363
364   session = vcl_session_alloc (wrk);
365
366   listen_session = vcl_session_get (wrk, ls_index);
367   if (listen_session->vpp_handle != mp->listener_handle)
368     {
369       VDBG (0, "ERROR: listener handle %lu does not match session %u",
370             mp->listener_handle, ls_index);
371       goto error;
372     }
373
374   if (vcl_wait_for_segment (mp->segment_handle))
375     {
376       VDBG (0, "ERROR: segment for session %u couldn't be mounted!",
377             session->session_index);
378       goto error;
379     }
380
381   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
382   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
383   session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
384                                          svm_msg_q_t *);
385   rx_fifo->client_session_index = session->session_index;
386   tx_fifo->client_session_index = session->session_index;
387   rx_fifo->client_thread_index = vcl_get_worker_index ();
388   tx_fifo->client_thread_index = vcl_get_worker_index ();
389   vpp_wrk_index = tx_fifo->master_thread_index;
390   vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
391   wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
392
393   session->vpp_handle = mp->handle;
394   session->vpp_thread_index = rx_fifo->master_thread_index;
395   session->rx_fifo = rx_fifo;
396   session->tx_fifo = tx_fifo;
397
398   session->session_state = STATE_ACCEPT;
399   session->transport.rmt_port = mp->rmt.port;
400   session->transport.is_ip4 = mp->rmt.is_ip4;
401   clib_memcpy_fast (&session->transport.rmt_ip, &mp->rmt.ip,
402                     sizeof (ip46_address_t));
403
404   vcl_session_table_add_vpp_handle (wrk, mp->handle, session->session_index);
405   session->transport.lcl_port = listen_session->transport.lcl_port;
406   session->transport.lcl_ip = listen_session->transport.lcl_ip;
407   session->session_type = listen_session->session_type;
408   session->is_dgram = vcl_proto_is_dgram (session->session_type);
409   session->listener_index = listen_session->session_index;
410   listen_session->n_accepted_sessions++;
411
412   VDBG (1, "session %u [0x%llx]: client accept request from %s address %U"
413         " port %d queue %p!", session->session_index, mp->handle,
414         mp->rmt.is_ip4 ? "IPv4" : "IPv6", format_ip46_address, &mp->rmt.ip,
415         mp->rmt.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
416         clib_net_to_host_u16 (mp->rmt.port), session->vpp_evt_q);
417   vcl_evt (VCL_EVT_ACCEPT, session, listen_session, session_index);
418
419   vcl_send_session_accepted_reply (session->vpp_evt_q, mp->context,
420                                    session->vpp_handle, 0);
421
422   return session->session_index;
423
424 error:
425   evt_q = uword_to_pointer (mp->vpp_event_queue_address, svm_msg_q_t *);
426   vcl_send_session_accepted_reply (evt_q, mp->context, mp->handle,
427                                    VNET_API_ERROR_INVALID_ARGUMENT);
428   vcl_session_free (wrk, session);
429   return VCL_INVALID_SESSION_INDEX;
430 }
431
432 static u32
433 vcl_session_connected_handler (vcl_worker_t * wrk,
434                                session_connected_msg_t * mp)
435 {
436   u32 session_index, vpp_wrk_index;
437   svm_fifo_t *rx_fifo, *tx_fifo;
438   vcl_session_t *session = 0;
439
440   session_index = mp->context;
441   session = vcl_session_get (wrk, session_index);
442   if (!session)
443     {
444       VDBG (0, "ERROR: vpp handle 0x%llx has no session index (%u)!",
445             mp->handle, session_index);
446       return VCL_INVALID_SESSION_INDEX;
447     }
448   if (mp->retval)
449     {
450       VDBG (0, "ERROR: session index %u: connect failed! %U",
451             session_index, format_api_error, ntohl (mp->retval));
452       session->session_state = STATE_FAILED | STATE_DISCONNECT;
453       session->vpp_handle = mp->handle;
454       return session_index;
455     }
456
457   session->vpp_handle = mp->handle;
458   session->vpp_evt_q = uword_to_pointer (mp->vpp_event_queue_address,
459                                          svm_msg_q_t *);
460   rx_fifo = uword_to_pointer (mp->server_rx_fifo, svm_fifo_t *);
461   tx_fifo = uword_to_pointer (mp->server_tx_fifo, svm_fifo_t *);
462   if (vcl_wait_for_segment (mp->segment_handle))
463     {
464       VDBG (0, "segment for session %u couldn't be mounted!",
465             session->session_index);
466       session->session_state = STATE_FAILED | STATE_DISCONNECT;
467       vcl_send_session_disconnect (wrk, session);
468       return session_index;
469     }
470
471   rx_fifo->client_session_index = session_index;
472   tx_fifo->client_session_index = session_index;
473   rx_fifo->client_thread_index = vcl_get_worker_index ();
474   tx_fifo->client_thread_index = vcl_get_worker_index ();
475
476   vpp_wrk_index = tx_fifo->master_thread_index;
477   vec_validate (wrk->vpp_event_queues, vpp_wrk_index);
478   wrk->vpp_event_queues[vpp_wrk_index] = session->vpp_evt_q;
479
480   if (mp->ct_rx_fifo)
481     {
482       session->ct_rx_fifo = uword_to_pointer (mp->ct_rx_fifo, svm_fifo_t *);
483       session->ct_tx_fifo = uword_to_pointer (mp->ct_tx_fifo, svm_fifo_t *);
484       if (vcl_wait_for_segment (mp->ct_segment_handle))
485         {
486           VDBG (0, "ct segment for session %u couldn't be mounted!",
487                 session->session_index);
488           session->session_state = STATE_FAILED | STATE_DISCONNECT;
489           vcl_send_session_disconnect (wrk, session);
490           return session_index;
491         }
492     }
493
494   session->rx_fifo = rx_fifo;
495   session->tx_fifo = tx_fifo;
496   session->vpp_thread_index = rx_fifo->master_thread_index;
497   session->transport.is_ip4 = mp->lcl.is_ip4;
498   clib_memcpy_fast (&session->transport.lcl_ip, &mp->lcl.ip,
499                     sizeof (session->transport.lcl_ip));
500   session->transport.lcl_port = mp->lcl.port;
501   session->session_state = STATE_CONNECT;
502
503   /* Add it to lookup table */
504   vcl_session_table_add_vpp_handle (wrk, mp->handle, session_index);
505
506   VDBG (1, "session %u [0x%llx] connected! rx_fifo %p, refcnt %d, tx_fifo %p,"
507         " refcnt %d", session_index, mp->handle, session->rx_fifo,
508         session->rx_fifo->refcnt, session->tx_fifo, session->tx_fifo->refcnt);
509
510   return session_index;
511 }
512
513 static int
514 vcl_flag_accepted_session (vcl_session_t * session, u64 handle, u32 flags)
515 {
516   vcl_session_msg_t *accepted_msg;
517   int i;
518
519   for (i = 0; i < vec_len (session->accept_evts_fifo); i++)
520     {
521       accepted_msg = &session->accept_evts_fifo[i];
522       if (accepted_msg->accepted_msg.handle == handle)
523         {
524           accepted_msg->flags |= flags;
525           return 1;
526         }
527     }
528   return 0;
529 }
530
531 static u32
532 vcl_session_reset_handler (vcl_worker_t * wrk,
533                            session_reset_msg_t * reset_msg)
534 {
535   vcl_session_t *session;
536   u32 sid;
537
538   sid = vcl_session_index_from_vpp_handle (wrk, reset_msg->handle);
539   session = vcl_session_get (wrk, sid);
540   if (!session)
541     {
542       VDBG (0, "request to reset unknown handle 0x%llx", reset_msg->handle);
543       return VCL_INVALID_SESSION_INDEX;
544     }
545
546   /* Caught a reset before actually accepting the session */
547   if (session->session_state == STATE_LISTEN)
548     {
549
550       if (!vcl_flag_accepted_session (session, reset_msg->handle,
551                                       VCL_ACCEPTED_F_RESET))
552         VDBG (0, "session was not accepted!");
553       return VCL_INVALID_SESSION_INDEX;
554     }
555
556   session->session_state = STATE_DISCONNECT;
557   VDBG (0, "reset session %u [0x%llx]", sid, reset_msg->handle);
558   return sid;
559 }
560
561 static u32
562 vcl_session_bound_handler (vcl_worker_t * wrk, session_bound_msg_t * mp)
563 {
564   vcl_session_t *session;
565   u32 sid = mp->context;
566
567   session = vcl_session_get (wrk, sid);
568   if (mp->retval)
569     {
570       VERR ("session %u [0x%llx]: bind failed: %U", sid, mp->handle,
571             format_api_error, mp->retval);
572       if (session)
573         {
574           session->session_state = STATE_FAILED;
575           session->vpp_handle = mp->handle;
576           return sid;
577         }
578       else
579         {
580           VDBG (0, "ERROR: session %u [0x%llx]: Invalid session index!",
581                 sid, mp->handle);
582           return VCL_INVALID_SESSION_INDEX;
583         }
584     }
585
586   session->vpp_handle = mp->handle;
587   session->transport.is_ip4 = mp->lcl_is_ip4;
588   clib_memcpy_fast (&session->transport.lcl_ip, mp->lcl_ip,
589                     sizeof (ip46_address_t));
590   session->transport.lcl_port = mp->lcl_port;
591   vcl_session_table_add_listener (wrk, mp->handle, sid);
592   session->session_state = STATE_LISTEN;
593
594   session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
595   vec_validate (wrk->vpp_event_queues, 0);
596   wrk->vpp_event_queues[0] = session->vpp_evt_q;
597
598   if (session->is_dgram)
599     {
600       svm_fifo_t *rx_fifo, *tx_fifo;
601       session->vpp_evt_q = uword_to_pointer (mp->vpp_evt_q, svm_msg_q_t *);
602       rx_fifo = uword_to_pointer (mp->rx_fifo, svm_fifo_t *);
603       rx_fifo->client_session_index = sid;
604       tx_fifo = uword_to_pointer (mp->tx_fifo, svm_fifo_t *);
605       tx_fifo->client_session_index = sid;
606       session->rx_fifo = rx_fifo;
607       session->tx_fifo = tx_fifo;
608     }
609
610   VDBG (0, "session %u [0x%llx]: listen succeeded!", sid, mp->handle);
611   return sid;
612 }
613
614 static void
615 vcl_session_unlisten_reply_handler (vcl_worker_t * wrk, void *data)
616 {
617   session_unlisten_reply_msg_t *mp = (session_unlisten_reply_msg_t *) data;
618   vcl_session_t *s;
619
620   s = vcl_session_get_w_vpp_handle (wrk, mp->handle);
621   if (!s || s->session_state != STATE_DISCONNECT)
622     {
623       VDBG (0, "Unlisten reply with wrong handle %llx", mp->handle);
624       return;
625     }
626
627   if (mp->retval)
628     VDBG (0, "ERROR: session %u [0xllx]: unlisten failed: %U",
629           s->session_index, mp->handle, format_api_error, ntohl (mp->retval));
630
631   if (mp->context != wrk->wrk_index)
632     VDBG (0, "wrong context");
633
634   vcl_session_table_del_vpp_handle (wrk, mp->handle);
635   vcl_session_free (wrk, s);
636 }
637
638 static vcl_session_t *
639 vcl_session_accepted (vcl_worker_t * wrk, session_accepted_msg_t * msg)
640 {
641   vcl_session_msg_t *vcl_msg;
642   vcl_session_t *session;
643
644   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
645   if (PREDICT_FALSE (session != 0))
646     VWRN ("session overlap handle %lu state %u!", msg->handle,
647           session->session_state);
648
649   session = vcl_session_table_lookup_listener (wrk, msg->listener_handle);
650   if (!session)
651     {
652       VERR ("couldn't find listen session: listener handle %llx",
653             msg->listener_handle);
654       return 0;
655     }
656
657   clib_fifo_add2 (session->accept_evts_fifo, vcl_msg);
658   vcl_msg->accepted_msg = *msg;
659   /* Session handle points to listener until fully accepted by app */
660   vcl_session_table_add_vpp_handle (wrk, msg->handle, session->session_index);
661
662   return session;
663 }
664
665 static vcl_session_t *
666 vcl_session_disconnected_handler (vcl_worker_t * wrk,
667                                   session_disconnected_msg_t * msg)
668 {
669   vcl_session_t *session;
670
671   session = vcl_session_get_w_vpp_handle (wrk, msg->handle);
672   if (!session)
673     {
674       VDBG (0, "request to disconnect unknown handle 0x%llx", msg->handle);
675       return 0;
676     }
677
678   /* Caught a disconnect before actually accepting the session */
679   if (session->session_state == STATE_LISTEN)
680     {
681       if (!vcl_flag_accepted_session (session, msg->handle,
682                                       VCL_ACCEPTED_F_CLOSED))
683         VDBG (0, "session was not accepted!");
684       return 0;
685     }
686
687   session->session_state = STATE_VPP_CLOSING;
688   return session;
689 }
690
691 static void
692 vcl_session_req_worker_update_handler (vcl_worker_t * wrk, void *data)
693 {
694   session_req_worker_update_msg_t *msg;
695   vcl_session_t *s;
696
697   msg = (session_req_worker_update_msg_t *) data;
698   s = vcl_session_get_w_vpp_handle (wrk, msg->session_handle);
699   if (!s)
700     return;
701
702   vec_add1 (wrk->pending_session_wrk_updates, s->session_index);
703 }
704
705 static void
706 vcl_session_worker_update_reply_handler (vcl_worker_t * wrk, void *data)
707 {
708   session_worker_update_reply_msg_t *msg;
709   vcl_session_t *s;
710
711   msg = (session_worker_update_reply_msg_t *) data;
712   s = vcl_session_get_w_vpp_handle (wrk, msg->handle);
713   if (!s)
714     {
715       VDBG (0, "unknown handle 0x%llx", msg->handle);
716       return;
717     }
718   if (vcl_wait_for_segment (msg->segment_handle))
719     {
720       clib_warning ("segment for session %u couldn't be mounted!",
721                     s->session_index);
722       return;
723     }
724
725   if (s->rx_fifo)
726     {
727       s->rx_fifo = uword_to_pointer (msg->rx_fifo, svm_fifo_t *);
728       s->tx_fifo = uword_to_pointer (msg->tx_fifo, svm_fifo_t *);
729       s->rx_fifo->client_session_index = s->session_index;
730       s->tx_fifo->client_session_index = s->session_index;
731       s->rx_fifo->client_thread_index = wrk->wrk_index;
732       s->tx_fifo->client_thread_index = wrk->wrk_index;
733     }
734   s->session_state = STATE_UPDATED;
735
736   VDBG (0, "session %u[0x%llx] moved to worker %u", s->session_index,
737         s->vpp_handle, wrk->wrk_index);
738 }
739
740 static int
741 vcl_handle_mq_event (vcl_worker_t * wrk, session_event_t * e)
742 {
743   session_disconnected_msg_t *disconnected_msg;
744   vcl_session_t *session;
745
746   switch (e->event_type)
747     {
748     case SESSION_IO_EVT_RX:
749     case SESSION_IO_EVT_TX:
750       session = vcl_session_get (wrk, e->session_index);
751       if (!session || !(session->session_state & STATE_OPEN))
752         break;
753       vec_add1 (wrk->unhandled_evts_vector, *e);
754       break;
755     case SESSION_CTRL_EVT_ACCEPTED:
756       vcl_session_accepted (wrk, (session_accepted_msg_t *) e->data);
757       break;
758     case SESSION_CTRL_EVT_CONNECTED:
759       vcl_session_connected_handler (wrk,
760                                      (session_connected_msg_t *) e->data);
761       break;
762     case SESSION_CTRL_EVT_DISCONNECTED:
763       disconnected_msg = (session_disconnected_msg_t *) e->data;
764       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
765       if (!session)
766         break;
767       VDBG (0, "disconnected session %u [0x%llx]", session->session_index,
768             session->vpp_handle);
769       break;
770     case SESSION_CTRL_EVT_RESET:
771       vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
772       break;
773     case SESSION_CTRL_EVT_BOUND:
774       vcl_session_bound_handler (wrk, (session_bound_msg_t *) e->data);
775       break;
776     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
777       vcl_session_unlisten_reply_handler (wrk, e->data);
778       break;
779     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
780       vcl_session_req_worker_update_handler (wrk, e->data);
781       break;
782     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
783       vcl_session_worker_update_reply_handler (wrk, e->data);
784       break;
785     default:
786       clib_warning ("unhandled %u", e->event_type);
787     }
788   return VPPCOM_OK;
789 }
790
791 static int
792 vppcom_wait_for_session_state_change (u32 session_index,
793                                       vcl_session_state_t state,
794                                       f64 wait_for_time)
795 {
796   vcl_worker_t *wrk = vcl_worker_get_current ();
797   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
798   vcl_session_t *volatile session;
799   svm_msg_q_msg_t msg;
800   session_event_t *e;
801
802   do
803     {
804       session = vcl_session_get (wrk, session_index);
805       if (PREDICT_FALSE (!session))
806         {
807           return VPPCOM_EBADFD;
808         }
809       if (session->session_state & state)
810         {
811           return VPPCOM_OK;
812         }
813       if (session->session_state & STATE_FAILED)
814         {
815           return VPPCOM_ECONNREFUSED;
816         }
817
818       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0))
819         {
820           usleep (100);
821           continue;
822         }
823       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
824       vcl_handle_mq_event (wrk, e);
825       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
826     }
827   while (clib_time_now (&wrk->clib_time) < timeout);
828
829   VDBG (0, "timeout waiting for state 0x%x (%s)", state,
830         vppcom_session_state_str (state));
831   vcl_evt (VCL_EVT_SESSION_TIMEOUT, session, session_state);
832
833   return VPPCOM_ETIMEDOUT;
834 }
835
836 static void
837 vcl_handle_pending_wrk_updates (vcl_worker_t * wrk)
838 {
839   vcl_session_state_t state;
840   vcl_session_t *s;
841   u32 *sip;
842
843   if (PREDICT_TRUE (vec_len (wrk->pending_session_wrk_updates) == 0))
844     return;
845
846   vec_foreach (sip, wrk->pending_session_wrk_updates)
847   {
848     s = vcl_session_get (wrk, *sip);
849     vcl_send_session_worker_update (wrk, s, wrk->wrk_index);
850     state = s->session_state;
851     vppcom_wait_for_session_state_change (s->session_index, STATE_UPDATED, 5);
852     s->session_state = state;
853   }
854   vec_reset_length (wrk->pending_session_wrk_updates);
855 }
856
857 void
858 vcl_flush_mq_events (void)
859 {
860   vcl_worker_t *wrk = vcl_worker_get_current ();
861   svm_msg_q_msg_t *msg;
862   session_event_t *e;
863   svm_msg_q_t *mq;
864   int i;
865
866   mq = wrk->app_event_queue;
867   svm_msg_q_lock (mq);
868   vcl_mq_dequeue_batch (wrk, mq, ~0);
869   svm_msg_q_unlock (mq);
870
871   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
872     {
873       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
874       e = svm_msg_q_msg_data (mq, msg);
875       vcl_handle_mq_event (wrk, e);
876       svm_msg_q_free_msg (mq, msg);
877     }
878   vec_reset_length (wrk->mq_msg_vector);
879   vcl_handle_pending_wrk_updates (wrk);
880 }
881
882 static int
883 vppcom_app_session_enable (void)
884 {
885   int rv;
886
887   if (vcm->app_state != STATE_APP_ENABLED)
888     {
889       vppcom_send_session_enable_disable (1 /* is_enabled == TRUE */ );
890       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
891       if (PREDICT_FALSE (rv))
892         {
893           VDBG (0, "application session enable timed out! returning %d (%s)",
894                 rv, vppcom_retval_str (rv));
895           return rv;
896         }
897     }
898   return VPPCOM_OK;
899 }
900
901 static int
902 vppcom_app_attach (void)
903 {
904   int rv;
905
906   vppcom_app_send_attach ();
907   rv = vcl_wait_for_app_state_change (STATE_APP_ATTACHED);
908   if (PREDICT_FALSE (rv))
909     {
910       VDBG (0, "application attach timed out! returning %d (%s)", rv,
911             vppcom_retval_str (rv));
912       return rv;
913     }
914
915   return VPPCOM_OK;
916 }
917
918 static int
919 vppcom_session_unbind (u32 session_handle)
920 {
921   vcl_worker_t *wrk = vcl_worker_get_current ();
922   session_accepted_msg_t *accepted_msg;
923   vcl_session_t *session = 0;
924   vcl_session_msg_t *evt;
925
926   session = vcl_session_get_w_handle (wrk, session_handle);
927   if (!session)
928     return VPPCOM_EBADFD;
929
930   /* Flush pending accept events, if any */
931   while (clib_fifo_elts (session->accept_evts_fifo))
932     {
933       clib_fifo_sub2 (session->accept_evts_fifo, evt);
934       accepted_msg = &evt->accepted_msg;
935       vcl_session_table_del_vpp_handle (wrk, accepted_msg->handle);
936       vcl_send_session_accepted_reply (session->vpp_evt_q,
937                                        accepted_msg->context,
938                                        session->vpp_handle, -1);
939     }
940   clib_fifo_free (session->accept_evts_fifo);
941
942   vcl_send_session_unlisten (wrk, session);
943
944   VDBG (1, "session %u [0x%llx]: sending unbind!", session->session_index,
945         session->vpp_handle);
946   vcl_evt (VCL_EVT_UNBIND, session);
947
948   session->vpp_handle = ~0;
949   session->session_state = STATE_DISCONNECT;
950
951   return VPPCOM_OK;
952 }
953
954 static int
955 vppcom_session_disconnect (u32 session_handle)
956 {
957   vcl_worker_t *wrk = vcl_worker_get_current ();
958   svm_msg_q_t *vpp_evt_q;
959   vcl_session_t *session, *listen_session;
960   vcl_session_state_t state;
961   u64 vpp_handle;
962
963   session = vcl_session_get_w_handle (wrk, session_handle);
964   if (!session)
965     return VPPCOM_EBADFD;
966
967   vpp_handle = session->vpp_handle;
968   state = session->session_state;
969
970   VDBG (1, "session %u [0x%llx] state 0x%x (%s)", session->session_index,
971         vpp_handle, state, vppcom_session_state_str (state));
972
973   if (PREDICT_FALSE (state & STATE_LISTEN))
974     {
975       VDBG (0, "ERROR: Cannot disconnect a listen socket!");
976       return VPPCOM_EBADFD;
977     }
978
979   if (state & STATE_VPP_CLOSING)
980     {
981       vpp_evt_q = vcl_session_vpp_evt_q (wrk, session);
982       vcl_send_session_disconnected_reply (vpp_evt_q, wrk->my_client_index,
983                                            vpp_handle, 0);
984       VDBG (1, "session %u [0x%llx]: sending disconnect REPLY...",
985             session->session_index, vpp_handle);
986     }
987   else
988     {
989       VDBG (1, "session %u [0x%llx]: sending disconnect...",
990             session->session_index, vpp_handle);
991       vcl_send_session_disconnect (wrk, session);
992     }
993
994   if (session->listener_index != VCL_INVALID_SESSION_INDEX)
995     {
996       listen_session = vcl_session_get (wrk, session->listener_index);
997       listen_session->n_accepted_sessions--;
998     }
999
1000   return VPPCOM_OK;
1001 }
1002
1003 /**
1004  * Handle app exit
1005  *
1006  * Notify vpp of the disconnect and mark the worker as free. If we're the
1007  * last worker, do a full cleanup otherwise, since we're probably a forked
1008  * child, avoid syscalls as much as possible. We might've lost privileges.
1009  */
1010 void
1011 vppcom_app_exit (void)
1012 {
1013   if (!pool_elts (vcm->workers))
1014     return;
1015   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1016   vcl_set_worker_index (~0);
1017   vcl_elog_stop (vcm);
1018   if (vec_len (vcm->workers) == 1)
1019     vppcom_disconnect_from_vpp ();
1020   else
1021     vl_client_send_disconnect (1 /* vpp should cleanup */ );
1022 }
1023
1024 /*
1025  * VPPCOM Public API functions
1026  */
1027 int
1028 vppcom_app_create (char *app_name)
1029 {
1030   vppcom_cfg_t *vcl_cfg = &vcm->cfg;
1031   int rv;
1032
1033   if (vcm->is_init)
1034     {
1035       VDBG (1, "already initialized");
1036       return VPPCOM_EEXIST;
1037     }
1038
1039   vcm->is_init = 1;
1040   vppcom_cfg (&vcm->cfg);
1041   vcl_cfg = &vcm->cfg;
1042
1043   vcm->main_cpu = pthread_self ();
1044   vcm->main_pid = getpid ();
1045   vcm->app_name = format (0, "%s", app_name);
1046   vppcom_init_error_string_table ();
1047   fifo_segment_main_init (&vcm->segment_main, vcl_cfg->segment_baseva,
1048                           20 /* timeout in secs */ );
1049   pool_alloc (vcm->workers, vcl_cfg->max_workers);
1050   clib_spinlock_init (&vcm->workers_lock);
1051   clib_rwlock_init (&vcm->segment_table_lock);
1052   atexit (vppcom_app_exit);
1053
1054   /* Allocate default worker */
1055   vcl_worker_alloc_and_init ();
1056
1057   /* API hookup and connect to VPP */
1058   vppcom_api_hookup ();
1059   vcl_elog_init (vcm);
1060   vcm->app_state = STATE_APP_START;
1061   rv = vppcom_connect_to_vpp (app_name);
1062   if (rv)
1063     {
1064       VERR ("couldn't connect to VPP!");
1065       return rv;
1066     }
1067   VDBG (0, "sending session enable");
1068   rv = vppcom_app_session_enable ();
1069   if (rv)
1070     {
1071       VERR ("vppcom_app_session_enable() failed!");
1072       return rv;
1073     }
1074
1075   VDBG (0, "sending app attach");
1076   rv = vppcom_app_attach ();
1077   if (rv)
1078     {
1079       VERR ("vppcom_app_attach() failed!");
1080       return rv;
1081     }
1082
1083   VDBG (0, "app_name '%s', my_client_index %d (0x%x)", app_name,
1084         vcm->workers[0].my_client_index, vcm->workers[0].my_client_index);
1085
1086   return VPPCOM_OK;
1087 }
1088
1089 void
1090 vppcom_app_destroy (void)
1091 {
1092   int rv;
1093   f64 orig_app_timeout;
1094
1095   if (!pool_elts (vcm->workers))
1096     return;
1097
1098   vcl_evt (VCL_EVT_DETACH, vcm);
1099
1100   if (pool_elts (vcm->workers) == 1)
1101     {
1102       vcl_send_app_detach (vcl_worker_get_current ());
1103       orig_app_timeout = vcm->cfg.app_timeout;
1104       vcm->cfg.app_timeout = 2.0;
1105       rv = vcl_wait_for_app_state_change (STATE_APP_ENABLED);
1106       vcm->cfg.app_timeout = orig_app_timeout;
1107       if (PREDICT_FALSE (rv))
1108         VDBG (0, "application detach timed out! returning %d (%s)", rv,
1109               vppcom_retval_str (rv));
1110       vec_free (vcm->app_name);
1111       vcl_worker_cleanup (vcl_worker_get_current (), 0 /* notify vpp */ );
1112     }
1113   else
1114     {
1115       vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
1116     }
1117
1118   vcl_set_worker_index (~0);
1119   vcl_elog_stop (vcm);
1120   vl_client_disconnect_from_vlib ();
1121 }
1122
1123 int
1124 vppcom_session_create (u8 proto, u8 is_nonblocking)
1125 {
1126   vcl_worker_t *wrk = vcl_worker_get_current ();
1127   vcl_session_t *session;
1128
1129   session = vcl_session_alloc (wrk);
1130
1131   session->session_type = proto;
1132   session->session_state = STATE_START;
1133   session->vpp_handle = ~0;
1134   session->is_dgram = vcl_proto_is_dgram (proto);
1135
1136   if (is_nonblocking)
1137     VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
1138
1139   vcl_evt (VCL_EVT_CREATE, session, session_type, session->session_state,
1140            is_nonblocking, session_index);
1141
1142   VDBG (0, "created session %u", session->session_index);
1143
1144   return vcl_session_handle (session);
1145 }
1146
1147 int
1148 vcl_session_cleanup (vcl_worker_t * wrk, vcl_session_t * session,
1149                      vcl_session_handle_t sh, u8 do_disconnect)
1150 {
1151   vcl_session_state_t state;
1152   u32 next_sh, vep_sh;
1153   int rv = VPPCOM_OK;
1154   u64 vpp_handle;
1155   u8 is_vep;
1156
1157   is_vep = session->is_vep;
1158   next_sh = session->vep.next_sh;
1159   vep_sh = session->vep.vep_sh;
1160   state = session->session_state;
1161   vpp_handle = session->vpp_handle;
1162
1163   VDBG (1, "session %u [0x%llx] closing", session->session_index, vpp_handle);
1164
1165   if (is_vep)
1166     {
1167       while (next_sh != ~0)
1168         {
1169           rv = vppcom_epoll_ctl (sh, EPOLL_CTL_DEL, next_sh, 0);
1170           if (PREDICT_FALSE (rv < 0))
1171             VDBG (0, "vpp handle 0x%llx, sh %u: EPOLL_CTL_DEL vep_idx %u"
1172                   " failed! rv %d (%s)", vpp_handle, next_sh, vep_sh, rv,
1173                   vppcom_retval_str (rv));
1174
1175           next_sh = session->vep.next_sh;
1176         }
1177     }
1178   else
1179     {
1180       if (session->is_vep_session)
1181         {
1182           rv = vppcom_epoll_ctl (vep_sh, EPOLL_CTL_DEL, sh, 0);
1183           if (rv < 0)
1184             VDBG (0, "session %u [0x%llx]: EPOLL_CTL_DEL vep_idx %u "
1185                   "failed! rv %d (%s)", session->session_index, vpp_handle,
1186                   vep_sh, rv, vppcom_retval_str (rv));
1187         }
1188
1189       if (!do_disconnect)
1190         {
1191           VDBG (1, "session %u [0x%llx] disconnect skipped",
1192                 session->session_index, vpp_handle);
1193           goto cleanup;
1194         }
1195
1196       if (state & STATE_LISTEN)
1197         {
1198           rv = vppcom_session_unbind (sh);
1199           if (PREDICT_FALSE (rv < 0))
1200             VDBG (0, "session %u [0x%llx]: listener unbind failed! "
1201                   "rv %d (%s)", session->session_index, vpp_handle, rv,
1202                   vppcom_retval_str (rv));
1203           return rv;
1204         }
1205       else if ((state & STATE_OPEN)
1206                || (vcl_session_is_connectable_listener (wrk, session)))
1207         {
1208           rv = vppcom_session_disconnect (sh);
1209           if (PREDICT_FALSE (rv < 0))
1210             VDBG (0, "ERROR: session %u [0x%llx]: disconnect failed!"
1211                   " rv %d (%s)", session->session_index, vpp_handle,
1212                   rv, vppcom_retval_str (rv));
1213         }
1214       else if (state == STATE_DISCONNECT)
1215         {
1216           svm_msg_q_t *mq = vcl_session_vpp_evt_q (wrk, session);
1217           vcl_send_session_reset_reply (mq, wrk->my_client_index,
1218                                         session->vpp_handle, 0);
1219         }
1220     }
1221
1222   VDBG (0, "session %u [0x%llx] removed", session->session_index, vpp_handle);
1223
1224 cleanup:
1225   vcl_session_table_del_vpp_handle (wrk, vpp_handle);
1226   vcl_session_free (wrk, session);
1227   vcl_evt (VCL_EVT_CLOSE, session, rv);
1228
1229   return rv;
1230 }
1231
1232 int
1233 vppcom_session_close (uint32_t session_handle)
1234 {
1235   vcl_worker_t *wrk = vcl_worker_get_current ();
1236   vcl_session_t *session;
1237
1238   session = vcl_session_get_w_handle (wrk, session_handle);
1239   if (!session)
1240     return VPPCOM_EBADFD;
1241   return vcl_session_cleanup (wrk, session, session_handle,
1242                               1 /* do_disconnect */ );
1243 }
1244
1245 int
1246 vppcom_session_bind (uint32_t session_handle, vppcom_endpt_t * ep)
1247 {
1248   vcl_worker_t *wrk = vcl_worker_get_current ();
1249   vcl_session_t *session = 0;
1250
1251   if (!ep || !ep->ip)
1252     return VPPCOM_EINVAL;
1253
1254   session = vcl_session_get_w_handle (wrk, session_handle);
1255   if (!session)
1256     return VPPCOM_EBADFD;
1257
1258   if (session->is_vep)
1259     {
1260       VDBG (0, "ERROR: cannot bind to epoll session %u!",
1261             session->session_index);
1262       return VPPCOM_EBADFD;
1263     }
1264
1265   session->transport.is_ip4 = ep->is_ip4;
1266   if (ep->is_ip4)
1267     clib_memcpy_fast (&session->transport.lcl_ip.ip4, ep->ip,
1268                       sizeof (ip4_address_t));
1269   else
1270     clib_memcpy_fast (&session->transport.lcl_ip.ip6, ep->ip,
1271                       sizeof (ip6_address_t));
1272   session->transport.lcl_port = ep->port;
1273
1274   VDBG (0, "session %u handle %u: binding to local %s address %U port %u, "
1275         "proto %s", session->session_index, session_handle,
1276         session->transport.is_ip4 ? "IPv4" : "IPv6",
1277         format_ip46_address, &session->transport.lcl_ip,
1278         session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1279         clib_net_to_host_u16 (session->transport.lcl_port),
1280         vppcom_proto_str (session->session_type));
1281   vcl_evt (VCL_EVT_BIND, session);
1282
1283   if (session->session_type == VPPCOM_PROTO_UDP)
1284     vppcom_session_listen (session_handle, 10);
1285
1286   return VPPCOM_OK;
1287 }
1288
1289 int
1290 vppcom_session_listen (uint32_t listen_sh, uint32_t q_len)
1291 {
1292   vcl_worker_t *wrk = vcl_worker_get_current ();
1293   vcl_session_t *listen_session = 0;
1294   u64 listen_vpp_handle;
1295   int rv;
1296
1297   listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1298   if (!listen_session || listen_session->is_vep)
1299     return VPPCOM_EBADFD;
1300
1301   if (q_len == 0 || q_len == ~0)
1302     q_len = vcm->cfg.listen_queue_size;
1303
1304   listen_vpp_handle = listen_session->vpp_handle;
1305   if (listen_session->session_state & STATE_LISTEN)
1306     {
1307       VDBG (0, "session %u [0x%llx]: already in listen state!",
1308             listen_sh, listen_vpp_handle);
1309       return VPPCOM_OK;
1310     }
1311
1312   VDBG (0, "session %u: sending vpp listen request...", listen_sh);
1313
1314   /*
1315    * Send listen request to vpp and wait for reply
1316    */
1317   vcl_send_session_listen (wrk, listen_session);
1318   rv = vppcom_wait_for_session_state_change (listen_session->session_index,
1319                                              STATE_LISTEN,
1320                                              vcm->cfg.session_timeout);
1321
1322   if (PREDICT_FALSE (rv))
1323     {
1324       listen_session = vcl_session_get_w_handle (wrk, listen_sh);
1325       VDBG (0, "session %u [0x%llx]: listen failed! returning %d (%s)",
1326             listen_sh, listen_session->vpp_handle, rv,
1327             vppcom_retval_str (rv));
1328       return rv;
1329     }
1330
1331   return VPPCOM_OK;
1332 }
1333
1334 int
1335 vppcom_session_tls_add_cert (uint32_t session_handle, char *cert,
1336                              uint32_t cert_len)
1337 {
1338
1339   vcl_worker_t *wrk = vcl_worker_get_current ();
1340   vcl_session_t *session = 0;
1341
1342   session = vcl_session_get_w_handle (wrk, session_handle);
1343   if (!session)
1344     return VPPCOM_EBADFD;
1345
1346   if (cert_len == 0 || cert_len == ~0)
1347     return VPPCOM_EBADFD;
1348
1349   /*
1350    * Send listen request to vpp and wait for reply
1351    */
1352   vppcom_send_application_tls_cert_add (session, cert, cert_len);
1353   vcm->app_state = STATE_APP_ADDING_TLS_DATA;
1354   vcl_wait_for_app_state_change (STATE_APP_READY);
1355   return VPPCOM_OK;
1356
1357 }
1358
1359 int
1360 vppcom_session_tls_add_key (uint32_t session_handle, char *key,
1361                             uint32_t key_len)
1362 {
1363
1364   vcl_worker_t *wrk = vcl_worker_get_current ();
1365   vcl_session_t *session = 0;
1366
1367   session = vcl_session_get_w_handle (wrk, session_handle);
1368   if (!session)
1369     return VPPCOM_EBADFD;
1370
1371   if (key_len == 0 || key_len == ~0)
1372     return VPPCOM_EBADFD;
1373
1374   vppcom_send_application_tls_key_add (session, key, key_len);
1375   vcm->app_state = STATE_APP_ADDING_TLS_DATA;
1376   vcl_wait_for_app_state_change (STATE_APP_READY);
1377   return VPPCOM_OK;
1378 }
1379
1380 static int
1381 validate_args_session_accept_ (vcl_worker_t * wrk, vcl_session_t * ls)
1382 {
1383   if (ls->is_vep)
1384     {
1385       VDBG (0, "ERROR: cannot accept on epoll session %u!",
1386             ls->session_index);
1387       return VPPCOM_EBADFD;
1388     }
1389
1390   if ((ls->session_state != STATE_LISTEN)
1391       && (!vcl_session_is_connectable_listener (wrk, ls)))
1392     {
1393       VDBG (0,
1394             "ERROR: session [0x%llx]: not in listen state! state 0x%x"
1395             " (%s)", ls->vpp_handle, ls->session_state,
1396             vppcom_session_state_str (ls->session_state));
1397       return VPPCOM_EBADFD;
1398     }
1399   return VPPCOM_OK;
1400 }
1401
1402 int
1403 vppcom_unformat_proto (uint8_t * proto, char *proto_str)
1404 {
1405   if (!strcmp (proto_str, "TCP"))
1406     *proto = VPPCOM_PROTO_TCP;
1407   else if (!strcmp (proto_str, "tcp"))
1408     *proto = VPPCOM_PROTO_TCP;
1409   else if (!strcmp (proto_str, "UDP"))
1410     *proto = VPPCOM_PROTO_UDP;
1411   else if (!strcmp (proto_str, "udp"))
1412     *proto = VPPCOM_PROTO_UDP;
1413   else if (!strcmp (proto_str, "UDPC"))
1414     *proto = VPPCOM_PROTO_UDPC;
1415   else if (!strcmp (proto_str, "udpc"))
1416     *proto = VPPCOM_PROTO_UDPC;
1417   else if (!strcmp (proto_str, "SCTP"))
1418     *proto = VPPCOM_PROTO_SCTP;
1419   else if (!strcmp (proto_str, "sctp"))
1420     *proto = VPPCOM_PROTO_SCTP;
1421   else if (!strcmp (proto_str, "TLS"))
1422     *proto = VPPCOM_PROTO_TLS;
1423   else if (!strcmp (proto_str, "tls"))
1424     *proto = VPPCOM_PROTO_TLS;
1425   else if (!strcmp (proto_str, "QUIC"))
1426     *proto = VPPCOM_PROTO_QUIC;
1427   else if (!strcmp (proto_str, "quic"))
1428     *proto = VPPCOM_PROTO_QUIC;
1429   else
1430     return 1;
1431   return 0;
1432 }
1433
1434 int
1435 vppcom_session_accept (uint32_t listen_session_handle, vppcom_endpt_t * ep,
1436                        uint32_t flags)
1437 {
1438   u32 client_session_index = ~0, listen_session_index, accept_flags = 0;
1439   vcl_worker_t *wrk = vcl_worker_get_current ();
1440   session_accepted_msg_t accepted_msg;
1441   vcl_session_t *listen_session = 0;
1442   vcl_session_t *client_session = 0;
1443   vcl_session_msg_t *evt;
1444   svm_msg_q_msg_t msg;
1445   session_event_t *e;
1446   u8 is_nonblocking;
1447   int rv;
1448
1449   listen_session = vcl_session_get_w_handle (wrk, listen_session_handle);
1450   if (!listen_session)
1451     return VPPCOM_EBADFD;
1452
1453   listen_session_index = listen_session->session_index;
1454   if ((rv = validate_args_session_accept_ (wrk, listen_session)))
1455     return rv;
1456
1457   if (clib_fifo_elts (listen_session->accept_evts_fifo))
1458     {
1459       clib_fifo_sub2 (listen_session->accept_evts_fifo, evt);
1460       accept_flags = evt->flags;
1461       accepted_msg = evt->accepted_msg;
1462       goto handle;
1463     }
1464
1465   is_nonblocking = VCL_SESS_ATTR_TEST (listen_session->attr,
1466                                        VCL_SESS_ATTR_NONBLOCK);
1467   if (svm_msg_q_is_empty (wrk->app_event_queue) && is_nonblocking)
1468     return VPPCOM_EAGAIN;
1469
1470   while (1)
1471     {
1472       if (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_WAIT, 0))
1473         return VPPCOM_EAGAIN;
1474
1475       e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
1476       if (e->event_type != SESSION_CTRL_EVT_ACCEPTED)
1477         {
1478           VDBG (0, "discarded event: %u", e->event_type);
1479           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1480           continue;
1481         }
1482       clib_memcpy_fast (&accepted_msg, e->data, sizeof (accepted_msg));
1483       svm_msg_q_free_msg (wrk->app_event_queue, &msg);
1484       break;
1485     }
1486
1487 handle:
1488
1489   client_session_index = vcl_session_accepted_handler (wrk, &accepted_msg,
1490                                                        listen_session_index);
1491   if (client_session_index == VCL_INVALID_SESSION_INDEX)
1492     return VPPCOM_ECONNABORTED;
1493
1494   listen_session = vcl_session_get (wrk, listen_session_index);
1495   client_session = vcl_session_get (wrk, client_session_index);
1496
1497   if (flags & O_NONBLOCK)
1498     VCL_SESS_ATTR_SET (client_session->attr, VCL_SESS_ATTR_NONBLOCK);
1499
1500   VDBG (1, "listener %u [0x%llx]: Got a connect request! session %u [0x%llx],"
1501         " flags %d, is_nonblocking %u", listen_session->session_index,
1502         listen_session->vpp_handle, client_session_index,
1503         client_session->vpp_handle, flags,
1504         VCL_SESS_ATTR_TEST (client_session->attr, VCL_SESS_ATTR_NONBLOCK));
1505
1506   if (ep)
1507     {
1508       ep->is_ip4 = client_session->transport.is_ip4;
1509       ep->port = client_session->transport.rmt_port;
1510       if (client_session->transport.is_ip4)
1511         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip4,
1512                           sizeof (ip4_address_t));
1513       else
1514         clib_memcpy_fast (ep->ip, &client_session->transport.rmt_ip.ip6,
1515                           sizeof (ip6_address_t));
1516     }
1517
1518   VDBG (0, "listener %u [0x%llx] accepted %u [0x%llx] peer: %U:%u "
1519         "local: %U:%u", listen_session_handle, listen_session->vpp_handle,
1520         client_session_index, client_session->vpp_handle,
1521         format_ip46_address, &client_session->transport.rmt_ip,
1522         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1523         clib_net_to_host_u16 (client_session->transport.rmt_port),
1524         format_ip46_address, &client_session->transport.lcl_ip,
1525         client_session->transport.is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
1526         clib_net_to_host_u16 (client_session->transport.lcl_port));
1527   vcl_evt (VCL_EVT_ACCEPT, client_session, listen_session,
1528            client_session_index);
1529
1530   /*
1531    * Session might have been closed already
1532    */
1533   if (accept_flags)
1534     {
1535       if (accept_flags & VCL_ACCEPTED_F_CLOSED)
1536         client_session->session_state = STATE_VPP_CLOSING;
1537       else if (accept_flags & VCL_ACCEPTED_F_RESET)
1538         client_session->session_state = STATE_DISCONNECT;
1539     }
1540   return vcl_session_handle (client_session);
1541 }
1542
1543 static void
1544 vcl_ip_copy_from_ep (ip46_address_t * ip, vppcom_endpt_t * ep)
1545 {
1546   if (ep->is_ip4)
1547     clib_memcpy_fast (&ip->ip4, ep->ip, sizeof (ip4_address_t));
1548   else
1549     clib_memcpy_fast (&ip->ip6, ep->ip, sizeof (ip6_address_t));
1550 }
1551
1552 void
1553 vcl_ip_copy_to_ep (ip46_address_t * ip, vppcom_endpt_t * ep, u8 is_ip4)
1554 {
1555   ep->is_ip4 = is_ip4;
1556   if (is_ip4)
1557     clib_memcpy_fast (ep->ip, &ip->ip4, sizeof (ip4_address_t));
1558   else
1559     clib_memcpy_fast (ep->ip, &ip->ip6, sizeof (ip6_address_t));
1560 }
1561
1562 int
1563 vppcom_session_connect (uint32_t session_handle, vppcom_endpt_t * server_ep)
1564 {
1565   vcl_worker_t *wrk = vcl_worker_get_current ();
1566   vcl_session_t *session = 0;
1567   u32 session_index;
1568   int rv;
1569
1570   session = vcl_session_get_w_handle (wrk, session_handle);
1571   if (!session)
1572     return VPPCOM_EBADFD;
1573   session_index = session->session_index;
1574
1575   if (PREDICT_FALSE (session->is_vep))
1576     {
1577       VDBG (0, "ERROR: cannot connect epoll session %u!",
1578             session->session_index);
1579       return VPPCOM_EBADFD;
1580     }
1581
1582   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1583     {
1584       VDBG (0, "session handle %u [0x%llx]: session already "
1585             "connected to %s %U port %d proto %s, state 0x%x (%s)",
1586             session_handle, session->vpp_handle,
1587             session->transport.is_ip4 ? "IPv4" : "IPv6", format_ip46_address,
1588             &session->transport.rmt_ip, session->transport.is_ip4 ?
1589             IP46_TYPE_IP4 : IP46_TYPE_IP6,
1590             clib_net_to_host_u16 (session->transport.rmt_port),
1591             vppcom_proto_str (session->session_type), session->session_state,
1592             vppcom_session_state_str (session->session_state));
1593       return VPPCOM_OK;
1594     }
1595
1596   session->transport.is_ip4 = server_ep->is_ip4;
1597   vcl_ip_copy_from_ep (&session->transport.rmt_ip, server_ep);
1598   session->transport.rmt_port = server_ep->port;
1599   session->parent_handle = VCL_INVALID_SESSION_HANDLE;
1600
1601   VDBG (0, "session handle %u: connecting to server %s %U "
1602         "port %d proto %s", session_handle,
1603         session->transport.is_ip4 ? "IPv4" : "IPv6",
1604         format_ip46_address,
1605         &session->transport.rmt_ip, session->transport.is_ip4 ?
1606         IP46_TYPE_IP4 : IP46_TYPE_IP6,
1607         clib_net_to_host_u16 (session->transport.rmt_port),
1608         vppcom_proto_str (session->session_type));
1609
1610   vcl_send_session_connect (wrk, session);
1611
1612   if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK))
1613     return VPPCOM_EINPROGRESS;
1614
1615   /*
1616    * Wait for reply from vpp if blocking
1617    */
1618   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1619                                              vcm->cfg.session_timeout);
1620
1621   session = vcl_session_get (wrk, session_index);
1622   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1623         session->vpp_handle, rv ? "failed" : "succeeded");
1624
1625   return rv;
1626 }
1627
1628 int
1629 vppcom_session_stream_connect (uint32_t session_handle,
1630                                uint32_t parent_session_handle)
1631 {
1632   vcl_worker_t *wrk = vcl_worker_get_current ();
1633   vcl_session_t *session, *parent_session;
1634   u32 session_index, parent_session_index;
1635   int rv;
1636
1637   session = vcl_session_get_w_handle (wrk, session_handle);
1638   if (!session)
1639     return VPPCOM_EBADFD;
1640   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1641   if (!parent_session)
1642     return VPPCOM_EBADFD;
1643
1644   session_index = session->session_index;
1645   parent_session_index = parent_session->session_index;
1646   if (PREDICT_FALSE (session->is_vep))
1647     {
1648       VDBG (0, "ERROR: cannot connect epoll session %u!",
1649             session->session_index);
1650       return VPPCOM_EBADFD;
1651     }
1652
1653   if (PREDICT_FALSE (session->session_state & CLIENT_STATE_OPEN))
1654     {
1655       VDBG (0, "session handle %u [0x%llx]: session already "
1656             "connected to session %u [0x%llx] proto %s, state 0x%x (%s)",
1657             session_handle, session->vpp_handle,
1658             parent_session_handle, parent_session->vpp_handle,
1659             vppcom_proto_str (session->session_type), session->session_state,
1660             vppcom_session_state_str (session->session_state));
1661       return VPPCOM_OK;
1662     }
1663
1664   /* Connect to quic session specifics */
1665   session->transport.is_ip4 = parent_session->transport.is_ip4;
1666   session->transport.rmt_ip.ip4.as_u32 = (uint32_t) 1;
1667   session->transport.rmt_port = 0;
1668   session->parent_handle = parent_session->vpp_handle;
1669
1670   VDBG (0, "session handle %u: connecting to session %u [0x%llx]",
1671         session_handle, parent_session_handle, parent_session->vpp_handle);
1672
1673   /*
1674    * Send connect request and wait for reply from vpp
1675    */
1676   vcl_send_session_connect (wrk, session);
1677   rv = vppcom_wait_for_session_state_change (session_index, STATE_CONNECT,
1678                                              vcm->cfg.session_timeout);
1679
1680   session->listener_index = parent_session_index;
1681   parent_session = vcl_session_get_w_handle (wrk, parent_session_handle);
1682   if (parent_session)
1683     parent_session->n_accepted_sessions++;
1684
1685   session = vcl_session_get (wrk, session_index);
1686   VDBG (0, "session %u [0x%llx]: connect %s!", session->session_index,
1687         session->vpp_handle, rv ? "failed" : "succeeded");
1688
1689   return rv;
1690 }
1691
1692 static u8
1693 vcl_is_rx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1694 {
1695   return (e->event_type == SESSION_IO_EVT_RX && e->session_index == sid);
1696 }
1697
1698 static inline int
1699 vppcom_session_read_internal (uint32_t session_handle, void *buf, int n,
1700                               u8 peek)
1701 {
1702   vcl_worker_t *wrk = vcl_worker_get_current ();
1703   int n_read = 0, is_nonblocking;
1704   vcl_session_t *s = 0;
1705   svm_fifo_t *rx_fifo;
1706   svm_msg_q_msg_t msg;
1707   session_event_t *e;
1708   svm_msg_q_t *mq;
1709   u8 is_ct;
1710
1711   if (PREDICT_FALSE (!buf))
1712     return VPPCOM_EINVAL;
1713
1714   s = vcl_session_get_w_handle (wrk, session_handle);
1715   if (PREDICT_FALSE (!s || s->is_vep))
1716     return VPPCOM_EBADFD;
1717
1718   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1719     {
1720       VDBG (0, "session %u[0x%llx] is not open! state 0x%x (%s)",
1721             s->session_index, s->vpp_handle, s->session_state,
1722             vppcom_session_state_str (s->session_state));
1723       return vcl_session_closed_error (s);
1724     }
1725
1726   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1727   is_ct = vcl_session_is_ct (s);
1728   mq = wrk->app_event_queue;
1729   rx_fifo = is_ct ? s->ct_rx_fifo : s->rx_fifo;
1730   s->has_rx_evt = 0;
1731
1732   if (svm_fifo_is_empty_cons (rx_fifo))
1733     {
1734       if (is_nonblocking)
1735         {
1736           svm_fifo_unset_event (s->rx_fifo);
1737           return VPPCOM_EWOULDBLOCK;
1738         }
1739       while (svm_fifo_is_empty_cons (rx_fifo))
1740         {
1741           if (vcl_session_is_closing (s))
1742             return vcl_session_closing_error (s);
1743
1744           svm_fifo_unset_event (s->rx_fifo);
1745           svm_msg_q_lock (mq);
1746           if (svm_msg_q_is_empty (mq))
1747             svm_msg_q_wait (mq);
1748
1749           svm_msg_q_sub_w_lock (mq, &msg);
1750           e = svm_msg_q_msg_data (mq, &msg);
1751           svm_msg_q_unlock (mq);
1752           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1753             vcl_handle_mq_event (wrk, e);
1754           svm_msg_q_free_msg (mq, &msg);
1755         }
1756     }
1757
1758   if (s->is_dgram)
1759     n_read = app_recv_dgram_raw (rx_fifo, buf, n, &s->transport, 0, peek);
1760   else
1761     n_read = app_recv_stream_raw (rx_fifo, buf, n, 0, peek);
1762
1763   if (svm_fifo_is_empty_cons (rx_fifo))
1764     svm_fifo_unset_event (s->rx_fifo);
1765
1766   /* Cut-through sessions might request tx notifications on rx fifos */
1767   if (PREDICT_FALSE (rx_fifo->want_deq_ntf))
1768     {
1769       app_send_io_evt_to_vpp (s->vpp_evt_q, s->rx_fifo->master_session_index,
1770                               SESSION_IO_EVT_RX, SVM_Q_WAIT);
1771       svm_fifo_reset_has_deq_ntf (s->rx_fifo);
1772     }
1773
1774   VDBG (2, "session %u[0x%llx]: read %d bytes from (%p)", s->session_index,
1775         s->vpp_handle, n_read, rx_fifo);
1776
1777   return n_read;
1778 }
1779
1780 int
1781 vppcom_session_read (uint32_t session_handle, void *buf, size_t n)
1782 {
1783   return (vppcom_session_read_internal (session_handle, buf, n, 0));
1784 }
1785
1786 static int
1787 vppcom_session_peek (uint32_t session_handle, void *buf, int n)
1788 {
1789   return (vppcom_session_read_internal (session_handle, buf, n, 1));
1790 }
1791
1792 int
1793 vppcom_session_read_segments (uint32_t session_handle,
1794                               vppcom_data_segments_t ds)
1795 {
1796   vcl_worker_t *wrk = vcl_worker_get_current ();
1797   int n_read = 0, is_nonblocking;
1798   vcl_session_t *s = 0;
1799   svm_fifo_t *rx_fifo;
1800   svm_msg_q_msg_t msg;
1801   session_event_t *e;
1802   svm_msg_q_t *mq;
1803   u8 is_ct;
1804
1805   s = vcl_session_get_w_handle (wrk, session_handle);
1806   if (PREDICT_FALSE (!s || s->is_vep))
1807     return VPPCOM_EBADFD;
1808
1809   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1810     return vcl_session_closed_error (s);
1811
1812   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1813   is_ct = vcl_session_is_ct (s);
1814   mq = is_ct ? s->our_evt_q : wrk->app_event_queue;
1815   rx_fifo = s->rx_fifo;
1816   s->has_rx_evt = 0;
1817
1818   if (is_ct)
1819     svm_fifo_unset_event (s->rx_fifo);
1820
1821   if (svm_fifo_is_empty_cons (rx_fifo))
1822     {
1823       if (is_nonblocking)
1824         {
1825           svm_fifo_unset_event (rx_fifo);
1826           return VPPCOM_EWOULDBLOCK;
1827         }
1828       while (svm_fifo_is_empty_cons (rx_fifo))
1829         {
1830           if (vcl_session_is_closing (s))
1831             return vcl_session_closing_error (s);
1832
1833           svm_fifo_unset_event (rx_fifo);
1834           svm_msg_q_lock (mq);
1835           if (svm_msg_q_is_empty (mq))
1836             svm_msg_q_wait (mq);
1837
1838           svm_msg_q_sub_w_lock (mq, &msg);
1839           e = svm_msg_q_msg_data (mq, &msg);
1840           svm_msg_q_unlock (mq);
1841           if (!vcl_is_rx_evt_for_session (e, s->session_index, is_ct))
1842             vcl_handle_mq_event (wrk, e);
1843           svm_msg_q_free_msg (mq, &msg);
1844         }
1845     }
1846
1847   n_read = svm_fifo_segments (rx_fifo, (svm_fifo_seg_t *) ds);
1848   svm_fifo_unset_event (rx_fifo);
1849
1850   return n_read;
1851 }
1852
1853 void
1854 vppcom_session_free_segments (uint32_t session_handle,
1855                               vppcom_data_segments_t ds)
1856 {
1857   vcl_worker_t *wrk = vcl_worker_get_current ();
1858   vcl_session_t *s;
1859
1860   s = vcl_session_get_w_handle (wrk, session_handle);
1861   if (PREDICT_FALSE (!s || s->is_vep))
1862     return;
1863
1864   svm_fifo_segments_free (s->rx_fifo, (svm_fifo_seg_t *) ds);
1865 }
1866
1867 int
1868 vppcom_data_segment_copy (void *buf, vppcom_data_segments_t ds, u32 max_bytes)
1869 {
1870   u32 first_copy = clib_min (ds[0].len, max_bytes);
1871   clib_memcpy_fast (buf, ds[0].data, first_copy);
1872   if (first_copy < max_bytes)
1873     {
1874       clib_memcpy_fast (buf + first_copy, ds[1].data,
1875                         clib_min (ds[1].len, max_bytes - first_copy));
1876     }
1877   return 0;
1878 }
1879
1880 static u8
1881 vcl_is_tx_evt_for_session (session_event_t * e, u32 sid, u8 is_ct)
1882 {
1883   return (e->event_type == SESSION_IO_EVT_TX && e->session_index == sid);
1884 }
1885
1886 static inline int
1887 vppcom_session_write_inline (uint32_t session_handle, void *buf, size_t n,
1888                              u8 is_flush)
1889 {
1890   vcl_worker_t *wrk = vcl_worker_get_current ();
1891   int n_write, is_nonblocking;
1892   vcl_session_t *s = 0;
1893   session_evt_type_t et;
1894   svm_msg_q_msg_t msg;
1895   svm_fifo_t *tx_fifo;
1896   session_event_t *e;
1897   svm_msg_q_t *mq;
1898   u8 is_ct;
1899
1900   if (PREDICT_FALSE (!buf))
1901     return VPPCOM_EINVAL;
1902
1903   s = vcl_session_get_w_handle (wrk, session_handle);
1904   if (PREDICT_FALSE (!s))
1905     return VPPCOM_EBADFD;
1906
1907   if (PREDICT_FALSE (s->is_vep))
1908     {
1909       VDBG (0, "ERROR: session %u [0x%llx]: cannot write to an epoll"
1910             " session!", s->session_index, s->vpp_handle);
1911       return VPPCOM_EBADFD;
1912     }
1913
1914   if (PREDICT_FALSE (!vcl_session_is_open (s)))
1915     {
1916       VDBG (1, "session %u [0x%llx]: is not open! state 0x%x (%s)",
1917             s->session_index, s->vpp_handle, s->session_state,
1918             vppcom_session_state_str (s->session_state));
1919       return vcl_session_closed_error (s);;
1920     }
1921
1922   is_ct = vcl_session_is_ct (s);
1923   tx_fifo = is_ct ? s->ct_tx_fifo : s->tx_fifo;
1924   is_nonblocking = VCL_SESS_ATTR_TEST (s->attr, VCL_SESS_ATTR_NONBLOCK);
1925
1926   mq = wrk->app_event_queue;
1927   if (svm_fifo_is_full_prod (tx_fifo))
1928     {
1929       if (is_nonblocking)
1930         {
1931           return VPPCOM_EWOULDBLOCK;
1932         }
1933       while (svm_fifo_is_full_prod (tx_fifo))
1934         {
1935           svm_fifo_add_want_deq_ntf (tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
1936           if (vcl_session_is_closing (s))
1937             return vcl_session_closing_error (s);
1938           svm_msg_q_lock (mq);
1939           if (svm_msg_q_is_empty (mq))
1940             svm_msg_q_wait (mq);
1941
1942           svm_msg_q_sub_w_lock (mq, &msg);
1943           e = svm_msg_q_msg_data (mq, &msg);
1944           svm_msg_q_unlock (mq);
1945
1946           if (!vcl_is_tx_evt_for_session (e, s->session_index, is_ct))
1947             vcl_handle_mq_event (wrk, e);
1948           svm_msg_q_free_msg (mq, &msg);
1949         }
1950     }
1951
1952   et = SESSION_IO_EVT_TX;
1953   if (is_flush && !is_ct)
1954     et = SESSION_IO_EVT_TX_FLUSH;
1955
1956   if (s->is_dgram)
1957     n_write = app_send_dgram_raw (tx_fifo, &s->transport,
1958                                   s->vpp_evt_q, buf, n, et,
1959                                   0 /* do_evt */ , SVM_Q_WAIT);
1960   else
1961     n_write = app_send_stream_raw (tx_fifo, s->vpp_evt_q, buf, n, et,
1962                                    0 /* do_evt */ , SVM_Q_WAIT);
1963
1964   if (svm_fifo_set_event (s->tx_fifo))
1965     app_send_io_evt_to_vpp (s->vpp_evt_q, s->tx_fifo->master_session_index,
1966                             et, SVM_Q_WAIT);
1967
1968   ASSERT (n_write > 0);
1969
1970   VDBG (2, "session %u [0x%llx]: wrote %d bytes", s->session_index,
1971         s->vpp_handle, n_write);
1972
1973   return n_write;
1974 }
1975
1976 int
1977 vppcom_session_write (uint32_t session_handle, void *buf, size_t n)
1978 {
1979   return vppcom_session_write_inline (session_handle, buf, n,
1980                                       0 /* is_flush */ );
1981 }
1982
1983 int
1984 vppcom_session_write_msg (uint32_t session_handle, void *buf, size_t n)
1985 {
1986   return vppcom_session_write_inline (session_handle, buf, n,
1987                                       1 /* is_flush */ );
1988 }
1989
1990 #define vcl_fifo_rx_evt_valid_or_break(_s)                              \
1991 if (PREDICT_FALSE (svm_fifo_is_empty (_s->rx_fifo)))                    \
1992   {                                                                     \
1993     if (!vcl_session_is_ct (_s))                                        \
1994       {                                                                 \
1995         svm_fifo_unset_event (_s->rx_fifo);                             \
1996         if (svm_fifo_is_empty (_s->rx_fifo))                            \
1997           break;                                                        \
1998       }                                                                 \
1999     else if (svm_fifo_is_empty (_s->ct_rx_fifo))                        \
2000       {                                                                 \
2001         svm_fifo_unset_event (_s->ct_rx_fifo);                          \
2002         if (svm_fifo_is_empty (_s->ct_rx_fifo))                         \
2003           break;                                                        \
2004       }                                                                 \
2005   }                                                                     \
2006
2007 static void
2008 vcl_select_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2009                             unsigned long n_bits, unsigned long *read_map,
2010                             unsigned long *write_map,
2011                             unsigned long *except_map, u32 * bits_set)
2012 {
2013   session_disconnected_msg_t *disconnected_msg;
2014   session_connected_msg_t *connected_msg;
2015   vcl_session_t *session;
2016   u32 sid;
2017
2018   switch (e->event_type)
2019     {
2020     case SESSION_IO_EVT_RX:
2021       sid = e->session_index;
2022       session = vcl_session_get (wrk, sid);
2023       if (!session)
2024         break;
2025       vcl_fifo_rx_evt_valid_or_break (session);
2026       if (sid < n_bits && read_map)
2027         {
2028           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2029           *bits_set += 1;
2030         }
2031       break;
2032     case SESSION_IO_EVT_TX:
2033       sid = e->session_index;
2034       session = vcl_session_get (wrk, sid);
2035       if (!session)
2036         break;
2037       if (sid < n_bits && write_map)
2038         {
2039           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2040           *bits_set += 1;
2041         }
2042       break;
2043     case SESSION_CTRL_EVT_ACCEPTED:
2044       session = vcl_session_accepted (wrk,
2045                                       (session_accepted_msg_t *) e->data);
2046       if (!session)
2047         break;
2048       sid = session->session_index;
2049       if (sid < n_bits && read_map)
2050         {
2051           clib_bitmap_set_no_check ((uword *) read_map, sid, 1);
2052           *bits_set += 1;
2053         }
2054       break;
2055     case SESSION_CTRL_EVT_CONNECTED:
2056       connected_msg = (session_connected_msg_t *) e->data;
2057       sid = vcl_session_connected_handler (wrk, connected_msg);
2058       if (sid == VCL_INVALID_SESSION_INDEX)
2059         break;
2060       if (sid < n_bits && write_map)
2061         {
2062           clib_bitmap_set_no_check ((uword *) write_map, sid, 1);
2063           *bits_set += 1;
2064         }
2065       break;
2066     case SESSION_CTRL_EVT_DISCONNECTED:
2067       disconnected_msg = (session_disconnected_msg_t *) e->data;
2068       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2069       if (!session)
2070         break;
2071       sid = session->session_index;
2072       if (sid < n_bits && except_map)
2073         {
2074           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2075           *bits_set += 1;
2076         }
2077       break;
2078     case SESSION_CTRL_EVT_RESET:
2079       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2080       if (sid < n_bits && except_map)
2081         {
2082           clib_bitmap_set_no_check ((uword *) except_map, sid, 1);
2083           *bits_set += 1;
2084         }
2085       break;
2086     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2087       vcl_session_unlisten_reply_handler (wrk, e->data);
2088       break;
2089     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2090       vcl_session_worker_update_reply_handler (wrk, e->data);
2091       break;
2092     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2093       vcl_session_req_worker_update_handler (wrk, e->data);
2094       break;
2095     default:
2096       clib_warning ("unhandled: %u", e->event_type);
2097       break;
2098     }
2099 }
2100
2101 static int
2102 vcl_select_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2103                       unsigned long n_bits, unsigned long *read_map,
2104                       unsigned long *write_map, unsigned long *except_map,
2105                       double time_to_wait, u32 * bits_set)
2106 {
2107   svm_msg_q_msg_t *msg;
2108   session_event_t *e;
2109   u32 i;
2110
2111   svm_msg_q_lock (mq);
2112   if (svm_msg_q_is_empty (mq))
2113     {
2114       if (*bits_set)
2115         {
2116           svm_msg_q_unlock (mq);
2117           return 0;
2118         }
2119
2120       if (!time_to_wait)
2121         {
2122           svm_msg_q_unlock (mq);
2123           return 0;
2124         }
2125       else if (time_to_wait < 0)
2126         {
2127           svm_msg_q_wait (mq);
2128         }
2129       else
2130         {
2131           if (svm_msg_q_timedwait (mq, time_to_wait))
2132             {
2133               svm_msg_q_unlock (mq);
2134               return 0;
2135             }
2136         }
2137     }
2138   vcl_mq_dequeue_batch (wrk, mq, ~0);
2139   svm_msg_q_unlock (mq);
2140
2141   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2142     {
2143       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2144       e = svm_msg_q_msg_data (mq, msg);
2145       vcl_select_handle_mq_event (wrk, e, n_bits, read_map, write_map,
2146                                   except_map, bits_set);
2147       svm_msg_q_free_msg (mq, msg);
2148     }
2149   vec_reset_length (wrk->mq_msg_vector);
2150   vcl_handle_pending_wrk_updates (wrk);
2151   return *bits_set;
2152 }
2153
2154 static int
2155 vppcom_select_condvar (vcl_worker_t * wrk, int n_bits,
2156                        vcl_si_set * read_map, vcl_si_set * write_map,
2157                        vcl_si_set * except_map, double time_to_wait,
2158                        u32 * bits_set)
2159 {
2160   double wait = 0, start = 0;
2161
2162   if (!*bits_set)
2163     {
2164       wait = time_to_wait;
2165       start = clib_time_now (&wrk->clib_time);
2166     }
2167
2168   do
2169     {
2170       vcl_select_handle_mq (wrk, wrk->app_event_queue, n_bits, read_map,
2171                             write_map, except_map, wait, bits_set);
2172       if (*bits_set)
2173         return *bits_set;
2174       if (wait == -1)
2175         continue;
2176
2177       wait = wait - (clib_time_now (&wrk->clib_time) - start);
2178     }
2179   while (wait > 0);
2180
2181   return 0;
2182 }
2183
2184 static int
2185 vppcom_select_eventfd (vcl_worker_t * wrk, int n_bits,
2186                        vcl_si_set * read_map, vcl_si_set * write_map,
2187                        vcl_si_set * except_map, double time_to_wait,
2188                        u32 * bits_set)
2189 {
2190   vcl_mq_evt_conn_t *mqc;
2191   int __clib_unused n_read;
2192   int n_mq_evts, i;
2193   u64 buf;
2194
2195   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2196   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2197                           vec_len (wrk->mq_events), time_to_wait);
2198   for (i = 0; i < n_mq_evts; i++)
2199     {
2200       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2201       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2202       vcl_select_handle_mq (wrk, mqc->mq, n_bits, read_map, write_map,
2203                             except_map, 0, bits_set);
2204     }
2205
2206   return (n_mq_evts > 0 ? (int) *bits_set : 0);
2207 }
2208
2209 int
2210 vppcom_select (int n_bits, vcl_si_set * read_map, vcl_si_set * write_map,
2211                vcl_si_set * except_map, double time_to_wait)
2212 {
2213   u32 sid, minbits = clib_max (n_bits, BITS (uword)), bits_set = 0;
2214   vcl_worker_t *wrk = vcl_worker_get_current ();
2215   vcl_session_t *session = 0;
2216   int rv, i;
2217
2218   if (n_bits && read_map)
2219     {
2220       clib_bitmap_validate (wrk->rd_bitmap, minbits);
2221       clib_memcpy_fast (wrk->rd_bitmap, read_map,
2222                         vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2223       memset (read_map, 0, vec_len (wrk->rd_bitmap) * sizeof (vcl_si_set));
2224     }
2225   if (n_bits && write_map)
2226     {
2227       clib_bitmap_validate (wrk->wr_bitmap, minbits);
2228       clib_memcpy_fast (wrk->wr_bitmap, write_map,
2229                         vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2230       memset (write_map, 0, vec_len (wrk->wr_bitmap) * sizeof (vcl_si_set));
2231     }
2232   if (n_bits && except_map)
2233     {
2234       clib_bitmap_validate (wrk->ex_bitmap, minbits);
2235       clib_memcpy_fast (wrk->ex_bitmap, except_map,
2236                         vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2237       memset (except_map, 0, vec_len (wrk->ex_bitmap) * sizeof (vcl_si_set));
2238     }
2239
2240   if (!n_bits)
2241     return 0;
2242
2243   if (!write_map)
2244     goto check_rd;
2245
2246   /* *INDENT-OFF* */
2247   clib_bitmap_foreach (sid, wrk->wr_bitmap, ({
2248     if (!(session = vcl_session_get (wrk, sid)))
2249       {
2250         if (except_map && sid < minbits)
2251           clib_bitmap_set_no_check (except_map, sid, 1);
2252         continue;
2253       }
2254
2255     rv = svm_fifo_is_full_prod (session->tx_fifo);
2256     if (!rv)
2257       {
2258         clib_bitmap_set_no_check ((uword*)write_map, sid, 1);
2259         bits_set++;
2260       }
2261     else
2262       svm_fifo_add_want_deq_ntf (session->tx_fifo, SVM_FIFO_WANT_DEQ_NOTIF);
2263   }));
2264
2265 check_rd:
2266   if (!read_map)
2267     goto check_mq;
2268
2269   clib_bitmap_foreach (sid, wrk->rd_bitmap, ({
2270     if (!(session = vcl_session_get (wrk, sid)))
2271       {
2272         if (except_map && sid < minbits)
2273           clib_bitmap_set_no_check (except_map, sid, 1);
2274         continue;
2275       }
2276
2277     rv = vcl_session_read_ready (session);
2278     if (rv)
2279       {
2280         clib_bitmap_set_no_check ((uword*)read_map, sid, 1);
2281         bits_set++;
2282       }
2283   }));
2284   /* *INDENT-ON* */
2285
2286 check_mq:
2287
2288   for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2289     {
2290       vcl_select_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i], n_bits,
2291                                   read_map, write_map, except_map, &bits_set);
2292     }
2293   vec_reset_length (wrk->unhandled_evts_vector);
2294
2295   if (vcm->cfg.use_mq_eventfd)
2296     vppcom_select_eventfd (wrk, n_bits, read_map, write_map, except_map,
2297                            time_to_wait, &bits_set);
2298   else
2299     vppcom_select_condvar (wrk, n_bits, read_map, write_map, except_map,
2300                            time_to_wait, &bits_set);
2301
2302   return (bits_set);
2303 }
2304
2305 static inline void
2306 vep_verify_epoll_chain (vcl_worker_t * wrk, u32 vep_handle)
2307 {
2308   vcl_session_t *session;
2309   vppcom_epoll_t *vep;
2310   u32 sh = vep_handle;
2311
2312   if (VPPCOM_DEBUG <= 2)
2313     return;
2314
2315   session = vcl_session_get_w_handle (wrk, vep_handle);
2316   if (PREDICT_FALSE (!session))
2317     {
2318       VDBG (0, "ERROR: Invalid vep_sh (%u)!", vep_handle);
2319       goto done;
2320     }
2321   if (PREDICT_FALSE (!session->is_vep))
2322     {
2323       VDBG (0, "ERROR: vep_sh (%u) is not a vep!", vep_handle);
2324       goto done;
2325     }
2326   vep = &session->vep;
2327   VDBG (0, "vep_sh (%u): Dumping epoll chain\n"
2328         "{\n"
2329         "   is_vep         = %u\n"
2330         "   is_vep_session = %u\n"
2331         "   next_sh        = 0x%x (%u)\n"
2332         "}\n", vep_handle, session->is_vep, session->is_vep_session,
2333         vep->next_sh, vep->next_sh);
2334
2335   for (sh = vep->next_sh; sh != ~0; sh = vep->next_sh)
2336     {
2337       session = vcl_session_get_w_handle (wrk, sh);
2338       if (PREDICT_FALSE (!session))
2339         {
2340           VDBG (0, "ERROR: Invalid sh (%u)!", sh);
2341           goto done;
2342         }
2343       if (PREDICT_FALSE (session->is_vep))
2344         {
2345           VDBG (0, "ERROR: sh (%u) is a vep!", vep_handle);
2346         }
2347       else if (PREDICT_FALSE (!session->is_vep_session))
2348         {
2349           VDBG (0, "ERROR: sh (%u) is not a vep session handle!", sh);
2350           goto done;
2351         }
2352       vep = &session->vep;
2353       if (PREDICT_FALSE (vep->vep_sh != vep_handle))
2354         VDBG (0, "ERROR: session (%u) vep_sh (%u) != vep_sh (%u)!",
2355               sh, session->vep.vep_sh, vep_handle);
2356       if (session->is_vep_session)
2357         {
2358           VDBG (0, "vep_sh[%u]: sh 0x%x (%u)\n"
2359                 "{\n"
2360                 "   next_sh        = 0x%x (%u)\n"
2361                 "   prev_sh        = 0x%x (%u)\n"
2362                 "   vep_sh         = 0x%x (%u)\n"
2363                 "   ev.events      = 0x%x\n"
2364                 "   ev.data.u64    = 0x%llx\n"
2365                 "   et_mask        = 0x%x\n"
2366                 "}\n",
2367                 vep_handle, sh, sh, vep->next_sh, vep->next_sh, vep->prev_sh,
2368                 vep->prev_sh, vep->vep_sh, vep->vep_sh, vep->ev.events,
2369                 vep->ev.data.u64, vep->et_mask);
2370         }
2371     }
2372
2373 done:
2374   VDBG (0, "vep_sh (%u): Dump complete!\n", vep_handle);
2375 }
2376
2377 int
2378 vppcom_epoll_create (void)
2379 {
2380   vcl_worker_t *wrk = vcl_worker_get_current ();
2381   vcl_session_t *vep_session;
2382
2383   vep_session = vcl_session_alloc (wrk);
2384
2385   vep_session->is_vep = 1;
2386   vep_session->vep.vep_sh = ~0;
2387   vep_session->vep.next_sh = ~0;
2388   vep_session->vep.prev_sh = ~0;
2389   vep_session->vpp_handle = ~0;
2390
2391   vcl_evt (VCL_EVT_EPOLL_CREATE, vep_session, vep_session->session_index);
2392   VDBG (0, "Created vep_idx %u", vep_session->session_index);
2393
2394   return vcl_session_handle (vep_session);
2395 }
2396
2397 int
2398 vppcom_epoll_ctl (uint32_t vep_handle, int op, uint32_t session_handle,
2399                   struct epoll_event *event)
2400 {
2401   vcl_worker_t *wrk = vcl_worker_get_current ();
2402   vcl_session_t *vep_session;
2403   vcl_session_t *session;
2404   int rv = VPPCOM_OK;
2405
2406   if (vep_handle == session_handle)
2407     {
2408       VDBG (0, "vep_sh == session handle (%u)!", vep_handle);
2409       return VPPCOM_EINVAL;
2410     }
2411
2412   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2413   if (PREDICT_FALSE (!vep_session))
2414     {
2415       VDBG (0, "Invalid vep_sh (%u)!", vep_handle);
2416       return VPPCOM_EBADFD;
2417     }
2418   if (PREDICT_FALSE (!vep_session->is_vep))
2419     {
2420       VDBG (0, "vep_sh (%u) is not a vep!", vep_handle);
2421       return VPPCOM_EINVAL;
2422     }
2423
2424   ASSERT (vep_session->vep.vep_sh == ~0);
2425   ASSERT (vep_session->vep.prev_sh == ~0);
2426
2427   session = vcl_session_get_w_handle (wrk, session_handle);
2428   if (PREDICT_FALSE (!session))
2429     {
2430       VDBG (0, "Invalid session_handle (%u)!", session_handle);
2431       return VPPCOM_EBADFD;
2432     }
2433   if (PREDICT_FALSE (session->is_vep))
2434     {
2435       VDBG (0, "session_handle (%u) is a vep!", vep_handle);
2436       return VPPCOM_EINVAL;
2437     }
2438
2439   switch (op)
2440     {
2441     case EPOLL_CTL_ADD:
2442       if (PREDICT_FALSE (!event))
2443         {
2444           VDBG (0, "EPOLL_CTL_ADD: NULL pointer to epoll_event structure!");
2445           return VPPCOM_EINVAL;
2446         }
2447       if (vep_session->vep.next_sh != ~0)
2448         {
2449           vcl_session_t *next_session;
2450           next_session = vcl_session_get_w_handle (wrk,
2451                                                    vep_session->vep.next_sh);
2452           if (PREDICT_FALSE (!next_session))
2453             {
2454               VDBG (0, "EPOLL_CTL_ADD: Invalid vep.next_sh (%u) on "
2455                     "vep_idx (%u)!", vep_session->vep.next_sh, vep_handle);
2456               return VPPCOM_EBADFD;
2457             }
2458           ASSERT (next_session->vep.prev_sh == vep_handle);
2459           next_session->vep.prev_sh = session_handle;
2460         }
2461       session->vep.next_sh = vep_session->vep.next_sh;
2462       session->vep.prev_sh = vep_handle;
2463       session->vep.vep_sh = vep_handle;
2464       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2465       session->vep.ev = *event;
2466       session->is_vep = 0;
2467       session->is_vep_session = 1;
2468       vep_session->vep.next_sh = session_handle;
2469
2470       if (session->tx_fifo)
2471         svm_fifo_add_want_deq_ntf (session->tx_fifo,
2472                                    SVM_FIFO_WANT_DEQ_NOTIF_IF_FULL);
2473
2474       VDBG (1, "EPOLL_CTL_ADD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2475             vep_handle, session_handle, event->events, event->data.u64);
2476       vcl_evt (VCL_EVT_EPOLL_CTLADD, session, event->events, event->data.u64);
2477       break;
2478
2479     case EPOLL_CTL_MOD:
2480       if (PREDICT_FALSE (!event))
2481         {
2482           VDBG (0, "EPOLL_CTL_MOD: NULL pointer to epoll_event structure!");
2483           rv = VPPCOM_EINVAL;
2484           goto done;
2485         }
2486       else if (PREDICT_FALSE (!session->is_vep_session))
2487         {
2488           VDBG (0, "sh %u EPOLL_CTL_MOD: not a vep session!", session_handle);
2489           rv = VPPCOM_EINVAL;
2490           goto done;
2491         }
2492       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2493         {
2494           VDBG (0, "EPOLL_CTL_MOD: sh %u vep_sh (%u) != vep_sh (%u)!",
2495                 session_handle, session->vep.vep_sh, vep_handle);
2496           rv = VPPCOM_EINVAL;
2497           goto done;
2498         }
2499       session->vep.et_mask = VEP_DEFAULT_ET_MASK;
2500       session->vep.ev = *event;
2501       VDBG (1, "EPOLL_CTL_MOD: vep_sh %u, sh %u, events 0x%x, data 0x%llx!",
2502             vep_handle, session_handle, event->events, event->data.u64);
2503       break;
2504
2505     case EPOLL_CTL_DEL:
2506       if (PREDICT_FALSE (!session->is_vep_session))
2507         {
2508           VDBG (0, "EPOLL_CTL_DEL: %u not a vep session!", session_handle);
2509           rv = VPPCOM_EINVAL;
2510           goto done;
2511         }
2512       else if (PREDICT_FALSE (session->vep.vep_sh != vep_handle))
2513         {
2514           VDBG (0, "EPOLL_CTL_DEL: sh %u vep_sh (%u) != vep_sh (%u)!",
2515                 session_handle, session->vep.vep_sh, vep_handle);
2516           rv = VPPCOM_EINVAL;
2517           goto done;
2518         }
2519
2520       if (session->vep.prev_sh == vep_handle)
2521         vep_session->vep.next_sh = session->vep.next_sh;
2522       else
2523         {
2524           vcl_session_t *prev_session;
2525           prev_session = vcl_session_get_w_handle (wrk, session->vep.prev_sh);
2526           if (PREDICT_FALSE (!prev_session))
2527             {
2528               VDBG (0, "EPOLL_CTL_DEL: Invalid prev_sh (%u) on sh (%u)!",
2529                     session->vep.prev_sh, session_handle);
2530               return VPPCOM_EBADFD;
2531             }
2532           ASSERT (prev_session->vep.next_sh == session_handle);
2533           prev_session->vep.next_sh = session->vep.next_sh;
2534         }
2535       if (session->vep.next_sh != ~0)
2536         {
2537           vcl_session_t *next_session;
2538           next_session = vcl_session_get_w_handle (wrk, session->vep.next_sh);
2539           if (PREDICT_FALSE (!next_session))
2540             {
2541               VDBG (0, "EPOLL_CTL_DEL: Invalid next_sh (%u) on sh (%u)!",
2542                     session->vep.next_sh, session_handle);
2543               return VPPCOM_EBADFD;
2544             }
2545           ASSERT (next_session->vep.prev_sh == session_handle);
2546           next_session->vep.prev_sh = session->vep.prev_sh;
2547         }
2548
2549       memset (&session->vep, 0, sizeof (session->vep));
2550       session->vep.next_sh = ~0;
2551       session->vep.prev_sh = ~0;
2552       session->vep.vep_sh = ~0;
2553       session->is_vep_session = 0;
2554
2555       if (session->tx_fifo)
2556         svm_fifo_del_want_deq_ntf (session->tx_fifo, SVM_FIFO_NO_DEQ_NOTIF);
2557
2558       VDBG (1, "EPOLL_CTL_DEL: vep_idx %u, sh %u!", vep_handle,
2559             session_handle);
2560       vcl_evt (VCL_EVT_EPOLL_CTLDEL, session, vep_sh);
2561       break;
2562
2563     default:
2564       VDBG (0, "Invalid operation (%d)!", op);
2565       rv = VPPCOM_EINVAL;
2566     }
2567
2568   vep_verify_epoll_chain (wrk, vep_handle);
2569
2570 done:
2571   return rv;
2572 }
2573
2574 static inline void
2575 vcl_epoll_wait_handle_mq_event (vcl_worker_t * wrk, session_event_t * e,
2576                                 struct epoll_event *events, u32 * num_ev)
2577 {
2578   session_disconnected_msg_t *disconnected_msg;
2579   session_connected_msg_t *connected_msg;
2580   u32 sid = ~0, session_events;
2581   u64 session_evt_data = ~0;
2582   vcl_session_t *session;
2583   u8 add_event = 0;
2584
2585   switch (e->event_type)
2586     {
2587     case SESSION_IO_EVT_RX:
2588       sid = e->session_index;
2589       if (!(session = vcl_session_get (wrk, sid)))
2590         break;
2591       vcl_fifo_rx_evt_valid_or_break (session);
2592       session_events = session->vep.ev.events;
2593       if (!(EPOLLIN & session->vep.ev.events) || session->has_rx_evt)
2594         break;
2595       add_event = 1;
2596       events[*num_ev].events |= EPOLLIN;
2597       session_evt_data = session->vep.ev.data.u64;
2598       session->has_rx_evt = 1;
2599       break;
2600     case SESSION_IO_EVT_TX:
2601       sid = e->session_index;
2602       if (!(session = vcl_session_get (wrk, sid)))
2603         break;
2604       session_events = session->vep.ev.events;
2605       if (!(EPOLLOUT & session_events))
2606         break;
2607       add_event = 1;
2608       events[*num_ev].events |= EPOLLOUT;
2609       session_evt_data = session->vep.ev.data.u64;
2610       svm_fifo_reset_has_deq_ntf (session->tx_fifo);
2611       break;
2612     case SESSION_CTRL_EVT_ACCEPTED:
2613       session = vcl_session_accepted (wrk,
2614                                       (session_accepted_msg_t *) e->data);
2615       if (!session)
2616         break;
2617
2618       session_events = session->vep.ev.events;
2619       if (!(EPOLLIN & session_events))
2620         break;
2621
2622       add_event = 1;
2623       events[*num_ev].events |= EPOLLIN;
2624       session_evt_data = session->vep.ev.data.u64;
2625       break;
2626     case SESSION_CTRL_EVT_CONNECTED:
2627       connected_msg = (session_connected_msg_t *) e->data;
2628       vcl_session_connected_handler (wrk, connected_msg);
2629       /* Generate EPOLLOUT because there's no connected event */
2630       sid = vcl_session_index_from_vpp_handle (wrk, connected_msg->handle);
2631       if (!(session = vcl_session_get (wrk, sid)))
2632         break;
2633       session_events = session->vep.ev.events;
2634       if (!(EPOLLOUT & session_events))
2635         break;
2636       add_event = 1;
2637       events[*num_ev].events |= EPOLLOUT;
2638       session_evt_data = session->vep.ev.data.u64;
2639       if (session->session_state & STATE_FAILED)
2640         events[*num_ev].events |= EPOLLHUP;
2641       break;
2642     case SESSION_CTRL_EVT_DISCONNECTED:
2643       disconnected_msg = (session_disconnected_msg_t *) e->data;
2644       session = vcl_session_disconnected_handler (wrk, disconnected_msg);
2645       if (!session)
2646         break;
2647       session_events = session->vep.ev.events;
2648       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2649         break;
2650       add_event = 1;
2651       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2652       session_evt_data = session->vep.ev.data.u64;
2653       break;
2654     case SESSION_CTRL_EVT_RESET:
2655       sid = vcl_session_reset_handler (wrk, (session_reset_msg_t *) e->data);
2656       if (!(session = vcl_session_get (wrk, sid)))
2657         break;
2658       session_events = session->vep.ev.events;
2659       if (!((EPOLLHUP | EPOLLRDHUP) & session_events))
2660         break;
2661       add_event = 1;
2662       events[*num_ev].events |= EPOLLHUP | EPOLLRDHUP;
2663       session_evt_data = session->vep.ev.data.u64;
2664       break;
2665     case SESSION_CTRL_EVT_UNLISTEN_REPLY:
2666       vcl_session_unlisten_reply_handler (wrk, e->data);
2667       break;
2668     case SESSION_CTRL_EVT_REQ_WORKER_UPDATE:
2669       vcl_session_req_worker_update_handler (wrk, e->data);
2670       break;
2671     case SESSION_CTRL_EVT_WORKER_UPDATE_REPLY:
2672       vcl_session_worker_update_reply_handler (wrk, e->data);
2673       break;
2674     default:
2675       VDBG (0, "unhandled: %u", e->event_type);
2676       break;
2677     }
2678
2679   if (add_event)
2680     {
2681       events[*num_ev].data.u64 = session_evt_data;
2682       if (EPOLLONESHOT & session_events)
2683         {
2684           session = vcl_session_get (wrk, sid);
2685           session->vep.ev.events = 0;
2686         }
2687       *num_ev += 1;
2688     }
2689 }
2690
2691 static int
2692 vcl_epoll_wait_handle_mq (vcl_worker_t * wrk, svm_msg_q_t * mq,
2693                           struct epoll_event *events, u32 maxevents,
2694                           double wait_for_time, u32 * num_ev)
2695 {
2696   svm_msg_q_msg_t *msg;
2697   session_event_t *e;
2698   int i;
2699
2700   if (vec_len (wrk->mq_msg_vector) && svm_msg_q_is_empty (mq))
2701     goto handle_dequeued;
2702
2703   svm_msg_q_lock (mq);
2704   if (svm_msg_q_is_empty (mq))
2705     {
2706       if (!wait_for_time)
2707         {
2708           svm_msg_q_unlock (mq);
2709           return 0;
2710         }
2711       else if (wait_for_time < 0)
2712         {
2713           svm_msg_q_wait (mq);
2714         }
2715       else
2716         {
2717           if (svm_msg_q_timedwait (mq, wait_for_time / 1e3))
2718             {
2719               svm_msg_q_unlock (mq);
2720               return 0;
2721             }
2722         }
2723     }
2724   ASSERT (maxevents > *num_ev);
2725   vcl_mq_dequeue_batch (wrk, mq, maxevents - *num_ev);
2726   svm_msg_q_unlock (mq);
2727
2728 handle_dequeued:
2729   for (i = 0; i < vec_len (wrk->mq_msg_vector); i++)
2730     {
2731       msg = vec_elt_at_index (wrk->mq_msg_vector, i);
2732       e = svm_msg_q_msg_data (mq, msg);
2733       vcl_epoll_wait_handle_mq_event (wrk, e, events, num_ev);
2734       svm_msg_q_free_msg (mq, msg);
2735     }
2736   vec_reset_length (wrk->mq_msg_vector);
2737   vcl_handle_pending_wrk_updates (wrk);
2738   return *num_ev;
2739 }
2740
2741 static int
2742 vppcom_epoll_wait_condvar (vcl_worker_t * wrk, struct epoll_event *events,
2743                            int maxevents, u32 n_evts, double wait_for_time)
2744 {
2745   double wait = 0, start = 0, now;
2746
2747   if (!n_evts)
2748     {
2749       wait = wait_for_time;
2750       start = clib_time_now (&wrk->clib_time);
2751     }
2752
2753   do
2754     {
2755       vcl_epoll_wait_handle_mq (wrk, wrk->app_event_queue, events, maxevents,
2756                                 wait, &n_evts);
2757       if (n_evts)
2758         return n_evts;
2759       if (wait == -1)
2760         continue;
2761
2762       now = clib_time_now (&wrk->clib_time);
2763       wait -= now - start;
2764       start = now;
2765     }
2766   while (wait > 0);
2767
2768   return 0;
2769 }
2770
2771 static int
2772 vppcom_epoll_wait_eventfd (vcl_worker_t * wrk, struct epoll_event *events,
2773                            int maxevents, u32 n_evts, double wait_for_time)
2774 {
2775   vcl_mq_evt_conn_t *mqc;
2776   int __clib_unused n_read;
2777   int n_mq_evts, i;
2778   u64 buf;
2779
2780   vec_validate (wrk->mq_events, pool_elts (wrk->mq_evt_conns));
2781 again:
2782   n_mq_evts = epoll_wait (wrk->mqs_epfd, wrk->mq_events,
2783                           vec_len (wrk->mq_events), wait_for_time);
2784   for (i = 0; i < n_mq_evts; i++)
2785     {
2786       mqc = vcl_mq_evt_conn_get (wrk, wrk->mq_events[i].data.u32);
2787       n_read = read (mqc->mq_fd, &buf, sizeof (buf));
2788       vcl_epoll_wait_handle_mq (wrk, mqc->mq, events, maxevents, 0, &n_evts);
2789     }
2790   if (!n_evts && n_mq_evts > 0)
2791     goto again;
2792
2793   return (int) n_evts;
2794 }
2795
2796 int
2797 vppcom_epoll_wait (uint32_t vep_handle, struct epoll_event *events,
2798                    int maxevents, double wait_for_time)
2799 {
2800   vcl_worker_t *wrk = vcl_worker_get_current ();
2801   vcl_session_t *vep_session;
2802   u32 n_evts = 0;
2803   int i;
2804
2805   if (PREDICT_FALSE (maxevents <= 0))
2806     {
2807       VDBG (0, "ERROR: Invalid maxevents (%d)!", maxevents);
2808       return VPPCOM_EINVAL;
2809     }
2810
2811   vep_session = vcl_session_get_w_handle (wrk, vep_handle);
2812   if (!vep_session)
2813     return VPPCOM_EBADFD;
2814
2815   if (PREDICT_FALSE (!vep_session->is_vep))
2816     {
2817       VDBG (0, "ERROR: vep_idx (%u) is not a vep!", vep_handle);
2818       return VPPCOM_EINVAL;
2819     }
2820
2821   memset (events, 0, sizeof (*events) * maxevents);
2822
2823   if (vec_len (wrk->unhandled_evts_vector))
2824     {
2825       for (i = 0; i < vec_len (wrk->unhandled_evts_vector); i++)
2826         {
2827           vcl_epoll_wait_handle_mq_event (wrk, &wrk->unhandled_evts_vector[i],
2828                                           events, &n_evts);
2829           if (n_evts == maxevents)
2830             {
2831               vec_delete (wrk->unhandled_evts_vector, i + 1, 0);
2832               return n_evts;
2833             }
2834         }
2835       vec_reset_length (wrk->unhandled_evts_vector);
2836     }
2837
2838   if (vcm->cfg.use_mq_eventfd)
2839     return vppcom_epoll_wait_eventfd (wrk, events, maxevents, n_evts,
2840                                       wait_for_time);
2841
2842   return vppcom_epoll_wait_condvar (wrk, events, maxevents, n_evts,
2843                                     wait_for_time);
2844 }
2845
2846 int
2847 vppcom_session_attr (uint32_t session_handle, uint32_t op,
2848                      void *buffer, uint32_t * buflen)
2849 {
2850   vcl_worker_t *wrk = vcl_worker_get_current ();
2851   vcl_session_t *session;
2852   int rv = VPPCOM_OK;
2853   u32 *flags = buffer, tmp_flags = 0;
2854   vppcom_endpt_t *ep = buffer;
2855
2856   session = vcl_session_get_w_handle (wrk, session_handle);
2857   if (!session)
2858     return VPPCOM_EBADFD;
2859
2860   switch (op)
2861     {
2862     case VPPCOM_ATTR_GET_NREAD:
2863       rv = vcl_session_read_ready (session);
2864       VDBG (2, "VPPCOM_ATTR_GET_NREAD: sh %u, nread = %d", session_handle,
2865             rv);
2866       break;
2867
2868     case VPPCOM_ATTR_GET_NWRITE:
2869       rv = vcl_session_write_ready (session);
2870       VDBG (2, "VPPCOM_ATTR_GET_NWRITE: sh %u, nwrite = %d", session_handle,
2871             rv);
2872       break;
2873
2874     case VPPCOM_ATTR_GET_FLAGS:
2875       if (PREDICT_TRUE (buffer && buflen && (*buflen >= sizeof (*flags))))
2876         {
2877           *flags = O_RDWR | (VCL_SESS_ATTR_TEST (session->attr,
2878                                                  VCL_SESS_ATTR_NONBLOCK));
2879           *buflen = sizeof (*flags);
2880           VDBG (2, "VPPCOM_ATTR_GET_FLAGS: sh %u, flags = 0x%08x, "
2881                 "is_nonblocking = %u", session_handle, *flags,
2882                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2883         }
2884       else
2885         rv = VPPCOM_EINVAL;
2886       break;
2887
2888     case VPPCOM_ATTR_SET_FLAGS:
2889       if (PREDICT_TRUE (buffer && buflen && (*buflen == sizeof (*flags))))
2890         {
2891           if (*flags & O_NONBLOCK)
2892             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_NONBLOCK);
2893           else
2894             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_NONBLOCK);
2895
2896           VDBG (2, "VPPCOM_ATTR_SET_FLAGS: sh %u, flags = 0x%08x,"
2897                 " is_nonblocking = %u", session_handle, *flags,
2898                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_NONBLOCK));
2899         }
2900       else
2901         rv = VPPCOM_EINVAL;
2902       break;
2903
2904     case VPPCOM_ATTR_GET_PEER_ADDR:
2905       if (PREDICT_TRUE (buffer && buflen &&
2906                         (*buflen >= sizeof (*ep)) && ep->ip))
2907         {
2908           ep->is_ip4 = session->transport.is_ip4;
2909           ep->port = session->transport.rmt_port;
2910           if (session->transport.is_ip4)
2911             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
2912                               sizeof (ip4_address_t));
2913           else
2914             clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
2915                               sizeof (ip6_address_t));
2916           *buflen = sizeof (*ep);
2917           VDBG (1, "VPPCOM_ATTR_GET_PEER_ADDR: sh %u, is_ip4 = %u, "
2918                 "addr = %U, port %u", session_handle, ep->is_ip4,
2919                 format_ip46_address, &session->transport.rmt_ip,
2920                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2921                 clib_net_to_host_u16 (ep->port));
2922         }
2923       else
2924         rv = VPPCOM_EINVAL;
2925       break;
2926
2927     case VPPCOM_ATTR_GET_LCL_ADDR:
2928       if (PREDICT_TRUE (buffer && buflen &&
2929                         (*buflen >= sizeof (*ep)) && ep->ip))
2930         {
2931           ep->is_ip4 = session->transport.is_ip4;
2932           ep->port = session->transport.lcl_port;
2933           if (session->transport.is_ip4)
2934             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip4,
2935                               sizeof (ip4_address_t));
2936           else
2937             clib_memcpy_fast (ep->ip, &session->transport.lcl_ip.ip6,
2938                               sizeof (ip6_address_t));
2939           *buflen = sizeof (*ep);
2940           VDBG (1, "VPPCOM_ATTR_GET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
2941                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
2942                 &session->transport.lcl_ip,
2943                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2944                 clib_net_to_host_u16 (ep->port));
2945         }
2946       else
2947         rv = VPPCOM_EINVAL;
2948       break;
2949
2950     case VPPCOM_ATTR_SET_LCL_ADDR:
2951       if (PREDICT_TRUE (buffer && buflen &&
2952                         (*buflen >= sizeof (*ep)) && ep->ip))
2953         {
2954           session->transport.is_ip4 = ep->is_ip4;
2955           session->transport.lcl_port = ep->port;
2956           vcl_ip_copy_from_ep (&session->transport.lcl_ip, ep);
2957           *buflen = sizeof (*ep);
2958           VDBG (1, "VPPCOM_ATTR_SET_LCL_ADDR: sh %u, is_ip4 = %u, addr = %U"
2959                 " port %d", session_handle, ep->is_ip4, format_ip46_address,
2960                 &session->transport.lcl_ip,
2961                 ep->is_ip4 ? IP46_TYPE_IP4 : IP46_TYPE_IP6,
2962                 clib_net_to_host_u16 (ep->port));
2963         }
2964       else
2965         rv = VPPCOM_EINVAL;
2966       break;
2967
2968     case VPPCOM_ATTR_GET_LIBC_EPFD:
2969       rv = session->libc_epfd;
2970       VDBG (2, "VPPCOM_ATTR_GET_LIBC_EPFD: libc_epfd %d", rv);
2971       break;
2972
2973     case VPPCOM_ATTR_SET_LIBC_EPFD:
2974       if (PREDICT_TRUE (buffer && buflen &&
2975                         (*buflen == sizeof (session->libc_epfd))))
2976         {
2977           session->libc_epfd = *(int *) buffer;
2978           *buflen = sizeof (session->libc_epfd);
2979
2980           VDBG (2, "VPPCOM_ATTR_SET_LIBC_EPFD: libc_epfd %d, buflen %d",
2981                 session->libc_epfd, *buflen);
2982         }
2983       else
2984         rv = VPPCOM_EINVAL;
2985       break;
2986
2987     case VPPCOM_ATTR_GET_PROTOCOL:
2988       if (buffer && buflen && (*buflen >= sizeof (int)))
2989         {
2990           *(int *) buffer = session->session_type;
2991           *buflen = sizeof (int);
2992
2993           VDBG (2, "VPPCOM_ATTR_GET_PROTOCOL: %d (%s), buflen %d",
2994                 *(int *) buffer, *(int *) buffer ? "UDP" : "TCP", *buflen);
2995         }
2996       else
2997         rv = VPPCOM_EINVAL;
2998       break;
2999
3000     case VPPCOM_ATTR_GET_LISTEN:
3001       if (buffer && buflen && (*buflen >= sizeof (int)))
3002         {
3003           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3004                                                 VCL_SESS_ATTR_LISTEN);
3005           *buflen = sizeof (int);
3006
3007           VDBG (2, "VPPCOM_ATTR_GET_LISTEN: %d, buflen %d", *(int *) buffer,
3008                 *buflen);
3009         }
3010       else
3011         rv = VPPCOM_EINVAL;
3012       break;
3013
3014     case VPPCOM_ATTR_GET_ERROR:
3015       if (buffer && buflen && (*buflen >= sizeof (int)))
3016         {
3017           *(int *) buffer = 0;
3018           *buflen = sizeof (int);
3019
3020           VDBG (2, "VPPCOM_ATTR_GET_ERROR: %d, buflen %d, #VPP-TBD#",
3021                 *(int *) buffer, *buflen);
3022         }
3023       else
3024         rv = VPPCOM_EINVAL;
3025       break;
3026
3027     case VPPCOM_ATTR_GET_TX_FIFO_LEN:
3028       if (buffer && buflen && (*buflen >= sizeof (u32)))
3029         {
3030
3031           /* VPP-TBD */
3032           *(size_t *) buffer = (session->sndbuf_size ? session->sndbuf_size :
3033                                 session->tx_fifo ? session->tx_fifo->nitems :
3034                                 vcm->cfg.tx_fifo_size);
3035           *buflen = sizeof (u32);
3036
3037           VDBG (2, "VPPCOM_ATTR_GET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3038                 " #VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer,
3039                 *buflen);
3040         }
3041       else
3042         rv = VPPCOM_EINVAL;
3043       break;
3044
3045     case VPPCOM_ATTR_SET_TX_FIFO_LEN:
3046       if (buffer && buflen && (*buflen == sizeof (u32)))
3047         {
3048           /* VPP-TBD */
3049           session->sndbuf_size = *(u32 *) buffer;
3050           VDBG (2, "VPPCOM_ATTR_SET_TX_FIFO_LEN: %u (0x%x), buflen %d,"
3051                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3052                 *buflen);
3053         }
3054       else
3055         rv = VPPCOM_EINVAL;
3056       break;
3057
3058     case VPPCOM_ATTR_GET_RX_FIFO_LEN:
3059       if (buffer && buflen && (*buflen >= sizeof (u32)))
3060         {
3061
3062           /* VPP-TBD */
3063           *(size_t *) buffer = (session->rcvbuf_size ? session->rcvbuf_size :
3064                                 session->rx_fifo ? session->rx_fifo->nitems :
3065                                 vcm->cfg.rx_fifo_size);
3066           *buflen = sizeof (u32);
3067
3068           VDBG (2, "VPPCOM_ATTR_GET_RX_FIFO_LEN: %u (0x%x), buflen %d, "
3069                 "#VPP-TBD#", *(size_t *) buffer, *(size_t *) buffer, *buflen);
3070         }
3071       else
3072         rv = VPPCOM_EINVAL;
3073       break;
3074
3075     case VPPCOM_ATTR_SET_RX_FIFO_LEN:
3076       if (buffer && buflen && (*buflen == sizeof (u32)))
3077         {
3078           /* VPP-TBD */
3079           session->rcvbuf_size = *(u32 *) buffer;
3080           VDBG (2, "VPPCOM_ATTR_SET_RX_FIFO_LEN: %u (0x%x), buflen %d,"
3081                 " #VPP-TBD#", session->sndbuf_size, session->sndbuf_size,
3082                 *buflen);
3083         }
3084       else
3085         rv = VPPCOM_EINVAL;
3086       break;
3087
3088     case VPPCOM_ATTR_GET_REUSEADDR:
3089       if (buffer && buflen && (*buflen >= sizeof (int)))
3090         {
3091           /* VPP-TBD */
3092           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3093                                                 VCL_SESS_ATTR_REUSEADDR);
3094           *buflen = sizeof (int);
3095
3096           VDBG (2, "VPPCOM_ATTR_GET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3097                 *(int *) buffer, *buflen);
3098         }
3099       else
3100         rv = VPPCOM_EINVAL;
3101       break;
3102
3103     case VPPCOM_ATTR_SET_REUSEADDR:
3104       if (buffer && buflen && (*buflen == sizeof (int)) &&
3105           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3106         {
3107           /* VPP-TBD */
3108           if (*(int *) buffer)
3109             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEADDR);
3110           else
3111             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEADDR);
3112
3113           VDBG (2, "VPPCOM_ATTR_SET_REUSEADDR: %d, buflen %d, #VPP-TBD#",
3114                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_REUSEADDR),
3115                 *buflen);
3116         }
3117       else
3118         rv = VPPCOM_EINVAL;
3119       break;
3120
3121     case VPPCOM_ATTR_GET_REUSEPORT:
3122       if (buffer && buflen && (*buflen >= sizeof (int)))
3123         {
3124           /* VPP-TBD */
3125           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3126                                                 VCL_SESS_ATTR_REUSEPORT);
3127           *buflen = sizeof (int);
3128
3129           VDBG (2, "VPPCOM_ATTR_GET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3130                 *(int *) buffer, *buflen);
3131         }
3132       else
3133         rv = VPPCOM_EINVAL;
3134       break;
3135
3136     case VPPCOM_ATTR_SET_REUSEPORT:
3137       if (buffer && buflen && (*buflen == sizeof (int)) &&
3138           !VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_LISTEN))
3139         {
3140           /* VPP-TBD */
3141           if (*(int *) buffer)
3142             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_REUSEPORT);
3143           else
3144             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_REUSEPORT);
3145
3146           VDBG (2, "VPPCOM_ATTR_SET_REUSEPORT: %d, buflen %d, #VPP-TBD#",
3147                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_REUSEPORT),
3148                 *buflen);
3149         }
3150       else
3151         rv = VPPCOM_EINVAL;
3152       break;
3153
3154     case VPPCOM_ATTR_GET_BROADCAST:
3155       if (buffer && buflen && (*buflen >= sizeof (int)))
3156         {
3157           /* VPP-TBD */
3158           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3159                                                 VCL_SESS_ATTR_BROADCAST);
3160           *buflen = sizeof (int);
3161
3162           VDBG (2, "VPPCOM_ATTR_GET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3163                 *(int *) buffer, *buflen);
3164         }
3165       else
3166         rv = VPPCOM_EINVAL;
3167       break;
3168
3169     case VPPCOM_ATTR_SET_BROADCAST:
3170       if (buffer && buflen && (*buflen == sizeof (int)))
3171         {
3172           /* VPP-TBD */
3173           if (*(int *) buffer)
3174             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_BROADCAST);
3175           else
3176             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_BROADCAST);
3177
3178           VDBG (2, "VPPCOM_ATTR_SET_BROADCAST: %d, buflen %d, #VPP-TBD#",
3179                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_BROADCAST),
3180                 *buflen);
3181         }
3182       else
3183         rv = VPPCOM_EINVAL;
3184       break;
3185
3186     case VPPCOM_ATTR_GET_V6ONLY:
3187       if (buffer && buflen && (*buflen >= sizeof (int)))
3188         {
3189           /* VPP-TBD */
3190           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3191                                                 VCL_SESS_ATTR_V6ONLY);
3192           *buflen = sizeof (int);
3193
3194           VDBG (2, "VPPCOM_ATTR_GET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3195                 *(int *) buffer, *buflen);
3196         }
3197       else
3198         rv = VPPCOM_EINVAL;
3199       break;
3200
3201     case VPPCOM_ATTR_SET_V6ONLY:
3202       if (buffer && buflen && (*buflen == sizeof (int)))
3203         {
3204           /* VPP-TBD */
3205           if (*(int *) buffer)
3206             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_V6ONLY);
3207           else
3208             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_V6ONLY);
3209
3210           VDBG (2, "VPPCOM_ATTR_SET_V6ONLY: %d, buflen %d, #VPP-TBD#",
3211                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_V6ONLY),
3212                 *buflen);
3213         }
3214       else
3215         rv = VPPCOM_EINVAL;
3216       break;
3217
3218     case VPPCOM_ATTR_GET_KEEPALIVE:
3219       if (buffer && buflen && (*buflen >= sizeof (int)))
3220         {
3221           /* VPP-TBD */
3222           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3223                                                 VCL_SESS_ATTR_KEEPALIVE);
3224           *buflen = sizeof (int);
3225
3226           VDBG (2, "VPPCOM_ATTR_GET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3227                 *(int *) buffer, *buflen);
3228         }
3229       else
3230         rv = VPPCOM_EINVAL;
3231       break;
3232
3233     case VPPCOM_ATTR_SET_KEEPALIVE:
3234       if (buffer && buflen && (*buflen == sizeof (int)))
3235         {
3236           /* VPP-TBD */
3237           if (*(int *) buffer)
3238             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3239           else
3240             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_KEEPALIVE);
3241
3242           VDBG (2, "VPPCOM_ATTR_SET_KEEPALIVE: %d, buflen %d, #VPP-TBD#",
3243                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_KEEPALIVE),
3244                 *buflen);
3245         }
3246       else
3247         rv = VPPCOM_EINVAL;
3248       break;
3249
3250     case VPPCOM_ATTR_GET_TCP_NODELAY:
3251       if (buffer && buflen && (*buflen >= sizeof (int)))
3252         {
3253           /* VPP-TBD */
3254           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3255                                                 VCL_SESS_ATTR_TCP_NODELAY);
3256           *buflen = sizeof (int);
3257
3258           VDBG (2, "VPPCOM_ATTR_GET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3259                 *(int *) buffer, *buflen);
3260         }
3261       else
3262         rv = VPPCOM_EINVAL;
3263       break;
3264
3265     case VPPCOM_ATTR_SET_TCP_NODELAY:
3266       if (buffer && buflen && (*buflen == sizeof (int)))
3267         {
3268           /* VPP-TBD */
3269           if (*(int *) buffer)
3270             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3271           else
3272             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_NODELAY);
3273
3274           VDBG (2, "VPPCOM_ATTR_SET_TCP_NODELAY: %d, buflen %d, #VPP-TBD#",
3275                 VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_TCP_NODELAY),
3276                 *buflen);
3277         }
3278       else
3279         rv = VPPCOM_EINVAL;
3280       break;
3281
3282     case VPPCOM_ATTR_GET_TCP_KEEPIDLE:
3283       if (buffer && buflen && (*buflen >= sizeof (int)))
3284         {
3285           /* VPP-TBD */
3286           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3287                                                 VCL_SESS_ATTR_TCP_KEEPIDLE);
3288           *buflen = sizeof (int);
3289
3290           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3291                 *(int *) buffer, *buflen);
3292         }
3293       else
3294         rv = VPPCOM_EINVAL;
3295       break;
3296
3297     case VPPCOM_ATTR_SET_TCP_KEEPIDLE:
3298       if (buffer && buflen && (*buflen == sizeof (int)))
3299         {
3300           /* VPP-TBD */
3301           if (*(int *) buffer)
3302             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3303           else
3304             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPIDLE);
3305
3306           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPIDLE: %d, buflen %d, #VPP-TBD#",
3307                 VCL_SESS_ATTR_TEST (session->attr,
3308                                     VCL_SESS_ATTR_TCP_KEEPIDLE), *buflen);
3309         }
3310       else
3311         rv = VPPCOM_EINVAL;
3312       break;
3313
3314     case VPPCOM_ATTR_GET_TCP_KEEPINTVL:
3315       if (buffer && buflen && (*buflen >= sizeof (int)))
3316         {
3317           /* VPP-TBD */
3318           *(int *) buffer = VCL_SESS_ATTR_TEST (session->attr,
3319                                                 VCL_SESS_ATTR_TCP_KEEPINTVL);
3320           *buflen = sizeof (int);
3321
3322           VDBG (2, "VPPCOM_ATTR_GET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3323                 *(int *) buffer, *buflen);
3324         }
3325       else
3326         rv = VPPCOM_EINVAL;
3327       break;
3328
3329     case VPPCOM_ATTR_SET_TCP_KEEPINTVL:
3330       if (buffer && buflen && (*buflen == sizeof (int)))
3331         {
3332           /* VPP-TBD */
3333           if (*(int *) buffer)
3334             VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3335           else
3336             VCL_SESS_ATTR_CLR (session->attr, VCL_SESS_ATTR_TCP_KEEPINTVL);
3337
3338           VDBG (2, "VPPCOM_ATTR_SET_TCP_KEEPINTVL: %d, buflen %d, #VPP-TBD#",
3339                 VCL_SESS_ATTR_TEST (session->attr,
3340                                     VCL_SESS_ATTR_TCP_KEEPINTVL), *buflen);
3341         }
3342       else
3343         rv = VPPCOM_EINVAL;
3344       break;
3345
3346     case VPPCOM_ATTR_GET_TCP_USER_MSS:
3347       if (buffer && buflen && (*buflen >= sizeof (u32)))
3348         {
3349           /* VPP-TBD */
3350           *(u32 *) buffer = session->user_mss;
3351           *buflen = sizeof (int);
3352
3353           VDBG (2, "VPPCOM_ATTR_GET_TCP_USER_MSS: %d, buflen %d, #VPP-TBD#",
3354                 *(int *) buffer, *buflen);
3355         }
3356       else
3357         rv = VPPCOM_EINVAL;
3358       break;
3359
3360     case VPPCOM_ATTR_SET_TCP_USER_MSS:
3361       if (buffer && buflen && (*buflen == sizeof (u32)))
3362         {
3363           /* VPP-TBD */
3364           session->user_mss = *(u32 *) buffer;
3365
3366           VDBG (2, "VPPCOM_ATTR_SET_TCP_USER_MSS: %u, buflen %d, #VPP-TBD#",
3367                 session->user_mss, *buflen);
3368         }
3369       else
3370         rv = VPPCOM_EINVAL;
3371       break;
3372
3373     case VPPCOM_ATTR_SET_SHUT:
3374       if (*flags == SHUT_RD || *flags == SHUT_RDWR)
3375         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_RD);
3376       if (*flags == SHUT_WR || *flags == SHUT_RDWR)
3377         VCL_SESS_ATTR_SET (session->attr, VCL_SESS_ATTR_SHUT_WR);
3378       break;
3379
3380     case VPPCOM_ATTR_GET_SHUT:
3381       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_RD))
3382         tmp_flags = 1;
3383       if (VCL_SESS_ATTR_TEST (session->attr, VCL_SESS_ATTR_SHUT_WR))
3384         tmp_flags |= 2;
3385       if (tmp_flags == 1)
3386         *(int *) buffer = SHUT_RD;
3387       else if (tmp_flags == 2)
3388         *(int *) buffer = SHUT_WR;
3389       else if (tmp_flags == 3)
3390         *(int *) buffer = SHUT_RDWR;
3391       *buflen = sizeof (int);
3392       break;
3393     default:
3394       rv = VPPCOM_EINVAL;
3395       break;
3396     }
3397
3398   return rv;
3399 }
3400
3401 int
3402 vppcom_session_recvfrom (uint32_t session_handle, void *buffer,
3403                          uint32_t buflen, int flags, vppcom_endpt_t * ep)
3404 {
3405   vcl_worker_t *wrk = vcl_worker_get_current ();
3406   int rv = VPPCOM_OK;
3407   vcl_session_t *session = 0;
3408
3409   if (ep)
3410     {
3411       session = vcl_session_get_w_handle (wrk, session_handle);
3412       if (PREDICT_FALSE (!session))
3413         {
3414           VDBG (0, "sh 0x%llx is closed!", session_handle);
3415           return VPPCOM_EBADFD;
3416         }
3417       ep->is_ip4 = session->transport.is_ip4;
3418       ep->port = session->transport.rmt_port;
3419     }
3420
3421   if (flags == 0)
3422     rv = vppcom_session_read (session_handle, buffer, buflen);
3423   else if (flags & MSG_PEEK)
3424     rv = vppcom_session_peek (session_handle, buffer, buflen);
3425   else
3426     {
3427       VDBG (0, "Unsupport flags for recvfrom %d", flags);
3428       return VPPCOM_EAFNOSUPPORT;
3429     }
3430
3431   if (ep)
3432     {
3433       if (session->transport.is_ip4)
3434         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip4,
3435                           sizeof (ip4_address_t));
3436       else
3437         clib_memcpy_fast (ep->ip, &session->transport.rmt_ip.ip6,
3438                           sizeof (ip6_address_t));
3439     }
3440
3441   return rv;
3442 }
3443
3444 int
3445 vppcom_session_sendto (uint32_t session_handle, void *buffer,
3446                        uint32_t buflen, int flags, vppcom_endpt_t * ep)
3447 {
3448   if (!buffer)
3449     return VPPCOM_EINVAL;
3450
3451   if (ep)
3452     {
3453       // TBD
3454       return VPPCOM_EINVAL;
3455     }
3456
3457   if (flags)
3458     {
3459       // TBD check the flags and do the right thing
3460       VDBG (2, "handling flags 0x%u (%d) not implemented yet.", flags, flags);
3461     }
3462
3463   return (vppcom_session_write_inline (session_handle, buffer, buflen, 1));
3464 }
3465
3466 int
3467 vppcom_poll (vcl_poll_t * vp, uint32_t n_sids, double wait_for_time)
3468 {
3469   vcl_worker_t *wrk = vcl_worker_get_current ();
3470   f64 timeout = clib_time_now (&wrk->clib_time) + wait_for_time;
3471   u32 i, keep_trying = 1;
3472   svm_msg_q_msg_t msg;
3473   session_event_t *e;
3474   int rv, num_ev = 0;
3475
3476   VDBG (3, "vp %p, nsids %u, wait_for_time %f", vp, n_sids, wait_for_time);
3477
3478   if (!vp)
3479     return VPPCOM_EFAULT;
3480
3481   do
3482     {
3483       vcl_session_t *session;
3484
3485       /* Dequeue all events and drop all unhandled io events */
3486       while (svm_msg_q_sub (wrk->app_event_queue, &msg, SVM_Q_NOWAIT, 0) == 0)
3487         {
3488           e = svm_msg_q_msg_data (wrk->app_event_queue, &msg);
3489           vcl_handle_mq_event (wrk, e);
3490           svm_msg_q_free_msg (wrk->app_event_queue, &msg);
3491         }
3492       vec_reset_length (wrk->unhandled_evts_vector);
3493
3494       for (i = 0; i < n_sids; i++)
3495         {
3496           session = vcl_session_get (wrk, vp[i].sh);
3497           if (!session)
3498             {
3499               vp[i].revents = POLLHUP;
3500               num_ev++;
3501               continue;
3502             }
3503
3504           vp[i].revents = 0;
3505
3506           if (POLLIN & vp[i].events)
3507             {
3508               rv = vcl_session_read_ready (session);
3509               if (rv > 0)
3510                 {
3511                   vp[i].revents |= POLLIN;
3512                   num_ev++;
3513                 }
3514               else if (rv < 0)
3515                 {
3516                   switch (rv)
3517                     {
3518                     case VPPCOM_ECONNRESET:
3519                       vp[i].revents = POLLHUP;
3520                       break;
3521
3522                     default:
3523                       vp[i].revents = POLLERR;
3524                       break;
3525                     }
3526                   num_ev++;
3527                 }
3528             }
3529
3530           if (POLLOUT & vp[i].events)
3531             {
3532               rv = vcl_session_write_ready (session);
3533               if (rv > 0)
3534                 {
3535                   vp[i].revents |= POLLOUT;
3536                   num_ev++;
3537                 }
3538               else if (rv < 0)
3539                 {
3540                   switch (rv)
3541                     {
3542                     case VPPCOM_ECONNRESET:
3543                       vp[i].revents = POLLHUP;
3544                       break;
3545
3546                     default:
3547                       vp[i].revents = POLLERR;
3548                       break;
3549                     }
3550                   num_ev++;
3551                 }
3552             }
3553
3554           if (0)                // Note "done:" label used by VCL_SESSION_LOCK_AND_GET()
3555             {
3556               vp[i].revents = POLLNVAL;
3557               num_ev++;
3558             }
3559         }
3560       if (wait_for_time != -1)
3561         keep_trying = (clib_time_now (&wrk->clib_time) <= timeout) ? 1 : 0;
3562     }
3563   while ((num_ev == 0) && keep_trying);
3564
3565   return num_ev;
3566 }
3567
3568 int
3569 vppcom_mq_epoll_fd (void)
3570 {
3571   vcl_worker_t *wrk = vcl_worker_get_current ();
3572   return wrk->mqs_epfd;
3573 }
3574
3575 int
3576 vppcom_session_index (vcl_session_handle_t session_handle)
3577 {
3578   return session_handle & 0xFFFFFF;
3579 }
3580
3581 int
3582 vppcom_session_worker (vcl_session_handle_t session_handle)
3583 {
3584   return session_handle >> 24;
3585 }
3586
3587 int
3588 vppcom_worker_register (void)
3589 {
3590   if (!vcl_worker_alloc_and_init ())
3591     return VPPCOM_EEXIST;
3592
3593   if (vcl_worker_set_bapi ())
3594     return VPPCOM_EEXIST;
3595
3596   if (vcl_worker_register_with_vpp ())
3597     return VPPCOM_EEXIST;
3598
3599   return VPPCOM_OK;
3600 }
3601
3602 void
3603 vppcom_worker_unregister (void)
3604 {
3605   vcl_worker_cleanup (vcl_worker_get_current (), 1 /* notify vpp */ );
3606   vcl_set_worker_index (~0);
3607 }
3608
3609 int
3610 vppcom_worker_index (void)
3611 {
3612   return vcl_get_worker_index ();
3613 }
3614
3615 int
3616 vppcom_worker_mqs_epfd (void)
3617 {
3618   vcl_worker_t *wrk = vcl_worker_get_current ();
3619   if (!vcm->cfg.use_mq_eventfd)
3620     return -1;
3621   return wrk->mqs_epfd;
3622 }
3623
3624 int
3625 vppcom_session_is_connectable_listener (uint32_t session_handle)
3626 {
3627   vcl_session_t *session;
3628   vcl_worker_t *wrk = vcl_worker_get_current ();
3629   session = vcl_session_get_w_handle (wrk, session_handle);
3630   if (!session)
3631     return VPPCOM_EBADFD;
3632   return vcl_session_is_connectable_listener (wrk, session);
3633 }
3634
3635 int
3636 vppcom_session_listener (uint32_t session_handle)
3637 {
3638   vcl_worker_t *wrk = vcl_worker_get_current ();
3639   vcl_session_t *listen_session, *session;
3640   session = vcl_session_get_w_handle (wrk, session_handle);
3641   if (!session)
3642     return VPPCOM_EBADFD;
3643   if (session->listener_index == VCL_INVALID_SESSION_INDEX)
3644     return VPPCOM_EBADFD;
3645   listen_session = vcl_session_get_w_handle (wrk, session->listener_index);
3646   if (!listen_session)
3647     return VPPCOM_EBADFD;
3648   return vcl_session_handle (listen_session);
3649 }
3650
3651 int
3652 vppcom_session_n_accepted (uint32_t session_handle)
3653 {
3654   vcl_worker_t *wrk = vcl_worker_get_current ();
3655   vcl_session_t *session = vcl_session_get_w_handle (wrk, session_handle);
3656   if (!session)
3657     return VPPCOM_EBADFD;
3658   return session->n_accepted_sessions;
3659 }
3660
3661 /*
3662  * fd.io coding-style-patch-verification: ON
3663  *
3664  * Local Variables:
3665  * eval: (c-set-style "gnu")
3666  * End:
3667  */