fix show session verbose crash with quic transport
[vpp.git] / src / plugins / quic / quic.c
1 /*
2  * Copyright (c) 2019 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <sys/socket.h>
17
18 #include <vnet/session/application.h>
19 #include <vnet/session/transport.h>
20 #include <vnet/session/session.h>
21 #include <vlib/unix/plugin.h>
22 #include <vpp/app/version.h>
23 #include <openssl/pem.h>
24
25 #include <vppinfra/lock.h>
26
27 #include <quic/quic.h>
28
29 #include <quicly/defaults.h>
30 #include <picotls/openssl.h>
31 #include <picotls/pembase64.h>
32
33 static quic_main_t quic_main;
34
35 static void quic_update_timer (quic_ctx_t * ctx);
36 static void quic_connection_closed (u32 conn_index, u32 thread_index);
37 static void quic_disconnect (u32 ctx_index, u32 thread_index);
38 static int quic_connect_new_stream (session_endpoint_cfg_t * sep);
39 static int quic_connect_new_connection (session_endpoint_cfg_t * sep);
40
41 static int64_t quic_get_time (quicly_now_t * self);
42 static quicly_now_t quicly_vpp_now_cb = { quic_get_time };
43
44 static void quic_transfer_connection (u32 ctx_index, u32 dest_thread);
45
46 #define QUIC_TIMER_HANDLE_INVALID ((u32) ~0)
47 #define QUIC_SESSION_INVALID ((u32) ~0 - 1)
48 #define QUIC_MAX_PACKET_SIZE 1280
49
50 #define QUIC_INT_MAX  0x3FFFFFFFFFFFFFFF
51
52 /* Taken from quicly.c */
53 #define QUICLY_QUIC_BIT 0x40
54
55 #define QUICLY_PACKET_TYPE_INITIAL (QUICLY_LONG_HEADER_BIT | QUICLY_QUIC_BIT | 0)
56 #define QUICLY_PACKET_TYPE_0RTT (QUICLY_LONG_HEADER_BIT | QUICLY_QUIC_BIT | 0x10)
57 #define QUICLY_PACKET_TYPE_HANDSHAKE (QUICLY_LONG_HEADER_BIT | QUICLY_QUIC_BIT | 0x20)
58 #define QUICLY_PACKET_TYPE_RETRY (QUICLY_LONG_HEADER_BIT | QUICLY_QUIC_BIT | 0x30)
59 #define QUICLY_PACKET_TYPE_BITMASK 0xf0
60 #define QUIC_FIFO_SIZE (64 << 10)
61
62 #define QUIC_ERROR_FULL_FIFO 0xff10
63
64 static char *
65 quic_format_err (u64 code)
66 {
67   switch (code)
68     {
69     case QUIC_ERROR_FULL_FIFO:
70       return "full fifo";
71     case QUICLY_ERROR_PACKET_IGNORED:
72       return "QUICLY_ERROR_PACKET_IGNORED";
73     case QUICLY_ERROR_SENDBUF_FULL:
74       return "QUICLY_ERROR_SENDBUF_FULL";
75     case QUICLY_ERROR_FREE_CONNECTION:
76       return "no open stream on connection";
77     case QUICLY_ERROR_RECEIVED_STATELESS_RESET:
78       return "QUICLY_ERROR_RECEIVED_STATELESS_RESET";
79     case QUICLY_TRANSPORT_ERROR_NONE:
80       return "QUICLY_TRANSPORT_ERROR_NONE";
81     case QUICLY_TRANSPORT_ERROR_INTERNAL:
82       return "QUICLY_TRANSPORT_ERROR_INTERNAL";
83     case QUICLY_TRANSPORT_ERROR_SERVER_BUSY:
84       return "QUICLY_TRANSPORT_ERROR_SERVER_BUSY";
85     case QUICLY_TRANSPORT_ERROR_FLOW_CONTROL:
86       return "QUICLY_TRANSPORT_ERROR_FLOW_CONTROL";
87     case QUICLY_TRANSPORT_ERROR_STREAM_ID:
88       return "QUICLY_TRANSPORT_ERROR_STREAM_ID";
89     case QUICLY_TRANSPORT_ERROR_STREAM_STATE:
90       return "QUICLY_TRANSPORT_ERROR_STREAM_STATE";
91     case QUICLY_TRANSPORT_ERROR_FINAL_OFFSET:
92       return "QUICLY_TRANSPORT_ERROR_FINAL_OFFSET";
93     case QUICLY_TRANSPORT_ERROR_FRAME_ENCODING:
94       return "QUICLY_TRANSPORT_ERROR_FRAME_ENCODING";
95     case QUICLY_TRANSPORT_ERROR_TRANSPORT_PARAMETER:
96       return "QUICLY_TRANSPORT_ERROR_TRANSPORT_PARAMETER";
97     case QUICLY_TRANSPORT_ERROR_VERSION_NEGOTIATION:
98       return "QUICLY_TRANSPORT_ERROR_VERSION_NEGOTIATION";
99     case QUICLY_TRANSPORT_ERROR_PROTOCOL_VIOLATION:
100       return "QUICLY_TRANSPORT_ERROR_PROTOCOL_VIOLATION";
101     case QUICLY_TRANSPORT_ERROR_INVALID_MIGRATION:
102       return "QUICLY_TRANSPORT_ERROR_INVALID_MIGRATION";
103     case QUICLY_TRANSPORT_ERROR_TLS_ALERT_BASE:
104       return "QUICLY_TRANSPORT_ERROR_TLS_ALERT_BASE";
105     default:
106       return "unknown error";
107     }
108 }
109
110 static u32
111 quic_ctx_alloc (u32 thread_index)
112 {
113   quic_main_t *qm = &quic_main;
114   quic_ctx_t *ctx;
115
116   pool_get (qm->ctx_pool[thread_index], ctx);
117
118   memset (ctx, 0, sizeof (quic_ctx_t));
119   ctx->c_thread_index = thread_index;
120   QUIC_DBG (1, "Allocated quic_ctx %u on thread %u",
121             ctx - qm->ctx_pool[thread_index], thread_index);
122   return ctx - qm->ctx_pool[thread_index];
123 }
124
125 static void
126 quic_ctx_free (quic_ctx_t * ctx)
127 {
128   QUIC_DBG (2, "Free ctx %u", ctx->c_c_index);
129   u32 thread_index = ctx->c_thread_index;
130   if (CLIB_DEBUG)
131     memset (ctx, 0xfb, sizeof (*ctx));
132   pool_put (quic_main.ctx_pool[thread_index], ctx);
133 }
134
135 static quic_ctx_t *
136 quic_ctx_get (u32 ctx_index, u32 thread_index)
137 {
138   return pool_elt_at_index (quic_main.ctx_pool[thread_index], ctx_index);
139 }
140
141 static quic_ctx_t *
142 quic_get_conn_ctx (quicly_conn_t * conn)
143 {
144   u64 conn_data;
145   conn_data = (u64) * quicly_get_data (conn);
146   return quic_ctx_get (conn_data & UINT32_MAX, conn_data >> 32);
147 }
148
149 static void
150 quic_store_conn_ctx (quicly_conn_t * conn, quic_ctx_t * ctx)
151 {
152   *quicly_get_data (conn) =
153     (void *) (((u64) ctx->c_thread_index) << 32 | (u64) ctx->c_c_index);
154 }
155
156 static void
157 quic_disconnect_transport (quic_ctx_t * ctx)
158 {
159   QUIC_DBG (2, "Called quic_disconnect_transport");
160   vnet_disconnect_args_t a = {
161     .handle = ctx->c_quic_ctx_id.udp_session_handle,
162     .app_index = quic_main.app_index,
163   };
164
165   if (vnet_disconnect_session (&a))
166     clib_warning ("UDP session disconnect errored");
167 }
168
169 static int
170 quic_send_datagram (session_t * udp_session, quicly_datagram_t * packet)
171 {
172   /*  QUIC_DBG (2, "Called quic_send_datagram at %ld", quic_get_time (NULL)); */
173   u32 max_enqueue;
174   session_dgram_hdr_t hdr;
175   u32 len, ret;
176   svm_fifo_t *f;
177   transport_connection_t *tc;
178
179   len = packet->data.len;
180   f = udp_session->tx_fifo;
181   tc = session_get_transport (udp_session);
182
183   max_enqueue = svm_fifo_max_enqueue (f);
184   if (max_enqueue <= sizeof (session_dgram_hdr_t))
185     {
186       QUIC_DBG (1, "Not enough space to enqueue header");
187       return QUIC_ERROR_FULL_FIFO;
188     }
189
190   max_enqueue -= sizeof (session_dgram_hdr_t);
191
192   if (max_enqueue < len)
193     {
194       QUIC_DBG (1, "Too much data to send, max_enqueue %u, len %u",
195                 max_enqueue, len);
196       return QUIC_ERROR_FULL_FIFO;
197     }
198
199   /*  Build packet header for fifo */
200   hdr.data_length = len;
201   hdr.data_offset = 0;
202   hdr.is_ip4 = tc->is_ip4;
203   clib_memcpy (&hdr.lcl_ip, &tc->lcl_ip, sizeof (ip46_address_t));
204   hdr.lcl_port = tc->lcl_port;
205
206   /*  Read dest address from quicly-provided sockaddr */
207   if (hdr.is_ip4)
208     {
209       ASSERT (packet->sa.sa_family == AF_INET);
210       struct sockaddr_in *sa4 = (struct sockaddr_in *) &packet->sa;
211       hdr.rmt_port = sa4->sin_port;
212       hdr.rmt_ip.ip4.as_u32 = sa4->sin_addr.s_addr;
213     }
214   else
215     {
216       ASSERT (packet->sa.sa_family == AF_INET6);
217       struct sockaddr_in6 *sa6 = (struct sockaddr_in6 *) &packet->sa;
218       hdr.rmt_port = sa6->sin6_port;
219       clib_memcpy (&hdr.rmt_ip.ip6, &sa6->sin6_addr, 16);
220     }
221
222   ret = svm_fifo_enqueue (f, sizeof (hdr), (u8 *) & hdr);
223   if (ret != sizeof (hdr))
224     {
225       QUIC_DBG (1, "Not enough space to enqueue header");
226       return QUIC_ERROR_FULL_FIFO;
227     }
228   ret = svm_fifo_enqueue (f, len, packet->data.base);
229   if (ret != len)
230     {
231       QUIC_DBG (1, "Not enough space to enqueue payload");
232       return QUIC_ERROR_FULL_FIFO;
233     }
234   return 0;
235 }
236
237 #define QUIC_SEND_PACKET_VEC_SIZE 16
238
239 static int
240 quic_sendable_packet_count (session_t * udp_session)
241 {
242   u32 max_enqueue;
243   max_enqueue = svm_fifo_max_enqueue (udp_session->tx_fifo);
244   return clib_min (max_enqueue /
245                    (QUIC_MAX_PACKET_SIZE + sizeof (session_dgram_hdr_t)),
246                    QUIC_SEND_PACKET_VEC_SIZE);
247 }
248
249 static int
250 quic_send_packets (quic_ctx_t * ctx)
251 {
252   quicly_datagram_t *packets[QUIC_SEND_PACKET_VEC_SIZE];
253   session_t *udp_session;
254   quicly_conn_t *conn;
255   size_t num_packets, i, max_packets;
256   quicly_context_t *quicly_context;
257   app_worker_t *app_wrk;
258   application_t *app;
259   int err;
260
261   /* We have sctx, get qctx */
262   if (ctx->c_quic_ctx_id.is_stream)
263     ctx =
264       quic_ctx_get (ctx->c_quic_ctx_id.quic_connection_ctx_id,
265                     ctx->c_thread_index);
266
267   ASSERT (!ctx->c_quic_ctx_id.is_stream);
268
269   udp_session =
270     session_get_from_handle (ctx->c_quic_ctx_id.udp_session_handle);
271   conn = ctx->c_quic_ctx_id.conn;
272
273   if (!conn)
274     return 0;
275
276   /* TODO : quicly can assert it can send min_packets up to 2 */
277   if (quic_sendable_packet_count (udp_session) < 2)
278     goto stop_sending;
279
280   app_wrk = app_worker_get_if_valid (ctx->c_quic_ctx_id.parent_app_wrk_id);
281   if (!app_wrk)
282     {
283       clib_warning ("Tried to send packets on non existing app worker %u",
284                     ctx->c_quic_ctx_id.parent_app_wrk_id);
285       quic_connection_closed (ctx->c_c_index, ctx->c_thread_index);
286       return 1;
287     }
288   app = application_get (app_wrk->app_index);
289
290   quicly_context = (quicly_context_t *) app->quicly_ctx;
291   do
292     {
293       max_packets = quic_sendable_packet_count (udp_session);
294       if (max_packets < 2)
295         break;
296       num_packets = max_packets;
297       if ((err = quicly_send (conn, packets, &num_packets)))
298         goto quicly_error;
299
300       for (i = 0; i != num_packets; ++i)
301         {
302           if ((err = quic_send_datagram (udp_session, packets[i])))
303             goto quicly_error;
304
305           quicly_context->packet_allocator->
306             free_packet (quicly_context->packet_allocator, packets[i]);
307         }
308     }
309   while (num_packets > 0 && num_packets == max_packets);
310
311   if (svm_fifo_set_event (udp_session->tx_fifo))
312     session_send_io_evt_to_thread (udp_session->tx_fifo, SESSION_IO_EVT_TX);
313
314 stop_sending:
315   quic_update_timer (ctx);
316   return 0;
317
318 quicly_error:
319   if (err != QUICLY_ERROR_PACKET_IGNORED)
320     clib_warning ("Quic error '%s'.", quic_format_err (err));
321   quic_connection_closed (ctx->c_c_index, ctx->c_thread_index);
322   return 1;
323 }
324
325 /*****************************************************************************
326  * START QUICLY CALLBACKS
327  * Called from QUIC lib
328  *****************************************************************************/
329
330 static void
331 quic_on_stream_destroy (quicly_stream_t * stream, int err)
332 {
333   quic_stream_data_t *stream_data = (quic_stream_data_t *) stream->data;
334   u32 sctx_id = stream_data->ctx_id;
335   session_t *stream_session;
336   quic_ctx_t *sctx = quic_ctx_get (sctx_id, stream_data->thread_index);
337   QUIC_DBG (2, "Stream %ld (ctx %u) destroyed", stream->stream_id, sctx_id);
338   stream_session = session_get (sctx->c_s_index, sctx->c_thread_index);
339   stream_session->session_state = SESSION_STATE_CLOSED;
340   session_transport_delete_notify (&sctx->connection);
341   quic_ctx_free (sctx);
342   free (stream->data);
343 }
344
345 static int
346 quic_on_stop_sending (quicly_stream_t * stream, int error_code)
347 {
348   QUIC_DBG (2, "received STOP_SENDING: %d", error_code);
349   return 0;
350 }
351
352 static int
353 quic_on_receive_reset (quicly_stream_t * stream, int error_code)
354 {
355   QUIC_DBG (2, "received RESET_STREAM: %d", error_code);
356   return 0;
357 }
358
359 static session_t *
360 get_stream_session_from_stream (quicly_stream_t * stream)
361 {
362   quic_ctx_t *ctx;
363   quic_stream_data_t *stream_data;
364
365   stream_data = (quic_stream_data_t *) stream->data;
366   ctx = quic_ctx_get (stream_data->ctx_id, stream_data->thread_index);
367   return session_get (ctx->c_s_index, stream_data->thread_index);
368 }
369
370 static int
371 quic_on_receive (quicly_stream_t * stream, size_t off, const void *src,
372                  size_t len)
373 {
374   QUIC_DBG (3, "received data: %lu bytes, offset %lu", len, off);
375   u32 max_enq;
376   quic_ctx_t *sctx;
377   session_t *stream_session;
378   app_worker_t *app_wrk;
379   svm_fifo_t *f;
380   quic_stream_data_t *stream_data;
381   int rlen;
382
383   stream_data = (quic_stream_data_t *) stream->data;
384   sctx = quic_ctx_get (stream_data->ctx_id, stream_data->thread_index);
385   stream_session = session_get (sctx->c_s_index, stream_data->thread_index);
386   f = stream_session->rx_fifo;
387
388   max_enq = svm_fifo_max_enqueue_prod (f);
389   QUIC_DBG (3, "Enqueuing %u at off %u in %u space", len, off, max_enq);
390   if (off + len > max_enq)
391     {
392       /* TODO : can we find a better solution, listening on RX fifo evts ? */
393       QUIC_DBG (3, "Ingoring packet, RX fifo is full");
394       return QUICLY_ERROR_PACKET_IGNORED;
395     }
396   if (off == 0)
397     {
398       rlen = svm_fifo_enqueue (f, len, (u8 *) src);
399       ASSERT (rlen >= len);
400
401       quicly_stream_sync_recvbuf (stream, rlen);
402       app_wrk = app_worker_get_if_valid (stream_session->app_wrk_index);
403       if (PREDICT_TRUE (app_wrk != 0))
404         app_worker_lock_and_send_event (app_wrk, stream_session,
405                                         SESSION_IO_EVT_RX);
406     }
407   else
408     {
409       rlen = svm_fifo_enqueue_with_offset (f, off, len, (u8 *) src);
410       ASSERT (rlen == 0);
411     }
412   return 0;
413 }
414
415 void
416 quic_fifo_egress_shift (quicly_stream_t * stream, size_t delta)
417 {
418   session_t *stream_session;
419   svm_fifo_t *f;
420
421   stream_session = get_stream_session_from_stream (stream);
422   f = stream_session->tx_fifo;
423
424   ASSERT (svm_fifo_dequeue_drop (f, delta) == delta);
425   quicly_stream_sync_sendbuf (stream, 0);
426 }
427
428 int
429 quic_fifo_egress_emit (quicly_stream_t * stream, size_t off, void *dst,
430                        size_t * len, int *wrote_all)
431 {
432   session_t *stream_session;
433   svm_fifo_t *f;
434   u32 deq_max, first_deq, max_rd_chunk, rem_offset;
435
436   stream_session = get_stream_session_from_stream (stream);
437   f = stream_session->tx_fifo;
438
439   QUIC_DBG (3, "Emitting %u, offset %u", *len, off);
440
441   deq_max = svm_fifo_max_dequeue_cons (f);
442   ASSERT (off <= deq_max);
443   if (off + *len < deq_max)
444     {
445       *wrote_all = 0;
446     }
447   else
448     {
449       QUIC_DBG (3, "Wrote ALL");
450       *wrote_all = 1;
451       *len = deq_max - off;
452     }
453
454   /* TODO, use something like : return svm_fifo_peek (f, off, *len, dst); */
455   max_rd_chunk = svm_fifo_max_read_chunk (f);
456
457   first_deq = 0;
458   if (off < max_rd_chunk)
459     {
460       first_deq = clib_min (*len, max_rd_chunk - off);
461       clib_memcpy_fast (dst, svm_fifo_head (f) + off, first_deq);
462     }
463
464   if (max_rd_chunk < off + *len)
465     {
466       rem_offset = max_rd_chunk < off ? off - max_rd_chunk : 0;
467       clib_memcpy_fast (dst + first_deq, f->head_chunk->data + rem_offset,
468                         *len - first_deq);
469     }
470
471   return 0;
472 }
473
474 static const quicly_stream_callbacks_t quic_stream_callbacks = {
475   .on_destroy = quic_on_stream_destroy,
476   .on_send_shift = quic_fifo_egress_shift,
477   .on_send_emit = quic_fifo_egress_emit,
478   .on_send_stop = quic_on_stop_sending,
479   .on_receive = quic_on_receive,
480   .on_receive_reset = quic_on_receive_reset
481 };
482
483 static void
484 quic_accept_stream (void *s)
485 {
486   quicly_stream_t *stream = (quicly_stream_t *) s;
487   session_t *stream_session;
488   quic_stream_data_t *stream_data;
489   app_worker_t *app_wrk;
490   quic_ctx_t *qctx, *sctx;
491   u32 sctx_id;
492   quic_main_t *qm = &quic_main;
493   int rv;
494
495   sctx_id = quic_ctx_alloc (vlib_get_thread_index ());
496
497   qctx = quic_get_conn_ctx (stream->conn);
498
499   stream_session = session_alloc (qctx->c_thread_index);
500   QUIC_DBG (2, "Allocated stream_session, id %u, thread %u ctx %u",
501             stream_session->session_index, stream_session->thread_index,
502             sctx_id);
503   sctx = quic_ctx_get (sctx_id, qctx->c_thread_index);
504   sctx->c_quic_ctx_id.parent_app_wrk_id =
505     qctx->c_quic_ctx_id.parent_app_wrk_id;
506   sctx->c_quic_ctx_id.parent_app_id = qctx->c_quic_ctx_id.parent_app_id;
507   sctx->c_quic_ctx_id.quic_connection_ctx_id = qctx->c_c_index;
508   sctx->c_c_index = sctx_id;
509   sctx->c_quic_ctx_id.is_stream = 1;
510   sctx->c_s_index = stream_session->session_index;
511   sctx->c_quic_ctx_id.stream = stream;
512
513   stream_data = (quic_stream_data_t *) stream->data;
514   stream_data->ctx_id = sctx_id;
515   stream_data->thread_index = sctx->c_thread_index;
516
517   sctx->c_s_index = stream_session->session_index;
518   stream_session->session_state = SESSION_STATE_CREATED;
519   stream_session->flags |= SESSION_F_QUIC_STREAM;
520   stream_session->app_wrk_index = sctx->c_quic_ctx_id.parent_app_wrk_id;
521   stream_session->connection_index = sctx->c_c_index;
522   stream_session->session_type =
523     session_type_from_proto_and_ip (TRANSPORT_PROTO_QUIC,
524                                     qctx->c_quic_ctx_id.udp_is_ip4);
525   stream_session->listener_index = qm->fake_app_listener_index;
526   stream_session->app_index = sctx->c_quic_ctx_id.parent_app_id;
527
528   app_wrk = app_worker_get (stream_session->app_wrk_index);
529   if ((rv = app_worker_init_connected (app_wrk, stream_session)))
530     {
531       QUIC_DBG (1, "failed to allocate fifos");
532       session_free (stream_session);
533       quicly_reset_stream (stream, 0x30001);
534       return;
535     }
536
537   rv = app_worker_accept_notify (app_wrk, stream_session);
538   if (rv)
539     {
540       QUIC_DBG (1, "failed to notify accept worker app");
541       session_free_w_fifos (stream_session);
542       quicly_reset_stream (stream, 0x30002);
543       return;
544     }
545   session_lookup_add_connection (&sctx->connection,
546                                  session_handle (stream_session));
547 }
548
549 static int
550 quic_on_stream_open (quicly_stream_open_t * self, quicly_stream_t * stream)
551 {
552   QUIC_DBG (2, "on_stream_open called");
553   stream->data = malloc (sizeof (quic_stream_data_t));
554   stream->callbacks = &quic_stream_callbacks;
555   /* Notify accept on parent qsession, but only if this is not a locally
556    * initiated stream */
557   if (!quicly_stream_is_self_initiated (stream))
558     {
559       quic_accept_stream (stream);
560     }
561   return 0;
562 }
563
564 static quicly_stream_open_t on_stream_open = { &quic_on_stream_open };
565
566 static void
567 quic_on_conn_close (quicly_closed_by_peer_t * self, quicly_conn_t * conn,
568                     int code, uint64_t frame_type,
569                     const char *reason, size_t reason_len)
570 {
571   QUIC_DBG (2, "connection closed, reason: %.*s", reason, reason_len);
572   quic_ctx_t *ctx = quic_get_conn_ctx (conn);
573   session_transport_closing_notify (&ctx->connection);
574 }
575
576 static quicly_closed_by_peer_t on_closed_by_peer = { &quic_on_conn_close };
577
578
579 /*****************************************************************************
580  * END QUICLY CALLBACKS
581  *****************************************************************************/
582
583 /* single-entry session cache */
584 struct st_util_session_cache_t
585 {
586   ptls_encrypt_ticket_t super;
587   uint8_t id[32];
588   ptls_iovec_t data;
589 };
590
591 static int
592 encrypt_ticket_cb (ptls_encrypt_ticket_t * _self, ptls_t * tls,
593                    int is_encrypt, ptls_buffer_t * dst, ptls_iovec_t src)
594 {
595   struct st_util_session_cache_t *self = (void *) _self;
596   int ret;
597
598   if (is_encrypt)
599     {
600
601       /* replace the cached entry along with a newly generated session id */
602       free (self->data.base);
603       if ((self->data.base = malloc (src.len)) == NULL)
604         return PTLS_ERROR_NO_MEMORY;
605
606       ptls_get_context (tls)->random_bytes (self->id, sizeof (self->id));
607       memcpy (self->data.base, src.base, src.len);
608       self->data.len = src.len;
609
610       /* store the session id in buffer */
611       if ((ret = ptls_buffer_reserve (dst, sizeof (self->id))) != 0)
612         return ret;
613       memcpy (dst->base + dst->off, self->id, sizeof (self->id));
614       dst->off += sizeof (self->id);
615
616     }
617   else
618     {
619
620       /* check if session id is the one stored in cache */
621       if (src.len != sizeof (self->id))
622         return PTLS_ERROR_SESSION_NOT_FOUND;
623       if (memcmp (self->id, src.base, sizeof (self->id)) != 0)
624         return PTLS_ERROR_SESSION_NOT_FOUND;
625
626       /* return the cached value */
627       if ((ret = ptls_buffer_reserve (dst, self->data.len)) != 0)
628         return ret;
629       memcpy (dst->base + dst->off, self->data.base, self->data.len);
630       dst->off += self->data.len;
631     }
632
633   return 0;
634 }
635
636 /* *INDENT-OFF* */
637 static struct st_util_session_cache_t sc = {
638   .super = {
639     .cb = encrypt_ticket_cb,
640   },
641 };
642
643 static ptls_context_t quic_tlsctx = {
644   .random_bytes = ptls_openssl_random_bytes,
645   .get_time = &ptls_get_time,
646   .key_exchanges = ptls_openssl_key_exchanges,
647   .cipher_suites = ptls_openssl_cipher_suites,
648   .certificates = {
649     .list = NULL,
650     .count = 0
651   },
652   .esni = NULL,
653   .on_client_hello = NULL,
654   .emit_certificate = NULL,
655   .sign_certificate = NULL,
656   .verify_certificate = NULL,
657   .ticket_lifetime = 86400,
658   .max_early_data_size = 8192,
659   .hkdf_label_prefix__obsolete = NULL,
660   .require_dhe_on_psk = 1,
661   .encrypt_ticket = &sc.super,
662 };
663 /* *INDENT-ON* */
664
665 static int
666 ptls_compare_separator_line (const char *line, const char *begin_or_end,
667                              const char *label)
668 {
669   int ret = strncmp (line, "-----", 5);
670   size_t text_index = 5;
671
672   if (ret == 0)
673     {
674       size_t begin_or_end_length = strlen (begin_or_end);
675       ret = strncmp (line + text_index, begin_or_end, begin_or_end_length);
676       text_index += begin_or_end_length;
677     }
678
679   if (ret == 0)
680     {
681       ret = line[text_index] - ' ';
682       text_index++;
683     }
684
685   if (ret == 0)
686     {
687       size_t label_length = strlen (label);
688       ret = strncmp (line + text_index, label, label_length);
689       text_index += label_length;
690     }
691
692   if (ret == 0)
693     {
694       ret = strncmp (line + text_index, "-----", 5);
695     }
696
697   return ret;
698 }
699
700 static int
701 ptls_get_bio_pem_object (BIO * bio, const char *label, ptls_buffer_t * buf)
702 {
703   int ret = PTLS_ERROR_PEM_LABEL_NOT_FOUND;
704   char line[256];
705   ptls_base64_decode_state_t state;
706
707   /* Get the label on a line by itself */
708   while (BIO_gets (bio, line, 256))
709     {
710       if (ptls_compare_separator_line (line, "BEGIN", label) == 0)
711         {
712           ret = 0;
713           ptls_base64_decode_init (&state);
714           break;
715         }
716     }
717   /* Get the data in the buffer */
718   while (ret == 0 && BIO_gets (bio, line, 256))
719     {
720       if (ptls_compare_separator_line (line, "END", label) == 0)
721         {
722           if (state.status == PTLS_BASE64_DECODE_DONE
723               || (state.status == PTLS_BASE64_DECODE_IN_PROGRESS
724                   && state.nbc == 0))
725             {
726               ret = 0;
727             }
728           else
729             {
730               ret = PTLS_ERROR_INCORRECT_BASE64;
731             }
732           break;
733         }
734       else
735         {
736           ret = ptls_base64_decode (line, &state, buf);
737         }
738     }
739
740   return ret;
741 }
742
743 static int
744 ptls_load_bio_pem_objects (BIO * bio, const char *label, ptls_iovec_t * list,
745                            size_t list_max, size_t * nb_objects)
746 {
747   int ret = 0;
748   size_t count = 0;
749
750   *nb_objects = 0;
751
752   if (ret == 0)
753     {
754       while (count < list_max)
755         {
756           ptls_buffer_t buf;
757
758           ptls_buffer_init (&buf, "", 0);
759
760           ret = ptls_get_bio_pem_object (bio, label, &buf);
761
762           if (ret == 0)
763             {
764               if (buf.off > 0 && buf.is_allocated)
765                 {
766                   list[count].base = buf.base;
767                   list[count].len = buf.off;
768                   count++;
769                 }
770               else
771                 {
772                   ptls_buffer_dispose (&buf);
773                 }
774             }
775           else
776             {
777               ptls_buffer_dispose (&buf);
778               break;
779             }
780         }
781     }
782
783   if (ret == PTLS_ERROR_PEM_LABEL_NOT_FOUND && count > 0)
784     {
785       ret = 0;
786     }
787
788   *nb_objects = count;
789
790   return ret;
791 }
792
793 #define PTLS_MAX_CERTS_IN_CONTEXT 16
794
795 static int
796 ptls_load_bio_certificates (ptls_context_t * ctx, BIO * bio)
797 {
798   int ret = 0;
799
800   ctx->certificates.list =
801     (ptls_iovec_t *) malloc (PTLS_MAX_CERTS_IN_CONTEXT *
802                              sizeof (ptls_iovec_t));
803
804   if (ctx->certificates.list == NULL)
805     {
806       ret = PTLS_ERROR_NO_MEMORY;
807     }
808   else
809     {
810       ret =
811         ptls_load_bio_pem_objects (bio, "CERTIFICATE", ctx->certificates.list,
812                                    PTLS_MAX_CERTS_IN_CONTEXT,
813                                    &ctx->certificates.count);
814     }
815
816   return ret;
817 }
818
819 static inline void
820 load_bio_certificate_chain (ptls_context_t * ctx, const char *cert_data)
821 {
822   BIO *cert_bio;
823   cert_bio = BIO_new_mem_buf (cert_data, -1);
824   if (ptls_load_bio_certificates (ctx, cert_bio) != 0)
825     {
826       BIO_free (cert_bio);
827       fprintf (stderr, "failed to load certificate:%s\n", strerror (errno));
828       exit (1);
829     }
830   BIO_free (cert_bio);
831 }
832
833 static inline void
834 load_bio_private_key (ptls_context_t * ctx, const char *pk_data)
835 {
836   static ptls_openssl_sign_certificate_t sc;
837   EVP_PKEY *pkey;
838   BIO *key_bio;
839
840   key_bio = BIO_new_mem_buf (pk_data, -1);
841   pkey = PEM_read_bio_PrivateKey (key_bio, NULL, NULL, NULL);
842   BIO_free (key_bio);
843
844   if (pkey == NULL)
845     {
846       fprintf (stderr, "failed to read private key from app configuration\n");
847       exit (1);
848     }
849
850   ptls_openssl_init_sign_certificate (&sc, pkey);
851   EVP_PKEY_free (pkey);
852
853   ctx->sign_certificate = &sc.super;
854 }
855
856 static inline void
857 quic_make_connection_key (clib_bihash_kv_16_8_t * kv,
858                           const quicly_cid_plaintext_t * id)
859 {
860   kv->key[0] = ((u64) id->master_id) << 32 | (u64) id->thread_id;
861   kv->key[1] = id->node_id;
862 }
863
864 static void
865 quic_connection_closed (u32 ctx_index, u32 thread_index)
866 {
867   /*  TODO : free fifos */
868   QUIC_DBG (2, "QUIC connection closed");
869   tw_timer_wheel_1t_3w_1024sl_ov_t *tw;
870   clib_bihash_kv_16_8_t kv;
871   quicly_conn_t *conn;
872   quic_ctx_t *ctx;
873
874   ctx = quic_ctx_get (ctx_index, thread_index);
875
876   ASSERT (!ctx->c_quic_ctx_id.is_stream);
877   /*  TODO if connection is not established, just delete the session? */
878
879   /*  Stop the timer */
880   if (ctx->timer_handle != QUIC_TIMER_HANDLE_INVALID)
881     {
882       tw = &quic_main.wrk_ctx[thread_index].timer_wheel;
883       tw_timer_stop_1t_3w_1024sl_ov (tw, ctx->timer_handle);
884     }
885
886   /*  Delete the connection from the connection map */
887   conn = ctx->c_quic_ctx_id.conn;
888   quic_make_connection_key (&kv, quicly_get_master_id (conn));
889   QUIC_DBG (2, "Deleting conn with id %lu %lu", kv.key[0], kv.key[1]);
890   clib_bihash_add_del_16_8 (&quic_main.connection_hash, &kv, 0 /* is_add */ );
891
892   // session_close (session_get_from_handle (ctx->c_quic_ctx_id.udp_session_handle));
893   quic_disconnect_transport (ctx);
894   session_transport_delete_notify (&ctx->connection);
895   /*  Do not try to send anything anymore */
896   quicly_free (ctx->c_quic_ctx_id.conn);
897   ctx->c_quic_ctx_id.conn = NULL;
898   quic_ctx_free (ctx);
899 }
900
901 static void
902 allocate_quicly_ctx (application_t * app, u8 is_client)
903 {
904   struct
905   {
906     quicly_context_t _;
907     char cid_key[17];
908   } *ctx_data;
909   quicly_context_t *quicly_ctx;
910   ptls_iovec_t key_vec;
911   QUIC_DBG (2, "Called allocate_quicly_ctx");
912
913   if (app->quicly_ctx)
914     {
915       QUIC_DBG (1, "Trying to reallocate quicly_ctx");
916       return;
917     }
918
919   ctx_data = malloc (sizeof (*ctx_data));
920   quicly_ctx = &ctx_data->_;
921   app->quicly_ctx = (u64 *) quicly_ctx;
922   memcpy (quicly_ctx, &quicly_spec_context, sizeof (quicly_context_t));
923
924   quicly_ctx->max_packet_size = QUIC_MAX_PACKET_SIZE;
925   quicly_ctx->tls = &quic_tlsctx;
926   quicly_ctx->stream_open = &on_stream_open;
927   quicly_ctx->closed_by_peer = &on_closed_by_peer;
928   quicly_ctx->now = &quicly_vpp_now_cb;
929
930   quicly_amend_ptls_context (quicly_ctx->tls);
931
932   quicly_ctx->event_log.mask = 0;       /* logs */
933   quicly_ctx->event_log.cb = quicly_new_default_event_logger (stderr);
934
935   quicly_ctx->transport_params.max_data = QUIC_INT_MAX;
936   quicly_ctx->transport_params.max_streams_uni = QUIC_INT_MAX;
937   quicly_ctx->transport_params.max_streams_bidi = QUIC_INT_MAX;
938   quicly_ctx->transport_params.max_stream_data.bidi_local = (QUIC_FIFO_SIZE - 1);       /* max_enq is SIZE - 1 */
939   quicly_ctx->transport_params.max_stream_data.bidi_remote = (QUIC_FIFO_SIZE - 1);      /* max_enq is SIZE - 1 */
940   quicly_ctx->transport_params.max_stream_data.uni = QUIC_INT_MAX;
941
942   quicly_ctx->tls->random_bytes (ctx_data->cid_key, 16);
943   ctx_data->cid_key[16] = 0;
944   key_vec = ptls_iovec_init (ctx_data->cid_key, strlen (ctx_data->cid_key));
945   quicly_ctx->cid_encryptor =
946     quicly_new_default_cid_encryptor (&ptls_openssl_bfecb,
947                                       &ptls_openssl_sha256, key_vec);
948   if (!is_client && app->tls_key != NULL && app->tls_cert != NULL)
949     {
950       load_bio_private_key (quicly_ctx->tls, (char *) app->tls_key);
951       load_bio_certificate_chain (quicly_ctx->tls, (char *) app->tls_cert);
952     }
953 }
954
955
956 /*****************************************************************************
957  * BEGIN TIMERS HANDLING
958  *****************************************************************************/
959
960 static int64_t
961 quic_get_thread_time (u8 thread_index)
962 {
963   return quic_main.wrk_ctx[thread_index].time_now;
964 }
965
966 static int64_t
967 quic_get_time (quicly_now_t * self)
968 {
969   u8 thread_index = vlib_get_thread_index ();
970   return quic_get_thread_time (thread_index);
971 }
972
973 static u32
974 quic_set_time_now (u32 thread_index)
975 {
976   vlib_main_t *vlib_main = vlib_get_main ();
977   f64 time = vlib_time_now (vlib_main);
978   quic_main.wrk_ctx[thread_index].time_now = (int64_t) (time * 1000.f);
979   return quic_main.wrk_ctx[thread_index].time_now;
980 }
981
982 /* Transport proto callback */
983 static void
984 quic_update_time (f64 now, u8 thread_index)
985 {
986   tw_timer_wheel_1t_3w_1024sl_ov_t *tw;
987
988   tw = &quic_main.wrk_ctx[thread_index].timer_wheel;
989   quic_set_time_now (thread_index);
990   tw_timer_expire_timers_1t_3w_1024sl_ov (tw, now);
991 }
992
993 static void
994 quic_timer_expired (u32 conn_index)
995 {
996   quic_ctx_t *ctx;
997   QUIC_DBG (4, "Timer expired for conn %u at %ld", conn_index,
998             quic_get_time (NULL));
999   ctx = quic_ctx_get (conn_index, vlib_get_thread_index ());
1000   ctx->timer_handle = QUIC_TIMER_HANDLE_INVALID;
1001   quic_send_packets (ctx);
1002 }
1003
1004 static void
1005 quic_update_timer (quic_ctx_t * ctx)
1006 {
1007   tw_timer_wheel_1t_3w_1024sl_ov_t *tw;
1008   int64_t next_timeout, next_interval;
1009   session_t *quic_session;
1010
1011   /*  This timeout is in ms which is the unit of our timer */
1012   next_timeout = quicly_get_first_timeout (ctx->c_quic_ctx_id.conn);
1013   next_interval = next_timeout - quic_get_time (NULL);
1014
1015   if (next_timeout == 0 || next_interval <= 0)
1016     {
1017       if (ctx->c_s_index == QUIC_SESSION_INVALID)
1018         {
1019           next_interval = 1;
1020         }
1021       else
1022         {
1023           quic_session = session_get (ctx->c_s_index, ctx->c_thread_index);
1024           if (svm_fifo_set_event (quic_session->tx_fifo))
1025             session_send_io_evt_to_thread_custom (quic_session,
1026                                                   quic_session->thread_index,
1027                                                   SESSION_IO_EVT_BUILTIN_TX);
1028           return;
1029         }
1030     }
1031
1032   tw = &quic_main.wrk_ctx[vlib_get_thread_index ()].timer_wheel;
1033
1034   QUIC_DBG (4, "Timer set to %ld (int %ld) for ctx %u", next_timeout,
1035             next_interval, ctx->c_c_index);
1036
1037   if (ctx->timer_handle == QUIC_TIMER_HANDLE_INVALID)
1038     {
1039       if (next_timeout == INT64_MAX)
1040         {
1041           QUIC_DBG (4, "timer for ctx %u already stopped", ctx->c_c_index);
1042           return;
1043         }
1044       ctx->timer_handle =
1045         tw_timer_start_1t_3w_1024sl_ov (tw, ctx->c_c_index, 0, next_interval);
1046     }
1047   else
1048     {
1049       if (next_timeout == INT64_MAX)
1050         {
1051           tw_timer_stop_1t_3w_1024sl_ov (tw, ctx->timer_handle);
1052           ctx->timer_handle = QUIC_TIMER_HANDLE_INVALID;
1053           QUIC_DBG (4, "Stopping timer for ctx %u", ctx->c_c_index);
1054         }
1055       else
1056         tw_timer_update_1t_3w_1024sl_ov (tw, ctx->timer_handle,
1057                                          next_interval);
1058     }
1059   return;
1060 }
1061
1062 static void
1063 quic_expired_timers_dispatch (u32 * expired_timers)
1064 {
1065   int i;
1066
1067   for (i = 0; i < vec_len (expired_timers); i++)
1068     {
1069       quic_timer_expired (expired_timers[i]);
1070     }
1071 }
1072
1073
1074 /*****************************************************************************
1075  * END TIMERS HANDLING
1076  *
1077  * BEGIN TRANSPORT PROTO FUNCTIONS
1078  *****************************************************************************/
1079
1080 static int
1081 quic_connect (transport_endpoint_cfg_t * tep)
1082 {
1083   QUIC_DBG (2, "Called quic_connect");
1084   session_endpoint_cfg_t *sep;
1085   int connect_stream = 0;
1086
1087   sep = (session_endpoint_cfg_t *) tep;
1088
1089   if (sep->port == 0)
1090     {
1091       /*  TODO: better logic to detect if this is a stream or a connection request */
1092       connect_stream = 1;
1093     }
1094
1095   if (connect_stream)
1096     {
1097       return quic_connect_new_stream (sep);
1098     }
1099   else
1100     {
1101       return quic_connect_new_connection (sep);
1102     }
1103 }
1104
1105 static int
1106 quic_connect_new_stream (session_endpoint_cfg_t * sep)
1107 {
1108   uint64_t quic_session_handle;
1109   session_t *quic_session, *stream_session;
1110   quic_stream_data_t *stream_data;
1111   quicly_stream_t *stream;
1112   quicly_conn_t *conn;
1113   app_worker_t *app_wrk;
1114   quic_ctx_t *qctx, *sctx;
1115   u32 sctx_index;
1116   quic_main_t *qm = &quic_main;
1117   int rv;
1118
1119   /*  Find base session to which the user want to attach a stream */
1120   quic_session_handle = sep->transport_opts;
1121   QUIC_DBG (2, "Opening new stream (qsession %u)", sep->transport_opts);
1122   quic_session = session_get_from_handle (quic_session_handle);
1123
1124   if (quic_session->session_type !=
1125       session_type_from_proto_and_ip (TRANSPORT_PROTO_QUIC, sep->is_ip4))
1126     {
1127       QUIC_DBG (1, "received incompatible session");
1128       return -1;
1129     }
1130
1131   app_wrk = app_worker_get_if_valid (quic_session->app_wrk_index);
1132   if (!app_wrk)
1133     {
1134       QUIC_DBG (1, "Invalid app worker :(");
1135       return -1;
1136     }
1137
1138   sctx_index = quic_ctx_alloc (quic_session->thread_index);     /*  Allocate before we get pointers */
1139   sctx = quic_ctx_get (sctx_index, quic_session->thread_index);
1140   qctx =
1141     quic_ctx_get (quic_session->connection_index, quic_session->thread_index);
1142   if (qctx->c_quic_ctx_id.is_stream)
1143     {
1144       QUIC_DBG (1, "session is a stream");
1145       quic_ctx_free (sctx);
1146       return -1;
1147     }
1148
1149   sctx->c_quic_ctx_id.parent_app_wrk_id =
1150     qctx->c_quic_ctx_id.parent_app_wrk_id;
1151   sctx->c_quic_ctx_id.parent_app_id = qctx->c_quic_ctx_id.parent_app_id;
1152   sctx->c_quic_ctx_id.quic_connection_ctx_id = qctx->c_c_index;
1153   sctx->c_c_index = sctx_index;
1154   sctx->c_quic_ctx_id.is_stream = 1;
1155
1156   conn = qctx->c_quic_ctx_id.conn;
1157
1158   if (!conn || !quicly_connection_is_ready (conn))
1159     return -1;
1160
1161   if ((rv = quicly_open_stream (conn, &stream, 0 /* uni */ )))
1162     {
1163       QUIC_DBG (2, "Stream open failed with %d", rv);
1164       return -1;
1165     }
1166   sctx->c_quic_ctx_id.stream = stream;
1167
1168   QUIC_DBG (2, "Opened stream %d, creating session", stream->stream_id);
1169
1170   stream_session = session_alloc (qctx->c_thread_index);
1171   QUIC_DBG (2, "Allocated stream_session, id %u, thread %u ctx %u",
1172             stream_session->session_index, stream_session->thread_index,
1173             sctx_index);
1174   stream_session->flags |= SESSION_F_QUIC_STREAM;
1175   stream_session->app_wrk_index = app_wrk->wrk_index;
1176   stream_session->connection_index = sctx_index;
1177   stream_session->listener_index = qm->fake_app_listener_index;
1178   stream_session->session_type =
1179     session_type_from_proto_and_ip (TRANSPORT_PROTO_QUIC,
1180                                     qctx->c_quic_ctx_id.udp_is_ip4);
1181
1182   sctx->c_s_index = stream_session->session_index;
1183
1184   if (app_worker_init_connected (app_wrk, stream_session))
1185     {
1186       QUIC_DBG (1, "failed to app_worker_init_connected");
1187       quicly_reset_stream (stream, 0x30003);
1188       session_free_w_fifos (stream_session);
1189       quic_ctx_free (sctx);
1190       return app_worker_connect_notify (app_wrk, NULL, sep->opaque);
1191     }
1192
1193   stream_session->session_state = SESSION_STATE_READY;
1194   if (app_worker_connect_notify (app_wrk, stream_session, sep->opaque))
1195     {
1196       QUIC_DBG (1, "failed to notify app");
1197       quicly_reset_stream (stream, 0x30004);
1198       session_free_w_fifos (stream_session);
1199       quic_ctx_free (sctx);
1200       return -1;
1201     }
1202   session_lookup_add_connection (&sctx->connection,
1203                                  session_handle (stream_session));
1204   stream_data = (quic_stream_data_t *) stream->data;
1205   stream_data->ctx_id = sctx->c_c_index;
1206   stream_data->thread_index = sctx->c_thread_index;
1207   return 0;
1208 }
1209
1210 static int
1211 quic_connect_new_connection (session_endpoint_cfg_t * sep)
1212 {
1213   vnet_connect_args_t _cargs = { {}, }, *cargs = &_cargs;
1214   quic_main_t *qm = &quic_main;
1215   quic_ctx_t *ctx;
1216   app_worker_t *app_wrk;
1217   application_t *app;
1218   u32 ctx_index;
1219   int error;
1220
1221   ctx_index = quic_ctx_alloc (vlib_get_thread_index ());
1222   ctx = quic_ctx_get (ctx_index, vlib_get_thread_index ());
1223   ctx->c_quic_ctx_id.parent_app_wrk_id = sep->app_wrk_index;
1224   ctx->c_s_index = QUIC_SESSION_INVALID;
1225   ctx->c_c_index = ctx_index;
1226   ctx->c_quic_ctx_id.udp_is_ip4 = sep->is_ip4;
1227   ctx->timer_handle = QUIC_TIMER_HANDLE_INVALID;
1228   ctx->conn_state = QUIC_CONN_STATE_HANDSHAKE;
1229   ctx->client_opaque = sep->opaque;
1230   if (sep->hostname)
1231     {
1232       ctx->srv_hostname = format (0, "%v", sep->hostname);
1233       vec_terminate_c_string (ctx->srv_hostname);
1234     }
1235   else
1236     {
1237       /*  needed by quic for crypto + determining client / server */
1238       ctx->srv_hostname =
1239         format (0, "%U", format_ip46_address, &sep->ip, sep->is_ip4);
1240     }
1241
1242   clib_memcpy (&cargs->sep, sep, sizeof (session_endpoint_cfg_t));
1243   cargs->sep.transport_proto = TRANSPORT_PROTO_UDPC;
1244   cargs->app_index = qm->app_index;
1245   cargs->api_context = ctx_index;
1246
1247   app_wrk = app_worker_get (sep->app_wrk_index);
1248   app = application_get (app_wrk->app_index);
1249   ctx->c_quic_ctx_id.parent_app_id = app_wrk->app_index;
1250   cargs->sep_ext.ns_index = app->ns_index;
1251
1252   allocate_quicly_ctx (app, 1 /* is client */ );
1253
1254   if ((error = vnet_connect (cargs)))
1255     return error;
1256
1257   return 0;
1258 }
1259
1260 static void
1261 quic_disconnect (u32 ctx_index, u32 thread_index)
1262 {
1263   QUIC_DBG (2, "Called quic_disconnect");
1264   quic_ctx_t *ctx;
1265
1266   ctx = quic_ctx_get (ctx_index, thread_index);
1267   if (ctx->c_quic_ctx_id.is_stream)
1268     {
1269       QUIC_DBG (2, "Closing stream %x, session %x", ctx_index,
1270                 ctx->c_s_index);
1271       quicly_stream_t *stream = ctx->c_quic_ctx_id.stream;
1272       quicly_reset_stream (stream, 0x30000);
1273     }
1274   else
1275     {
1276       QUIC_DBG (2, "Closing connection %x, session %x", ctx_index,
1277                 ctx->c_s_index);
1278       quicly_conn_t *conn = ctx->c_quic_ctx_id.conn;
1279       /* Start connection closing. Keep sending packets until quicly_send
1280          returns QUICLY_ERROR_FREE_CONNECTION */
1281       quicly_close (conn, 0, "");
1282       /* This also causes all streams to be closed (and the cb called) */
1283       quic_send_packets (ctx);
1284     }
1285 }
1286
1287 static u32
1288 quic_start_listen (u32 quic_listen_session_index, transport_endpoint_t * tep)
1289 {
1290   vnet_listen_args_t _bargs, *args = &_bargs;
1291   quic_main_t *qm = &quic_main;
1292   session_handle_t udp_handle;
1293   session_endpoint_cfg_t *sep;
1294   session_t *udp_listen_session;
1295   app_worker_t *app_wrk;
1296   application_t *app;
1297   quic_ctx_t *lctx;
1298   u32 lctx_index;
1299   app_listener_t *app_listener;
1300
1301   sep = (session_endpoint_cfg_t *) tep;
1302   app_wrk = app_worker_get (sep->app_wrk_index);
1303   /* We need to call this because we call app_worker_init_connected in
1304    * quic_accept_stream, which assumes the connect segment manager exists */
1305   app_worker_alloc_connects_segment_manager (app_wrk);
1306   app = application_get (app_wrk->app_index);
1307   QUIC_DBG (2, "Called quic_start_listen for app %d", app_wrk->app_index);
1308
1309   allocate_quicly_ctx (app, 0 /* is_client */ );
1310
1311   sep->transport_proto = TRANSPORT_PROTO_UDPC;
1312   memset (args, 0, sizeof (*args));
1313   args->app_index = qm->app_index;
1314   args->sep_ext = *sep;
1315   args->sep_ext.ns_index = app->ns_index;
1316   if (vnet_listen (args))
1317     return -1;
1318
1319   lctx_index = quic_ctx_alloc (0);      /*  listener */
1320   udp_handle = args->handle;
1321   app_listener = app_listener_get_w_handle (udp_handle);
1322   udp_listen_session = app_listener_get_session (app_listener);
1323   udp_listen_session->opaque = lctx_index;
1324
1325   lctx = quic_ctx_get (lctx_index, 0);  /*  listener */
1326   lctx->is_listener = 1;
1327   lctx->c_quic_ctx_id.parent_app_wrk_id = sep->app_wrk_index;
1328   lctx->c_quic_ctx_id.parent_app_id = app_wrk->app_index;
1329   lctx->c_quic_ctx_id.udp_session_handle = udp_handle;
1330   lctx->c_quic_ctx_id.udp_is_ip4 = sep->is_ip4;
1331   lctx->c_s_index = quic_listen_session_index;
1332
1333   QUIC_DBG (2, "Started listening %d", lctx_index);
1334   return lctx_index;
1335 }
1336
1337 static u32
1338 quic_stop_listen (u32 lctx_index)
1339 {
1340   QUIC_DBG (2, "Called quic_stop_listen");
1341   quic_ctx_t *lctx;
1342
1343   lctx = quic_ctx_get (lctx_index, 0);  /*  listener */
1344   vnet_unlisten_args_t a = {
1345     .handle = lctx->c_quic_ctx_id.udp_session_handle,
1346     .app_index = quic_main.app_index,
1347     .wrk_map_index = 0          /* default wrk */
1348   };
1349   if (vnet_unlisten (&a))
1350     clib_warning ("unlisten errored");
1351
1352   /*  TODO: crypto state cleanup */
1353
1354   quic_ctx_free (lctx);         /*  listener */
1355   return 0;
1356 }
1357
1358 static transport_connection_t *
1359 quic_connection_get (u32 ctx_index, u32 thread_index)
1360 {
1361   QUIC_DBG (2, "Called quic_connection_get");
1362   quic_ctx_t *ctx;
1363   ctx = quic_ctx_get (ctx_index, thread_index);
1364   return &ctx->connection;
1365 }
1366
1367 static transport_connection_t *
1368 quic_listener_get (u32 listener_index)
1369 {
1370   QUIC_DBG (2, "Called quic_listener_get");
1371   quic_ctx_t *ctx;
1372   ctx = quic_ctx_get (listener_index, 0);
1373   return &ctx->connection;
1374 }
1375
1376 static u8 *
1377 format_quic_ctx (u8 * s, va_list * args)
1378 {
1379   quic_ctx_t *ctx = va_arg (*args, quic_ctx_t *);
1380   u32 verbose = va_arg (*args, u32);
1381
1382   if (!ctx)
1383     return s;
1384   s = format (s, "[#%d][%s] ", ctx->c_thread_index, "Q");
1385
1386   if (ctx->is_listener)
1387     {
1388       s = format (s, "%s Listener: ", ctx->c_quic_ctx_id.is_stream ?
1389                   "Stream" : "QSession");
1390       if (verbose)
1391         s = format (s, "app %d wrk %d", ctx->c_quic_ctx_id.parent_app_id,
1392                     ctx->c_quic_ctx_id.parent_app_wrk_id);
1393     }
1394   else
1395     {
1396       if (ctx->c_is_ip4)
1397         s = format (s, "%U:%d->%U:%d", format_ip4_address, &ctx->c_lcl_ip4,
1398                     clib_net_to_host_u16 (ctx->c_lcl_port),
1399                     format_ip4_address, &ctx->c_rmt_ip4,
1400                     clib_net_to_host_u16 (ctx->c_rmt_port));
1401       else
1402         s = format (s, "%U:%d->%U:%d", format_ip6_address, &ctx->c_lcl_ip6,
1403                     clib_net_to_host_u16 (ctx->c_lcl_port),
1404                     format_ip6_address, &ctx->c_rmt_ip6,
1405                     clib_net_to_host_u16 (ctx->c_rmt_port));
1406     }
1407   return s;
1408 }
1409
1410 static u8 *
1411 format_quic_connection (u8 * s, va_list * args)
1412 {
1413   u32 qc_index = va_arg (*args, u32);
1414   u32 thread_index = va_arg (*args, u32);
1415   u32 verbose = va_arg (*args, u32);
1416   quic_ctx_t *ctx = quic_ctx_get (qc_index, thread_index);
1417   if (ctx)
1418     s = format (s, "%-50U", format_quic_ctx, ctx, verbose);
1419   return s;
1420 }
1421
1422 static u8 *
1423 format_quic_half_open (u8 * s, va_list * args)
1424 {
1425   u32 qc_index = va_arg (*args, u32);
1426   quic_ctx_t *ctx = quic_ctx_get (qc_index, vlib_get_thread_index ());
1427   s = format (s, "[QUIC] half-open app %u", ctx->c_quic_ctx_id.parent_app_id);
1428   return s;
1429 }
1430
1431 /*  TODO improve */
1432 static u8 *
1433 format_quic_listener (u8 * s, va_list * args)
1434 {
1435   u32 tci = va_arg (*args, u32);
1436   u32 verbose = va_arg (*args, u32);
1437   quic_ctx_t *ctx = quic_ctx_get (tci, vlib_get_thread_index ());
1438   if (ctx)
1439     {
1440       ASSERT (ctx->is_listener);
1441       s = format (s, "%-50U", format_quic_ctx, ctx, verbose);
1442     }
1443   return s;
1444 }
1445
1446 /*****************************************************************************
1447  * END TRANSPORT PROTO FUNCTIONS
1448  *
1449  * START SESSION CALLBACKS
1450  * Called from UDP layer
1451  *****************************************************************************/
1452
1453 static inline void
1454 quic_build_sockaddr (struct sockaddr *sa, socklen_t * salen,
1455                      ip46_address_t * addr, u16 port, u8 is_ip4)
1456 {
1457   if (is_ip4)
1458     {
1459       struct sockaddr_in *sa4 = (struct sockaddr_in *) sa;
1460       sa4->sin_family = AF_INET;
1461       sa4->sin_port = port;
1462       sa4->sin_addr.s_addr = addr->ip4.as_u32;
1463       *salen = sizeof (struct sockaddr_in);
1464     }
1465   else
1466     {
1467       struct sockaddr_in6 *sa6 = (struct sockaddr_in6 *) sa;
1468       sa6->sin6_family = AF_INET6;
1469       sa6->sin6_port = port;
1470       clib_memcpy (&sa6->sin6_addr, &addr->ip6, 16);
1471       *salen = sizeof (struct sockaddr_in6);
1472     }
1473 }
1474
1475 static int
1476 quic_notify_app_connected (quic_ctx_t * ctx)
1477 {
1478   QUIC_DBG (1, "quic_notify_app_connected");
1479   session_t *quic_session;
1480   app_worker_t *app_wrk;
1481   u32 ctx_id = ctx->c_c_index;
1482   u32 thread_index = ctx->c_thread_index;
1483   quic_main_t *qm = &quic_main;
1484
1485   app_wrk = app_worker_get_if_valid (ctx->c_quic_ctx_id.parent_app_wrk_id);
1486   if (!app_wrk)
1487     {
1488       quic_disconnect_transport (ctx);
1489       return -1;
1490     }
1491
1492   quic_session = session_alloc (thread_index);
1493
1494   QUIC_DBG (2, "Allocated quic_session, id %u, thread %u",
1495             quic_session->session_index, quic_session->thread_index);
1496   ctx->c_s_index = quic_session->session_index;
1497   quic_session->app_wrk_index = ctx->c_quic_ctx_id.parent_app_wrk_id;
1498   quic_session->connection_index = ctx->c_c_index;
1499   quic_session->listener_index = qm->fake_app_listener_index;
1500   quic_session->session_type =
1501     session_type_from_proto_and_ip (TRANSPORT_PROTO_QUIC,
1502                                     ctx->c_quic_ctx_id.udp_is_ip4);
1503
1504   if (app_worker_init_connected (app_wrk, quic_session))
1505     {
1506       QUIC_DBG (1, "failed to app_worker_init_connected");
1507       quic_disconnect (ctx_id, thread_index);
1508       return app_worker_connect_notify (app_wrk, NULL, ctx->client_opaque);
1509     }
1510
1511   quic_session->session_state = SESSION_STATE_CONNECTING;
1512   if (app_worker_connect_notify (app_wrk, quic_session, ctx->client_opaque))
1513     {
1514       QUIC_DBG (1, "failed to notify app");
1515       quic_disconnect (ctx_id, thread_index);
1516       return -1;
1517     }
1518
1519   /*  If the app opens a stream in its callback it may invalidate ctx */
1520   ctx = quic_ctx_get (ctx_id, thread_index);
1521   quic_session->session_state = SESSION_STATE_LISTENING;
1522   session_lookup_add_connection (&ctx->connection,
1523                                  session_handle (quic_session));
1524
1525   return 0;
1526 }
1527
1528 static int
1529 quic_session_connected_callback (u32 quic_app_index, u32 ctx_index,
1530                                  session_t * udp_session, u8 is_fail)
1531 {
1532   QUIC_DBG (2, "QSession is now connected (id %u)",
1533             udp_session->session_index);
1534   /* This should always be called before quic_connect returns since UDP always
1535    * connects instantly. */
1536   clib_bihash_kv_16_8_t kv;
1537   struct sockaddr_in6 sa6;
1538   struct sockaddr *sa = (struct sockaddr *) &sa6;
1539   socklen_t salen;
1540   transport_connection_t *tc;
1541   app_worker_t *app_wrk;
1542   quicly_conn_t *conn;
1543   application_t *app;
1544   quic_ctx_t *ctx;
1545   u32 thread_index = vlib_get_thread_index ();
1546   int ret;
1547
1548   ctx = quic_ctx_get (ctx_index, thread_index);
1549   if (is_fail)
1550     {
1551       u32 api_context;
1552       int rv = 0;
1553
1554       app_wrk =
1555         app_worker_get_if_valid (ctx->c_quic_ctx_id.parent_app_wrk_id);
1556       if (app_wrk)
1557         {
1558           api_context = ctx->c_s_index;
1559           app_worker_connect_notify (app_wrk, 0, api_context);
1560         }
1561       return rv;
1562     }
1563
1564   app_wrk = app_worker_get_if_valid (ctx->c_quic_ctx_id.parent_app_wrk_id);
1565   if (!app_wrk)
1566     {
1567       QUIC_DBG (1, "Appwrk not found");
1568       return -1;
1569     }
1570   app = application_get (app_wrk->app_index);
1571
1572   ctx->c_thread_index = thread_index;
1573   ctx->c_c_index = ctx_index;
1574
1575   QUIC_DBG (2, "Quic connect returned %u. New ctx [%u]%x",
1576             is_fail, thread_index, (ctx) ? ctx_index : ~0);
1577
1578   ctx->c_quic_ctx_id.udp_session_handle = session_handle (udp_session);
1579   udp_session->opaque = ctx->c_quic_ctx_id.parent_app_id;
1580   udp_session->session_state = SESSION_STATE_READY;
1581
1582   /* Init QUIC lib connection
1583    * Generate required sockaddr & salen */
1584   tc = session_get_transport (udp_session);
1585   quic_build_sockaddr (sa, &salen, &tc->rmt_ip, tc->rmt_port, tc->is_ip4);
1586
1587   ret =
1588     quicly_connect (&ctx->c_quic_ctx_id.conn,
1589                     (quicly_context_t *) app->quicly_ctx,
1590                     (char *) ctx->srv_hostname, sa, salen,
1591                     &quic_main.next_cid, &quic_main.hs_properties, NULL);
1592   ++quic_main.next_cid.master_id;
1593   /*  Save context handle in quicly connection */
1594   quic_store_conn_ctx (ctx->c_quic_ctx_id.conn, ctx);
1595   assert (ret == 0);
1596
1597   /*  Register connection in connections map */
1598   conn = ctx->c_quic_ctx_id.conn;
1599   quic_make_connection_key (&kv, quicly_get_master_id (conn));
1600   kv.value = ((u64) thread_index) << 32 | (u64) ctx_index;
1601   QUIC_DBG (2, "Registering conn with id %lu %lu", kv.key[0], kv.key[1]);
1602   clib_bihash_add_del_16_8 (&quic_main.connection_hash, &kv, 1 /* is_add */ );
1603
1604   quic_send_packets (ctx);
1605
1606   /*  UDP stack quirk? preemptively transfer connection if that happens */
1607   if (udp_session->thread_index != thread_index)
1608     quic_transfer_connection (ctx_index, udp_session->thread_index);
1609
1610   return ret;
1611 }
1612
1613 static void
1614 quic_receive_connection (void *arg)
1615 {
1616   u32 new_ctx_id, thread_index = vlib_get_thread_index ();
1617   quic_ctx_t *temp_ctx, *new_ctx;
1618   clib_bihash_kv_16_8_t kv;
1619   quicly_conn_t *conn;
1620
1621   temp_ctx = arg;
1622   new_ctx_id = quic_ctx_alloc (thread_index);
1623   new_ctx = quic_ctx_get (new_ctx_id, thread_index);
1624
1625   QUIC_DBG (2, "Received conn %u (now %u)", temp_ctx->c_thread_index,
1626             new_ctx_id);
1627
1628
1629   memcpy (new_ctx, temp_ctx, sizeof (quic_ctx_t));
1630   free (temp_ctx);
1631
1632   new_ctx->c_thread_index = thread_index;
1633   new_ctx->c_c_index = new_ctx_id;
1634
1635   conn = new_ctx->c_quic_ctx_id.conn;
1636   quic_store_conn_ctx (conn, new_ctx);
1637   quic_make_connection_key (&kv, quicly_get_master_id (conn));
1638   kv.value = ((u64) thread_index) << 32 | (u64) new_ctx_id;
1639   QUIC_DBG (2, "Registering conn with id %lu %lu", kv.key[0], kv.key[1]);
1640   clib_bihash_add_del_16_8 (&quic_main.connection_hash, &kv, 1 /* is_add */ );
1641   new_ctx->timer_handle = QUIC_TIMER_HANDLE_INVALID;
1642   quic_update_timer (new_ctx);
1643
1644   /*  Trigger read on this connection ? */
1645 }
1646
1647 static void
1648 quic_transfer_connection (u32 ctx_index, u32 dest_thread)
1649 {
1650   tw_timer_wheel_1t_3w_1024sl_ov_t *tw;
1651   quic_ctx_t *ctx, *temp_ctx;
1652   clib_bihash_kv_16_8_t kv;
1653   quicly_conn_t *conn;
1654   u32 thread_index = vlib_get_thread_index ();
1655
1656   QUIC_DBG (2, "Transferring conn %u to thread %u", ctx_index, dest_thread);
1657
1658   temp_ctx = malloc (sizeof (quic_ctx_t));
1659   ASSERT (temp_ctx);
1660   ctx = quic_ctx_get (ctx_index, thread_index);
1661
1662   memcpy (temp_ctx, ctx, sizeof (quic_ctx_t));
1663
1664   /*  Remove from lookup hash, timer wheel and thread-local pool */
1665   conn = ctx->c_quic_ctx_id.conn;
1666   quic_make_connection_key (&kv, quicly_get_master_id (conn));
1667   clib_bihash_add_del_16_8 (&quic_main.connection_hash, &kv, 0 /* is_add */ );
1668   if (ctx->timer_handle != QUIC_TIMER_HANDLE_INVALID)
1669     {
1670       tw = &quic_main.wrk_ctx[thread_index].timer_wheel;
1671       tw_timer_stop_1t_3w_1024sl_ov (tw, ctx->timer_handle);
1672     }
1673   quic_ctx_free (ctx);
1674
1675   /*  Send connection to destination thread */
1676   session_send_rpc_evt_to_thread (dest_thread, quic_receive_connection,
1677                                   (void *) temp_ctx);
1678 }
1679
1680 static void
1681 quic_transfer_connection_rpc (void *arg)
1682 {
1683   u64 arg_int = (u64) arg;
1684   u32 ctx_index, dest_thread;
1685
1686   ctx_index = (u32) (arg_int >> 32);
1687   dest_thread = (u32) (arg_int & UINT32_MAX);
1688   quic_transfer_connection (ctx_index, dest_thread);
1689 }
1690
1691 /*
1692  * This assumes that the connection is not yet associated to a session
1693  * So currently it only works on the client side when receiving the first packet
1694  * from the server
1695  */
1696 static void
1697 quic_move_connection_to_thread (u32 ctx_index, u32 owner_thread,
1698                                 u32 to_thread)
1699 {
1700   QUIC_DBG (2, "Requesting transfer of conn %u from thread %u", ctx_index,
1701             owner_thread);
1702   u64 arg = ((u64) ctx_index) << 32 | to_thread;
1703   session_send_rpc_evt_to_thread (owner_thread, quic_transfer_connection_rpc,
1704                                   (void *) arg);
1705 }
1706
1707 static void
1708 quic_session_disconnect_callback (session_t * s)
1709 {
1710   clib_warning ("UDP session disconnected???");
1711 }
1712
1713 static void
1714 quic_session_reset_callback (session_t * s)
1715 {
1716   clib_warning ("UDP session reset???");
1717 }
1718
1719 int
1720 quic_session_accepted_callback (session_t * udp_session)
1721 {
1722   /* New UDP connection, try to accept it */
1723   QUIC_DBG (2, "UDP session accepted");
1724   u32 ctx_index;
1725   u32 *pool_index;
1726   quic_ctx_t *ctx, *lctx;
1727   session_t *udp_listen_session;
1728   u32 thread_index = vlib_get_thread_index ();
1729
1730   udp_listen_session = listen_session_get (udp_session->listener_index);
1731
1732   ctx_index = quic_ctx_alloc (thread_index);
1733   ctx = quic_ctx_get (ctx_index, thread_index);
1734   ctx->c_thread_index = udp_session->thread_index;
1735   ctx->c_c_index = ctx_index;
1736   ctx->c_s_index = QUIC_SESSION_INVALID;
1737   ctx->c_quic_ctx_id.udp_session_handle = session_handle (udp_session);
1738   ctx->c_quic_ctx_id.listener_ctx_id = udp_listen_session->opaque;
1739   lctx = quic_ctx_get (udp_listen_session->opaque,
1740                        udp_listen_session->thread_index);
1741   ctx->c_quic_ctx_id.udp_is_ip4 = lctx->c_quic_ctx_id.udp_is_ip4;
1742   ctx->c_quic_ctx_id.parent_app_id = lctx->c_quic_ctx_id.parent_app_id;
1743   ctx->c_quic_ctx_id.parent_app_wrk_id =
1744     lctx->c_quic_ctx_id.parent_app_wrk_id;
1745   ctx->timer_handle = QUIC_TIMER_HANDLE_INVALID;
1746   ctx->conn_state = QUIC_CONN_STATE_OPENED;
1747
1748   udp_session->opaque = ctx->c_quic_ctx_id.parent_app_id;
1749
1750   /* Put this ctx in the "opening" pool */
1751   pool_get (quic_main.wrk_ctx[ctx->c_thread_index].opening_ctx_pool,
1752             pool_index);
1753   *pool_index = ctx_index;
1754
1755   /* TODO timeout to delete these if they never connect */
1756   return 0;
1757 }
1758
1759 static int
1760 quic_add_segment_callback (u32 client_index, u64 seg_handle)
1761 {
1762   QUIC_DBG (2, "Called quic_add_segment_callback");
1763   QUIC_DBG (2, "NOT IMPLEMENTED");
1764   /* No-op for builtin */
1765   return 0;
1766 }
1767
1768 static int
1769 quic_del_segment_callback (u32 client_index, u64 seg_handle)
1770 {
1771   QUIC_DBG (2, "Called quic_del_segment_callback");
1772   QUIC_DBG (2, "NOT IMPLEMENTED");
1773   /* No-op for builtin */
1774   return 0;
1775 }
1776
1777 static int
1778 quic_custom_tx_callback (void *s)
1779 {
1780   session_t *stream_session = (session_t *) s;
1781   quicly_stream_t *stream;
1782   quic_ctx_t *ctx;
1783   int rv;
1784
1785   svm_fifo_unset_event (stream_session->tx_fifo);
1786   if (PREDICT_FALSE
1787       (stream_session->session_state >= SESSION_STATE_TRANSPORT_CLOSING))
1788     return 0;
1789   ctx =
1790     quic_ctx_get (stream_session->connection_index,
1791                   stream_session->thread_index);
1792   if (PREDICT_FALSE (!ctx->c_quic_ctx_id.is_stream))
1793     {
1794       goto tx_end;              /* Most probably a reschedule */
1795     }
1796
1797   stream = ctx->c_quic_ctx_id.stream;
1798   if (!quicly_sendstate_is_open (&stream->sendstate))
1799     {
1800       QUIC_DBG (1, "Warning: tried to send on closed stream");
1801       return -1;
1802     }
1803
1804   if ((rv = quicly_stream_sync_sendbuf (stream, 1)) != 0)
1805     return rv;
1806
1807 tx_end:
1808   quic_send_packets (ctx);
1809   return 0;
1810 }
1811
1812
1813 /*
1814  * Returns 0 if a matching connection is found and is on the right thread.
1815  * If a connection is found, even on the wrong thread, ctx_thread and ctx_index
1816  * will be set.
1817  */
1818 static inline int
1819 quic_find_packet_ctx (u32 * ctx_thread, u32 * ctx_index,
1820                       struct sockaddr *sa, socklen_t salen,
1821                       quicly_decoded_packet_t * packet,
1822                       u32 caller_thread_index)
1823 {
1824   quic_ctx_t *ctx_;
1825   quicly_conn_t *conn_;
1826   clib_bihash_kv_16_8_t kv;
1827   clib_bihash_16_8_t *h;
1828
1829   h = &quic_main.connection_hash;
1830   quic_make_connection_key (&kv, &packet->cid.dest.plaintext);
1831   QUIC_DBG (3, "Searching conn with id %lu %lu", kv.key[0], kv.key[1]);
1832
1833   if (clib_bihash_search_16_8 (h, &kv, &kv) == 0)
1834     {
1835       u32 index = kv.value & UINT32_MAX;
1836       u8 thread_id = kv.value >> 32;
1837       /* Check if this connection belongs to this thread, otherwise
1838        * ask for it to be moved */
1839       if (thread_id != caller_thread_index)
1840         {
1841           QUIC_DBG (2, "Connection is on wrong thread");
1842           /* Cannot make full check with quicly_is_destination... */
1843           *ctx_index = index;
1844           *ctx_thread = thread_id;
1845           return -1;
1846         }
1847       ctx_ = quic_ctx_get (index, vlib_get_thread_index ());
1848       conn_ = ctx_->c_quic_ctx_id.conn;
1849       if (conn_ && quicly_is_destination (conn_, sa, salen, packet))
1850         {
1851           QUIC_DBG (3, "Connection found");
1852           *ctx_index = index;
1853           *ctx_thread = thread_id;
1854           return 0;
1855         }
1856     }
1857   QUIC_DBG (3, "connection not found");
1858   return -1;
1859 }
1860
1861 static int
1862 quic_receive (quic_ctx_t * ctx, quicly_conn_t * conn,
1863               quicly_decoded_packet_t packet)
1864 {
1865   int rv;
1866   u32 ctx_id = ctx->c_c_index;
1867   u32 thread_index = ctx->c_thread_index;
1868   /* TODO : QUICLY_ERROR_PACKET_IGNORED sould be handled */
1869   rv = quicly_receive (conn, &packet);
1870   if (rv)
1871     {
1872       QUIC_DBG (2, "Quicly receive ignored packet code : %u", rv);
1873       return 0;
1874     }
1875   /* ctx pointer may change if a new stream is opened */
1876   ctx = quic_ctx_get (ctx_id, thread_index);
1877   /* Conn may be set to null if the connection is terminated */
1878   if (ctx->c_quic_ctx_id.conn && ctx->conn_state == QUIC_CONN_STATE_HANDSHAKE)
1879     {
1880       if (quicly_connection_is_ready (conn))
1881         {
1882           ctx->conn_state = QUIC_CONN_STATE_READY;
1883           if (quicly_is_client (conn))
1884             {
1885               quic_notify_app_connected (ctx);
1886               ctx = quic_ctx_get (ctx_id, thread_index);
1887             }
1888         }
1889     }
1890   return quic_send_packets (ctx);
1891 }
1892
1893 static int
1894 quic_create_quic_session (quic_ctx_t * ctx)
1895 {
1896   session_t *quic_session;
1897   app_worker_t *app_wrk;
1898   quic_ctx_t *lctx;
1899   quic_main_t *qm = &quic_main;
1900   int rv;
1901
1902   quic_session = session_alloc (ctx->c_thread_index);
1903   QUIC_DBG (2, "Allocated quic_session, id %u, thread %u ctx %u",
1904             quic_session->session_index, quic_session->thread_index,
1905             ctx->c_c_index);
1906   quic_session->session_state = SESSION_STATE_LISTENING;
1907   ctx->c_s_index = quic_session->session_index;
1908
1909   lctx = quic_ctx_get (ctx->c_quic_ctx_id.listener_ctx_id, 0);
1910
1911   quic_session->app_wrk_index = lctx->c_quic_ctx_id.parent_app_wrk_id;
1912   quic_session->connection_index = ctx->c_c_index;
1913   quic_session->session_type =
1914     session_type_from_proto_and_ip (TRANSPORT_PROTO_QUIC,
1915                                     ctx->c_quic_ctx_id.udp_is_ip4);
1916   quic_session->listener_index = qm->fake_app_listener_index;
1917   quic_session->app_index = quic_main.app_index;
1918
1919   /* TODO: don't alloc fifos when we don't transfer data on this session
1920    * but we still need fifos for the events? */
1921   if ((rv = app_worker_init_accepted (quic_session)))
1922     {
1923       QUIC_DBG (1, "failed to allocate fifos");
1924       session_free (quic_session);
1925       return rv;
1926     }
1927   session_lookup_add_connection (&ctx->connection,
1928                                  session_handle (quic_session));
1929   app_wrk = app_worker_get (quic_session->app_wrk_index);
1930   rv = app_worker_accept_notify (app_wrk, quic_session);
1931   if (rv)
1932     {
1933       QUIC_DBG (1, "failed to notify accept worker app");
1934       return rv;
1935     }
1936   return 0;
1937 }
1938
1939 static int
1940 quic_create_connection (quicly_context_t * quicly_ctx,
1941                         u64 udp_session_handle, u32 ctx_index,
1942                         struct sockaddr *sa,
1943                         socklen_t salen, quicly_decoded_packet_t packet)
1944 {
1945   clib_bihash_kv_16_8_t kv;
1946   quic_ctx_t *ctx;
1947   quicly_conn_t *conn;
1948   u32 thread_index = vlib_get_thread_index ();
1949   int rv;
1950
1951   /* new connection, accept and create context if packet is valid
1952    * TODO: check if socket is actually listening? */
1953   if ((rv = quicly_accept (&conn, quicly_ctx, sa, salen,
1954                            &packet, ptls_iovec_init (NULL, 0),
1955                            &quic_main.next_cid, NULL)))
1956     {
1957       /* Invalid packet, pass */
1958       assert (conn == NULL);
1959       QUIC_DBG (1, "Accept failed with %d", rv);
1960       /* TODO: cleanup created quic ctx and UDP session */
1961       return 0;
1962     }
1963   assert (conn != NULL);
1964
1965   ++quic_main.next_cid.master_id;
1966   ctx = quic_ctx_get (ctx_index, thread_index);
1967   /* Save ctx handle in quicly connection */
1968   quic_store_conn_ctx (conn, ctx);
1969   ctx->c_quic_ctx_id.conn = conn;
1970   ctx->conn_state = QUIC_CONN_STATE_HANDSHAKE;
1971
1972   quic_create_quic_session (ctx);
1973
1974   /* Register connection in connections map */
1975   quic_make_connection_key (&kv, quicly_get_master_id (conn));
1976   kv.value = ((u64) thread_index) << 32 | (u64) ctx_index;
1977   clib_bihash_add_del_16_8 (&quic_main.connection_hash, &kv, 1 /* is_add */ );
1978   QUIC_DBG (2, "Registering conn with id %lu %lu", kv.key[0], kv.key[1]);
1979
1980   return quic_send_packets (ctx);
1981 }
1982
1983 static int
1984 quic_reset_connection (quicly_context_t * quicly_ctx, u64 udp_session_handle,
1985                        struct sockaddr *sa, socklen_t salen,
1986                        quicly_decoded_packet_t packet)
1987 {
1988   /* short header packet; potentially a dead connection. No need to check the
1989    * length of the incoming packet, because loop is prevented by authenticating
1990    * the CID (by checking node_id and thread_id). If the peer is also sending a
1991    * reset, then the next CID is highly likely to contain a non-authenticating
1992    * CID, ... */
1993   QUIC_DBG (2, "Sending stateless reset");
1994   quicly_datagram_t *dgram;
1995   session_t *udp_session;
1996   if (packet.cid.dest.plaintext.node_id == 0
1997       && packet.cid.dest.plaintext.thread_id == 0)
1998     {
1999       dgram = quicly_send_stateless_reset (quicly_ctx, sa, salen,
2000                                            &packet.cid.dest.plaintext);
2001       if (dgram == NULL)
2002         return 1;
2003       udp_session = session_get_from_handle (udp_session_handle);
2004       return quic_send_datagram (udp_session, dgram);   /*  TODO : set event on fifo */
2005     }
2006   return 0;
2007 }
2008
2009 static int
2010 quic_app_rx_callback (session_t * udp_session)
2011 {
2012   /*  Read data from UDP rx_fifo and pass it to the quicly conn. */
2013   quicly_decoded_packet_t packet;
2014   session_dgram_hdr_t ph;
2015   application_t *app;
2016   quic_ctx_t *ctx = NULL;
2017   svm_fifo_t *f;
2018   size_t plen;
2019   struct sockaddr_in6 sa6;
2020   struct sockaddr *sa = (struct sockaddr *) &sa6;
2021   socklen_t salen;
2022   u32 max_deq, len, full_len, ctx_index = UINT32_MAX, ctx_thread =
2023     UINT32_MAX, ret;
2024   u8 *data;
2025   int err;
2026   u32 *opening_ctx_pool, *ctx_index_ptr;
2027   u32 app_index = udp_session->opaque;
2028   u64 udp_session_handle = session_handle (udp_session);
2029   int rv = 0;
2030   u32 thread_index = vlib_get_thread_index ();
2031
2032   app = application_get_if_valid (app_index);
2033   if (!app)
2034     {
2035       QUIC_DBG (1, "Got RX on detached app");
2036       /*  TODO: close this session, cleanup state? */
2037       return 1;
2038     }
2039
2040   do
2041     {
2042       udp_session = session_get_from_handle (udp_session_handle);       /*  session alloc might have happened */
2043       f = udp_session->rx_fifo;
2044       svm_fifo_unset_event (f);
2045       max_deq = svm_fifo_max_dequeue (f);
2046       if (max_deq < sizeof (session_dgram_hdr_t))
2047         return 0;
2048
2049       ret = svm_fifo_peek (f, 0, SESSION_CONN_HDR_LEN, (u8 *) & ph);
2050       if (ret != SESSION_CONN_HDR_LEN)
2051         {
2052           QUIC_DBG (1, "Not enough data for header in RX");
2053           return 1;
2054         }
2055       if (ph.data_length < ph.data_offset)
2056         {
2057           QUIC_DBG (1, "Not enough data vs offset in RX");
2058           return 1;
2059         }
2060       len = ph.data_length - ph.data_offset;
2061       full_len = ph.data_length + ph.data_offset + SESSION_CONN_HDR_LEN;
2062       if (full_len > max_deq)
2063         {
2064           QUIC_DBG (1, "Not enough data in fifo RX");
2065           return 1;
2066         }
2067
2068       /* Quicly can read len bytes from the fifo at offset:
2069        * ph.data_offset + SESSION_CONN_HDR_LEN */
2070       data = malloc (ph.data_length);
2071       ret =
2072         svm_fifo_peek (f, ph.data_offset + SESSION_CONN_HDR_LEN,
2073                        ph.data_length, data);
2074       if (ret != ph.data_length)
2075         {
2076           QUIC_DBG (1, "Not enough data peeked in RX");
2077           free (data);
2078           return 1;
2079         }
2080
2081       plen =
2082         quicly_decode_packet ((quicly_context_t *) app->quicly_ctx, &packet,
2083                               data, len);
2084
2085       rv = 0;
2086       quic_build_sockaddr (sa, &salen, &ph.rmt_ip, ph.rmt_port, ph.is_ip4);
2087       plen =
2088         quicly_decode_packet ((quicly_context_t *) app->quicly_ctx, &packet,
2089                               data, len);
2090
2091       if (plen != SIZE_MAX)
2092         {
2093
2094           err = quic_find_packet_ctx (&ctx_thread, &ctx_index, sa, salen,
2095                                       &packet, thread_index);
2096           if (err == 0)
2097             {
2098               ctx = quic_ctx_get (ctx_index, thread_index);
2099               quic_receive (ctx, ctx->c_quic_ctx_id.conn, packet);
2100             }
2101           else if (ctx_thread != UINT32_MAX)
2102             {
2103               /*  Connection found but on wrong thread, ask move */
2104               quic_move_connection_to_thread (ctx_index, ctx_thread,
2105                                               thread_index);
2106             }
2107           else if ((packet.octets.base[0] & QUICLY_PACKET_TYPE_BITMASK) ==
2108                    QUICLY_PACKET_TYPE_INITIAL)
2109             {
2110               /*  Try to find matching "opening" ctx */
2111               opening_ctx_pool =
2112                 quic_main.wrk_ctx[thread_index].opening_ctx_pool;
2113
2114               /* *INDENT-OFF* */
2115               pool_foreach (ctx_index_ptr, opening_ctx_pool,
2116               ({
2117                 ctx = quic_ctx_get (*ctx_index_ptr, thread_index);
2118                 if (ctx->c_quic_ctx_id.udp_session_handle == udp_session_handle)
2119                   {
2120                     /*  Right ctx found, create conn & remove from pool */
2121                     quic_create_connection ((quicly_context_t *) app->quicly_ctx,
2122                                             udp_session_handle, *ctx_index_ptr,
2123                                             sa, salen, packet);
2124                     pool_put (opening_ctx_pool, ctx_index_ptr);
2125                     goto ctx_search_done;
2126                   }
2127               }));
2128               /* *INDENT-ON* */
2129
2130             }
2131           else
2132             {
2133               quic_reset_connection ((quicly_context_t *) app->quicly_ctx,
2134                                      udp_session_handle, sa, salen, packet);
2135             }
2136         }
2137     ctx_search_done:
2138       svm_fifo_dequeue_drop (f,
2139                              ph.data_length + ph.data_offset +
2140                              SESSION_CONN_HDR_LEN);
2141       free (data);
2142     }
2143   while (1);
2144   return rv;
2145 }
2146
2147 always_inline void
2148 quic_common_get_transport_endpoint (quic_ctx_t * ctx,
2149                                     transport_endpoint_t * tep, u8 is_lcl)
2150 {
2151   session_t *udp_session;
2152   if (ctx->c_quic_ctx_id.is_stream)
2153     {
2154       tep->is_ip4 = 255;        /* well this is ugly */
2155     }
2156   else
2157     {
2158       udp_session =
2159         session_get_from_handle (ctx->c_quic_ctx_id.udp_session_handle);
2160       session_get_endpoint (udp_session, tep, is_lcl);
2161     }
2162 }
2163
2164 static void
2165 quic_get_transport_listener_endpoint (u32 listener_index,
2166                                       transport_endpoint_t * tep, u8 is_lcl)
2167 {
2168   quic_ctx_t *ctx;
2169   app_listener_t *app_listener;
2170   session_t *udp_listen_session;
2171   ctx = quic_ctx_get (listener_index, vlib_get_thread_index ());
2172   if (ctx->is_listener)
2173     {
2174       app_listener =
2175         app_listener_get_w_handle (ctx->c_quic_ctx_id.udp_session_handle);
2176       udp_listen_session = app_listener_get_session (app_listener);
2177       return session_get_endpoint (udp_listen_session, tep, is_lcl);
2178     }
2179   quic_common_get_transport_endpoint (ctx, tep, is_lcl);
2180 }
2181
2182 static void
2183 quic_get_transport_endpoint (u32 ctx_index, u32 thread_index,
2184                              transport_endpoint_t * tep, u8 is_lcl)
2185 {
2186   quic_ctx_t *ctx;
2187   ctx = quic_ctx_get (ctx_index, thread_index);
2188   quic_common_get_transport_endpoint (ctx, tep, is_lcl);
2189 }
2190
2191 /*****************************************************************************
2192  * END TRANSPORT PROTO FUNCTIONS
2193 *****************************************************************************/
2194
2195 /* *INDENT-OFF* */
2196 static session_cb_vft_t quic_app_cb_vft = {
2197   .session_accept_callback = quic_session_accepted_callback,
2198   .session_disconnect_callback = quic_session_disconnect_callback,
2199   .session_connected_callback = quic_session_connected_callback,
2200   .session_reset_callback = quic_session_reset_callback,
2201   .add_segment_callback = quic_add_segment_callback,
2202   .del_segment_callback = quic_del_segment_callback,
2203   .builtin_app_rx_callback = quic_app_rx_callback,
2204 };
2205
2206 static const transport_proto_vft_t quic_proto = {
2207   .connect = quic_connect,
2208   .close = quic_disconnect,
2209   .start_listen = quic_start_listen,
2210   .stop_listen = quic_stop_listen,
2211   .get_connection = quic_connection_get,
2212   .get_listener = quic_listener_get,
2213   .update_time = quic_update_time,
2214   .custom_tx = quic_custom_tx_callback,
2215   .tx_type = TRANSPORT_TX_INTERNAL,
2216   .service_type = TRANSPORT_SERVICE_APP,
2217   .format_connection = format_quic_connection,
2218   .format_half_open = format_quic_half_open,
2219   .format_listener = format_quic_listener,
2220   .get_transport_endpoint = quic_get_transport_endpoint,
2221   .get_transport_listener_endpoint = quic_get_transport_listener_endpoint,
2222 };
2223 /* *INDENT-ON* */
2224
2225 static clib_error_t *
2226 quic_init (vlib_main_t * vm)
2227 {
2228   u32 add_segment_size = (4096ULL << 20) - 1, segment_size = 512 << 20;
2229   vlib_thread_main_t *vtm = vlib_get_thread_main ();
2230   tw_timer_wheel_1t_3w_1024sl_ov_t *tw;
2231   vnet_app_attach_args_t _a, *a = &_a;
2232   u64 options[APP_OPTIONS_N_OPTIONS];
2233   quic_main_t *qm = &quic_main;
2234   u32 fifo_size = QUIC_FIFO_SIZE;
2235   u32 num_threads, i;
2236   application_t *app;
2237
2238   num_threads = 1 /* main thread */  + vtm->n_threads;
2239
2240   memset (a, 0, sizeof (*a));
2241   memset (options, 0, sizeof (options));
2242
2243   a->session_cb_vft = &quic_app_cb_vft;
2244   a->api_client_index = APP_INVALID_INDEX;
2245   a->options = options;
2246   a->name = format (0, "quic");
2247   a->options[APP_OPTIONS_SEGMENT_SIZE] = segment_size;
2248   a->options[APP_OPTIONS_ADD_SEGMENT_SIZE] = add_segment_size;
2249   a->options[APP_OPTIONS_RX_FIFO_SIZE] = fifo_size;
2250   a->options[APP_OPTIONS_TX_FIFO_SIZE] = fifo_size;
2251   a->options[APP_OPTIONS_FLAGS] = APP_OPTIONS_FLAGS_IS_BUILTIN;
2252   a->options[APP_OPTIONS_FLAGS] |= APP_OPTIONS_FLAGS_USE_GLOBAL_SCOPE;
2253   a->options[APP_OPTIONS_FLAGS] |= APP_OPTIONS_FLAGS_IS_TRANSPORT_APP;
2254
2255   if (vnet_application_attach (a))
2256     {
2257       clib_warning ("failed to attach quic app");
2258       return clib_error_return (0, "failed to attach quic app");
2259     }
2260
2261   vec_validate (qm->ctx_pool, num_threads - 1);
2262   vec_validate (qm->wrk_ctx, num_threads - 1);
2263   /*  Timer wheels, one per thread. */
2264   for (i = 0; i < num_threads; i++)
2265     {
2266       tw = &qm->wrk_ctx[i].timer_wheel;
2267       tw_timer_wheel_init_1t_3w_1024sl_ov (tw, quic_expired_timers_dispatch,
2268                                            1e-3 /* timer period 1ms */ , ~0);
2269       tw->last_run_time = vlib_time_now (vlib_get_main ());
2270     }
2271
2272   clib_bihash_init_16_8 (&qm->connection_hash, "quic connections", 1024,
2273                          4 << 20);
2274
2275   if (!qm->ca_cert_path)
2276     qm->ca_cert_path = QUIC_DEFAULT_CA_CERT_PATH;
2277
2278   qm->app_index = a->app_index;
2279
2280   /*  Fake app listener hack, to remove */
2281   app = application_get (a->app_index);
2282   app_listener_t *fake_app_listener;
2283   pool_get (app->listeners, fake_app_listener);
2284   clib_memset (fake_app_listener, 0, sizeof (*fake_app_listener));
2285   fake_app_listener->al_index = fake_app_listener - app->listeners;
2286   fake_app_listener->app_index = app->app_index;
2287   fake_app_listener->session_index = SESSION_INVALID_INDEX;
2288   fake_app_listener->local_index = SESSION_INVALID_INDEX;
2289   qm->fake_app_listener_index = fake_app_listener->al_index;
2290   /* End fake listener hack */
2291
2292   qm->tstamp_ticks_per_clock = vm->clib_time.seconds_per_clock
2293     / QUIC_TSTAMP_RESOLUTION;
2294
2295   transport_register_protocol (TRANSPORT_PROTO_QUIC, &quic_proto,
2296                                FIB_PROTOCOL_IP4, ~0);
2297   transport_register_protocol (TRANSPORT_PROTO_QUIC, &quic_proto,
2298                                FIB_PROTOCOL_IP6, ~0);
2299
2300   vec_free (a->name);
2301   return 0;
2302 }
2303
2304 VLIB_INIT_FUNCTION (quic_init);
2305
2306 /* *INDENT-OFF* */
2307 VLIB_PLUGIN_REGISTER () =
2308 {
2309   .version = VPP_BUILD_VER,
2310   .description = "Quic transport protocol",
2311 };
2312 /* *INDENT-ON* */
2313
2314 /*
2315  * fd.io coding-style-patch-verification: ON
2316  *
2317  * Local Variables:
2318  * eval: (c-set-style "gnu")
2319  * End:
2320  */