misc: fix the formatting style
[vpp.git] / src / vnet / devices / virtio / device.c
1 /*
2  *------------------------------------------------------------------
3  * Copyright (c) 2016 Cisco and/or its affiliates.
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  *------------------------------------------------------------------
16  */
17
18 #include <sys/types.h>
19 #include <sys/stat.h>
20 #include <fcntl.h>
21
22 #include <vlib/vlib.h>
23 #include <vlib/unix/unix.h>
24 #include <vnet/vnet.h>
25 #include <vnet/ethernet/ethernet.h>
26 #include <vnet/gso/gro_func.h>
27 #include <vnet/gso/hdr_offset_parser.h>
28 #include <vnet/ip/ip4_packet.h>
29 #include <vnet/ip/ip6_packet.h>
30 #include <vnet/tcp/tcp_packet.h>
31 #include <vnet/udp/udp_packet.h>
32 #include <vnet/devices/virtio/virtio.h>
33
34 #define foreach_virtio_tx_func_error           \
35 _(NO_FREE_SLOTS, "no free tx slots")           \
36 _(TRUNC_PACKET, "packet > buffer size -- truncated in tx ring") \
37 _(PENDING_MSGS, "pending msgs in tx ring") \
38 _(INDIRECT_DESC_ALLOC_FAILED, "indirect descriptor allocation failed - packet drop") \
39 _(OUT_OF_ORDER, "out-of-order buffers in used ring") \
40 _(GSO_PACKET_DROP, "gso disabled on itf  -- gso packet drop") \
41 _(CSUM_OFFLOAD_PACKET_DROP, "checksum offload disabled on itf -- csum offload packet drop")
42
43 typedef enum
44 {
45 #define _(f,s) VIRTIO_TX_ERROR_##f,
46   foreach_virtio_tx_func_error
47 #undef _
48     VIRTIO_TX_N_ERROR,
49 } virtio_tx_func_error_t;
50
51 static char *virtio_tx_func_error_strings[] = {
52 #define _(n,s) s,
53   foreach_virtio_tx_func_error
54 #undef _
55 };
56
57 static u8 *
58 format_virtio_device (u8 * s, va_list * args)
59 {
60   u32 dev_instance = va_arg (*args, u32);
61   int verbose = va_arg (*args, int);
62   u32 indent = format_get_indent (s);
63
64   s = format (s, "VIRTIO interface");
65   if (verbose)
66     {
67       s = format (s, "\n%U instance %u", format_white_space, indent + 2,
68                   dev_instance);
69     }
70   return s;
71 }
72
73 typedef struct
74 {
75   u32 buffer_index;
76   u32 sw_if_index;
77   vlib_buffer_t buffer;
78   generic_header_offset_t gho;
79 } virtio_tx_trace_t;
80
81 static u8 *
82 format_virtio_tx_trace (u8 * s, va_list * va)
83 {
84   CLIB_UNUSED (vlib_main_t * vm) = va_arg (*va, vlib_main_t *);
85   CLIB_UNUSED (vlib_node_t * node) = va_arg (*va, vlib_node_t *);
86   virtio_tx_trace_t *t = va_arg (*va, virtio_tx_trace_t *);
87   u32 indent = format_get_indent (s);
88
89   s = format (s, "%Ubuffer 0x%x: %U\n",
90               format_white_space, indent,
91               t->buffer_index, format_vnet_buffer, &t->buffer);
92   s =
93     format (s, "%U%U\n", format_white_space, indent,
94             format_generic_header_offset, &t->gho);
95   s =
96     format (s, "%U%U", format_white_space, indent,
97             format_ethernet_header_with_length, t->buffer.pre_data,
98             sizeof (t->buffer.pre_data));
99   return s;
100 }
101
102 static_always_inline void
103 virtio_interface_drop_inline (vlib_main_t * vm, uword node_index,
104                               u32 * buffers, u16 n,
105                               virtio_tx_func_error_t error)
106 {
107   vlib_error_count (vm, node_index, error, n);
108   vlib_buffer_free (vm, buffers, n);
109 }
110
111 static_always_inline void
112 virtio_memset_ring_u32 (u32 * ring, u32 start, u32 ring_size, u32 n_buffers)
113 {
114   ASSERT (n_buffers <= ring_size);
115
116   if (PREDICT_TRUE (start + n_buffers <= ring_size))
117     {
118       clib_memset_u32 (ring + start, ~0, n_buffers);
119     }
120   else
121     {
122       clib_memset_u32 (ring + start, ~0, ring_size - start);
123       clib_memset_u32 (ring, ~0, n_buffers - (ring_size - start));
124     }
125 }
126
127 static_always_inline void
128 virtio_free_used_device_desc (vlib_main_t * vm, virtio_vring_t * vring,
129                               uword node_index)
130 {
131   u16 used = vring->desc_in_use;
132   u16 sz = vring->size;
133   u16 mask = sz - 1;
134   u16 last = vring->last_used_idx;
135   u16 n_left = vring->used->idx - last;
136   u16 out_of_order_count = 0;
137
138   if (n_left == 0)
139     return;
140
141   while (n_left)
142     {
143       vring_used_elem_t *e = &vring->used->ring[last & mask];
144       u16 slot, n_buffers;
145       slot = n_buffers = e->id;
146
147       while (e->id == (n_buffers & mask))
148         {
149           n_left--;
150           last++;
151           n_buffers++;
152           vring_desc_t *d = &vring->desc[e->id];
153           u16 next;
154           while (d->flags & VRING_DESC_F_NEXT)
155             {
156               n_buffers++;
157               next = d->next;
158               d = &vring->desc[next];
159             }
160           if (n_left == 0)
161             break;
162           e = &vring->used->ring[last & mask];
163         }
164       vlib_buffer_free_from_ring (vm, vring->buffers, slot,
165                                   sz, (n_buffers - slot));
166       virtio_memset_ring_u32 (vring->buffers, slot, sz, (n_buffers - slot));
167       used -= (n_buffers - slot);
168
169       if (n_left > 0)
170         {
171           vlib_buffer_free (vm, &vring->buffers[e->id], 1);
172           vring->buffers[e->id] = ~0;
173           used--;
174           last++;
175           n_left--;
176           out_of_order_count++;
177           vring->flags |= VRING_TX_OUT_OF_ORDER;
178         }
179     }
180
181   /*
182    * Some vhost-backends give buffers back in out-of-order fashion in used ring.
183    * It impacts the overall virtio-performance.
184    */
185   if (out_of_order_count)
186     vlib_error_count (vm, node_index, VIRTIO_TX_ERROR_OUT_OF_ORDER,
187                       out_of_order_count);
188
189   vring->desc_in_use = used;
190   vring->last_used_idx = last;
191 }
192
193 static_always_inline void
194 set_checksum_offsets (vlib_buffer_t * b, virtio_net_hdr_v1_t * hdr, int is_l2)
195 {
196   if (b->flags & VNET_BUFFER_F_IS_IP4)
197     {
198       ip4_header_t *ip4;
199       generic_header_offset_t gho = { 0 };
200       vnet_generic_header_offset_parser (b, &gho, is_l2, 1 /* ip4 */ ,
201                                          0 /* ip6 */ );
202       hdr->flags = VIRTIO_NET_HDR_F_NEEDS_CSUM;
203       hdr->csum_start = gho.l4_hdr_offset;      // 0x22;
204       if (b->flags & VNET_BUFFER_F_OFFLOAD_TCP_CKSUM)
205         {
206           hdr->csum_offset = STRUCT_OFFSET_OF (tcp_header_t, checksum);
207         }
208       else if (b->flags & VNET_BUFFER_F_OFFLOAD_UDP_CKSUM)
209         {
210           hdr->csum_offset = STRUCT_OFFSET_OF (udp_header_t, checksum);
211         }
212
213       /*
214        * virtio devices do not support IP4 checksum offload. So driver takes care
215        * of it while doing tx.
216        */
217       ip4 =
218         (ip4_header_t *) (vlib_buffer_get_current (b) + gho.l3_hdr_offset);
219       if (b->flags & VNET_BUFFER_F_OFFLOAD_IP_CKSUM)
220         ip4->checksum = ip4_header_checksum (ip4);
221     }
222   else if (b->flags & VNET_BUFFER_F_IS_IP6)
223     {
224       generic_header_offset_t gho = { 0 };
225       vnet_generic_header_offset_parser (b, &gho, is_l2, 0 /* ip4 */ ,
226                                          1 /* ip6 */ );
227       hdr->flags = VIRTIO_NET_HDR_F_NEEDS_CSUM;
228       hdr->csum_start = gho.l4_hdr_offset;      // 0x36;
229       if (b->flags & VNET_BUFFER_F_OFFLOAD_TCP_CKSUM)
230         {
231           hdr->csum_offset = STRUCT_OFFSET_OF (tcp_header_t, checksum);
232         }
233       else if (b->flags & VNET_BUFFER_F_OFFLOAD_UDP_CKSUM)
234         {
235           hdr->csum_offset = STRUCT_OFFSET_OF (udp_header_t, checksum);
236         }
237     }
238 }
239
240 static_always_inline void
241 set_gso_offsets (vlib_buffer_t * b, virtio_net_hdr_v1_t * hdr, int is_l2)
242 {
243   if (b->flags & VNET_BUFFER_F_IS_IP4)
244     {
245       ip4_header_t *ip4;
246       generic_header_offset_t gho = { 0 };
247       vnet_generic_header_offset_parser (b, &gho, is_l2, 1 /* ip4 */ ,
248                                          0 /* ip6 */ );
249       hdr->gso_type = VIRTIO_NET_HDR_GSO_TCPV4;
250       hdr->gso_size = vnet_buffer2 (b)->gso_size;
251       hdr->hdr_len = gho.hdr_sz;
252       hdr->flags = VIRTIO_NET_HDR_F_NEEDS_CSUM;
253       hdr->csum_start = gho.l4_hdr_offset;      // 0x22;
254       hdr->csum_offset = STRUCT_OFFSET_OF (tcp_header_t, checksum);
255       ip4 =
256         (ip4_header_t *) (vlib_buffer_get_current (b) + gho.l3_hdr_offset);
257       /*
258        * virtio devices do not support IP4 checksum offload. So driver takes care
259        * of it while doing tx.
260        */
261       if (b->flags & VNET_BUFFER_F_OFFLOAD_IP_CKSUM)
262         ip4->checksum = ip4_header_checksum (ip4);
263     }
264   else if (b->flags & VNET_BUFFER_F_IS_IP6)
265     {
266       generic_header_offset_t gho = { 0 };
267       vnet_generic_header_offset_parser (b, &gho, is_l2, 0 /* ip4 */ ,
268                                          1 /* ip6 */ );
269       hdr->gso_type = VIRTIO_NET_HDR_GSO_TCPV6;
270       hdr->gso_size = vnet_buffer2 (b)->gso_size;
271       hdr->hdr_len = gho.hdr_sz;
272       hdr->flags = VIRTIO_NET_HDR_F_NEEDS_CSUM;
273       hdr->csum_start = gho.l4_hdr_offset;      // 0x36;
274       hdr->csum_offset = STRUCT_OFFSET_OF (tcp_header_t, checksum);
275     }
276 }
277
278 static_always_inline u16
279 add_buffer_to_slot (vlib_main_t * vm, virtio_if_t * vif,
280                     virtio_if_type_t type, virtio_vring_t * vring,
281                     u32 bi, u16 free_desc_count,
282                     u16 avail, u16 next, u16 mask, int do_gso,
283                     int csum_offload, uword node_index)
284 {
285   u16 n_added = 0;
286   int hdr_sz = vif->virtio_net_hdr_sz;
287   vring_desc_t *d;
288   d = &vring->desc[next];
289   vlib_buffer_t *b = vlib_get_buffer (vm, bi);
290   virtio_net_hdr_v1_t *hdr = vlib_buffer_get_current (b) - hdr_sz;
291   int is_l2 = (type & (VIRTIO_IF_TYPE_TAP | VIRTIO_IF_TYPE_PCI));
292
293   clib_memset (hdr, 0, hdr_sz);
294
295   if (b->flags & VNET_BUFFER_F_GSO)
296     {
297       if (do_gso)
298         set_gso_offsets (b, hdr, is_l2);
299       else
300         {
301           virtio_interface_drop_inline (vm, node_index, &bi, 1,
302                                         VIRTIO_TX_ERROR_GSO_PACKET_DROP);
303           return n_added;
304         }
305     }
306   else if (b->flags & (VNET_BUFFER_F_OFFLOAD_TCP_CKSUM |
307                        VNET_BUFFER_F_OFFLOAD_UDP_CKSUM))
308     {
309       if (csum_offload)
310         set_checksum_offsets (b, hdr, is_l2);
311       else
312         {
313           virtio_interface_drop_inline (vm, node_index, &bi, 1,
314                                         VIRTIO_TX_ERROR_CSUM_OFFLOAD_PACKET_DROP);
315           return n_added;
316         }
317     }
318
319   if (PREDICT_TRUE ((b->flags & VLIB_BUFFER_NEXT_PRESENT) == 0))
320     {
321       d->addr =
322         ((type == VIRTIO_IF_TYPE_PCI) ? vlib_buffer_get_current_pa (vm,
323                                                                     b) :
324          pointer_to_uword (vlib_buffer_get_current (b))) - hdr_sz;
325       d->len = b->current_length + hdr_sz;
326       d->flags = 0;
327     }
328   else if (vif->features & VIRTIO_FEATURE (VIRTIO_RING_F_INDIRECT_DESC))
329     {
330       /*
331        * We are using single vlib_buffer_t for indirect descriptor(s)
332        * chain. Single descriptor is 16 bytes and vlib_buffer_t
333        * has 2048 bytes space. So maximum long chain can have 128
334        * (=2048/16) indirect descriptors.
335        * It can easily support 65535 bytes of Jumbo frames with
336        * each data buffer size of 512 bytes minimum.
337        */
338       u32 indirect_buffer = 0;
339       if (PREDICT_FALSE (vlib_buffer_alloc (vm, &indirect_buffer, 1) == 0))
340         {
341           virtio_interface_drop_inline (vm, node_index, &bi, 1,
342                                         VIRTIO_TX_ERROR_INDIRECT_DESC_ALLOC_FAILED);
343           return n_added;
344         }
345
346       vlib_buffer_t *indirect_desc = vlib_get_buffer (vm, indirect_buffer);
347       indirect_desc->current_data = 0;
348       indirect_desc->flags |= VLIB_BUFFER_NEXT_PRESENT;
349       indirect_desc->next_buffer = bi;
350       bi = indirect_buffer;
351
352       vring_desc_t *id =
353         (vring_desc_t *) vlib_buffer_get_current (indirect_desc);
354       u32 count = 1;
355       if (type == VIRTIO_IF_TYPE_PCI)
356         {
357           d->addr = vlib_physmem_get_pa (vm, id);
358           id->addr = vlib_buffer_get_current_pa (vm, b) - hdr_sz;
359
360           /*
361            * If VIRTIO_F_ANY_LAYOUT is not negotiated, then virtio_net_hdr
362            * should be presented in separate descriptor and data will start
363            * from next descriptor.
364            */
365           if (PREDICT_TRUE
366               (vif->features & VIRTIO_FEATURE (VIRTIO_F_ANY_LAYOUT)))
367             id->len = b->current_length + hdr_sz;
368           else
369             {
370               id->len = hdr_sz;
371               id->flags = VRING_DESC_F_NEXT;
372               id->next = count;
373               count++;
374               id++;
375               id->addr = vlib_buffer_get_current_pa (vm, b);
376               id->len = b->current_length;
377             }
378           while (b->flags & VLIB_BUFFER_NEXT_PRESENT)
379             {
380               id->flags = VRING_DESC_F_NEXT;
381               id->next = count;
382               count++;
383               id++;
384               b = vlib_get_buffer (vm, b->next_buffer);
385               id->addr = vlib_buffer_get_current_pa (vm, b);
386               id->len = b->current_length;
387             }
388         }
389       else                      /* VIRTIO_IF_TYPE_[TAP | TUN] */
390         {
391           d->addr = pointer_to_uword (id);
392           /* first buffer in chain */
393           id->addr = pointer_to_uword (vlib_buffer_get_current (b)) - hdr_sz;
394           id->len = b->current_length + hdr_sz;
395
396           while (b->flags & VLIB_BUFFER_NEXT_PRESENT)
397             {
398               id->flags = VRING_DESC_F_NEXT;
399               id->next = count;
400               count++;
401               id++;
402               b = vlib_get_buffer (vm, b->next_buffer);
403               id->addr = pointer_to_uword (vlib_buffer_get_current (b));
404               id->len = b->current_length;
405             }
406         }
407       id->flags = 0;
408       id->next = 0;
409       d->len = count * sizeof (vring_desc_t);
410       d->flags = VRING_DESC_F_INDIRECT;
411     }
412   else if (type == VIRTIO_IF_TYPE_PCI)
413     {
414       u16 count = next;
415       vlib_buffer_t *b_temp = b;
416       u16 n_buffers_in_chain = 1;
417
418       /*
419        * Check the length of the chain for the required number of
420        * descriptors. Return from here, retry to get more descriptors,
421        * if chain length is greater than available descriptors.
422        */
423       while (b_temp->flags & VLIB_BUFFER_NEXT_PRESENT)
424         {
425           n_buffers_in_chain++;
426           b_temp = vlib_get_buffer (vm, b_temp->next_buffer);
427         }
428
429       if (n_buffers_in_chain > free_desc_count)
430         return n_buffers_in_chain;
431
432       d->addr = vlib_buffer_get_current_pa (vm, b) - hdr_sz;
433       d->len = b->current_length + hdr_sz;
434
435       while (b->flags & VLIB_BUFFER_NEXT_PRESENT)
436         {
437           d->flags = VRING_DESC_F_NEXT;
438           vring->buffers[count] = bi;
439           b->flags &=
440             ~(VLIB_BUFFER_NEXT_PRESENT | VLIB_BUFFER_TOTAL_LENGTH_VALID);
441           bi = b->next_buffer;
442           b->next_buffer = 0;
443           n_added++;
444           count = (count + 1) & mask;
445           d->next = count;
446           d = &vring->desc[count];
447           b = vlib_get_buffer (vm, bi);
448           d->addr = vlib_buffer_get_current_pa (vm, b);
449           d->len = b->current_length;
450         }
451       d->flags = 0;
452       vring->buffers[count] = bi;
453       vring->avail->ring[avail & mask] = next;
454       n_added++;
455       return n_added;
456     }
457   else
458     {
459       ASSERT (0);
460     }
461   vring->buffers[next] = bi;
462   vring->avail->ring[avail & mask] = next;
463   n_added++;
464   return n_added;
465 }
466
467 static_always_inline void
468 virtio_find_free_desc (virtio_vring_t * vring, u16 size, u16 mask,
469                        u16 req, u16 next, u32 * first_free_desc_index,
470                        u16 * free_desc_count)
471 {
472   u16 start = 0;
473   /* next is used as hint: from where to start looking */
474   for (u16 i = 0; i < size; i++, next++)
475     {
476       if (vring->buffers[next & mask] == ~0)
477         {
478           if (*first_free_desc_index == ~0)
479             {
480               *first_free_desc_index = (next & mask);
481               start = i;
482               (*free_desc_count)++;
483               req--;
484               if (req == 0)
485                 break;
486             }
487           else
488             {
489               if (start + *free_desc_count == i)
490                 {
491                   (*free_desc_count)++;
492                   req--;
493                   if (req == 0)
494                     break;
495                 }
496               else
497                 break;
498             }
499         }
500     }
501 }
502
503 static_always_inline uword
504 virtio_interface_tx_gso_inline (vlib_main_t * vm, vlib_node_runtime_t * node,
505                                 vlib_frame_t * frame, virtio_if_t * vif,
506                                 virtio_if_type_t type, int do_gso,
507                                 int csum_offload, int do_gro)
508 {
509   u16 n_left = frame->n_vectors;
510   virtio_vring_t *vring;
511   u16 qid = vm->thread_index % vif->num_txqs;
512   vring = vec_elt_at_index (vif->txq_vrings, qid);
513   u16 used, next, avail;
514   u16 sz = vring->size;
515   u16 mask = sz - 1;
516   u16 retry_count = 2;
517   u32 *buffers = vlib_frame_vector_args (frame);
518   u32 to[GRO_TO_VECTOR_SIZE (n_left)];
519
520   clib_spinlock_lock_if_init (&vring->lockp);
521
522   if ((vring->used->flags & VRING_USED_F_NO_NOTIFY) == 0 &&
523       (vring->last_kick_avail_idx != vring->avail->idx))
524     virtio_kick (vm, vring, vif);
525
526   if (do_gro)
527     {
528       n_left = vnet_gro_inline (vm, vring->flow_table, buffers, n_left, to);
529       buffers = to;
530     }
531
532 retry:
533   /* free consumed buffers */
534   virtio_free_used_device_desc (vm, vring, node->node_index);
535
536   used = vring->desc_in_use;
537   next = vring->desc_next;
538   avail = vring->avail->idx;
539
540   u16 free_desc_count = 0;
541
542   if (PREDICT_FALSE (vring->flags & VRING_TX_OUT_OF_ORDER))
543     {
544       u32 first_free_desc_index = ~0;
545
546       virtio_find_free_desc (vring, sz, mask, n_left, next,
547                              &first_free_desc_index, &free_desc_count);
548
549       if (free_desc_count)
550         next = first_free_desc_index;
551     }
552   else
553     free_desc_count = sz - used;
554
555   while (n_left && free_desc_count)
556     {
557       u16 n_added = 0;
558       virtio_tx_trace_t *t;
559
560       vlib_buffer_t *b0 = vlib_get_buffer (vm, buffers[0]);
561       if (b0->flags & VLIB_BUFFER_IS_TRACED)
562         {
563           t = vlib_add_trace (vm, node, b0, sizeof (t[0]));
564           t->sw_if_index = vnet_buffer (b0)->sw_if_index[VLIB_TX];
565           t->buffer_index = buffers[0];
566           if (type == VIRTIO_IF_TYPE_TUN)
567             {
568               int is_ip4 = 0, is_ip6 = 0;
569
570               switch (((u8 *) vlib_buffer_get_current (b0))[0] & 0xf0)
571                 {
572                 case 0x40:
573                   is_ip4 = 1;
574                   break;
575                 case 0x60:
576                   is_ip6 = 1;
577                   break;
578                 default:
579                   break;
580                 }
581               vnet_generic_header_offset_parser (b0, &t->gho, 0, is_ip4,
582                                                  is_ip6);
583             }
584           else
585             vnet_generic_header_offset_parser (b0, &t->gho, 1,
586                                                b0->flags &
587                                                VNET_BUFFER_F_IS_IP4,
588                                                b0->flags &
589                                                VNET_BUFFER_F_IS_IP6);
590
591           clib_memcpy_fast (&t->buffer, b0,
592                             sizeof (*b0) - sizeof (b0->pre_data));
593           clib_memcpy_fast (t->buffer.pre_data, vlib_buffer_get_current (b0),
594                             sizeof (t->buffer.pre_data));
595         }
596       n_added =
597         add_buffer_to_slot (vm, vif, type, vring, buffers[0], free_desc_count,
598                             avail, next, mask, do_gso, csum_offload,
599                             node->node_index);
600
601       if (PREDICT_FALSE (n_added == 0))
602         {
603           buffers++;
604           n_left--;
605           continue;
606         }
607       else if (PREDICT_FALSE (n_added > free_desc_count))
608         break;
609
610       avail++;
611       next = (next + n_added) & mask;
612       used += n_added;
613       buffers++;
614       n_left--;
615       free_desc_count -= n_added;
616     }
617
618   if (n_left != frame->n_vectors)
619     {
620       CLIB_MEMORY_STORE_BARRIER ();
621       vring->avail->idx = avail;
622       vring->desc_next = next;
623       vring->desc_in_use = used;
624       if ((vring->used->flags & VRING_USED_F_NO_NOTIFY) == 0)
625         virtio_kick (vm, vring, vif);
626     }
627
628   if (n_left)
629     {
630       if (retry_count--)
631         goto retry;
632
633       virtio_interface_drop_inline (vm, node->node_index,
634                                     buffers, n_left,
635                                     VIRTIO_TX_ERROR_NO_FREE_SLOTS);
636     }
637
638   clib_spinlock_unlock_if_init (&vring->lockp);
639
640   return frame->n_vectors - n_left;
641 }
642
643 static_always_inline uword
644 virtio_interface_tx_inline (vlib_main_t * vm, vlib_node_runtime_t * node,
645                             vlib_frame_t * frame, virtio_if_t * vif,
646                             virtio_if_type_t type)
647 {
648   vnet_main_t *vnm = vnet_get_main ();
649   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, vif->hw_if_index);
650
651   if (hw->flags & VNET_HW_INTERFACE_FLAG_SUPPORTS_GSO)
652     return virtio_interface_tx_gso_inline (vm, node, frame, vif, type,
653                                            1 /* do_gso */ ,
654                                            1 /* checksum offload */ ,
655                                            vif->packet_coalesce);
656   else if (hw->flags & VNET_HW_INTERFACE_FLAG_SUPPORTS_TX_L4_CKSUM_OFFLOAD)
657     return virtio_interface_tx_gso_inline (vm, node, frame, vif, type,
658                                            0 /* no do_gso */ ,
659                                            1 /* checksum offload */ ,
660                                            0 /* do_gro */ );
661   else
662     return virtio_interface_tx_gso_inline (vm, node, frame, vif, type,
663                                            0 /* no do_gso */ ,
664                                            0 /* no checksum offload */ ,
665                                            0 /* do_gro */ );
666 }
667
668 VNET_DEVICE_CLASS_TX_FN (virtio_device_class) (vlib_main_t * vm,
669                                                vlib_node_runtime_t * node,
670                                                vlib_frame_t * frame)
671 {
672   virtio_main_t *nm = &virtio_main;
673   vnet_interface_output_runtime_t *rund = (void *) node->runtime_data;
674   virtio_if_t *vif = pool_elt_at_index (nm->interfaces, rund->dev_instance);
675
676   if (vif->type == VIRTIO_IF_TYPE_TAP)
677     return virtio_interface_tx_inline (vm, node, frame, vif,
678                                        VIRTIO_IF_TYPE_TAP);
679   else if (vif->type == VIRTIO_IF_TYPE_PCI)
680     return virtio_interface_tx_inline (vm, node, frame, vif,
681                                        VIRTIO_IF_TYPE_PCI);
682   else if (vif->type == VIRTIO_IF_TYPE_TUN)
683     return virtio_interface_tx_inline (vm, node, frame, vif,
684                                        VIRTIO_IF_TYPE_TUN);
685   else
686     ASSERT (0);
687
688   return 0;
689 }
690
691 static void
692 virtio_set_interface_next_node (vnet_main_t * vnm, u32 hw_if_index,
693                                 u32 node_index)
694 {
695   virtio_main_t *apm = &virtio_main;
696   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
697   virtio_if_t *vif = pool_elt_at_index (apm->interfaces, hw->dev_instance);
698
699   /* Shut off redirection */
700   if (node_index == ~0)
701     {
702       vif->per_interface_next_index = node_index;
703       return;
704     }
705
706   vif->per_interface_next_index =
707     vlib_node_add_next (vlib_get_main (), virtio_input_node.index,
708                         node_index);
709 }
710
711 static void
712 virtio_clear_hw_interface_counters (u32 instance)
713 {
714   /* Nothing for now */
715 }
716
717 static clib_error_t *
718 virtio_interface_rx_mode_change (vnet_main_t * vnm, u32 hw_if_index, u32 qid,
719                                  vnet_hw_interface_rx_mode mode)
720 {
721   virtio_main_t *mm = &virtio_main;
722   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
723   virtio_if_t *vif = pool_elt_at_index (mm->interfaces, hw->dev_instance);
724   virtio_vring_t *vring = vec_elt_at_index (vif->rxq_vrings, qid);
725
726   if (vif->type == VIRTIO_IF_TYPE_PCI && !(vif->support_int_mode))
727     {
728       vring->avail->flags |= VRING_AVAIL_F_NO_INTERRUPT;
729       return clib_error_return (0, "interrupt mode is not supported");
730     }
731
732   if (mode == VNET_HW_INTERFACE_RX_MODE_POLLING)
733     {
734       /* only enable packet coalesce in poll mode */
735       gro_flow_table_set_is_enable (vring->flow_table, 1);
736       vring->avail->flags |= VRING_AVAIL_F_NO_INTERRUPT;
737     }
738   else
739     {
740       gro_flow_table_set_is_enable (vring->flow_table, 0);
741       vring->avail->flags &= ~VRING_AVAIL_F_NO_INTERRUPT;
742     }
743
744   return 0;
745 }
746
747 static clib_error_t *
748 virtio_interface_admin_up_down (vnet_main_t * vnm, u32 hw_if_index, u32 flags)
749 {
750   virtio_main_t *mm = &virtio_main;
751   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
752   virtio_if_t *vif = pool_elt_at_index (mm->interfaces, hw->dev_instance);
753
754   if (flags & VNET_SW_INTERFACE_FLAG_ADMIN_UP)
755     {
756       vif->flags |= VIRTIO_IF_FLAG_ADMIN_UP;
757       vnet_hw_interface_set_flags (vnm, vif->hw_if_index,
758                                    VNET_HW_INTERFACE_FLAG_LINK_UP);
759     }
760   else
761     {
762       vif->flags &= ~VIRTIO_IF_FLAG_ADMIN_UP;
763       vnet_hw_interface_set_flags (vnm, vif->hw_if_index, 0);
764     }
765   return 0;
766 }
767
768 static clib_error_t *
769 virtio_subif_add_del_function (vnet_main_t * vnm,
770                                u32 hw_if_index,
771                                struct vnet_sw_interface_t *st, int is_add)
772 {
773   /* Nothing for now */
774   return 0;
775 }
776
777 /* *INDENT-OFF* */
778 VNET_DEVICE_CLASS (virtio_device_class) = {
779   .name = "virtio",
780   .format_device_name = format_virtio_device_name,
781   .format_device = format_virtio_device,
782   .format_tx_trace = format_virtio_tx_trace,
783   .tx_function_n_errors = VIRTIO_TX_N_ERROR,
784   .tx_function_error_strings = virtio_tx_func_error_strings,
785   .rx_redirect_to_node = virtio_set_interface_next_node,
786   .clear_counters = virtio_clear_hw_interface_counters,
787   .admin_up_down_function = virtio_interface_admin_up_down,
788   .subif_add_del_function = virtio_subif_add_del_function,
789   .rx_mode_change_function = virtio_interface_rx_mode_change,
790 };
791
792 /* *INDENT-ON* */
793
794 /*
795  * fd.io coding-style-patch-verification: ON
796  *
797  * Local Variables:
798  * eval: (c-set-style "gnu")
799  * End:
800  */