072e8a755b0d1194051d6b0aa280511ac0cccb6d
[vpp.git] / src / vnet / devices / virtio / virtio.c
1 /*
2  *------------------------------------------------------------------
3  * Copyright (c) 2017 Cisco and/or its affiliates.
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  *------------------------------------------------------------------
16  */
17
18 #include <sys/types.h>
19 #include <sys/stat.h>
20 #include <fcntl.h>
21 #include <net/if.h>
22 #include <linux/if_tun.h>
23 #include <sys/ioctl.h>
24 #include <linux/virtio_net.h>
25 #include <linux/vhost.h>
26 #include <sys/eventfd.h>
27
28 #include <vlib/vlib.h>
29 #include <vlib/unix/unix.h>
30 #include <vnet/ethernet/ethernet.h>
31 #include <vnet/ip/ip4_packet.h>
32 #include <vnet/ip/ip6_packet.h>
33 #include <vnet/devices/virtio/virtio.h>
34
35 virtio_main_t virtio_main;
36
37 #define _IOCTL(fd,a,...) \
38   if (ioctl (fd, a, __VA_ARGS__) < 0) \
39     { \
40       err = clib_error_return_unix (0, "ioctl(" #a ")"); \
41       goto error; \
42     }
43
44 static clib_error_t *
45 call_read_ready (clib_file_t * uf)
46 {
47   virtio_main_t *nm = &virtio_main;
48   vnet_main_t *vnm = vnet_get_main ();
49   u16 qid = uf->private_data & 0xFFFF;
50   virtio_if_t *vif =
51     vec_elt_at_index (nm->interfaces, uf->private_data >> 16);
52   u64 b;
53
54   CLIB_UNUSED (ssize_t size) = read (uf->file_descriptor, &b, sizeof (b));
55   if ((qid & 1) == 0)
56     vnet_device_input_set_interrupt_pending (vnm, vif->hw_if_index, qid);
57
58   return 0;
59 }
60
61
62 clib_error_t *
63 virtio_vring_init (vlib_main_t * vm, virtio_if_t * vif, u16 idx, u16 sz)
64 {
65   clib_error_t *err = 0;
66   virtio_vring_t *vring;
67   struct vhost_vring_state state = { 0 };
68   struct vhost_vring_addr addr = { 0 };
69   struct vhost_vring_file file = { 0 };
70   clib_file_t t = { 0 };
71   int i;
72
73   if (!is_pow2 (sz))
74     return clib_error_return (0, "ring size must be power of 2");
75
76   if (sz > 32768)
77     return clib_error_return (0, "ring size must be 32768 or lower");
78
79   if (sz == 0)
80     sz = 256;
81
82   vec_validate_aligned (vif->vrings, idx, CLIB_CACHE_LINE_BYTES);
83   vring = vec_elt_at_index (vif->vrings, idx);
84
85   i = sizeof (struct vring_desc) * sz;
86   i = round_pow2 (i, CLIB_CACHE_LINE_BYTES);
87   vring->desc = clib_mem_alloc_aligned (i, CLIB_CACHE_LINE_BYTES);
88   memset (vring->desc, 0, i);
89
90   i = sizeof (struct vring_avail) + sz * sizeof (vring->avail->ring[0]);
91   i = round_pow2 (i, CLIB_CACHE_LINE_BYTES);
92   vring->avail = clib_mem_alloc_aligned (i, CLIB_CACHE_LINE_BYTES);
93   memset (vring->avail, 0, i);
94   // tell kernel that we don't need interrupt
95   vring->avail->flags = VIRTIO_RING_FLAG_MASK_INT;
96
97   i = sizeof (struct vring_used) + sz * sizeof (struct vring_used_elem);
98   i = round_pow2 (i, CLIB_CACHE_LINE_BYTES);
99   vring->used = clib_mem_alloc_aligned (i, CLIB_CACHE_LINE_BYTES);
100   memset (vring->used, 0, i);
101
102   ASSERT (vring->buffers == 0);
103   vec_validate_aligned (vring->buffers, sz, CLIB_CACHE_LINE_BYTES);
104
105   vring->size = sz;
106   vring->call_fd = eventfd (0, EFD_NONBLOCK | EFD_CLOEXEC);
107   vring->kick_fd = eventfd (0, EFD_CLOEXEC);
108
109   t.read_function = call_read_ready;
110   t.file_descriptor = vring->call_fd;
111   t.private_data = vif->dev_instance << 16 | idx;
112   t.description = format (0, "%U vring %u", format_virtio_device_name,
113                           vif->dev_instance, idx);
114   vring->call_file_index = clib_file_add (&file_main, &t);
115
116   state.index = idx;
117   state.num = sz;
118   _IOCTL (vif->fd, VHOST_SET_VRING_NUM, &state);
119
120   addr.index = idx;
121   addr.flags = 0;
122   addr.desc_user_addr = pointer_to_uword (vring->desc);
123   addr.avail_user_addr = pointer_to_uword (vring->avail);
124   addr.used_user_addr = pointer_to_uword (vring->used);
125   _IOCTL (vif->fd, VHOST_SET_VRING_ADDR, &addr);
126
127   file.index = idx;
128   file.fd = vring->kick_fd;
129   _IOCTL (vif->fd, VHOST_SET_VRING_KICK, &file);
130   file.fd = vring->call_fd;
131   _IOCTL (vif->fd, VHOST_SET_VRING_CALL, &file);
132   file.fd = vif->tap_fd;
133   _IOCTL (vif->fd, VHOST_NET_SET_BACKEND, &file);
134
135 error:
136   return err;
137 }
138
139 static_always_inline void
140 virtio_free_rx_buffers (vlib_main_t * vm, virtio_vring_t * vring)
141 {
142   u16 used = vring->desc_in_use;
143   u16 last = vring->last_used_idx;
144   u16 mask = vring->size - 1;
145
146   while (used)
147     {
148       vlib_buffer_free (vm, &vring->buffers[last & mask], 1);
149       last++;
150       used--;
151     }
152 }
153
154 clib_error_t *
155 virtio_vring_free (vlib_main_t * vm, virtio_if_t * vif, u32 idx)
156 {
157   virtio_vring_t *vring = vec_elt_at_index (vif->vrings, idx);
158
159   clib_file_del_by_index (&file_main, vring->call_file_index);
160   close (vring->kick_fd);
161   close (vring->call_fd);
162   if (vring->used)
163     {
164       if ((idx & 1) == 1)
165         virtio_free_used_desc (vm, vring);
166       else
167         virtio_free_rx_buffers (vm, vring);
168       clib_mem_free (vring->used);
169     }
170   if (vring->desc)
171     clib_mem_free (vring->desc);
172   if (vring->avail)
173     clib_mem_free (vring->avail);
174   vec_free (vring->buffers);
175   return 0;
176 }
177
178 /*
179  * fd.io coding-style-patch-verification: ON
180  *
181  * Local Variables:
182  * eval: (c-set-style "gnu")
183  * End:
184  */