Imported Upstream version 16.04
[deb_dpdk.git] / lib / librte_vhost / vhost_cuse / vhost-net-cdev.c
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 #include <errno.h>
35 #include <fuse/cuse_lowlevel.h>
36 #include <linux/limits.h>
37 #include <linux/vhost.h>
38 #include <stdint.h>
39 #include <string.h>
40 #include <unistd.h>
41
42 #include <rte_ethdev.h>
43 #include <rte_log.h>
44 #include <rte_string_fns.h>
45 #include <rte_virtio_net.h>
46
47 #include "virtio-net-cdev.h"
48 #include "vhost-net.h"
49 #include "eventfd_copy.h"
50
51 #define FUSE_OPT_DUMMY "\0\0"
52 #define FUSE_OPT_FORE  "-f\0\0"
53 #define FUSE_OPT_NOMULTI "-s\0\0"
54
55 static const uint32_t default_major = 231;
56 static const uint32_t default_minor = 1;
57 static const char cuse_device_name[] = "/dev/cuse";
58 static const char default_cdev[] = "vhost-net";
59
60 static struct fuse_session *session;
61
62 /*
63  * Returns vhost_device_ctx from given fuse_req_t. The index is populated later
64  * when the device is added to the device linked list.
65  */
66 static struct vhost_device_ctx
67 fuse_req_to_vhost_ctx(fuse_req_t req, struct fuse_file_info *fi)
68 {
69         struct vhost_device_ctx ctx;
70         struct fuse_ctx const *const req_ctx = fuse_req_ctx(req);
71
72         ctx.pid = req_ctx->pid;
73         ctx.fh = fi->fh;
74
75         return ctx;
76 }
77
78 /*
79  * When the device is created in QEMU it gets initialised here and
80  * added to the device linked list.
81  */
82 static void
83 vhost_net_open(fuse_req_t req, struct fuse_file_info *fi)
84 {
85         struct vhost_device_ctx ctx = fuse_req_to_vhost_ctx(req, fi);
86         int err = 0;
87
88         err = vhost_new_device(ctx);
89         if (err == -1) {
90                 fuse_reply_err(req, EPERM);
91                 return;
92         }
93
94         fi->fh = err;
95
96         RTE_LOG(INFO, VHOST_CONFIG,
97                 "(%"PRIu64") Device configuration started\n", fi->fh);
98         fuse_reply_open(req, fi);
99 }
100
101 /*
102  * When QEMU is shutdown or killed the device gets released.
103  */
104 static void
105 vhost_net_release(fuse_req_t req, struct fuse_file_info *fi)
106 {
107         int err = 0;
108         struct vhost_device_ctx ctx = fuse_req_to_vhost_ctx(req, fi);
109
110         vhost_destroy_device(ctx);
111         RTE_LOG(INFO, VHOST_CONFIG, "(%"PRIu64") Device released\n", ctx.fh);
112         fuse_reply_err(req, err);
113 }
114
115 /*
116  * Boilerplate code for CUSE IOCTL
117  * Implicit arguments: ctx, req, result.
118  */
119 #define VHOST_IOCTL(func) do {  \
120         result = (func)(ctx);   \
121         fuse_reply_ioctl(req, result, NULL, 0); \
122 } while (0)
123
124 /*
125  * Boilerplate IOCTL RETRY
126  * Implicit arguments: req.
127  */
128 #define VHOST_IOCTL_RETRY(size_r, size_w) do {  \
129         struct iovec iov_r = { arg, (size_r) }; \
130         struct iovec iov_w = { arg, (size_w) }; \
131         fuse_reply_ioctl_retry(req, &iov_r,     \
132                 (size_r) ? 1 : 0, &iov_w, (size_w) ? 1 : 0);\
133 } while (0)
134
135 /*
136  * Boilerplate code for CUSE Read IOCTL
137  * Implicit arguments: ctx, req, result, in_bufsz, in_buf.
138  */
139 #define VHOST_IOCTL_R(type, var, func) do {     \
140         if (!in_bufsz) {        \
141                 VHOST_IOCTL_RETRY(sizeof(type), 0);\
142         } else {        \
143                 (var) = *(const type*)in_buf;   \
144                 result = func(ctx, &(var));     \
145                 fuse_reply_ioctl(req, result, NULL, 0);\
146         }       \
147 } while (0)
148
149 /*
150  * Boilerplate code for CUSE Write IOCTL
151  * Implicit arguments: ctx, req, result, out_bufsz.
152  */
153 #define VHOST_IOCTL_W(type, var, func) do {     \
154         if (!out_bufsz) {       \
155                 VHOST_IOCTL_RETRY(0, sizeof(type));\
156         } else {        \
157                 result = (func)(ctx, &(var));\
158                 fuse_reply_ioctl(req, result, &(var), sizeof(type));\
159         } \
160 } while (0)
161
162 /*
163  * Boilerplate code for CUSE Read/Write IOCTL
164  * Implicit arguments: ctx, req, result, in_bufsz, in_buf.
165  */
166 #define VHOST_IOCTL_RW(type1, var1, type2, var2, func) do {     \
167         if (!in_bufsz) {        \
168                 VHOST_IOCTL_RETRY(sizeof(type1), sizeof(type2));\
169         } else {        \
170                 (var1) = *(const type1*) (in_buf);      \
171                 result = (func)(ctx, (var1), &(var2));  \
172                 fuse_reply_ioctl(req, result, &(var2), sizeof(type2));\
173         }       \
174 } while (0)
175
176 /*
177  * The IOCTLs are handled using CUSE/FUSE in userspace. Depending on the type
178  * of IOCTL a buffer is requested to read or to write. This request is handled
179  * by FUSE and the buffer is then given to CUSE.
180  */
181 static void
182 vhost_net_ioctl(fuse_req_t req, int cmd, void *arg,
183                 struct fuse_file_info *fi, __rte_unused unsigned flags,
184                 const void *in_buf, size_t in_bufsz, size_t out_bufsz)
185 {
186         struct vhost_device_ctx ctx = fuse_req_to_vhost_ctx(req, fi);
187         struct vhost_vring_file file;
188         struct vhost_vring_state state;
189         struct vhost_vring_addr addr;
190         uint64_t features;
191         uint32_t index;
192         int result = 0;
193
194         switch (cmd) {
195         case VHOST_NET_SET_BACKEND:
196                 LOG_DEBUG(VHOST_CONFIG,
197                         "(%"PRIu64") IOCTL: VHOST_NET_SET_BACKEND\n", ctx.fh);
198                 if (!in_buf) {
199                         VHOST_IOCTL_RETRY(sizeof(file), 0);
200                         break;
201                 }
202                 file = *(const struct vhost_vring_file *)in_buf;
203                 result = cuse_set_backend(ctx, &file);
204                 fuse_reply_ioctl(req, result, NULL, 0);
205                 break;
206
207         case VHOST_GET_FEATURES:
208                 LOG_DEBUG(VHOST_CONFIG,
209                         "(%"PRIu64") IOCTL: VHOST_GET_FEATURES\n", ctx.fh);
210                 VHOST_IOCTL_W(uint64_t, features, vhost_get_features);
211                 break;
212
213         case VHOST_SET_FEATURES:
214                 LOG_DEBUG(VHOST_CONFIG,
215                         "(%"PRIu64") IOCTL: VHOST_SET_FEATURES\n", ctx.fh);
216                 VHOST_IOCTL_R(uint64_t, features, vhost_set_features);
217                 break;
218
219         case VHOST_RESET_OWNER:
220                 LOG_DEBUG(VHOST_CONFIG,
221                         "(%"PRIu64") IOCTL: VHOST_RESET_OWNER\n", ctx.fh);
222                 VHOST_IOCTL(vhost_reset_owner);
223                 break;
224
225         case VHOST_SET_OWNER:
226                 LOG_DEBUG(VHOST_CONFIG,
227                         "(%"PRIu64") IOCTL: VHOST_SET_OWNER\n", ctx.fh);
228                 VHOST_IOCTL(vhost_set_owner);
229                 break;
230
231         case VHOST_SET_MEM_TABLE:
232                 /*TODO fix race condition.*/
233                 LOG_DEBUG(VHOST_CONFIG,
234                         "(%"PRIu64") IOCTL: VHOST_SET_MEM_TABLE\n", ctx.fh);
235                 static struct vhost_memory mem_temp;
236
237                 switch (in_bufsz) {
238                 case 0:
239                         VHOST_IOCTL_RETRY(sizeof(struct vhost_memory), 0);
240                         break;
241
242                 case sizeof(struct vhost_memory):
243                         mem_temp = *(const struct vhost_memory *) in_buf;
244
245                         if (mem_temp.nregions > 0) {
246                                 VHOST_IOCTL_RETRY(sizeof(struct vhost_memory) +
247                                         (sizeof(struct vhost_memory_region) *
248                                                 mem_temp.nregions), 0);
249                         } else {
250                                 result = -1;
251                                 fuse_reply_ioctl(req, result, NULL, 0);
252                         }
253                         break;
254
255                 default:
256                         result = cuse_set_mem_table(ctx, in_buf,
257                                 mem_temp.nregions);
258                         if (result)
259                                 fuse_reply_err(req, EINVAL);
260                         else
261                                 fuse_reply_ioctl(req, result, NULL, 0);
262                 }
263                 break;
264
265         case VHOST_SET_VRING_NUM:
266                 LOG_DEBUG(VHOST_CONFIG,
267                         "(%"PRIu64") IOCTL: VHOST_SET_VRING_NUM\n", ctx.fh);
268                 VHOST_IOCTL_R(struct vhost_vring_state, state,
269                         vhost_set_vring_num);
270                 break;
271
272         case VHOST_SET_VRING_BASE:
273                 LOG_DEBUG(VHOST_CONFIG,
274                         "(%"PRIu64") IOCTL: VHOST_SET_VRING_BASE\n", ctx.fh);
275                 VHOST_IOCTL_R(struct vhost_vring_state, state,
276                         vhost_set_vring_base);
277                 break;
278
279         case VHOST_GET_VRING_BASE:
280                 LOG_DEBUG(VHOST_CONFIG,
281                         "(%"PRIu64") IOCTL: VHOST_GET_VRING_BASE\n", ctx.fh);
282                 VHOST_IOCTL_RW(uint32_t, index,
283                         struct vhost_vring_state, state, vhost_get_vring_base);
284                 break;
285
286         case VHOST_SET_VRING_ADDR:
287                 LOG_DEBUG(VHOST_CONFIG,
288                         "(%"PRIu64") IOCTL: VHOST_SET_VRING_ADDR\n", ctx.fh);
289                 VHOST_IOCTL_R(struct vhost_vring_addr, addr,
290                         vhost_set_vring_addr);
291                 break;
292
293         case VHOST_SET_VRING_KICK:
294         case VHOST_SET_VRING_CALL:
295                 if (cmd == VHOST_SET_VRING_KICK)
296                         LOG_DEBUG(VHOST_CONFIG,
297                                 "(%"PRIu64") IOCTL: VHOST_SET_VRING_KICK\n",
298                         ctx.fh);
299                 else
300                         LOG_DEBUG(VHOST_CONFIG,
301                                 "(%"PRIu64") IOCTL: VHOST_SET_VRING_CALL\n",
302                         ctx.fh);
303                 if (!in_buf)
304                         VHOST_IOCTL_RETRY(sizeof(struct vhost_vring_file), 0);
305                 else {
306                         int fd;
307                         file = *(const struct vhost_vring_file *)in_buf;
308                         LOG_DEBUG(VHOST_CONFIG,
309                                 "idx:%d fd:%d\n", file.index, file.fd);
310                         fd = eventfd_copy(file.fd, ctx.pid);
311                         if (fd < 0) {
312                                 fuse_reply_ioctl(req, -1, NULL, 0);
313                                 result = -1;
314                                 break;
315                         }
316                         file.fd = fd;
317                         if (cmd == VHOST_SET_VRING_KICK) {
318                                 result = vhost_set_vring_kick(ctx, &file);
319                                 fuse_reply_ioctl(req, result, NULL, 0);
320                         } else {
321                                 result = vhost_set_vring_call(ctx, &file);
322                                 fuse_reply_ioctl(req, result, NULL, 0);
323                         }
324                 }
325                 break;
326
327         default:
328                 RTE_LOG(ERR, VHOST_CONFIG,
329                         "(%"PRIu64") IOCTL: DOESN NOT EXIST\n", ctx.fh);
330                 result = -1;
331                 fuse_reply_ioctl(req, result, NULL, 0);
332         }
333
334         if (result < 0)
335                 LOG_DEBUG(VHOST_CONFIG,
336                         "(%"PRIu64") IOCTL: FAIL\n", ctx.fh);
337         else
338                 LOG_DEBUG(VHOST_CONFIG,
339                         "(%"PRIu64") IOCTL: SUCCESS\n", ctx.fh);
340 }
341
342 /*
343  * Structure handling open, release and ioctl function pointers is populated.
344  */
345 static const struct cuse_lowlevel_ops vhost_net_ops = {
346         .open           = vhost_net_open,
347         .release        = vhost_net_release,
348         .ioctl          = vhost_net_ioctl,
349 };
350
351 /*
352  * cuse_info is populated and used to register the cuse device.
353  * vhost_net_device_ops are also passed when the device is registered in app.
354  */
355 int
356 rte_vhost_driver_register(const char *dev_name)
357 {
358         struct cuse_info cuse_info;
359         char device_name[PATH_MAX] = "";
360         char char_device_name[PATH_MAX] = "";
361         const char *device_argv[] = { device_name };
362
363         char fuse_opt_dummy[] = FUSE_OPT_DUMMY;
364         char fuse_opt_fore[] = FUSE_OPT_FORE;
365         char fuse_opt_nomulti[] = FUSE_OPT_NOMULTI;
366         char *fuse_argv[] = {fuse_opt_dummy, fuse_opt_fore, fuse_opt_nomulti};
367
368         if (access(cuse_device_name, R_OK | W_OK) < 0) {
369                 RTE_LOG(ERR, VHOST_CONFIG,
370                         "char device %s can't be accessed, maybe not exist\n",
371                         cuse_device_name);
372                 return -1;
373         }
374
375         if (eventfd_init() < 0)
376                 return -1;
377
378         /*
379          * The device name is created. This is passed to QEMU so that it can
380          * register the device with our application.
381          */
382         snprintf(device_name, PATH_MAX, "DEVNAME=%s", dev_name);
383         snprintf(char_device_name, PATH_MAX, "/dev/%s", dev_name);
384
385         /* Check if device already exists. */
386         if (access(char_device_name, F_OK) != -1) {
387                 RTE_LOG(ERR, VHOST_CONFIG,
388                         "char device %s already exists\n", char_device_name);
389                 return -1;
390         }
391
392         memset(&cuse_info, 0, sizeof(cuse_info));
393         cuse_info.dev_major = default_major;
394         cuse_info.dev_minor = default_minor;
395         cuse_info.dev_info_argc = 1;
396         cuse_info.dev_info_argv = device_argv;
397         cuse_info.flags = CUSE_UNRESTRICTED_IOCTL;
398
399         session = cuse_lowlevel_setup(3, fuse_argv,
400                         &cuse_info, &vhost_net_ops, 0, NULL);
401         if (session == NULL)
402                 return -1;
403
404         return 0;
405 }
406
407 /**
408  * An empty function for unregister
409  */
410 int
411 rte_vhost_driver_unregister(const char *dev_name __rte_unused)
412 {
413         return 0;
414 }
415
416 /**
417  * The CUSE session is launched allowing the application to receive open,
418  * release and ioctl calls.
419  */
420 int
421 rte_vhost_driver_session_start(void)
422 {
423         fuse_session_loop(session);
424
425         return 0;
426 }