MAP: Convert from DPO to input feature.
[vpp.git] / src / plugins / vmxnet3 / vmxnet3.c
1 /*
2  * Copyright (c) 2018 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <vppinfra/types.h>
17 #include <vlib/vlib.h>
18 #include <vlib/pci/pci.h>
19 #include <vnet/ethernet/ethernet.h>
20 #include <vnet/plugin/plugin.h>
21 #include <vpp/app/version.h>
22
23 #include <vmxnet3/vmxnet3.h>
24
25 #define PCI_VENDOR_ID_VMWARE                            0x15ad
26 #define PCI_DEVICE_ID_VMWARE_VMXNET3                    0x07b0
27
28 vmxnet3_main_t vmxnet3_main;
29
30 static pci_device_id_t vmxnet3_pci_device_ids[] = {
31   {
32    .vendor_id = PCI_VENDOR_ID_VMWARE,
33    .device_id = PCI_DEVICE_ID_VMWARE_VMXNET3},
34   {0},
35 };
36
37 static clib_error_t *
38 vmxnet3_interface_admin_up_down (vnet_main_t * vnm, u32 hw_if_index,
39                                  u32 flags)
40 {
41   vnet_hw_interface_t *hi = vnet_get_hw_interface (vnm, hw_if_index);
42   vmxnet3_main_t *vmxm = &vmxnet3_main;
43   vmxnet3_device_t *vd = vec_elt_at_index (vmxm->devices, hi->dev_instance);
44   uword is_up = (flags & VNET_SW_INTERFACE_FLAG_ADMIN_UP) != 0;
45
46   if (vd->flags & VMXNET3_DEVICE_F_ERROR)
47     return clib_error_return (0, "device is in error state");
48
49   if (is_up)
50     {
51       vnet_hw_interface_set_flags (vnm, vd->hw_if_index,
52                                    VNET_HW_INTERFACE_FLAG_LINK_UP);
53       vd->flags |= VMXNET3_DEVICE_F_ADMIN_UP;
54     }
55   else
56     {
57       vnet_hw_interface_set_flags (vnm, vd->hw_if_index, 0);
58       vd->flags &= ~VMXNET3_DEVICE_F_ADMIN_UP;
59     }
60   return 0;
61 }
62
63 static clib_error_t *
64 vmxnet3_interface_rx_mode_change (vnet_main_t * vnm, u32 hw_if_index, u32 qid,
65                                   vnet_hw_interface_rx_mode mode)
66 {
67   vmxnet3_main_t *vmxm = &vmxnet3_main;
68   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
69   vmxnet3_device_t *vd = pool_elt_at_index (vmxm->devices, hw->dev_instance);
70   vmxnet3_rxq_t *rxq = vec_elt_at_index (vd->rxqs, qid);
71
72   if (mode == VNET_HW_INTERFACE_RX_MODE_POLLING)
73     rxq->int_mode = 0;
74   else
75     rxq->int_mode = 1;
76
77   return 0;
78 }
79
80 static void
81 vmxnet3_set_interface_next_node (vnet_main_t * vnm, u32 hw_if_index,
82                                  u32 node_index)
83 {
84   vmxnet3_main_t *vmxm = &vmxnet3_main;
85   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
86   vmxnet3_device_t *vd = pool_elt_at_index (vmxm->devices, hw->dev_instance);
87
88   /* Shut off redirection */
89   if (node_index == ~0)
90     {
91       vd->per_interface_next_index = node_index;
92       return;
93     }
94
95   vd->per_interface_next_index =
96     vlib_node_add_next (vlib_get_main (), vmxnet3_input_node.index,
97                         node_index);
98 }
99
100 static void
101 vmxnet3_clear_hw_interface_counters (u32 instance)
102 {
103   vmxnet3_main_t *vmxm = &vmxnet3_main;
104   vmxnet3_device_t *vd = pool_elt_at_index (vmxm->devices, instance);
105   vmxnet3_queues *q = &vd->dma->queues;
106
107   /*
108    * Set the "last_cleared_stats" to the current stats, so that
109    * things appear to clear from a display perspective.
110    */
111   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_GET_STATS);
112
113   clib_memcpy (&vd->tx_stats, &q->tx.stats, sizeof (vd->tx_stats));
114   clib_memcpy (&vd->rx_stats, &q->rx.stats, sizeof (vd->rx_stats));
115 }
116
117 static char *vmxnet3_tx_func_error_strings[] = {
118 #define _(n,s) s,
119   foreach_vmxnet3_tx_func_error
120 #undef _
121 };
122
123 /* *INDENT-OFF* */
124 VNET_DEVICE_CLASS (vmxnet3_device_class,) =
125 {
126   .name = "VMXNET3 interface",
127   .format_device = format_vmxnet3_device,
128   .format_device_name = format_vmxnet3_device_name,
129   .admin_up_down_function = vmxnet3_interface_admin_up_down,
130   .clear_counters = vmxnet3_clear_hw_interface_counters,
131   .rx_mode_change_function = vmxnet3_interface_rx_mode_change,
132   .rx_redirect_to_node = vmxnet3_set_interface_next_node,
133   .tx_function_n_errors = VMXNET3_TX_N_ERROR,
134   .tx_function_error_strings = vmxnet3_tx_func_error_strings,
135 };
136 /* *INDENT-ON* */
137
138 static u32
139 vmxnet3_flag_change (vnet_main_t * vnm, vnet_hw_interface_t * hw, u32 flags)
140 {
141   return 0;
142 }
143
144 static void
145 vmxnet3_write_mac (vmxnet3_device_t * vd)
146 {
147   u32 val;
148
149   memcpy (&val, vd->mac_addr, 4);
150   vmxnet3_reg_write (vd, 1, VMXNET3_REG_MACL, val);
151
152   val = 0;
153   memcpy (&val, vd->mac_addr + 4, 2);
154   vmxnet3_reg_write (vd, 1, VMXNET3_REG_MACH, val);
155 }
156
157 static clib_error_t *
158 vmxnet3_provision_driver_shared (vlib_main_t * vm, vmxnet3_device_t * vd)
159 {
160   vmxnet3_shared *shared;
161   vmxnet3_queues *q;
162   u64 shared_dma;
163   u16 qid = 0, rid;
164   vmxnet3_rxq_t *rxq = vec_elt_at_index (vd->rxqs, qid);
165   vmxnet3_txq_t *txq = vec_elt_at_index (vd->txqs, qid);
166
167   vd->dma = vlib_physmem_alloc_aligned (vm, sizeof (*vd->dma), 512);
168   if (vd->dma == 0)
169     return vlib_physmem_last_error (vm);
170
171   clib_memset (vd->dma, 0, sizeof (*vd->dma));
172
173   q = &vd->dma->queues;
174   q->tx.cfg.desc_address = vmxnet3_dma_addr (vm, vd, txq->tx_desc);
175   q->tx.cfg.comp_address = vmxnet3_dma_addr (vm, vd, txq->tx_comp);
176   q->tx.cfg.num_desc = txq->size;
177   q->tx.cfg.num_comp = txq->size;
178   for (rid = 0; rid < VMXNET3_RX_RING_SIZE; rid++)
179     {
180       q->rx.cfg.desc_address[rid] = vmxnet3_dma_addr (vm, vd,
181                                                       rxq->rx_desc[rid]);
182       q->rx.cfg.num_desc[rid] = rxq->size;
183     }
184   q->rx.cfg.comp_address = vmxnet3_dma_addr (vm, vd, rxq->rx_comp);
185   q->rx.cfg.num_comp = rxq->size;
186
187   shared = &vd->dma->shared;
188   shared->magic = VMXNET3_SHARED_MAGIC;
189   shared->misc.version = VMXNET3_VERSION_MAGIC;
190   if (sizeof (void *) == 4)
191     shared->misc.guest_info = VMXNET3_GOS_BITS_32;
192   else
193     shared->misc.guest_info = VMXNET3_GOS_BITS_64;
194   shared->misc.guest_info |= VMXNET3_GOS_TYPE_LINUX;
195   shared->misc.version_support = VMXNET3_VERSION_SELECT;
196   shared->misc.upt_version_support = VMXNET3_UPT_VERSION_SELECT;
197   shared->misc.queue_desc_address = vmxnet3_dma_addr (vm, vd, q);
198   shared->misc.queue_desc_len = sizeof (*q);
199   shared->misc.mtu = VMXNET3_MTU;
200   shared->misc.num_tx_queues = vd->num_tx_queues;
201   shared->misc.num_rx_queues = vd->num_rx_queues;
202   shared->interrupt.num_intrs = vd->num_intrs;
203   shared->interrupt.event_intr_index = 1;
204   shared->interrupt.control = VMXNET3_IC_DISABLE_ALL;
205   shared->rx_filter.mode = VMXNET3_RXMODE_UCAST | VMXNET3_RXMODE_BCAST |
206     VMXNET3_RXMODE_ALL_MULTI | VMXNET3_RXMODE_PROMISC;
207   shared_dma = vmxnet3_dma_addr (vm, vd, shared);
208
209   vmxnet3_reg_write (vd, 1, VMXNET3_REG_DSAL, shared_dma);
210   vmxnet3_reg_write (vd, 1, VMXNET3_REG_DSAH, shared_dma >> 32);
211
212   return 0;
213 }
214
215 static inline void
216 vmxnet3_enable_interrupt (vmxnet3_device_t * vd)
217 {
218   int i;
219   vmxnet3_shared *shared = &vd->dma->shared;
220
221   shared->interrupt.control &= ~VMXNET3_IC_DISABLE_ALL;
222   for (i = 0; i < vd->num_intrs; i++)
223     vmxnet3_reg_write (vd, 0, VMXNET3_REG_IMR + i * 8, 0);
224 }
225
226 static inline void
227 vmxnet3_disable_interrupt (vmxnet3_device_t * vd)
228 {
229   int i;
230   vmxnet3_shared *shared = &vd->dma->shared;
231
232   shared->interrupt.control |= VMXNET3_IC_DISABLE_ALL;
233   for (i = 0; i < vd->num_intrs; i++)
234     vmxnet3_reg_write (vd, 0, VMXNET3_REG_IMR + i * 8, 1);
235 }
236
237 static clib_error_t *
238 vmxnet3_rxq_init (vlib_main_t * vm, vmxnet3_device_t * vd, u16 qid, u16 qsz)
239 {
240   vmxnet3_rxq_t *rxq;
241   u16 rid;
242
243   vec_validate_aligned (vd->rxqs, qid, CLIB_CACHE_LINE_BYTES);
244   rxq = vec_elt_at_index (vd->rxqs, qid);
245   clib_memset (rxq, 0, sizeof (*rxq));
246   rxq->size = qsz;
247   for (rid = 0; rid < VMXNET3_RX_RING_SIZE; rid++)
248     {
249       rxq->rx_desc[rid] = vlib_physmem_alloc_aligned
250         (vm, qsz * sizeof (*rxq->rx_desc[rid]), 512);
251
252       if (rxq->rx_desc[rid] == 0)
253         return vlib_physmem_last_error (vm);
254
255       clib_memset (rxq->rx_desc[rid], 0, qsz * sizeof (*rxq->rx_desc[rid]));
256     }
257   rxq->rx_comp = vlib_physmem_alloc_aligned (vm, qsz * sizeof (*rxq->rx_comp),
258                                              512);
259   if (rxq->rx_comp == 0)
260     return vlib_physmem_last_error (vm);
261
262   clib_memset (rxq->rx_comp, 0, qsz * sizeof (*rxq->rx_comp));
263   for (rid = 0; rid < VMXNET3_RX_RING_SIZE; rid++)
264     {
265       vmxnet3_rx_ring *ring;
266
267       ring = &rxq->rx_ring[rid];
268       ring->gen = VMXNET3_RXF_GEN;
269       ring->rid = rid;
270       vec_validate_aligned (ring->bufs, rxq->size, CLIB_CACHE_LINE_BYTES);
271     }
272   rxq->rx_comp_ring.gen = VMXNET3_RXCF_GEN;
273
274   return 0;
275 }
276
277 static clib_error_t *
278 vmxnet3_txq_init (vlib_main_t * vm, vmxnet3_device_t * vd, u16 qid, u16 qsz)
279 {
280   vmxnet3_txq_t *txq;
281
282   if (qid >= vd->num_tx_queues)
283     {
284       qid = qid % vd->num_tx_queues;
285       txq = vec_elt_at_index (vd->txqs, qid);
286       if (txq->lock == 0)
287         clib_spinlock_init (&txq->lock);
288       vd->flags |= VMXNET3_DEVICE_F_SHARED_TXQ_LOCK;
289       return 0;
290     }
291
292   vec_validate_aligned (vd->txqs, qid, CLIB_CACHE_LINE_BYTES);
293   txq = vec_elt_at_index (vd->txqs, qid);
294   clib_memset (txq, 0, sizeof (*txq));
295   txq->size = qsz;
296   txq->tx_desc = vlib_physmem_alloc_aligned (vm, qsz * sizeof (*txq->tx_desc),
297                                              512);
298   if (txq->tx_desc == 0)
299     return vlib_physmem_last_error (vm);
300
301   memset (txq->tx_desc, 0, qsz * sizeof (*txq->tx_desc));
302   txq->tx_comp = vlib_physmem_alloc_aligned (vm, qsz * sizeof (*txq->tx_comp),
303                                              512);
304   if (txq->tx_comp == 0)
305     return vlib_physmem_last_error (vm);
306
307   clib_memset (txq->tx_comp, 0, qsz * sizeof (*txq->tx_comp));
308   vec_validate_aligned (txq->tx_ring.bufs, txq->size, CLIB_CACHE_LINE_BYTES);
309   txq->tx_ring.gen = VMXNET3_TXF_GEN;
310   txq->tx_comp_ring.gen = VMXNET3_TXCF_GEN;
311
312   return 0;
313 }
314
315 static clib_error_t *
316 vmxnet3_device_init (vlib_main_t * vm, vmxnet3_device_t * vd,
317                      vmxnet3_create_if_args_t * args)
318 {
319   clib_error_t *error = 0;
320   u32 ret, i;
321   vlib_thread_main_t *tm = vlib_get_thread_main ();
322
323   vd->num_tx_queues = 1;
324   vd->num_rx_queues = 1;
325   vd->num_intrs = 2;
326
327   /* Quiesce the device */
328   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_QUIESCE_DEV);
329   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_CMD);
330   if (ret != 0)
331     {
332       error = clib_error_return (0, "error on quiescing device rc (%u)", ret);
333       return error;
334     }
335
336   /* Reset the device */
337   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_RESET_DEV);
338   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_CMD);
339   if (ret != 0)
340     {
341       error = clib_error_return (0, "error on resetting device rc (%u)", ret);
342       return error;
343     }
344
345   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_VRRS);
346   vd->version = count_leading_zeros (ret);
347   vd->version = uword_bits - vd->version;
348
349   if (vd->version == 0 || vd->version > 3)
350     {
351       error = clib_error_return (0, "unsupported hardware version %u",
352                                  vd->version);
353       return error;
354     }
355
356   vmxnet3_reg_write (vd, 1, VMXNET3_REG_VRRS, 1 << (vd->version - 1));
357
358   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_UVRS);
359   if (ret & 1)
360     vmxnet3_reg_write (vd, 1, VMXNET3_REG_UVRS, 1);
361   else
362     {
363       error = clib_error_return (0, "unsupported upt version %u", ret);
364       return error;
365     }
366
367   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_GET_LINK);
368   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_CMD);
369   if (ret & 1)
370     {
371       vd->flags |= VMXNET3_DEVICE_F_LINK_UP;
372       vd->link_speed = ret >> 16;
373     }
374   else
375     {
376       vd->flags &= ~VMXNET3_DEVICE_F_LINK_UP;
377     }
378
379   /* Get the mac address */
380   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_MACL);
381   clib_memcpy (vd->mac_addr, &ret, 4);
382   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_MACH);
383   clib_memcpy (vd->mac_addr + 4, &ret, 2);
384
385   error = vmxnet3_rxq_init (vm, vd, 0, args->rxq_size);
386   if (error)
387     return error;
388
389   for (i = 0; i < tm->n_vlib_mains; i++)
390     {
391       error = vmxnet3_txq_init (vm, vd, i, args->txq_size);
392       if (error)
393         return error;
394     }
395
396   error = vmxnet3_provision_driver_shared (vm, vd);
397   if (error)
398     return error;
399
400   vmxnet3_write_mac (vd);
401
402   /* Activate device */
403   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_ACTIVATE_DEV);
404   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_CMD);
405   if (ret != 0)
406     {
407       error =
408         clib_error_return (0, "error on activating device rc (%u)", ret);
409       return error;
410     }
411
412   /* Disable interrupts */
413   vmxnet3_disable_interrupt (vd);
414
415   vec_foreach_index (i, vd->rxqs)
416   {
417     vmxnet3_rxq_t *rxq = vec_elt_at_index (vd->rxqs, i);
418
419     vmxnet3_rxq_refill_ring0 (vm, vd, rxq);
420     vmxnet3_rxq_refill_ring1 (vm, vd, rxq);
421   }
422   vd->flags |= VMXNET3_DEVICE_F_INITIALIZED;
423
424   vmxnet3_enable_interrupt (vd);
425
426   return error;
427 }
428
429 static void
430 vmxnet3_irq_0_handler (vlib_main_t * vm, vlib_pci_dev_handle_t h, u16 line)
431 {
432   vnet_main_t *vnm = vnet_get_main ();
433   vmxnet3_main_t *vmxm = &vmxnet3_main;
434   uword pd = vlib_pci_get_private_data (vm, h);
435   vmxnet3_device_t *vd = pool_elt_at_index (vmxm->devices, pd);
436   u16 qid = line;
437
438   if (vec_len (vd->rxqs) > qid && vd->rxqs[qid].int_mode != 0)
439     vnet_device_input_set_interrupt_pending (vnm, vd->hw_if_index, qid);
440 }
441
442 static void
443 vmxnet3_irq_1_handler (vlib_main_t * vm, vlib_pci_dev_handle_t h, u16 line)
444 {
445   vnet_main_t *vnm = vnet_get_main ();
446   vmxnet3_main_t *vmxm = &vmxnet3_main;
447   uword pd = vlib_pci_get_private_data (vm, h);
448   vmxnet3_device_t *vd = pool_elt_at_index (vmxm->devices, pd);
449   u32 ret;
450
451   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_GET_LINK);
452   ret = vmxnet3_reg_read (vd, 1, VMXNET3_REG_CMD);
453   if (ret & 1)
454     {
455       vd->flags |= VMXNET3_DEVICE_F_LINK_UP;
456       vd->link_speed = ret >> 16;
457       vnet_hw_interface_set_flags (vnm, vd->hw_if_index,
458                                    VNET_HW_INTERFACE_FLAG_LINK_UP);
459     }
460   else
461     {
462       vd->flags &= ~VMXNET3_DEVICE_F_LINK_UP;
463       vnet_hw_interface_set_flags (vnm, vd->hw_if_index, 0);
464     }
465 }
466
467 static u8
468 vmxnet3_queue_size_valid (u16 qsz)
469 {
470   if (qsz < 64 || qsz > 4096)
471     return 0;
472   if ((qsz % 64) != 0)
473     return 0;
474   return 1;
475 }
476
477 void
478 vmxnet3_create_if (vlib_main_t * vm, vmxnet3_create_if_args_t * args)
479 {
480   vnet_main_t *vnm = vnet_get_main ();
481   vmxnet3_main_t *vmxm = &vmxnet3_main;
482   vmxnet3_device_t *vd;
483   vlib_pci_dev_handle_t h;
484   clib_error_t *error = 0;
485
486   if (args->rxq_size == 0)
487     args->rxq_size = VMXNET3_NUM_RX_DESC;
488   if (args->txq_size == 0)
489     args->txq_size = VMXNET3_NUM_TX_DESC;
490
491   if (!vmxnet3_queue_size_valid (args->rxq_size) ||
492       !vmxnet3_queue_size_valid (args->txq_size))
493     {
494       args->rv = VNET_API_ERROR_INVALID_VALUE;
495       args->error =
496         clib_error_return (error,
497                            "queue size must be <= 4096, >= 64, "
498                            "and multiples of 64");
499       vlib_log (VLIB_LOG_LEVEL_ERR, vmxm->log_default, "%U: %s",
500                 format_vlib_pci_addr, &args->addr,
501                 "queue size must be <= 4096, >= 64, and multiples of 64");
502       return;
503     }
504
505   /* *INDENT-OFF* */
506   pool_foreach (vd, vmxm->devices, ({
507     if (vd->pci_addr.as_u32 == args->addr.as_u32)
508       {
509         args->rv = VNET_API_ERROR_INVALID_VALUE;
510         args->error =
511           clib_error_return (error, "PCI address in use");
512         vlib_log (VLIB_LOG_LEVEL_ERR, vmxm->log_default, "%U: %s",
513                   format_vlib_pci_addr, &args->addr, "pci address in use");
514         return;
515       }
516   }));
517   /* *INDENT-ON* */
518
519   pool_get (vmxm->devices, vd);
520   vd->dev_instance = vd - vmxm->devices;
521   vd->per_interface_next_index = ~0;
522   vd->pci_addr = args->addr;
523
524   if (args->enable_elog)
525     vd->flags |= VMXNET3_DEVICE_F_ELOG;
526
527   if ((error =
528        vlib_pci_device_open (vm, &args->addr, vmxnet3_pci_device_ids, &h)))
529     {
530       pool_put (vmxm->devices, vd);
531       args->rv = VNET_API_ERROR_INVALID_INTERFACE;
532       args->error =
533         clib_error_return (error, "pci-addr %U", format_vlib_pci_addr,
534                            &args->addr);
535       vlib_log (VLIB_LOG_LEVEL_ERR, vmxm->log_default, "%U: %s",
536                 format_vlib_pci_addr, &args->addr,
537                 "error encountered on pci device open");
538       return;
539     }
540
541   /*
542    * Do not use vmxnet3_log_error prior to this line since the macro
543    * references vd->pci_dev_handle
544    */
545   vd->pci_dev_handle = h;
546   vlib_pci_set_private_data (vm, h, vd->dev_instance);
547
548   if ((error = vlib_pci_bus_master_enable (vm, h)))
549     {
550       vmxnet3_log_error (vd, "error encountered on pci bus master enable");
551       goto error;
552     }
553
554   if ((error = vlib_pci_map_region (vm, h, 0, (void **) &vd->bar[0])))
555     {
556       vmxnet3_log_error (vd, "error encountered on pci map region for bar 0");
557       goto error;
558     }
559
560   if ((error = vlib_pci_map_region (vm, h, 1, (void **) &vd->bar[1])))
561     {
562       vmxnet3_log_error (vd, "error encountered on pci map region for bar 1");
563       goto error;
564     }
565
566   if ((error = vlib_pci_register_msix_handler (vm, h, 0, 1,
567                                                &vmxnet3_irq_0_handler)))
568     {
569       vmxnet3_log_error (vd,
570                          "error encountered on pci register msix handler 0");
571       goto error;
572     }
573
574   if ((error = vlib_pci_register_msix_handler (vm, h, 1, 1,
575                                                &vmxnet3_irq_1_handler)))
576     {
577       vmxnet3_log_error (vd,
578                          "error encountered on pci register msix handler 1");
579       goto error;
580     }
581
582   if ((error = vlib_pci_enable_msix_irq (vm, h, 0, 2)))
583     {
584       vmxnet3_log_error (vd, "error encountered on pci enable msix irq");
585       goto error;
586     }
587
588   if ((error = vlib_pci_intr_enable (vm, h)))
589     {
590       vmxnet3_log_error (vd, "error encountered on pci interrupt enable");
591       goto error;
592     }
593
594   if ((error = vmxnet3_device_init (vm, vd, args)))
595     {
596       vmxnet3_log_error (vd, "error encountered on device init");
597       goto error;
598     }
599
600   /* create interface */
601   error = ethernet_register_interface (vnm, vmxnet3_device_class.index,
602                                        vd->dev_instance, vd->mac_addr,
603                                        &vd->hw_if_index, vmxnet3_flag_change);
604
605   if (error)
606     {
607       vmxnet3_log_error (vd,
608                          "error encountered on ethernet register interface");
609       goto error;
610     }
611
612   vnet_sw_interface_t *sw = vnet_get_hw_sw_interface (vnm, vd->hw_if_index);
613   vd->sw_if_index = sw->sw_if_index;
614   args->sw_if_index = sw->sw_if_index;
615
616   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, vd->hw_if_index);
617   hw->flags |= VNET_HW_INTERFACE_FLAG_SUPPORTS_INT_MODE;
618   vnet_hw_interface_set_input_node (vnm, vd->hw_if_index,
619                                     vmxnet3_input_node.index);
620   vnet_hw_interface_assign_rx_thread (vnm, vd->hw_if_index, 0, ~0);
621   if (vd->flags & VMXNET3_DEVICE_F_LINK_UP)
622     vnet_hw_interface_set_flags (vnm, vd->hw_if_index,
623                                  VNET_HW_INTERFACE_FLAG_LINK_UP);
624   else
625     vnet_hw_interface_set_flags (vnm, vd->hw_if_index, 0);
626   return;
627
628 error:
629   vmxnet3_delete_if (vm, vd);
630   args->rv = VNET_API_ERROR_INVALID_INTERFACE;
631   args->error = error;
632 }
633
634 void
635 vmxnet3_delete_if (vlib_main_t * vm, vmxnet3_device_t * vd)
636 {
637   vnet_main_t *vnm = vnet_get_main ();
638   vmxnet3_main_t *vmxm = &vmxnet3_main;
639   u32 i, bi;
640   u16 desc_idx;
641
642   /* Quiesce the device */
643   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_QUIESCE_DEV);
644
645   /* Reset the device */
646   vmxnet3_reg_write (vd, 1, VMXNET3_REG_CMD, VMXNET3_CMD_RESET_DEV);
647
648   if (vd->hw_if_index)
649     {
650       vnet_hw_interface_set_flags (vnm, vd->hw_if_index, 0);
651       vnet_hw_interface_unassign_rx_thread (vnm, vd->hw_if_index, 0);
652       ethernet_delete_interface (vnm, vd->hw_if_index);
653     }
654
655   vlib_pci_device_close (vm, vd->pci_dev_handle);
656
657   /* *INDENT-OFF* */
658   vec_foreach_index (i, vd->rxqs)
659     {
660       vmxnet3_rxq_t *rxq = vec_elt_at_index (vd->rxqs, i);
661       u16 mask = rxq->size - 1;
662       u16 rid;
663
664       for (rid = 0; rid < VMXNET3_RX_RING_SIZE; rid++)
665         {
666           vmxnet3_rx_ring *ring;
667
668           ring = &rxq->rx_ring[rid];
669           desc_idx = (ring->consume + 1) & mask;
670           vlib_buffer_free_from_ring (vm, ring->bufs, desc_idx, rxq->size,
671                                       ring->fill);
672           vec_free (ring->bufs);
673           vlib_physmem_free (vm, rxq->rx_desc[rid]);
674         }
675       vlib_physmem_free (vm, rxq->rx_comp);
676     }
677   /* *INDENT-ON* */
678   vec_free (vd->rxqs);
679
680   /* *INDENT-OFF* */
681   vec_foreach_index (i, vd->txqs)
682     {
683       vmxnet3_txq_t *txq = vec_elt_at_index (vd->txqs, i);
684       u16 mask = txq->size - 1;
685       u16 end_idx;
686
687       desc_idx = txq->tx_ring.consume;
688       end_idx = txq->tx_ring.produce;
689       while (desc_idx != end_idx)
690         {
691           bi = txq->tx_ring.bufs[desc_idx];
692           vlib_buffer_free_no_next (vm, &bi, 1);
693           desc_idx++;
694           desc_idx &= mask;
695         }
696       clib_spinlock_free (&txq->lock);
697       vec_free (txq->tx_ring.bufs);
698       vlib_physmem_free (vm, txq->tx_desc);
699       vlib_physmem_free (vm, txq->tx_comp);
700     }
701   /* *INDENT-ON* */
702   vec_free (vd->txqs);
703
704   vlib_physmem_free (vm, vd->dma);
705
706   clib_error_free (vd->error);
707   clib_memset (vd, 0, sizeof (*vd));
708   pool_put (vmxm->devices, vd);
709 }
710
711 /*
712  * fd.io coding-style-patch-verification: ON
713  *
714  * Local Variables:
715  * eval: (c-set-style "gnu")
716  * End:
717  */