dpdk: allow configure individual VMBUS devices
[vpp.git] / src / plugins / dpdk / device / common.c
1 /*
2  * Copyright (c) 2017 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <vnet/vnet.h>
17 #include <vppinfra/vec.h>
18 #include <vppinfra/format.h>
19 #include <assert.h>
20
21 #include <vnet/ip/ip.h>
22 #include <vnet/ethernet/ethernet.h>
23 #include <vnet/ethernet/arp_packet.h>
24 #include <dpdk/buffer.h>
25 #include <dpdk/device/dpdk.h>
26 #include <dpdk/device/dpdk_priv.h>
27 #include <vppinfra/error.h>
28
29 void
30 dpdk_device_error (dpdk_device_t * xd, char *str, int rv)
31 {
32   dpdk_log_err ("Interface %U error %d: %s",
33                 format_dpdk_device_name, xd->port_id, rv, rte_strerror (rv));
34   xd->errors = clib_error_return (xd->errors, "%s[port:%d, errno:%d]: %s",
35                                   str, xd->port_id, rv, rte_strerror (rv));
36 }
37
38 void
39 dpdk_device_setup (dpdk_device_t * xd)
40 {
41   dpdk_main_t *dm = &dpdk_main;
42   vlib_main_t *vm = vlib_get_main ();
43   vnet_main_t *vnm = vnet_get_main ();
44   vlib_thread_main_t *tm = vlib_get_thread_main ();
45   vnet_sw_interface_t *sw = vnet_get_sw_interface (vnm, xd->sw_if_index);
46   vnet_hw_interface_t *hi = vnet_get_hw_interface (vnm, xd->hw_if_index);
47   struct rte_eth_dev_info dev_info;
48   u64 bitmap;
49   int rv;
50   int j;
51
52   ASSERT (vlib_get_thread_index () == 0);
53
54   clib_error_free (xd->errors);
55   sw->flags &= ~VNET_SW_INTERFACE_FLAG_ERROR;
56
57   if (xd->flags & DPDK_DEVICE_FLAG_ADMIN_UP)
58     {
59       vnet_hw_interface_set_flags (dm->vnet_main, xd->hw_if_index, 0);
60       dpdk_device_stop (xd);
61     }
62
63   /* Enable flow director when flows exist */
64   if (xd->pmd == VNET_DPDK_PMD_I40E)
65     {
66       if ((xd->flags & DPDK_DEVICE_FLAG_RX_FLOW_OFFLOAD) != 0)
67         xd->port_conf.fdir_conf.mode = RTE_FDIR_MODE_PERFECT;
68       else
69         xd->port_conf.fdir_conf.mode = RTE_FDIR_MODE_NONE;
70     }
71
72   rte_eth_dev_info_get (xd->port_id, &dev_info);
73
74   bitmap = xd->port_conf.txmode.offloads & ~dev_info.tx_offload_capa;
75   if (bitmap)
76     {
77       dpdk_log_warn ("unsupported tx offloads requested on port %u: %U",
78                      xd->port_id, format_dpdk_tx_offload_caps, bitmap);
79       xd->port_conf.txmode.offloads ^= bitmap;
80     }
81
82   bitmap = xd->port_conf.rxmode.offloads & ~dev_info.rx_offload_capa;
83   if (bitmap)
84     {
85       dpdk_log_warn ("unsupported rx offloads requested on port %u: %U",
86                      xd->port_id, format_dpdk_rx_offload_caps, bitmap);
87       xd->port_conf.rxmode.offloads ^= bitmap;
88     }
89
90   rv = rte_eth_dev_configure (xd->port_id, xd->rx_q_used,
91                               xd->tx_q_used, &xd->port_conf);
92
93   if (rv < 0)
94     {
95       dpdk_device_error (xd, "rte_eth_dev_configure", rv);
96       goto error;
97     }
98
99   vec_validate_aligned (xd->tx_queues, xd->tx_q_used - 1,
100                         CLIB_CACHE_LINE_BYTES);
101   for (j = 0; j < xd->tx_q_used; j++)
102     {
103       rv =
104         rte_eth_tx_queue_setup (xd->port_id, j, xd->nb_tx_desc,
105                                 xd->cpu_socket, &xd->tx_conf);
106
107       /* retry with any other CPU socket */
108       if (rv < 0)
109         rv =
110           rte_eth_tx_queue_setup (xd->port_id, j,
111                                   xd->nb_tx_desc, SOCKET_ID_ANY,
112                                   &xd->tx_conf);
113       if (rv < 0)
114         dpdk_device_error (xd, "rte_eth_tx_queue_setup", rv);
115
116       if (xd->tx_q_used < tm->n_vlib_mains)
117         clib_spinlock_init (&vec_elt (xd->tx_queues, j).lock);
118     }
119
120   vec_validate_aligned (xd->rx_queues, xd->rx_q_used - 1,
121                         CLIB_CACHE_LINE_BYTES);
122   for (j = 0; j < xd->rx_q_used; j++)
123     {
124       dpdk_rx_queue_t *rxq = vec_elt_at_index (xd->rx_queues, j);
125       uword tidx = vnet_get_device_input_thread_index (dm->vnet_main,
126                                                        xd->hw_if_index, j);
127       unsigned lcore = vlib_worker_threads[tidx].cpu_id;
128       u16 socket_id = rte_lcore_to_socket_id (lcore);
129       u8 bpidx = vlib_buffer_pool_get_default_for_numa (vm, socket_id);
130       vlib_buffer_pool_t *bp = vlib_get_buffer_pool (vm, bpidx);
131       struct rte_mempool *mp = dpdk_mempool_by_buffer_pool_index[bpidx];
132
133       rv = rte_eth_rx_queue_setup (xd->port_id, j, xd->nb_rx_desc,
134                                    xd->cpu_socket, 0, mp);
135
136       /* retry with any other CPU socket */
137       if (rv < 0)
138         rv = rte_eth_rx_queue_setup (xd->port_id, j, xd->nb_rx_desc,
139                                      SOCKET_ID_ANY, 0, mp);
140
141       rxq->buffer_pool_index = bp->index;
142
143       if (rv < 0)
144         dpdk_device_error (xd, "rte_eth_rx_queue_setup", rv);
145     }
146
147   if (vec_len (xd->errors))
148     goto error;
149
150   rte_eth_dev_set_mtu (xd->port_id, hi->max_packet_bytes);
151
152   if (xd->flags & DPDK_DEVICE_FLAG_ADMIN_UP)
153     dpdk_device_start (xd);
154
155   if (vec_len (xd->errors))
156     goto error;
157
158   return;
159
160 error:
161   xd->flags |= DPDK_DEVICE_FLAG_PMD_INIT_FAIL;
162   sw->flags |= VNET_SW_INTERFACE_FLAG_ERROR;
163 }
164
165 void
166 dpdk_device_start (dpdk_device_t * xd)
167 {
168   int rv;
169
170   if (xd->flags & DPDK_DEVICE_FLAG_PMD_INIT_FAIL)
171     return;
172
173   rv = rte_eth_dev_start (xd->port_id);
174
175   if (rv)
176     {
177       dpdk_device_error (xd, "rte_eth_dev_start", rv);
178       return;
179     }
180
181   if (xd->default_mac_address)
182     rv = rte_eth_dev_default_mac_addr_set (xd->port_id,
183                                            (void *) xd->default_mac_address);
184
185   if (rv)
186     dpdk_device_error (xd, "rte_eth_dev_default_mac_addr_set", rv);
187
188   if (xd->flags & DPDK_DEVICE_FLAG_PROMISC)
189     rte_eth_promiscuous_enable (xd->port_id);
190   else
191     rte_eth_promiscuous_disable (xd->port_id);
192
193   rte_eth_allmulticast_enable (xd->port_id);
194
195   dpdk_log_info ("Interface %U started",
196                  format_dpdk_device_name, xd->port_id);
197 }
198
199 void
200 dpdk_device_stop (dpdk_device_t * xd)
201 {
202   if (xd->flags & DPDK_DEVICE_FLAG_PMD_INIT_FAIL)
203     return;
204
205   rte_eth_allmulticast_disable (xd->port_id);
206   rte_eth_dev_stop (xd->port_id);
207   clib_memset (&xd->link, 0, sizeof (struct rte_eth_link));
208
209   dpdk_log_info ("Interface %U stopped",
210                  format_dpdk_device_name, xd->port_id);
211 }
212
213 void vl_api_force_rpc_call_main_thread (void *fp, u8 * data, u32 data_length);
214
215 always_inline int
216 dpdk_port_state_callback_inline (dpdk_portid_t port_id,
217                                  enum rte_eth_event_type type, void *param)
218 {
219   struct rte_eth_link link;
220
221   RTE_SET_USED (param);
222   if (type != RTE_ETH_EVENT_INTR_LSC)
223     {
224       dpdk_log_info ("Unknown event %d received for port %d", type, port_id);
225       return -1;
226     }
227
228   rte_eth_link_get_nowait (port_id, &link);
229   u8 link_up = link.link_status;
230   if (link_up)
231     dpdk_log_info ("Port %d Link Up - speed %u Mbps - %s",
232                    port_id, (unsigned) link.link_speed,
233                    (link.link_duplex == ETH_LINK_FULL_DUPLEX) ?
234                    "full-duplex" : "half-duplex");
235   else
236     dpdk_log_info ("Port %d Link Down\n\n", port_id);
237
238   return 0;
239 }
240
241 int
242 dpdk_port_state_callback (dpdk_portid_t port_id,
243                           enum rte_eth_event_type type,
244                           void *param,
245                           void *ret_param __attribute__ ((unused)))
246 {
247   return dpdk_port_state_callback_inline (port_id, type, param);
248 }
249
250 /* If this device is PCI return pointer to info, otherwise NULL */
251 struct rte_pci_device *
252 dpdk_get_pci_device (const struct rte_eth_dev_info *info)
253 {
254   const struct rte_bus *bus;
255
256   bus = rte_bus_find_by_device (info->device);
257   if (bus && !strcmp (bus->name, "pci"))
258     return RTE_DEV_TO_PCI (info->device);
259   else
260     return NULL;
261 }
262
263 /* If this device is VMBUS return pointer to info, otherwise NULL */
264 struct rte_vmbus_device *
265 dpdk_get_vmbus_device (const struct rte_eth_dev_info *info)
266 {
267   const struct rte_bus *bus;
268
269   bus = rte_bus_find_by_device (info->device);
270   if (bus && !strcmp (bus->name, "vmbus"))
271     return container_of (info->device, struct rte_vmbus_device, device);
272   else
273     return NULL;
274 }
275
276 /*
277  * fd.io coding-style-patch-verification: ON
278  *
279  * Local Variables:
280  * eval: (c-set-style "gnu")
281  * End:
282  */