f91e3bf836fdc748ec6e563fa61914fd3a3488e2
[vpp.git] / src / plugins / dpdk / device / common.c
1 /*
2  * Copyright (c) 2017 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <vnet/vnet.h>
17 #include <vppinfra/vec.h>
18 #include <vppinfra/format.h>
19 #include <vlib/unix/cj.h>
20 #include <assert.h>
21
22 #include <vnet/ip/ip.h>
23 #include <vnet/ethernet/ethernet.h>
24 #include <vnet/ethernet/arp_packet.h>
25 #include <dpdk/buffer.h>
26 #include <dpdk/device/dpdk.h>
27 #include <dpdk/device/dpdk_priv.h>
28 #include <vppinfra/error.h>
29
30 void
31 dpdk_device_error (dpdk_device_t * xd, char *str, int rv)
32 {
33   dpdk_log_err ("Interface %U error %d: %s",
34                 format_dpdk_device_name, xd->port_id, rv, rte_strerror (rv));
35   xd->errors = clib_error_return (xd->errors, "%s[port:%d, errno:%d]: %s",
36                                   str, xd->port_id, rv, rte_strerror (rv));
37 }
38
39 void
40 dpdk_device_setup (dpdk_device_t * xd)
41 {
42   dpdk_main_t *dm = &dpdk_main;
43   vlib_main_t *vm = vlib_get_main ();
44   vnet_main_t *vnm = vnet_get_main ();
45   vnet_sw_interface_t *sw = vnet_get_sw_interface (vnm, xd->sw_if_index);
46   vnet_hw_interface_t *hi = vnet_get_hw_interface (vnm, xd->hw_if_index);
47   struct rte_eth_dev_info dev_info;
48   u64 bitmap;
49   int rv;
50   int j;
51
52   ASSERT (vlib_get_thread_index () == 0);
53
54   clib_error_free (xd->errors);
55   sw->flags &= ~VNET_SW_INTERFACE_FLAG_ERROR;
56
57   if (xd->flags & DPDK_DEVICE_FLAG_ADMIN_UP)
58     {
59       vnet_hw_interface_set_flags (dm->vnet_main, xd->hw_if_index, 0);
60       dpdk_device_stop (xd);
61     }
62
63   /* Enable flow director when flows exist */
64   if (xd->pmd == VNET_DPDK_PMD_I40E)
65     {
66       if ((xd->flags & DPDK_DEVICE_FLAG_RX_FLOW_OFFLOAD) != 0)
67         xd->port_conf.fdir_conf.mode = RTE_FDIR_MODE_PERFECT;
68       else
69         xd->port_conf.fdir_conf.mode = RTE_FDIR_MODE_NONE;
70     }
71
72   rte_eth_dev_info_get (xd->port_id, &dev_info);
73
74   bitmap = xd->port_conf.txmode.offloads & ~dev_info.tx_offload_capa;
75   if (bitmap)
76     {
77       dpdk_log_warn ("unsupported tx offloads requested on port %u: %U",
78                      xd->port_id, format_dpdk_tx_offload_caps, bitmap);
79       xd->port_conf.txmode.offloads ^= bitmap;
80     }
81
82   bitmap = xd->port_conf.rxmode.offloads & ~dev_info.rx_offload_capa;
83   if (bitmap)
84     {
85       dpdk_log_warn ("unsupported rx offloads requested on port %u: %U",
86                      xd->port_id, format_dpdk_rx_offload_caps, bitmap);
87       xd->port_conf.rxmode.offloads ^= bitmap;
88     }
89
90   rv = rte_eth_dev_configure (xd->port_id, xd->rx_q_used,
91                               xd->tx_q_used, &xd->port_conf);
92
93   if (rv < 0)
94     {
95       dpdk_device_error (xd, "rte_eth_dev_configure", rv);
96       goto error;
97     }
98
99   /* Set up one TX-queue per worker thread */
100   for (j = 0; j < xd->tx_q_used; j++)
101     {
102       rv =
103         rte_eth_tx_queue_setup (xd->port_id, j, xd->nb_tx_desc,
104                                 xd->cpu_socket, &xd->tx_conf);
105
106       /* retry with any other CPU socket */
107       if (rv < 0)
108         rv =
109           rte_eth_tx_queue_setup (xd->port_id, j,
110                                   xd->nb_tx_desc, SOCKET_ID_ANY,
111                                   &xd->tx_conf);
112       if (rv < 0)
113         dpdk_device_error (xd, "rte_eth_tx_queue_setup", rv);
114     }
115
116   vec_validate_aligned (xd->buffer_pool_for_queue, xd->rx_q_used - 1,
117                         CLIB_CACHE_LINE_BYTES);
118   for (j = 0; j < xd->rx_q_used; j++)
119     {
120       uword tidx = vnet_get_device_input_thread_index (dm->vnet_main,
121                                                        xd->hw_if_index, j);
122       unsigned lcore = vlib_worker_threads[tidx].cpu_id;
123       u16 socket_id = rte_lcore_to_socket_id (lcore);
124       u8 bpidx = vlib_buffer_pool_get_default_for_numa (vm, socket_id);
125       vlib_buffer_pool_t *bp = vlib_get_buffer_pool (vm, bpidx);
126       struct rte_mempool *mp = dpdk_mempool_by_buffer_pool_index[bpidx];
127
128       rv = rte_eth_rx_queue_setup (xd->port_id, j, xd->nb_rx_desc,
129                                    xd->cpu_socket, 0, mp);
130
131       /* retry with any other CPU socket */
132       if (rv < 0)
133         rv = rte_eth_rx_queue_setup (xd->port_id, j, xd->nb_rx_desc,
134                                      SOCKET_ID_ANY, 0, mp);
135
136       xd->buffer_pool_for_queue[j] = bp->index;
137
138       if (rv < 0)
139         dpdk_device_error (xd, "rte_eth_rx_queue_setup", rv);
140     }
141
142   if (vec_len (xd->errors))
143     goto error;
144
145   rte_eth_dev_set_mtu (xd->port_id, hi->max_packet_bytes);
146
147   if (xd->flags & DPDK_DEVICE_FLAG_ADMIN_UP)
148     dpdk_device_start (xd);
149
150   if (vec_len (xd->errors))
151     goto error;
152
153   return;
154
155 error:
156   xd->flags |= DPDK_DEVICE_FLAG_PMD_INIT_FAIL;
157   sw->flags |= VNET_SW_INTERFACE_FLAG_ERROR;
158 }
159
160 void
161 dpdk_device_start (dpdk_device_t * xd)
162 {
163   int rv;
164
165   if (xd->flags & DPDK_DEVICE_FLAG_PMD_INIT_FAIL)
166     return;
167
168   rv = rte_eth_dev_start (xd->port_id);
169
170   if (rv)
171     {
172       dpdk_device_error (xd, "rte_eth_dev_start", rv);
173       return;
174     }
175
176   if (xd->default_mac_address)
177     rv = rte_eth_dev_default_mac_addr_set (xd->port_id,
178                                            (void *) xd->default_mac_address);
179
180   if (rv)
181     dpdk_device_error (xd, "rte_eth_dev_default_mac_addr_set", rv);
182
183   if (xd->flags & DPDK_DEVICE_FLAG_PROMISC)
184     rte_eth_promiscuous_enable (xd->port_id);
185   else
186     rte_eth_promiscuous_disable (xd->port_id);
187
188   rte_eth_allmulticast_enable (xd->port_id);
189
190   dpdk_log_info ("Interface %U started",
191                  format_dpdk_device_name, xd->port_id);
192 }
193
194 void
195 dpdk_device_stop (dpdk_device_t * xd)
196 {
197   if (xd->flags & DPDK_DEVICE_FLAG_PMD_INIT_FAIL)
198     return;
199
200   rte_eth_allmulticast_disable (xd->port_id);
201   rte_eth_dev_stop (xd->port_id);
202   clib_memset (&xd->link, 0, sizeof (struct rte_eth_link));
203
204   dpdk_log_info ("Interface %U stopped",
205                  format_dpdk_device_name, xd->port_id);
206 }
207
208 void vl_api_force_rpc_call_main_thread (void *fp, u8 * data, u32 data_length);
209
210 always_inline int
211 dpdk_port_state_callback_inline (dpdk_portid_t port_id,
212                                  enum rte_eth_event_type type, void *param)
213 {
214   struct rte_eth_link link;
215
216   RTE_SET_USED (param);
217   if (type != RTE_ETH_EVENT_INTR_LSC)
218     {
219       dpdk_log_info ("Unknown event %d received for port %d", type, port_id);
220       return -1;
221     }
222
223   rte_eth_link_get_nowait (port_id, &link);
224   u8 link_up = link.link_status;
225   if (link_up)
226     dpdk_log_info ("Port %d Link Up - speed %u Mbps - %s",
227                    port_id, (unsigned) link.link_speed,
228                    (link.link_duplex == ETH_LINK_FULL_DUPLEX) ?
229                    "full-duplex" : "half-duplex");
230   else
231     dpdk_log_info ("Port %d Link Down\n\n", port_id);
232
233   return 0;
234 }
235
236 int
237 dpdk_port_state_callback (dpdk_portid_t port_id,
238                           enum rte_eth_event_type type,
239                           void *param,
240                           void *ret_param __attribute__ ((unused)))
241 {
242   return dpdk_port_state_callback_inline (port_id, type, param);
243 }
244
245 /* If this device is PCI return pointer to info, otherwise NULL */
246 struct rte_pci_device *
247 dpdk_get_pci_device (const struct rte_eth_dev_info *info)
248 {
249   const struct rte_bus *bus;
250
251   bus = rte_bus_find_by_device (info->device);
252   if (bus && !strcmp (bus->name, "pci"))
253     return RTE_DEV_TO_PCI (info->device);
254   else
255     return NULL;
256 }
257
258 /*
259  * fd.io coding-style-patch-verification: ON
260  *
261  * Local Variables:
262  * eval: (c-set-style "gnu")
263  * End:
264  */