24c91c6a9ca6cb6fc0878c9e4a21d76689083c50
[vpp.git] / vnet / vnet / devices / dpdk / dpdk_priv.h
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #define DPDK_NB_RX_DESC_DEFAULT   512
17 #define DPDK_NB_TX_DESC_DEFAULT   512
18 #define DPDK_NB_RX_DESC_VIRTIO    256
19 #define DPDK_NB_TX_DESC_VIRTIO    256
20 #define DPDK_NB_RX_DESC_10GE    1024
21 #define DPDK_NB_TX_DESC_10GE    1024
22 #define DPDK_NB_RX_DESC_40GE    1024
23 #define DPDK_NB_TX_DESC_40GE    1024
24 #define DPDK_NB_RX_DESC_ENIC    1024
25
26 /* These args appear by themselves */
27 #define foreach_eal_double_hyphen_predicate_arg \
28 _(no-shconf)                                    \
29 _(no-hpet)                                      \
30 _(no-pci)                                       \
31 _(no-huge)                                      \
32 _(vmware-tsc-map)                               \
33 _(virtio-vhost)
34
35 #define foreach_eal_single_hyphen_mandatory_arg \
36 _(coremask, c)                                  \
37 _(nchannels, n)                                 \
38
39 #define foreach_eal_single_hyphen_arg           \
40 _(blacklist, b)                                 \
41 _(mem-alloc-request, m)                         \
42 _(force-ranks, r)
43
44 /* These args are preceeded by "--" and followed by a single string */
45 #define foreach_eal_double_hyphen_arg           \
46 _(huge-dir)                                     \
47 _(proc-type)                                    \
48 _(file-prefix)                                  \
49 _(vdev)
50
51 static inline u32
52 dpdk_rx_burst ( dpdk_main_t * dm, dpdk_device_t * xd, u16 queue_id)
53 {
54   u32 n_buffers;
55   u32 n_left;
56   u32 n_this_chunk;
57
58   n_left = VLIB_FRAME_SIZE;
59   n_buffers = 0;
60
61   if (PREDICT_TRUE(xd->dev_type == VNET_DPDK_DEV_ETH))
62     {
63       while (n_left)
64         {
65           n_this_chunk = rte_eth_rx_burst (xd->device_index, queue_id,
66                                            xd->rx_vectors[queue_id] + n_buffers, n_left);
67           n_buffers += n_this_chunk;
68           n_left -= n_this_chunk;
69
70           /* Empirically, DPDK r1.8 produces vectors w/ 32 or fewer elts */
71           if (n_this_chunk < 32)
72             break;
73       }
74     }
75   else if (xd->dev_type == VNET_DPDK_DEV_VHOST_USER)
76     {
77       vlib_main_t * vm = vlib_get_main();
78       vlib_buffer_main_t * bm = vm->buffer_main;
79       unsigned socket_id = rte_socket_id();
80       u32 offset = 0;
81
82 #if RTE_VERSION >= RTE_VERSION_NUM(2, 2, 0, 0)
83       offset = queue_id * VIRTIO_QNUM;
84
85       struct vhost_virtqueue *vq =
86         xd->vu_vhost_dev.virtqueue[offset + VIRTIO_TXQ];
87
88       if (PREDICT_FALSE(!vq->enabled))
89         return 0;
90 #else
91       if (PREDICT_FALSE(!xd->vu_is_running))
92         return 0;
93 #endif
94
95       struct rte_mbuf **pkts = xd->rx_vectors[queue_id];
96       while (n_left) {
97           n_this_chunk = rte_vhost_dequeue_burst(&xd->vu_vhost_dev,
98                                                  offset + VIRTIO_TXQ,
99                                                  bm->pktmbuf_pools[socket_id],
100                                                  pkts + n_buffers,
101                                                  n_left);
102           n_buffers += n_this_chunk;
103           n_left -= n_this_chunk;
104           if (n_this_chunk == 0)
105               break;
106       }
107
108       int i; u32 bytes = 0;
109       for (i = 0; i < n_buffers; i++) {
110           struct rte_mbuf *buff = pkts[i];
111           bytes += rte_pktmbuf_data_len(buff);
112       } 
113
114       f64 now = vlib_time_now (vm);
115
116       dpdk_vu_vring *vring = NULL;
117       /* send pending interrupts if needed */
118       if (dpdk_vhost_user_want_interrupt(xd, offset + VIRTIO_TXQ)) {
119           vring = &(xd->vu_intf->vrings[offset + VIRTIO_TXQ]);
120           vring->n_since_last_int += n_buffers;
121
122           if ((vring->n_since_last_int && (vring->int_deadline < now))
123               || (vring->n_since_last_int > dm->conf->vhost_coalesce_frames))
124             dpdk_vhost_user_send_interrupt(vm, xd, offset + VIRTIO_TXQ);
125       }
126
127       vring = &(xd->vu_intf->vrings[offset + VIRTIO_RXQ]);
128       vring->packets += n_buffers;
129       vring->bytes += bytes;
130
131       if (dpdk_vhost_user_want_interrupt(xd, offset + VIRTIO_RXQ)) {
132           if (vring->n_since_last_int && (vring->int_deadline < now))
133             dpdk_vhost_user_send_interrupt(vm, xd, offset + VIRTIO_RXQ);
134       }
135
136     }
137 #ifdef RTE_LIBRTE_KNI
138   else if (xd->dev_type == VNET_DPDK_DEV_KNI)
139     {
140       n_buffers = rte_kni_rx_burst(xd->kni, xd->rx_vectors[queue_id], VLIB_FRAME_SIZE);
141       rte_kni_handle_request(xd->kni);
142     }
143 #endif
144   else
145     {
146       ASSERT(0);
147     }
148
149   return n_buffers;
150 }
151
152
153 static inline void
154 dpdk_get_xstats (dpdk_device_t * xd)
155 {
156   int len;
157   if ((len = rte_eth_xstats_get(xd->device_index, NULL, 0)) > 0)
158     {
159       vec_validate(xd->xstats, len - 1);
160       vec_validate(xd->last_cleared_xstats, len - 1);
161
162       len = rte_eth_xstats_get(xd->device_index, xd->xstats, vec_len(xd->xstats));
163
164       ASSERT(vec_len(xd->xstats) == len);
165       ASSERT(vec_len(xd->last_cleared_xstats) == len);
166
167       _vec_len(xd->xstats) = len;
168       _vec_len(xd->last_cleared_xstats) = len;
169
170     }
171 }
172
173
174 static inline void
175 dpdk_update_counters (dpdk_device_t * xd, f64 now)
176 {
177   vlib_simple_counter_main_t * cm;
178   vnet_main_t * vnm = vnet_get_main();
179   u32 my_cpu = os_get_cpu_number();
180   u64 rxerrors, last_rxerrors;
181
182   /* only update counters for PMD interfaces */
183   if (xd->dev_type != VNET_DPDK_DEV_ETH)
184     return;
185
186   /*
187    * DAW-FIXME: VMXNET3 device stop/start doesn't work,
188    * therefore fake the stop in the dpdk driver by
189    * silently dropping all of the incoming pkts instead of
190    * stopping the driver / hardware.
191    */
192   if (xd->admin_up != 0xff)
193     {
194       xd->time_last_stats_update = now ? now : xd->time_last_stats_update;
195       clib_memcpy (&xd->last_stats, &xd->stats, sizeof (xd->last_stats));
196       rte_eth_stats_get (xd->device_index, &xd->stats);
197
198       /* maybe bump interface rx no buffer counter */
199       if (PREDICT_FALSE (xd->stats.rx_nombuf != xd->last_stats.rx_nombuf))
200         {
201           cm = vec_elt_at_index (vnm->interface_main.sw_if_counters,
202                                  VNET_INTERFACE_COUNTER_RX_NO_BUF);
203
204           vlib_increment_simple_counter (cm, my_cpu, xd->vlib_sw_if_index,
205                                          xd->stats.rx_nombuf -
206                                          xd->last_stats.rx_nombuf);
207         }
208
209       /* missed pkt counter */
210       if (PREDICT_FALSE (xd->stats.imissed != xd->last_stats.imissed))
211         {
212           cm = vec_elt_at_index (vnm->interface_main.sw_if_counters,
213                                  VNET_INTERFACE_COUNTER_RX_MISS);
214
215           vlib_increment_simple_counter (cm, my_cpu, xd->vlib_sw_if_index,
216                                          xd->stats.imissed -
217                                          xd->last_stats.imissed);
218         }
219 #if RTE_VERSION >= RTE_VERSION_NUM(2, 2, 0, 0)
220       rxerrors = xd->stats.ierrors;
221       last_rxerrors = xd->last_stats.ierrors;
222 #else
223       rxerrors = xd->stats.ibadcrc
224         + xd->stats.ibadlen + xd->stats.ierrors;
225       last_rxerrors = xd->last_stats.ibadcrc
226         + xd->last_stats.ibadlen + xd->last_stats.ierrors;
227 #endif
228
229       if (PREDICT_FALSE (rxerrors != last_rxerrors))
230         {
231           cm = vec_elt_at_index (vnm->interface_main.sw_if_counters,
232                                  VNET_INTERFACE_COUNTER_RX_ERROR);
233
234           vlib_increment_simple_counter (cm, my_cpu, xd->vlib_sw_if_index,
235                                          rxerrors - last_rxerrors);
236         }
237     }
238
239   dpdk_get_xstats(xd);
240 }