buffers: major cleanup and improvements
[vpp.git] / src / plugins / dpdk / device / device.c
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 #include <vnet/vnet.h>
16 #include <vppinfra/vec.h>
17 #include <vppinfra/format.h>
18 #include <vlib/unix/cj.h>
19 #include <assert.h>
20
21 #include <vnet/ethernet/ethernet.h>
22 #include <dpdk/buffer.h>
23 #include <dpdk/device/dpdk.h>
24 #include <dpdk/device/dpdk_priv.h>
25 #include <vppinfra/error.h>
26
27 #define foreach_dpdk_tx_func_error                      \
28   _(BAD_RETVAL, "DPDK tx function returned an error")   \
29   _(PKT_DROP, "Tx packet drops (dpdk tx failure)")
30
31 typedef enum
32 {
33 #define _(f,s) DPDK_TX_FUNC_ERROR_##f,
34   foreach_dpdk_tx_func_error
35 #undef _
36     DPDK_TX_FUNC_N_ERROR,
37 } dpdk_tx_func_error_t;
38
39 static char *dpdk_tx_func_error_strings[] = {
40 #define _(n,s) s,
41   foreach_dpdk_tx_func_error
42 #undef _
43 };
44
45 static clib_error_t *
46 dpdk_set_mac_address (vnet_hw_interface_t * hi,
47                       const u8 * old_address, const u8 * address)
48 {
49   int error;
50   dpdk_main_t *dm = &dpdk_main;
51   dpdk_device_t *xd = vec_elt_at_index (dm->devices, hi->dev_instance);
52
53   error = rte_eth_dev_default_mac_addr_set (xd->port_id,
54                                             (struct ether_addr *) address);
55
56   if (error)
57     {
58       return clib_error_return (0, "mac address set failed: %d", error);
59     }
60   else
61     {
62       vec_reset_length (xd->default_mac_address);
63       vec_add (xd->default_mac_address, address, sizeof (address));
64       return NULL;
65     }
66 }
67
68 static void
69 dpdk_tx_trace_buffer (dpdk_main_t * dm, vlib_node_runtime_t * node,
70                       dpdk_device_t * xd, u16 queue_id,
71                       vlib_buffer_t * buffer)
72 {
73   vlib_main_t *vm = vlib_get_main ();
74   dpdk_tx_trace_t *t0;
75   struct rte_mbuf *mb;
76
77   mb = rte_mbuf_from_vlib_buffer (buffer);
78
79   t0 = vlib_add_trace (vm, node, buffer, sizeof (t0[0]));
80   t0->queue_index = queue_id;
81   t0->device_index = xd->device_index;
82   t0->buffer_index = vlib_get_buffer_index (vm, buffer);
83   clib_memcpy_fast (&t0->mb, mb, sizeof (t0->mb));
84   clib_memcpy_fast (&t0->buffer, buffer,
85                     sizeof (buffer[0]) - sizeof (buffer->pre_data));
86   clib_memcpy_fast (t0->buffer.pre_data, buffer->data + buffer->current_data,
87                     sizeof (t0->buffer.pre_data));
88   clib_memcpy_fast (&t0->data, mb->buf_addr + mb->data_off,
89                     sizeof (t0->data));
90 }
91
92 static_always_inline void
93 dpdk_validate_rte_mbuf (vlib_main_t * vm, vlib_buffer_t * b,
94                         int maybe_multiseg)
95 {
96   struct rte_mbuf *mb, *first_mb, *last_mb;
97
98   /* buffer is coming from non-dpdk source so we need to init
99      rte_mbuf header */
100   if (PREDICT_FALSE ((b->flags & VLIB_BUFFER_EXT_HDR_VALID) == 0))
101     {
102       vlib_buffer_t *b2 = b;
103       last_mb = mb = rte_mbuf_from_vlib_buffer (b2);
104       rte_pktmbuf_reset (mb);
105       while (maybe_multiseg && (b2->flags & VLIB_BUFFER_NEXT_PRESENT))
106         {
107           b2 = vlib_get_buffer (vm, b2->next_buffer);
108           mb = rte_mbuf_from_vlib_buffer (b2);
109           rte_pktmbuf_reset (mb);
110         }
111     }
112
113   last_mb = first_mb = mb = rte_mbuf_from_vlib_buffer (b);
114   first_mb->nb_segs = 1;
115   mb->data_len = b->current_length;
116   mb->pkt_len = maybe_multiseg ? vlib_buffer_length_in_chain (vm, b) :
117     b->current_length;
118   mb->data_off = VLIB_BUFFER_PRE_DATA_SIZE + b->current_data;
119
120   while (maybe_multiseg && (b->flags & VLIB_BUFFER_NEXT_PRESENT))
121     {
122       b = vlib_get_buffer (vm, b->next_buffer);
123       mb = rte_mbuf_from_vlib_buffer (b);
124       last_mb->next = mb;
125       last_mb = mb;
126       mb->data_len = b->current_length;
127       mb->pkt_len = b->current_length;
128       mb->data_off = VLIB_BUFFER_PRE_DATA_SIZE + b->current_data;
129       first_mb->nb_segs++;
130       if (PREDICT_FALSE (b->ref_count > 1))
131         mb->pool =
132           dpdk_no_cache_mempool_by_buffer_pool_index[b->buffer_pool_index];
133     }
134 }
135
136 /*
137  * This function calls the dpdk's tx_burst function to transmit the packets.
138  * It manages a lock per-device if the device does not
139  * support multiple queues. It returns the number of packets untransmitted
140  * If all packets are transmitted (the normal case), the function returns 0.
141  */
142 static_always_inline
143   u32 tx_burst_vector_internal (vlib_main_t * vm,
144                                 dpdk_device_t * xd,
145                                 struct rte_mbuf **mb, u32 n_left)
146 {
147   dpdk_main_t *dm = &dpdk_main;
148   u32 n_retry;
149   int n_sent = 0;
150   int queue_id;
151
152   n_retry = 16;
153   queue_id = vm->thread_index;
154
155   do
156     {
157       /*
158        * This device only supports one TX queue,
159        * and we're running multi-threaded...
160        */
161       if (PREDICT_FALSE (xd->lockp != 0))
162         {
163           queue_id = queue_id % xd->tx_q_used;
164           while (clib_atomic_test_and_set (xd->lockp[queue_id]))
165             /* zzzz */
166             queue_id = (queue_id + 1) % xd->tx_q_used;
167         }
168
169       if (PREDICT_FALSE (xd->flags & DPDK_DEVICE_FLAG_HQOS))    /* HQoS ON */
170         {
171           /* no wrap, transmit in one burst */
172           dpdk_device_hqos_per_worker_thread_t *hqos =
173             &xd->hqos_wt[vm->thread_index];
174
175           ASSERT (hqos->swq != NULL);
176
177           dpdk_hqos_metadata_set (hqos, mb, n_left);
178           n_sent = rte_ring_sp_enqueue_burst (hqos->swq, (void **) mb,
179                                               n_left, 0);
180         }
181       else if (PREDICT_TRUE (xd->flags & DPDK_DEVICE_FLAG_PMD))
182         {
183           /* no wrap, transmit in one burst */
184           n_sent = rte_eth_tx_burst (xd->port_id, queue_id, mb, n_left);
185         }
186       else
187         {
188           ASSERT (0);
189           n_sent = 0;
190         }
191
192       if (PREDICT_FALSE (xd->lockp != 0))
193         clib_atomic_release (xd->lockp[queue_id]);
194
195       if (PREDICT_FALSE (n_sent < 0))
196         {
197           // emit non-fatal message, bump counter
198           vnet_main_t *vnm = dm->vnet_main;
199           vnet_interface_main_t *im = &vnm->interface_main;
200           u32 node_index;
201
202           node_index = vec_elt_at_index (im->hw_interfaces,
203                                          xd->hw_if_index)->tx_node_index;
204
205           vlib_error_count (vm, node_index, DPDK_TX_FUNC_ERROR_BAD_RETVAL, 1);
206           clib_warning ("rte_eth_tx_burst[%d]: error %d",
207                         xd->port_id, n_sent);
208           return n_left;        // untransmitted packets
209         }
210       n_left -= n_sent;
211       mb += n_sent;
212     }
213   while (n_sent && n_left && (n_retry > 0));
214
215   return n_left;
216 }
217
218 static_always_inline void
219 dpdk_prefetch_buffer (vlib_main_t * vm, struct rte_mbuf *mb)
220 {
221   vlib_buffer_t *b = vlib_buffer_from_rte_mbuf (mb);
222   CLIB_PREFETCH (mb, 2 * CLIB_CACHE_LINE_BYTES, STORE);
223   CLIB_PREFETCH (b, CLIB_CACHE_LINE_BYTES, LOAD);
224 }
225
226 static_always_inline void
227 dpdk_buffer_tx_offload (dpdk_device_t * xd, vlib_buffer_t * b,
228                         struct rte_mbuf *mb)
229 {
230   u32 ip_cksum = b->flags & VNET_BUFFER_F_OFFLOAD_IP_CKSUM;
231   u32 tcp_cksum = b->flags & VNET_BUFFER_F_OFFLOAD_TCP_CKSUM;
232   u32 udp_cksum = b->flags & VNET_BUFFER_F_OFFLOAD_UDP_CKSUM;
233   int is_ip4 = b->flags & VNET_BUFFER_F_IS_IP4;
234   u64 ol_flags;
235
236   /* Is there any work for us? */
237   if (PREDICT_TRUE ((ip_cksum | tcp_cksum | udp_cksum) == 0))
238     return;
239
240   mb->l2_len = vnet_buffer (b)->l3_hdr_offset - b->current_data;
241   mb->l3_len = vnet_buffer (b)->l4_hdr_offset -
242     vnet_buffer (b)->l3_hdr_offset;
243   mb->outer_l3_len = 0;
244   mb->outer_l2_len = 0;
245   ol_flags = is_ip4 ? PKT_TX_IPV4 : PKT_TX_IPV6;
246   ol_flags |= ip_cksum ? PKT_TX_IP_CKSUM : 0;
247   ol_flags |= tcp_cksum ? PKT_TX_TCP_CKSUM : 0;
248   ol_flags |= udp_cksum ? PKT_TX_UDP_CKSUM : 0;
249   mb->ol_flags |= ol_flags;
250
251   /* we are trying to help compiler here by using local ol_flags with known
252      state of all flags */
253   if (xd->flags & DPDK_DEVICE_FLAG_INTEL_PHDR_CKSUM)
254     rte_net_intel_cksum_flags_prepare (mb, ol_flags);
255 }
256
257 /*
258  * Transmits the packets on the frame to the interface associated with the
259  * node. It first copies packets on the frame to a per-thread arrays
260  * containing the rte_mbuf pointers.
261  */
262 VNET_DEVICE_CLASS_TX_FN (dpdk_device_class) (vlib_main_t * vm,
263                                              vlib_node_runtime_t * node,
264                                              vlib_frame_t * f)
265 {
266   dpdk_main_t *dm = &dpdk_main;
267   vnet_interface_output_runtime_t *rd = (void *) node->runtime_data;
268   dpdk_device_t *xd = vec_elt_at_index (dm->devices, rd->dev_instance);
269   u32 n_packets = f->n_vectors;
270   u32 n_left;
271   u32 *from;
272   u32 thread_index = vm->thread_index;
273   int queue_id = thread_index;
274   u32 tx_pkts = 0, all_or_flags = 0;
275   dpdk_per_thread_data_t *ptd = vec_elt_at_index (dm->per_thread_data,
276                                                   thread_index);
277   struct rte_mbuf **mb;
278   vlib_buffer_t *b[4];
279
280   from = vlib_frame_vector_args (f);
281
282   ASSERT (n_packets <= VLIB_FRAME_SIZE);
283
284   /* TX PCAP tracing */
285   if (PREDICT_FALSE (dm->pcap[VLIB_TX].pcap_enable))
286     {
287       n_left = n_packets;
288       while (n_left > 0)
289         {
290           u32 bi0 = from[0];
291           vlib_buffer_t *b0 = vlib_get_buffer (vm, bi0);
292           if (dm->pcap[VLIB_TX].pcap_sw_if_index == 0 ||
293               dm->pcap[VLIB_TX].pcap_sw_if_index
294               == vnet_buffer (b0)->sw_if_index[VLIB_TX])
295             pcap_add_buffer (&dm->pcap[VLIB_TX].pcap_main, vm, bi0, 512);
296           from++;
297           n_left--;
298         }
299     }
300
301   /* calculate rte_mbuf pointers out of buffer indices */
302   vlib_get_buffers_with_offset (vm, vlib_frame_vector_args (f),
303                                 (void **) ptd->mbufs, n_packets,
304                                 -(i32) sizeof (struct rte_mbuf));
305
306   from = vlib_frame_vector_args (f);
307   n_left = n_packets;
308   mb = ptd->mbufs;
309
310   while (n_left >= 8)
311     {
312       u32 or_flags;
313
314       dpdk_prefetch_buffer (vm, mb[4]);
315       dpdk_prefetch_buffer (vm, mb[5]);
316       dpdk_prefetch_buffer (vm, mb[6]);
317       dpdk_prefetch_buffer (vm, mb[7]);
318
319       b[0] = vlib_buffer_from_rte_mbuf (mb[0]);
320       b[1] = vlib_buffer_from_rte_mbuf (mb[1]);
321       b[2] = vlib_buffer_from_rte_mbuf (mb[2]);
322       b[3] = vlib_buffer_from_rte_mbuf (mb[3]);
323
324       or_flags = b[0]->flags | b[1]->flags | b[2]->flags | b[3]->flags;
325       all_or_flags |= or_flags;
326
327       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[0]);
328       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[1]);
329       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[2]);
330       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[3]);
331
332       if (or_flags & VLIB_BUFFER_NEXT_PRESENT)
333         {
334           dpdk_validate_rte_mbuf (vm, b[0], 1);
335           dpdk_validate_rte_mbuf (vm, b[1], 1);
336           dpdk_validate_rte_mbuf (vm, b[2], 1);
337           dpdk_validate_rte_mbuf (vm, b[3], 1);
338         }
339       else
340         {
341           dpdk_validate_rte_mbuf (vm, b[0], 0);
342           dpdk_validate_rte_mbuf (vm, b[1], 0);
343           dpdk_validate_rte_mbuf (vm, b[2], 0);
344           dpdk_validate_rte_mbuf (vm, b[3], 0);
345         }
346
347       if (PREDICT_FALSE ((xd->flags & DPDK_DEVICE_FLAG_TX_OFFLOAD) &&
348                          (or_flags &
349                           (VNET_BUFFER_F_OFFLOAD_TCP_CKSUM
350                            | VNET_BUFFER_F_OFFLOAD_IP_CKSUM
351                            | VNET_BUFFER_F_OFFLOAD_UDP_CKSUM))))
352         {
353           dpdk_buffer_tx_offload (xd, b[0], mb[0]);
354           dpdk_buffer_tx_offload (xd, b[1], mb[1]);
355           dpdk_buffer_tx_offload (xd, b[2], mb[2]);
356           dpdk_buffer_tx_offload (xd, b[3], mb[3]);
357         }
358
359       if (PREDICT_FALSE (node->flags & VLIB_NODE_FLAG_TRACE))
360         {
361           if (b[0]->flags & VLIB_BUFFER_IS_TRACED)
362             dpdk_tx_trace_buffer (dm, node, xd, queue_id, b[0]);
363           if (b[1]->flags & VLIB_BUFFER_IS_TRACED)
364             dpdk_tx_trace_buffer (dm, node, xd, queue_id, b[1]);
365           if (b[2]->flags & VLIB_BUFFER_IS_TRACED)
366             dpdk_tx_trace_buffer (dm, node, xd, queue_id, b[2]);
367           if (b[3]->flags & VLIB_BUFFER_IS_TRACED)
368             dpdk_tx_trace_buffer (dm, node, xd, queue_id, b[3]);
369         }
370
371       mb += 4;
372       n_left -= 4;
373     }
374   while (n_left > 0)
375     {
376       b[0] = vlib_buffer_from_rte_mbuf (mb[0]);
377       all_or_flags |= b[0]->flags;
378       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[0]);
379
380       dpdk_validate_rte_mbuf (vm, b[0], 1);
381       dpdk_buffer_tx_offload (xd, b[0], mb[0]);
382
383       if (PREDICT_FALSE (node->flags & VLIB_NODE_FLAG_TRACE))
384         if (b[0]->flags & VLIB_BUFFER_IS_TRACED)
385           dpdk_tx_trace_buffer (dm, node, xd, queue_id, b[0]);
386
387       mb++;
388       n_left--;
389     }
390
391   /* transmit as many packets as possible */
392   tx_pkts = n_packets = mb - ptd->mbufs;
393   n_left = tx_burst_vector_internal (vm, xd, ptd->mbufs, n_packets);
394
395   {
396     /* If there is no callback then drop any non-transmitted packets */
397     if (PREDICT_FALSE (n_left))
398       {
399         tx_pkts -= n_left;
400         vlib_simple_counter_main_t *cm;
401         vnet_main_t *vnm = vnet_get_main ();
402
403         cm = vec_elt_at_index (vnm->interface_main.sw_if_counters,
404                                VNET_INTERFACE_COUNTER_TX_ERROR);
405
406         vlib_increment_simple_counter (cm, thread_index, xd->sw_if_index,
407                                        n_left);
408
409         vlib_error_count (vm, node->node_index, DPDK_TX_FUNC_ERROR_PKT_DROP,
410                           n_left);
411
412         while (n_left--)
413           rte_pktmbuf_free (ptd->mbufs[n_packets - n_left - 1]);
414       }
415   }
416
417   return tx_pkts;
418 }
419
420 static void
421 dpdk_clear_hw_interface_counters (u32 instance)
422 {
423   dpdk_main_t *dm = &dpdk_main;
424   dpdk_device_t *xd = vec_elt_at_index (dm->devices, instance);
425
426   /*
427    * Set the "last_cleared_stats" to the current stats, so that
428    * things appear to clear from a display perspective.
429    */
430   dpdk_update_counters (xd, vlib_time_now (dm->vlib_main));
431
432   clib_memcpy_fast (&xd->last_cleared_stats, &xd->stats, sizeof (xd->stats));
433   clib_memcpy_fast (xd->last_cleared_xstats, xd->xstats,
434                     vec_len (xd->last_cleared_xstats) *
435                     sizeof (xd->last_cleared_xstats[0]));
436
437 }
438
439 static clib_error_t *
440 dpdk_interface_admin_up_down (vnet_main_t * vnm, u32 hw_if_index, u32 flags)
441 {
442   vnet_hw_interface_t *hif = vnet_get_hw_interface (vnm, hw_if_index);
443   uword is_up = (flags & VNET_SW_INTERFACE_FLAG_ADMIN_UP) != 0;
444   dpdk_main_t *dm = &dpdk_main;
445   dpdk_device_t *xd = vec_elt_at_index (dm->devices, hif->dev_instance);
446
447   if (xd->flags & DPDK_DEVICE_FLAG_PMD_INIT_FAIL)
448     return clib_error_return (0, "Interface not initialized");
449
450   if (is_up)
451     {
452       if ((xd->flags & DPDK_DEVICE_FLAG_ADMIN_UP) == 0)
453         dpdk_device_start (xd);
454       xd->flags |= DPDK_DEVICE_FLAG_ADMIN_UP;
455       f64 now = vlib_time_now (dm->vlib_main);
456       dpdk_update_counters (xd, now);
457       dpdk_update_link_state (xd, now);
458     }
459   else
460     {
461       vnet_hw_interface_set_flags (vnm, xd->hw_if_index, 0);
462       if ((xd->flags & DPDK_DEVICE_FLAG_ADMIN_UP) != 0)
463         dpdk_device_stop (xd);
464       xd->flags &= ~DPDK_DEVICE_FLAG_ADMIN_UP;
465     }
466
467   return /* no error */ 0;
468 }
469
470 /*
471  * Dynamically redirect all pkts from a specific interface
472  * to the specified node
473  */
474 static void
475 dpdk_set_interface_next_node (vnet_main_t * vnm, u32 hw_if_index,
476                               u32 node_index)
477 {
478   dpdk_main_t *xm = &dpdk_main;
479   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
480   dpdk_device_t *xd = vec_elt_at_index (xm->devices, hw->dev_instance);
481
482   /* Shut off redirection */
483   if (node_index == ~0)
484     {
485       xd->per_interface_next_index = node_index;
486       return;
487     }
488
489   xd->per_interface_next_index =
490     vlib_node_add_next (xm->vlib_main, dpdk_input_node.index, node_index);
491 }
492
493
494 static clib_error_t *
495 dpdk_subif_add_del_function (vnet_main_t * vnm,
496                              u32 hw_if_index,
497                              struct vnet_sw_interface_t *st, int is_add)
498 {
499   dpdk_main_t *xm = &dpdk_main;
500   vnet_hw_interface_t *hw = vnet_get_hw_interface (vnm, hw_if_index);
501   dpdk_device_t *xd = vec_elt_at_index (xm->devices, hw->dev_instance);
502   vnet_sw_interface_t *t = (vnet_sw_interface_t *) st;
503   int r, vlan_offload;
504   u32 prev_subifs = xd->num_subifs;
505   clib_error_t *err = 0;
506
507   if (is_add)
508     xd->num_subifs++;
509   else if (xd->num_subifs)
510     xd->num_subifs--;
511
512   if ((xd->flags & DPDK_DEVICE_FLAG_PMD) == 0)
513     goto done;
514
515   /* currently we program VLANS only for IXGBE VF and I40E VF */
516   if ((xd->pmd != VNET_DPDK_PMD_IXGBEVF) && (xd->pmd != VNET_DPDK_PMD_I40EVF))
517     goto done;
518
519   if (t->sub.eth.flags.no_tags == 1)
520     goto done;
521
522   if ((t->sub.eth.flags.one_tag != 1) || (t->sub.eth.flags.exact_match != 1))
523     {
524       xd->num_subifs = prev_subifs;
525       err = clib_error_return (0, "unsupported VLAN setup");
526       goto done;
527     }
528
529   vlan_offload = rte_eth_dev_get_vlan_offload (xd->port_id);
530   vlan_offload |= ETH_VLAN_FILTER_OFFLOAD;
531
532   if ((r = rte_eth_dev_set_vlan_offload (xd->port_id, vlan_offload)))
533     {
534       xd->num_subifs = prev_subifs;
535       err = clib_error_return (0, "rte_eth_dev_set_vlan_offload[%d]: err %d",
536                                xd->port_id, r);
537       goto done;
538     }
539
540
541   if ((r =
542        rte_eth_dev_vlan_filter (xd->port_id,
543                                 t->sub.eth.outer_vlan_id, is_add)))
544     {
545       xd->num_subifs = prev_subifs;
546       err = clib_error_return (0, "rte_eth_dev_vlan_filter[%d]: err %d",
547                                xd->port_id, r);
548       goto done;
549     }
550
551 done:
552   if (xd->num_subifs)
553     xd->flags |= DPDK_DEVICE_FLAG_HAVE_SUBIF;
554   else
555     xd->flags &= ~DPDK_DEVICE_FLAG_HAVE_SUBIF;
556
557   return err;
558 }
559
560 /* *INDENT-OFF* */
561 VNET_DEVICE_CLASS (dpdk_device_class) = {
562   .name = "dpdk",
563   .tx_function_n_errors = DPDK_TX_FUNC_N_ERROR,
564   .tx_function_error_strings = dpdk_tx_func_error_strings,
565   .format_device_name = format_dpdk_device_name,
566   .format_device = format_dpdk_device,
567   .format_tx_trace = format_dpdk_tx_trace,
568   .clear_counters = dpdk_clear_hw_interface_counters,
569   .admin_up_down_function = dpdk_interface_admin_up_down,
570   .subif_add_del_function = dpdk_subif_add_del_function,
571   .rx_redirect_to_node = dpdk_set_interface_next_node,
572   .mac_addr_change_function = dpdk_set_mac_address,
573   .format_flow = format_dpdk_flow,
574   .flow_ops_function = dpdk_flow_ops_fn,
575 };
576 /* *INDENT-ON* */
577
578 #define UP_DOWN_FLAG_EVENT 1
579
580 static uword
581 admin_up_down_process (vlib_main_t * vm,
582                        vlib_node_runtime_t * rt, vlib_frame_t * f)
583 {
584   clib_error_t *error = 0;
585   uword event_type;
586   uword *event_data = 0;
587   u32 sw_if_index;
588   u32 flags;
589
590   while (1)
591     {
592       vlib_process_wait_for_event (vm);
593
594       event_type = vlib_process_get_events (vm, &event_data);
595
596       dpdk_main.admin_up_down_in_progress = 1;
597
598       switch (event_type)
599         {
600         case UP_DOWN_FLAG_EVENT:
601           {
602             if (vec_len (event_data) == 2)
603               {
604                 sw_if_index = event_data[0];
605                 flags = event_data[1];
606                 error =
607                   vnet_sw_interface_set_flags (vnet_get_main (), sw_if_index,
608                                                flags);
609                 clib_error_report (error);
610               }
611           }
612           break;
613         }
614
615       vec_reset_length (event_data);
616
617       dpdk_main.admin_up_down_in_progress = 0;
618
619     }
620   return 0;                     /* or not */
621 }
622
623 /* *INDENT-OFF* */
624 VLIB_REGISTER_NODE (admin_up_down_process_node) = {
625     .function = admin_up_down_process,
626     .type = VLIB_NODE_TYPE_PROCESS,
627     .name = "admin-up-down-process",
628     .process_log2_n_stack_bytes = 17,  // 256KB
629 };
630 /* *INDENT-ON* */
631
632 /*
633  * fd.io coding-style-patch-verification: ON
634  *
635  * Local Variables:
636  * eval: (c-set-style "gnu")
637  * End:
638  */