79ca2faf164b037bc0a2d91a637a8b140f669a17
[vpp.git] / src / vnet / bonding / device.c
1 /*
2  *------------------------------------------------------------------
3  * Copyright (c) 2017 Cisco and/or its affiliates.
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  *------------------------------------------------------------------
16  */
17
18 #define _GNU_SOURCE
19 #include <stdint.h>
20 #include <vnet/ethernet/ethernet.h>
21 #include <vnet/ip/ip4_packet.h>
22 #include <vnet/ip/ip6_packet.h>
23 #include <vnet/ip/ip6_hop_by_hop_packet.h>
24 #include <vnet/bonding/node.h>
25 #include <vppinfra/lb_hash_hash.h>
26 #include <vnet/ip/ip.h>
27 #include <vnet/ethernet/arp_packet.h>
28
29 #define foreach_bond_tx_error     \
30   _(NONE, "no error")             \
31   _(IF_DOWN, "interface down")    \
32   _(NO_SLAVE, "no slave")
33
34 typedef enum
35 {
36 #define _(f,s) BOND_TX_ERROR_##f,
37   foreach_bond_tx_error
38 #undef _
39     BOND_TX_N_ERROR,
40 } bond_tx_error_t;
41
42 static char *bond_tx_error_strings[] = {
43 #define _(n,s) s,
44   foreach_bond_tx_error
45 #undef _
46 };
47
48 static u8 *
49 format_bond_tx_trace (u8 * s, va_list * args)
50 {
51   CLIB_UNUSED (vlib_main_t * vm) = va_arg (*args, vlib_main_t *);
52   CLIB_UNUSED (vlib_node_t * node) = va_arg (*args, vlib_node_t *);
53   bond_packet_trace_t *t = va_arg (*args, bond_packet_trace_t *);
54   vnet_hw_interface_t *hw, *hw1;
55   vnet_main_t *vnm = vnet_get_main ();
56
57   hw = vnet_get_sup_hw_interface (vnm, t->sw_if_index);
58   hw1 = vnet_get_sup_hw_interface (vnm, t->bond_sw_if_index);
59   s = format (s, "src %U, dst %U, %s -> %s",
60               format_ethernet_address, t->ethernet.src_address,
61               format_ethernet_address, t->ethernet.dst_address,
62               hw->name, hw1->name);
63
64   return s;
65 }
66
67 #ifndef CLIB_MARCH_VARIANT
68 u8 *
69 format_bond_interface_name (u8 * s, va_list * args)
70 {
71   u32 dev_instance = va_arg (*args, u32);
72   bond_main_t *bm = &bond_main;
73   bond_if_t *bif = pool_elt_at_index (bm->interfaces, dev_instance);
74
75   s = format (s, "BondEthernet%lu", bif->dev_instance);
76
77   return s;
78 }
79 #endif
80
81 static __clib_unused clib_error_t *
82 bond_set_l2_mode_function (vnet_main_t * vnm,
83                            struct vnet_hw_interface_t *bif_hw,
84                            i32 l2_if_adjust)
85 {
86   bond_if_t *bif;
87   u32 *sw_if_index;
88   struct vnet_hw_interface_t *sif_hw;
89
90   bif = bond_get_master_by_sw_if_index (bif_hw->sw_if_index);
91   if (!bif)
92     return 0;
93
94   if ((bif_hw->l2_if_count == 1) && (l2_if_adjust == 1))
95     {
96       /* Just added first L2 interface on this port */
97       vec_foreach (sw_if_index, bif->slaves)
98       {
99         sif_hw = vnet_get_sup_hw_interface (vnm, *sw_if_index);
100         ethernet_set_flags (vnm, sif_hw->hw_if_index,
101                             ETHERNET_INTERFACE_FLAG_ACCEPT_ALL);
102
103         /* ensure all packets go to ethernet-input */
104         ethernet_set_rx_redirect (vnm, sif_hw, 1);
105       }
106     }
107
108   return 0;
109 }
110
111 static __clib_unused clib_error_t *
112 bond_subif_add_del_function (vnet_main_t * vnm, u32 hw_if_index,
113                              struct vnet_sw_interface_t *st, int is_add)
114 {
115   /* Nothing for now */
116   return 0;
117 }
118
119 static clib_error_t *
120 bond_interface_admin_up_down (vnet_main_t * vnm, u32 hw_if_index, u32 flags)
121 {
122   vnet_hw_interface_t *hif = vnet_get_hw_interface (vnm, hw_if_index);
123   uword is_up = (flags & VNET_SW_INTERFACE_FLAG_ADMIN_UP) != 0;
124   bond_main_t *bm = &bond_main;
125   bond_if_t *bif = pool_elt_at_index (bm->interfaces, hif->dev_instance);
126
127   bif->admin_up = is_up;
128   if (is_up && vec_len (bif->active_slaves))
129     vnet_hw_interface_set_flags (vnm, bif->hw_if_index,
130                                  VNET_HW_INTERFACE_FLAG_LINK_UP);
131   return 0;
132 }
133
134 static_always_inline u32
135 bond_load_balance_broadcast (vlib_main_t * vm, vlib_node_runtime_t * node,
136                              bond_if_t * bif, vlib_buffer_t * b0,
137                              uword slave_count)
138 {
139   bond_main_t *bm = &bond_main;
140   vlib_buffer_t *c0;
141   int port;
142   u32 sw_if_index;
143   u16 thread_index = vm->thread_index;
144   bond_per_thread_data_t *ptd = vec_elt_at_index (bm->per_thread_data,
145                                                   thread_index);
146
147   for (port = 1; port < slave_count; port++)
148     {
149       sw_if_index = *vec_elt_at_index (bif->active_slaves, port);
150       c0 = vlib_buffer_copy (vm, b0);
151       if (PREDICT_TRUE (c0 != 0))
152         {
153           vnet_buffer (c0)->sw_if_index[VLIB_TX] = sw_if_index;
154           ptd->per_port_queue[sw_if_index].buffers[ptd->per_port_queue
155                                                    [sw_if_index].n_buffers] =
156             vlib_get_buffer_index (vm, c0);
157           ptd->per_port_queue[sw_if_index].n_buffers++;
158         }
159     }
160
161   return 0;
162 }
163
164 static_always_inline u32
165 bond_load_balance_l2 (vlib_main_t * vm, vlib_node_runtime_t * node,
166                       bond_if_t * bif, vlib_buffer_t * b0, uword slave_count)
167 {
168   ethernet_header_t *eth = (ethernet_header_t *) vlib_buffer_get_current (b0);
169   u32 c;
170   u64 *dst = (u64 *) & eth->dst_address[0];
171   u64 a = clib_mem_unaligned (dst, u64);
172   u32 *src = (u32 *) & eth->src_address[2];
173   u32 b = clib_mem_unaligned (src, u32);
174
175   c = lb_hash_hash_2_tuples (a, b);
176
177   if (BOND_MODULO_SHORTCUT (slave_count))
178     return (c & (slave_count - 1));
179   else
180     return c % slave_count;
181 }
182
183 static_always_inline u16 *
184 bond_locate_ethertype (ethernet_header_t * eth)
185 {
186   u16 *ethertype_p;
187   ethernet_vlan_header_t *vlan;
188
189   if (!ethernet_frame_is_tagged (clib_net_to_host_u16 (eth->type)))
190     {
191       ethertype_p = &eth->type;
192     }
193   else
194     {
195       vlan = (void *) (eth + 1);
196       ethertype_p = &vlan->type;
197       if (*ethertype_p == ntohs (ETHERNET_TYPE_VLAN))
198         {
199           vlan++;
200           ethertype_p = &vlan->type;
201         }
202     }
203   return ethertype_p;
204 }
205
206 static_always_inline u32
207 bond_load_balance_l23 (vlib_main_t * vm, vlib_node_runtime_t * node,
208                        bond_if_t * bif, vlib_buffer_t * b0, uword slave_count)
209 {
210   ethernet_header_t *eth = (ethernet_header_t *) vlib_buffer_get_current (b0);
211   u8 ip_version;
212   ip4_header_t *ip4;
213   u16 ethertype, *ethertype_p;
214   u32 *mac1, *mac2, *mac3;
215
216   ethertype_p = bond_locate_ethertype (eth);
217   ethertype = clib_mem_unaligned (ethertype_p, u16);
218
219   if ((ethertype != htons (ETHERNET_TYPE_IP4)) &&
220       (ethertype != htons (ETHERNET_TYPE_IP6)))
221     return (bond_load_balance_l2 (vm, node, bif, b0, slave_count));
222
223   ip4 = (ip4_header_t *) (ethertype_p + 1);
224   ip_version = (ip4->ip_version_and_header_length >> 4);
225
226   if (ip_version == 0x4)
227     {
228       u32 a, c;
229
230       mac1 = (u32 *) & eth->dst_address[0];
231       mac2 = (u32 *) & eth->dst_address[4];
232       mac3 = (u32 *) & eth->src_address[2];
233
234       a = clib_mem_unaligned (mac1, u32) ^ clib_mem_unaligned (mac2, u32) ^
235         clib_mem_unaligned (mac3, u32);
236       c =
237         lb_hash_hash_2_tuples (clib_mem_unaligned (&ip4->address_pair, u64),
238                                a);
239       if (BOND_MODULO_SHORTCUT (slave_count))
240         return (c & (slave_count - 1));
241       else
242         return c % slave_count;
243     }
244   else if (ip_version == 0x6)
245     {
246       u64 a;
247       u32 c;
248       ip6_header_t *ip6 = (ip6_header_t *) (eth + 1);
249
250       mac1 = (u32 *) & eth->dst_address[0];
251       mac2 = (u32 *) & eth->dst_address[4];
252       mac3 = (u32 *) & eth->src_address[2];
253
254       a = clib_mem_unaligned (mac1, u32) ^ clib_mem_unaligned (mac2, u32) ^
255         clib_mem_unaligned (mac3, u32);
256       c =
257         lb_hash_hash (clib_mem_unaligned
258                       (&ip6->src_address.as_uword[0], uword),
259                       clib_mem_unaligned (&ip6->src_address.as_uword[1],
260                                           uword),
261                       clib_mem_unaligned (&ip6->dst_address.as_uword[0],
262                                           uword),
263                       clib_mem_unaligned (&ip6->dst_address.as_uword[1],
264                                           uword), a);
265       if (BOND_MODULO_SHORTCUT (slave_count))
266         return (c & (slave_count - 1));
267       else
268         return c % slave_count;
269     }
270   return (bond_load_balance_l2 (vm, node, bif, b0, slave_count));
271 }
272
273 static_always_inline u32
274 bond_load_balance_l34 (vlib_main_t * vm, vlib_node_runtime_t * node,
275                        bond_if_t * bif, vlib_buffer_t * b0, uword slave_count)
276 {
277   ethernet_header_t *eth = (ethernet_header_t *) vlib_buffer_get_current (b0);
278   u8 ip_version;
279   uword is_tcp_udp;
280   ip4_header_t *ip4;
281   u16 ethertype, *ethertype_p;
282
283   ethertype_p = bond_locate_ethertype (eth);
284   ethertype = clib_mem_unaligned (ethertype_p, u16);
285
286   if ((ethertype != htons (ETHERNET_TYPE_IP4)) &&
287       (ethertype != htons (ETHERNET_TYPE_IP6)))
288     return (bond_load_balance_l2 (vm, node, bif, b0, slave_count));
289
290   ip4 = (ip4_header_t *) (ethertype_p + 1);
291   ip_version = (ip4->ip_version_and_header_length >> 4);
292
293   if (ip_version == 0x4)
294     {
295       u32 a, c, t1, t2;
296       tcp_header_t *tcp = (void *) (ip4 + 1);
297
298       is_tcp_udp = (ip4->protocol == IP_PROTOCOL_TCP) ||
299         (ip4->protocol == IP_PROTOCOL_UDP);
300       t1 = is_tcp_udp ? clib_mem_unaligned (&tcp->src, u16) : 0;
301       t2 = is_tcp_udp ? clib_mem_unaligned (&tcp->dst, u16) : 0;
302       a = t1 ^ t2;
303       c =
304         lb_hash_hash_2_tuples (clib_mem_unaligned (&ip4->address_pair, u64),
305                                a);
306       if (BOND_MODULO_SHORTCUT (slave_count))
307         return (c & (slave_count - 1));
308       else
309         return c % slave_count;
310     }
311   else if (ip_version == 0x6)
312     {
313       u64 a;
314       u32 c, t1, t2;
315       ip6_header_t *ip6 = (ip6_header_t *) (eth + 1);
316       tcp_header_t *tcp = (void *) (ip6 + 1);
317
318       is_tcp_udp = 0;
319       if (PREDICT_TRUE ((ip6->protocol == IP_PROTOCOL_TCP) ||
320                         (ip6->protocol == IP_PROTOCOL_UDP)))
321         {
322           is_tcp_udp = 1;
323           tcp = (void *) (ip6 + 1);
324         }
325       else if (ip6->protocol == IP_PROTOCOL_IP6_HOP_BY_HOP_OPTIONS)
326         {
327           ip6_hop_by_hop_header_t *hbh =
328             (ip6_hop_by_hop_header_t *) (ip6 + 1);
329           if ((hbh->protocol == IP_PROTOCOL_TCP)
330               || (hbh->protocol == IP_PROTOCOL_UDP))
331             {
332               is_tcp_udp = 1;
333               tcp = (tcp_header_t *) ((u8 *) hbh + ((hbh->length + 1) << 3));
334             }
335         }
336       t1 = is_tcp_udp ? clib_mem_unaligned (&tcp->src, u16) : 0;
337       t2 = is_tcp_udp ? clib_mem_unaligned (&tcp->dst, u16) : 0;
338       a = t1 ^ t2;
339       c =
340         lb_hash_hash (clib_mem_unaligned
341                       (&ip6->src_address.as_uword[0], uword),
342                       clib_mem_unaligned (&ip6->src_address.as_uword[1],
343                                           uword),
344                       clib_mem_unaligned (&ip6->dst_address.as_uword[0],
345                                           uword),
346                       clib_mem_unaligned (&ip6->dst_address.as_uword[1],
347                                           uword), a);
348       if (BOND_MODULO_SHORTCUT (slave_count))
349         return (c & (slave_count - 1));
350       else
351         return c % slave_count;
352     }
353
354   return (bond_load_balance_l2 (vm, node, bif, b0, slave_count));
355 }
356
357 static_always_inline u32
358 bond_load_balance_round_robin (vlib_main_t * vm,
359                                vlib_node_runtime_t * node,
360                                bond_if_t * bif, vlib_buffer_t * b0,
361                                uword slave_count)
362 {
363   bif->lb_rr_last_index++;
364   if (BOND_MODULO_SHORTCUT (slave_count))
365     bif->lb_rr_last_index &= slave_count - 1;
366   else
367     bif->lb_rr_last_index %= slave_count;
368
369   return bif->lb_rr_last_index;
370 }
371
372 static_always_inline u32
373 bond_load_balance_active_backup (vlib_main_t * vm,
374                                  vlib_node_runtime_t * node,
375                                  bond_if_t * bif, vlib_buffer_t * b0,
376                                  uword slave_count)
377 {
378   /* First interface is the active, the rest is backup */
379   return 0;
380 }
381
382 static bond_load_balance_func_t bond_load_balance_table[] = {
383 #define _(v,f,s, p) { bond_load_balance_##p },
384   foreach_bond_lb_algo
385 #undef _
386 };
387
388 VNET_DEVICE_CLASS_TX_FN (bond_dev_class) (vlib_main_t * vm,
389                                           vlib_node_runtime_t * node,
390                                           vlib_frame_t * frame)
391 {
392   vnet_interface_output_runtime_t *rund = (void *) node->runtime_data;
393   bond_main_t *bm = &bond_main;
394   bond_if_t *bif = pool_elt_at_index (bm->interfaces, rund->dev_instance);
395   vlib_buffer_t *bufs[VLIB_FRAME_SIZE], **b;
396   u32 *from = vlib_frame_vector_args (frame);
397   ethernet_header_t *eth;
398   u32 n_left;
399   u32 sw_if_index;
400   bond_packet_trace_t *t0;
401   uword n_trace = vlib_get_trace_count (vm, node);
402   u16 thread_index = vm->thread_index;
403   vnet_main_t *vnm = vnet_get_main ();
404   u32 *to_next;
405   vlib_frame_t *f;
406   uword slave_count;
407   u32 port0 = 0, port1 = 0, port2 = 0, port3 = 0;
408   bond_per_thread_data_t *ptd = vec_elt_at_index (bm->per_thread_data,
409                                                   thread_index);
410
411   if (PREDICT_FALSE (bif->admin_up == 0))
412     {
413       vlib_buffer_free (vm, vlib_frame_args (frame), frame->n_vectors);
414       vlib_increment_simple_counter (vnet_main.interface_main.sw_if_counters +
415                                      VNET_INTERFACE_COUNTER_DROP,
416                                      thread_index, bif->sw_if_index,
417                                      frame->n_vectors);
418       vlib_error_count (vm, node->node_index, BOND_TX_ERROR_IF_DOWN,
419                         frame->n_vectors);
420       return frame->n_vectors;
421     }
422
423   n_left = frame->n_vectors;
424   vlib_get_buffers (vm, from, bufs, n_left);
425
426   slave_count = vec_len (bif->active_slaves);
427   if (PREDICT_FALSE (slave_count == 0))
428     {
429       vlib_buffer_free (vm, vlib_frame_args (frame), frame->n_vectors);
430       vlib_increment_simple_counter (vnet_main.interface_main.sw_if_counters +
431                                      VNET_INTERFACE_COUNTER_DROP,
432                                      thread_index, bif->sw_if_index,
433                                      frame->n_vectors);
434       vlib_error_count (vm, node->node_index, BOND_TX_ERROR_NO_SLAVE,
435                         frame->n_vectors);
436       return frame->n_vectors;
437     }
438
439   b = bufs;
440   while (n_left >= 4)
441     {
442       u32 sif_if_index0, sif_if_index1, sif_if_index2, sif_if_index3;
443
444       // Prefetch next iteration
445       if (n_left >= 8)
446         {
447           vlib_buffer_t **pb = b + 4;
448
449           vlib_prefetch_buffer_header (pb[0], LOAD);
450           vlib_prefetch_buffer_header (pb[1], LOAD);
451           vlib_prefetch_buffer_header (pb[2], LOAD);
452           vlib_prefetch_buffer_header (pb[3], LOAD);
453
454           CLIB_PREFETCH (pb[0]->data, CLIB_CACHE_LINE_BYTES, LOAD);
455           CLIB_PREFETCH (pb[1]->data, CLIB_CACHE_LINE_BYTES, LOAD);
456           CLIB_PREFETCH (pb[2]->data, CLIB_CACHE_LINE_BYTES, LOAD);
457           CLIB_PREFETCH (pb[3]->data, CLIB_CACHE_LINE_BYTES, LOAD);
458         }
459
460       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[0]);
461       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[1]);
462       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[2]);
463       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[3]);
464
465       if (PREDICT_TRUE (slave_count > 1))
466         {
467           port0 =
468             (bond_load_balance_table[bif->lb]).load_balance (vm, node,
469                                                              bif, b[0],
470                                                              slave_count);
471           port1 =
472             (bond_load_balance_table[bif->lb]).load_balance (vm, node,
473                                                              bif, b[1],
474                                                              slave_count);
475           port2 =
476             (bond_load_balance_table[bif->lb]).load_balance (vm, node,
477                                                              bif, b[2],
478                                                              slave_count);
479           port3 =
480             (bond_load_balance_table[bif->lb]).load_balance (vm, node,
481                                                              bif, b[3],
482                                                              slave_count);
483         }
484
485       sif_if_index0 = *vec_elt_at_index (bif->active_slaves, port0);
486       sif_if_index1 = *vec_elt_at_index (bif->active_slaves, port1);
487       sif_if_index2 = *vec_elt_at_index (bif->active_slaves, port2);
488       sif_if_index3 = *vec_elt_at_index (bif->active_slaves, port3);
489
490       /* Do the tracing before the interface is overwritten */
491       if (PREDICT_FALSE (n_trace > 0))
492         {
493           u32 next0 = 0, next1 = 0, next2 = 0, next3 = 0;
494           vlib_trace_buffer (vm, node, next0, b[0], 0 /* follow_chain */ );
495           vlib_set_trace_count (vm, node, --n_trace);
496           t0 = vlib_add_trace (vm, node, b[0], sizeof (*t0));
497           eth = (ethernet_header_t *) vlib_buffer_get_current (b[0]);
498           t0->ethernet = *eth;
499           t0->sw_if_index = vnet_buffer (b[0])->sw_if_index[VLIB_TX];
500           t0->bond_sw_if_index = sif_if_index0;
501
502           if (PREDICT_TRUE (n_trace > 0))
503             {
504               vlib_trace_buffer (vm, node, next1, b[1],
505                                  0 /* follow_chain */ );
506               vlib_set_trace_count (vm, node, --n_trace);
507               t0 = vlib_add_trace (vm, node, b[1], sizeof (*t0));
508               eth = (ethernet_header_t *) vlib_buffer_get_current (b[1]);
509               t0->ethernet = *eth;
510               t0->sw_if_index = vnet_buffer (b[1])->sw_if_index[VLIB_TX];
511               t0->bond_sw_if_index = sif_if_index1;
512
513               if (PREDICT_TRUE (n_trace > 0))
514                 {
515                   vlib_trace_buffer (vm, node, next2, b[2],
516                                      0 /* follow_chain */ );
517                   vlib_set_trace_count (vm, node, --n_trace);
518                   t0 = vlib_add_trace (vm, node, b[2], sizeof (*t0));
519                   eth = (ethernet_header_t *) vlib_buffer_get_current (b[2]);
520                   t0->ethernet = *eth;
521                   t0->sw_if_index = vnet_buffer (b[2])->sw_if_index[VLIB_TX];
522                   t0->bond_sw_if_index = sif_if_index2;
523
524                   if (PREDICT_TRUE (n_trace > 0))
525                     {
526                       vlib_trace_buffer (vm, node, next3, b[3],
527                                          0 /* follow_chain */ );
528                       vlib_set_trace_count (vm, node, --n_trace);
529                       t0 = vlib_add_trace (vm, node, b[3], sizeof (*t0));
530                       eth =
531                         (ethernet_header_t *) vlib_buffer_get_current (b[3]);
532                       t0->ethernet = *eth;
533                       t0->sw_if_index =
534                         vnet_buffer (b[3])->sw_if_index[VLIB_TX];
535                       t0->bond_sw_if_index = sif_if_index3;
536                     }
537                 }
538             }
539         }
540
541       vnet_buffer (b[0])->sw_if_index[VLIB_TX] = sif_if_index0;
542       vnet_buffer (b[1])->sw_if_index[VLIB_TX] = sif_if_index1;
543       vnet_buffer (b[2])->sw_if_index[VLIB_TX] = sif_if_index2;
544       vnet_buffer (b[3])->sw_if_index[VLIB_TX] = sif_if_index3;
545
546       ptd->per_port_queue[sif_if_index0].buffers[ptd->per_port_queue
547                                                  [sif_if_index0].n_buffers] =
548         vlib_get_buffer_index (vm, b[0]);
549       ptd->per_port_queue[sif_if_index0].n_buffers++;
550
551       ptd->per_port_queue[sif_if_index1].buffers[ptd->per_port_queue
552                                                  [sif_if_index1].n_buffers] =
553         vlib_get_buffer_index (vm, b[1]);
554       ptd->per_port_queue[sif_if_index1].n_buffers++;
555
556       ptd->per_port_queue[sif_if_index2].buffers[ptd->per_port_queue
557                                                  [sif_if_index2].n_buffers] =
558         vlib_get_buffer_index (vm, b[2]);
559       ptd->per_port_queue[sif_if_index2].n_buffers++;
560
561       ptd->per_port_queue[sif_if_index3].buffers[ptd->per_port_queue
562                                                  [sif_if_index3].n_buffers] =
563         vlib_get_buffer_index (vm, b[3]);
564       ptd->per_port_queue[sif_if_index3].n_buffers++;
565
566       n_left -= 4;
567       b += 4;
568     }
569
570   while (n_left > 0)
571     {
572       u32 sif_if_index0;
573
574       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b[0]);
575
576       if (PREDICT_TRUE (slave_count > 1))
577         port0 =
578           (bond_load_balance_table[bif->lb]).load_balance (vm, node, bif,
579                                                            b[0], slave_count);
580       sif_if_index0 = *vec_elt_at_index (bif->active_slaves, port0);
581
582       /* Do the tracing before the old interface is overwritten */
583       if (PREDICT_FALSE (n_trace > 0))
584         {
585           u32 next0 = 0;
586
587           vlib_trace_buffer (vm, node, next0, b[0], 0 /* follow_chain */ );
588           vlib_set_trace_count (vm, node, --n_trace);
589           t0 = vlib_add_trace (vm, node, b[0], sizeof (*t0));
590           eth = (ethernet_header_t *) vlib_buffer_get_current (b[0]);
591           t0->ethernet = *eth;
592           t0->sw_if_index = vnet_buffer (b[0])->sw_if_index[VLIB_TX];
593           t0->bond_sw_if_index = sif_if_index0;
594         }
595
596       vnet_buffer (b[0])->sw_if_index[VLIB_TX] = sif_if_index0;
597
598       ptd->per_port_queue[sif_if_index0].buffers[ptd->per_port_queue
599                                                  [sif_if_index0].n_buffers] =
600         vlib_get_buffer_index (vm, b[0]);
601       ptd->per_port_queue[sif_if_index0].n_buffers++;
602
603       n_left -= 1;
604       b += 1;
605     }
606
607   for (port0 = 0; port0 < slave_count; port0++)
608     {
609       sw_if_index = *vec_elt_at_index (bif->active_slaves, port0);
610       if (PREDICT_TRUE (ptd->per_port_queue[sw_if_index].n_buffers))
611         {
612           f = vnet_get_frame_to_sw_interface (vnm, sw_if_index);
613           f->n_vectors = ptd->per_port_queue[sw_if_index].n_buffers;
614           to_next = vlib_frame_vector_args (f);
615           clib_memcpy (to_next, ptd->per_port_queue[sw_if_index].buffers,
616                        f->n_vectors << 2);
617           vnet_put_frame_to_sw_interface (vnm, sw_if_index, f);
618           ptd->per_port_queue[sw_if_index].n_buffers = 0;
619         }
620     }
621
622   vlib_increment_simple_counter (vnet_main.interface_main.sw_if_counters
623                                  + VNET_INTERFACE_COUNTER_TX, thread_index,
624                                  bif->sw_if_index, frame->n_vectors);
625
626   return frame->n_vectors;
627 }
628
629 static walk_rc_t
630 bond_active_interface_switch_cb (vnet_main_t * vnm, u32 sw_if_index,
631                                  void *arg)
632 {
633   bond_main_t *bm = &bond_main;
634
635   send_ip4_garp (bm->vlib_main, sw_if_index);
636   send_ip6_na (bm->vlib_main, sw_if_index);
637
638   return (WALK_CONTINUE);
639 }
640
641 static uword
642 bond_process (vlib_main_t * vm, vlib_node_runtime_t * rt, vlib_frame_t * f)
643 {
644   vnet_main_t *vnm = vnet_get_main ();
645   uword event_type, *event_data = 0;
646
647   while (1)
648     {
649       u32 i;
650       u32 hw_if_index;
651
652       vlib_process_wait_for_event (vm);
653       event_type = vlib_process_get_events (vm, &event_data);
654       ASSERT (event_type == BOND_SEND_GARP_NA);
655       for (i = 0; i < vec_len (event_data); i++)
656         {
657           hw_if_index = event_data[i];
658           /* walk hw interface to process all subinterfaces */
659           vnet_hw_interface_walk_sw (vnm, hw_if_index,
660                                      bond_active_interface_switch_cb, 0);
661         }
662       vec_reset_length (event_data);
663     }
664   return 0;
665 }
666
667 /* *INDENT-OFF* */
668 VLIB_REGISTER_NODE (bond_process_node) = {
669   .function = bond_process,
670   .type = VLIB_NODE_TYPE_PROCESS,
671   .name = "bond-process",
672 };
673 /* *INDENT-ON* */
674
675 /* *INDENT-OFF* */
676 VNET_DEVICE_CLASS (bond_dev_class) = {
677   .name = "bond",
678   .tx_function_n_errors = BOND_TX_N_ERROR,
679   .tx_function_error_strings = bond_tx_error_strings,
680   .format_device_name = format_bond_interface_name,
681   .set_l2_mode_function = bond_set_l2_mode_function,
682   .admin_up_down_function = bond_interface_admin_up_down,
683   .subif_add_del_function = bond_subif_add_del_function,
684   .format_tx_trace = format_bond_tx_trace,
685 };
686
687 /* *INDENT-ON* */
688
689 /*
690  * fd.io coding-style-patch-verification: ON
691  *
692  * Local Variables:
693  * eval: (c-set-style "gnu")
694  * End:
695  */