e7d9792bd65889b6a9f092c2f1ea7da981324fe1
[vpp.git] / vnet / vnet / devices / ssvm / node.c
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 #include "ssvm_eth.h"
16
17 vlib_node_registration_t ssvm_eth_input_node;
18
19 typedef struct
20 {
21   u32 next_index;
22   u32 sw_if_index;
23 } ssvm_eth_input_trace_t;
24
25 /* packet trace format function */
26 static u8 *
27 format_ssvm_eth_input_trace (u8 * s, va_list * args)
28 {
29   CLIB_UNUSED (vlib_main_t * vm) = va_arg (*args, vlib_main_t *);
30   CLIB_UNUSED (vlib_node_t * node) = va_arg (*args, vlib_node_t *);
31   ssvm_eth_input_trace_t *t = va_arg (*args, ssvm_eth_input_trace_t *);
32
33   s = format (s, "SSVM_ETH_INPUT: sw_if_index %d, next index %d",
34               t->sw_if_index, t->next_index);
35   return s;
36 }
37
38 vlib_node_registration_t ssvm_eth_input_node;
39
40 #define foreach_ssvm_eth_input_error \
41 _(NO_BUFFERS, "Rx packet drops (no buffers)")
42
43 typedef enum
44 {
45 #define _(sym,str) SSVM_ETH_INPUT_ERROR_##sym,
46   foreach_ssvm_eth_input_error
47 #undef _
48     SSVM_ETH_INPUT_N_ERROR,
49 } ssvm_eth_input_error_t;
50
51 static char *ssvm_eth_input_error_strings[] = {
52 #define _(sym,string) string,
53   foreach_ssvm_eth_input_error
54 #undef _
55 };
56
57 typedef enum
58 {
59   SSVM_ETH_INPUT_NEXT_DROP,
60   SSVM_ETH_INPUT_NEXT_ETHERNET_INPUT,
61   SSVM_ETH_INPUT_NEXT_IP4_INPUT,
62   SSVM_ETH_INPUT_NEXT_IP6_INPUT,
63   SSVM_ETH_INPUT_NEXT_MPLS_INPUT,
64   SSVM_ETH_INPUT_N_NEXT,
65 } ssvm_eth_input_next_t;
66
67 static inline uword
68 ssvm_eth_device_input (ssvm_eth_main_t * em,
69                        ssvm_private_t * intfc, vlib_node_runtime_t * node)
70 {
71   ssvm_shared_header_t *sh = intfc->sh;
72   vlib_main_t *vm = em->vlib_main;
73   unix_shared_memory_queue_t *q;
74   ssvm_eth_queue_elt_t *elt, *elts;
75   u32 elt_index;
76   u32 my_pid = intfc->my_pid;
77   int rx_queue_index;
78   u32 n_to_alloc = VLIB_FRAME_SIZE * 2;
79   u32 n_allocated, n_present_in_cache;
80 #if DPDK > 0
81   u32 next_index = DPDK_RX_NEXT_ETHERNET_INPUT;
82 #else
83   u32 next_index = 0;
84 #endif
85   vlib_buffer_free_list_t *fl;
86   u32 n_left_to_next, *to_next;
87   u32 next0;
88   u32 n_buffers;
89   u32 n_available;
90   u32 bi0, saved_bi0;
91   vlib_buffer_t *b0, *prev;
92   u32 saved_cache_size = 0;
93   ethernet_header_t *eh0;
94   u16 type0;
95   u32 n_rx_bytes = 0, l3_offset0;
96   u32 cpu_index = os_get_cpu_number ();
97   u32 trace_cnt __attribute__ ((unused)) = vlib_get_trace_count (vm, node);
98   volatile u32 *lock;
99   u32 *elt_indices;
100   uword n_trace = vlib_get_trace_count (vm, node);
101
102   /* Either side down? buh-bye... */
103   if (pointer_to_uword (sh->opaque[MASTER_ADMIN_STATE_INDEX]) == 0 ||
104       pointer_to_uword (sh->opaque[SLAVE_ADMIN_STATE_INDEX]) == 0)
105     return 0;
106
107   if (intfc->i_am_master)
108     q = (unix_shared_memory_queue_t *) (sh->opaque[TO_MASTER_Q_INDEX]);
109   else
110     q = (unix_shared_memory_queue_t *) (sh->opaque[TO_SLAVE_Q_INDEX]);
111
112   /* Nothing to do? */
113   if (q->cursize == 0)
114     return 0;
115
116   fl = vlib_buffer_get_free_list (vm, VLIB_BUFFER_DEFAULT_FREE_LIST_INDEX);
117
118   vec_reset_length (intfc->rx_queue);
119
120   lock = (u32 *) q;
121   while (__sync_lock_test_and_set (lock, 1))
122     ;
123   while (q->cursize > 0)
124     {
125       unix_shared_memory_queue_sub_raw (q, (u8 *) & elt_index);
126       ASSERT (elt_index < 2048);
127       vec_add1 (intfc->rx_queue, elt_index);
128     }
129   CLIB_MEMORY_BARRIER ();
130   *lock = 0;
131
132   n_present_in_cache = vec_len (em->buffer_cache);
133
134   if (vec_len (em->buffer_cache) < vec_len (intfc->rx_queue) * 2)
135     {
136       vec_validate (em->buffer_cache,
137                     n_to_alloc + vec_len (em->buffer_cache) - 1);
138       n_allocated =
139         vlib_buffer_alloc (vm, &em->buffer_cache[n_present_in_cache],
140                            n_to_alloc);
141
142       n_present_in_cache += n_allocated;
143       _vec_len (em->buffer_cache) = n_present_in_cache;
144     }
145
146   elts = (ssvm_eth_queue_elt_t *) (sh->opaque[CHUNK_POOL_INDEX]);
147
148   n_buffers = vec_len (intfc->rx_queue);
149   rx_queue_index = 0;
150
151   while (n_buffers > 0)
152     {
153       vlib_get_next_frame (vm, node, next_index, to_next, n_left_to_next);
154
155       while (n_buffers > 0 && n_left_to_next > 0)
156         {
157           elt = elts + intfc->rx_queue[rx_queue_index];
158
159           saved_cache_size = n_present_in_cache;
160           if (PREDICT_FALSE (saved_cache_size == 0))
161             {
162               vlib_put_next_frame (vm, node, next_index, n_left_to_next);
163               goto out;
164             }
165           saved_bi0 = bi0 = em->buffer_cache[--n_present_in_cache];
166           b0 = vlib_get_buffer (vm, bi0);
167           prev = 0;
168
169           while (1)
170             {
171               vlib_buffer_init_for_free_list (b0, fl);
172
173               b0->current_data = elt->current_data_hint;
174               b0->current_length = elt->length_this_buffer;
175               b0->total_length_not_including_first_buffer =
176                 elt->total_length_not_including_first_buffer;
177
178               clib_memcpy (b0->data + b0->current_data, elt->data,
179                            b0->current_length);
180
181               if (PREDICT_FALSE (prev != 0))
182                 prev->next_buffer = bi0;
183
184               if (PREDICT_FALSE (elt->flags & SSVM_BUFFER_NEXT_PRESENT))
185                 {
186                   prev = b0;
187                   if (PREDICT_FALSE (n_present_in_cache == 0))
188                     {
189                       vlib_put_next_frame (vm, node, next_index,
190                                            n_left_to_next);
191                       goto out;
192                     }
193                   bi0 = em->buffer_cache[--n_present_in_cache];
194                   b0 = vlib_get_buffer (vm, bi0);
195                 }
196               else
197                 break;
198             }
199
200           saved_cache_size = n_present_in_cache;
201
202           to_next[0] = saved_bi0;
203           to_next++;
204           n_left_to_next--;
205
206           b0 = vlib_get_buffer (vm, saved_bi0);
207           eh0 = vlib_buffer_get_current (b0);
208
209           type0 = clib_net_to_host_u16 (eh0->type);
210
211           next0 = SSVM_ETH_INPUT_NEXT_ETHERNET_INPUT;
212
213           if (type0 == ETHERNET_TYPE_IP4)
214             next0 = SSVM_ETH_INPUT_NEXT_IP4_INPUT;
215           else if (type0 == ETHERNET_TYPE_IP6)
216             next0 = SSVM_ETH_INPUT_NEXT_IP6_INPUT;
217           else if (type0 == ETHERNET_TYPE_MPLS_UNICAST)
218             next0 = SSVM_ETH_INPUT_NEXT_MPLS_INPUT;
219
220           l3_offset0 = ((next0 == SSVM_ETH_INPUT_NEXT_IP4_INPUT ||
221                          next0 == SSVM_ETH_INPUT_NEXT_IP6_INPUT ||
222                          next0 == SSVM_ETH_INPUT_NEXT_MPLS_INPUT) ?
223                         sizeof (ethernet_header_t) : 0);
224
225           n_rx_bytes += b0->current_length
226             + b0->total_length_not_including_first_buffer;
227
228           b0->current_data += l3_offset0;
229           b0->current_length -= l3_offset0;
230           b0->flags = VLIB_BUFFER_TOTAL_LENGTH_VALID;
231
232           vnet_buffer (b0)->sw_if_index[VLIB_RX] = intfc->vlib_hw_if_index;
233           vnet_buffer (b0)->sw_if_index[VLIB_TX] = (u32) ~ 0;
234
235           /*
236            * Turn this on if you run into
237            * "bad monkey" contexts, and you want to know exactly
238            * which nodes they've visited... See main.c...
239            */
240           VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b0);
241
242           if (PREDICT_FALSE (n_trace > 0))
243             {
244               ssvm_eth_input_trace_t *tr;
245
246               vlib_trace_buffer (vm, node, next0, b0, /* follow_chain */ 1);
247               vlib_set_trace_count (vm, node, --n_trace);
248
249               tr = vlib_add_trace (vm, node, b0, sizeof (*tr));
250
251               tr->next_index = next0;
252               tr->sw_if_index = intfc->vlib_hw_if_index;
253             }
254
255           vlib_validate_buffer_enqueue_x1 (vm, node, next_index,
256                                            to_next, n_left_to_next,
257                                            bi0, next0);
258           n_buffers--;
259           rx_queue_index++;
260         }
261
262       vlib_put_next_frame (vm, node, next_index, n_left_to_next);
263     }
264
265 out:
266   if (em->buffer_cache)
267     _vec_len (em->buffer_cache) = saved_cache_size;
268   else
269     ASSERT (saved_cache_size == 0);
270
271   ssvm_lock (sh, my_pid, 2);
272
273   ASSERT (vec_len (intfc->rx_queue) > 0);
274
275   n_available = (u32) pointer_to_uword (sh->opaque[CHUNK_POOL_NFREE]);
276   elt_indices = (u32 *) (sh->opaque[CHUNK_POOL_FREELIST_INDEX]);
277
278   clib_memcpy (&elt_indices[n_available], intfc->rx_queue,
279                vec_len (intfc->rx_queue) * sizeof (u32));
280
281   n_available += vec_len (intfc->rx_queue);
282   sh->opaque[CHUNK_POOL_NFREE] = uword_to_pointer (n_available, void *);
283
284   ssvm_unlock (sh);
285
286   vlib_error_count (vm, node->node_index, SSVM_ETH_INPUT_ERROR_NO_BUFFERS,
287                     n_buffers);
288
289   vlib_increment_combined_counter
290     (vnet_get_main ()->interface_main.combined_sw_if_counters
291      + VNET_INTERFACE_COUNTER_RX, cpu_index,
292      intfc->vlib_hw_if_index, rx_queue_index, n_rx_bytes);
293
294   return rx_queue_index;
295 }
296
297 static uword
298 ssvm_eth_input_node_fn (vlib_main_t * vm,
299                         vlib_node_runtime_t * node, vlib_frame_t * frame)
300 {
301   ssvm_eth_main_t *em = &ssvm_eth_main;
302   ssvm_private_t *intfc;
303   uword n_rx_packets = 0;
304
305   vec_foreach (intfc, em->intfcs)
306   {
307     n_rx_packets += ssvm_eth_device_input (em, intfc, node);
308   }
309
310   return n_rx_packets;
311 }
312
313 /* *INDENT-OFF* */
314 VLIB_REGISTER_NODE (ssvm_eth_input_node) = {
315   .function = ssvm_eth_input_node_fn,
316   .name = "ssvm_eth_input",
317   .vector_size = sizeof (u32),
318   .format_trace = format_ssvm_eth_input_trace,
319   .type = VLIB_NODE_TYPE_INPUT,
320   .state = VLIB_NODE_STATE_DISABLED,
321
322   .n_errors = ARRAY_LEN(ssvm_eth_input_error_strings),
323   .error_strings = ssvm_eth_input_error_strings,
324
325   .n_next_nodes = SSVM_ETH_INPUT_N_NEXT,
326
327   /* edit / add dispositions here */
328   .next_nodes = {
329         [SSVM_ETH_INPUT_NEXT_DROP] = "error-drop",
330         [SSVM_ETH_INPUT_NEXT_ETHERNET_INPUT] = "ethernet-input",
331         [SSVM_ETH_INPUT_NEXT_IP4_INPUT] = "ip4-input",
332         [SSVM_ETH_INPUT_NEXT_IP6_INPUT] = "ip6-input",
333         [SSVM_ETH_INPUT_NEXT_MPLS_INPUT] = "mpls-gre-input",
334   },
335 };
336
337 VLIB_NODE_FUNCTION_MULTIARCH (ssvm_eth_input_node, ssvm_eth_input_node_fn)
338 /* *INDENT-ON* */
339
340
341 /*
342  * fd.io coding-style-patch-verification: ON
343  *
344  * Local Variables:
345  * eval: (c-set-style "gnu")
346  * End:
347  */