Add clib_memcpy macro based on DPDK rte_memcpy implementation
[vpp.git] / vlib / vlib / node.c
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 /*
16  * node.c: VLIB processing nodes
17  *
18  * Copyright (c) 2008 Eliot Dresselhaus
19  *
20  * Permission is hereby granted, free of charge, to any person obtaining
21  * a copy of this software and associated documentation files (the
22  * "Software"), to deal in the Software without restriction, including
23  * without limitation the rights to use, copy, modify, merge, publish,
24  * distribute, sublicense, and/or sell copies of the Software, and to
25  * permit persons to whom the Software is furnished to do so, subject to
26  * the following conditions:
27  *
28  * The above copyright notice and this permission notice shall be
29  * included in all copies or substantial portions of the Software.
30  *
31  *  THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
32  *  EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
33  *  MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
34  *  NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
35  *  LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
36  *  OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
37  *  WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
38  */
39
40 #include <vlib/vlib.h>
41 #include <vlib/threads.h>
42
43 /* Query node given name. */
44 vlib_node_t * vlib_get_node_by_name (vlib_main_t * vm, u8 * name)
45 {
46   vlib_node_main_t * nm = &vm->node_main;
47   uword * p;
48   u8 * key = name;
49   if (! clib_mem_is_heap_object (key))
50     key = format (0, "%s", key);
51   p = hash_get (nm->node_by_name, key);
52   if (key != name)
53     vec_free (key);
54   return p ? vec_elt (nm->nodes, p[0]) : 0;
55 }
56
57 static void node_set_elog_name (vlib_main_t * vm, uword node_index)
58 {
59   vlib_node_t * n = vlib_get_node (vm, node_index);
60   elog_event_type_t * t;
61
62   t = vec_elt_at_index (vm->node_call_elog_event_types, node_index);
63   vec_free (t->format);
64   t->format = (char *) format (0, "%v-call: %%d%c", n->name, 0);
65
66   t = vec_elt_at_index (vm->node_return_elog_event_types, node_index);
67   vec_free (t->format);
68   t->format = (char *) format (0, "%v-return: %%d%c", n->name, 0);
69
70   n->name_elog_string = elog_string (&vm->elog_main, "%v%c", n->name,0);
71 }
72
73 void vlib_node_rename (vlib_main_t * vm, u32 node_index, char * fmt, ...)
74 {
75   va_list va;
76   vlib_node_main_t * nm = &vm->node_main;
77   vlib_node_t * n = vlib_get_node (vm, node_index);
78
79   va_start (va, fmt);
80   hash_unset (nm->node_by_name, n->name);
81   vec_free (n->name);
82   n->name = va_format (0, fmt, &va);
83   va_end (va);
84   hash_set (nm->node_by_name, n->name, n->index);
85
86   node_set_elog_name (vm, node_index);
87 }
88
89 static void
90 vlib_node_runtime_update (vlib_main_t * vm,
91                           u32 node_index,
92                           u32 next_index)
93 {
94   vlib_node_main_t * nm = &vm->node_main;
95   vlib_node_runtime_t * r, * s;
96   vlib_node_t * node, * next_node;
97   vlib_next_frame_t * nf;
98   vlib_pending_frame_t * pf;
99   i32 i, j, n_insert;
100
101   ASSERT(os_get_cpu_number() == 0);
102
103   vlib_worker_thread_barrier_sync(vm);
104
105   node = vec_elt (nm->nodes, node_index);
106   r = vlib_node_get_runtime (vm, node_index);
107
108   n_insert = vec_len (node->next_nodes) - r->n_next_nodes;
109   if (n_insert > 0)
110     {
111       i = r->next_frame_index + r->n_next_nodes;
112       vec_insert (nm->next_frames, n_insert, i);
113
114       /* Initialize newly inserted next frames. */
115       for (j = 0; j < n_insert; j++)
116         vlib_next_frame_init (nm->next_frames + i + j);
117
118       /* Relocate other next frames at higher indices. */
119       for (j = 0; j < vec_len (nm->nodes); j++)
120         {
121           s = vlib_node_get_runtime (vm, j);
122           if (j != node_index
123               && s->next_frame_index >= i)
124             s->next_frame_index += n_insert;
125         }
126
127       /* Pending frames may need to be relocated also. */
128       vec_foreach (pf, nm->pending_frames)
129         {
130           if (pf->next_frame_index != VLIB_PENDING_FRAME_NO_NEXT_FRAME
131               && pf->next_frame_index >= i)
132             pf->next_frame_index += n_insert;
133         }
134       pool_foreach (pf, nm->suspended_process_frames, ({
135           if (pf->next_frame_index != ~0 && pf->next_frame_index >= i)
136             pf->next_frame_index += n_insert;
137       }));
138
139       r->n_next_nodes = vec_len (node->next_nodes);
140     }
141
142   /* Set frame's node runtime index. */
143   next_node = vlib_get_node (vm, node->next_nodes[next_index]);
144   nf = nm->next_frames + r->next_frame_index + next_index;
145   nf->node_runtime_index = next_node->runtime_index;
146
147   vlib_worker_thread_node_runtime_update();
148
149   vlib_worker_thread_barrier_release(vm);
150 }
151
152 /* Add next node to given node in given slot. */
153 uword
154 vlib_node_add_next_with_slot (vlib_main_t * vm,
155                               uword node_index,
156                               uword next_node_index,
157                               uword slot)
158 {
159   vlib_node_main_t * nm = &vm->node_main;
160   vlib_node_t * node, * next;
161   uword * p;
162
163   node = vec_elt (nm->nodes, node_index);
164   next = vec_elt (nm->nodes, next_node_index);
165
166   /* Fill in static next nodes if runtime has yet to be initialized. */
167   if (slot == ~0 && ! (nm->flags & VLIB_NODE_MAIN_RUNTIME_STARTED))
168     {
169       uword i;
170       for (i = 0; i < vec_len (node->next_node_names); i++)
171         {
172           char * a = node->next_node_names[i];
173           if (a)
174             vlib_node_add_named_next_with_slot (vm, node->index, a, i);
175         }
176     }
177
178   if ((p = hash_get (node->next_slot_by_node, next_node_index)))
179     {
180       /* Next already exists: use it if slot not specified or the same. */
181       if ((slot == ~0) || (slot == p[0]))
182           return p[0];
183     }
184
185   if (slot == ~0)
186     slot = vec_len (node->next_nodes);
187
188   vec_validate_init_empty (node->next_nodes, slot, ~0);
189   vec_validate (node->n_vectors_by_next_node, slot);
190
191   node->next_nodes[slot] = next_node_index;
192   if (!p) hash_set (node->next_slot_by_node, next_node_index, slot);
193
194   vlib_node_runtime_update (vm, node_index, slot);
195
196   next->prev_node_bitmap = clib_bitmap_ori (next->prev_node_bitmap,
197                                             node_index);
198
199   /* Siblings all get same node structure. */
200   {
201     uword sib_node_index, sib_slot;
202     vlib_node_t * sib_node;
203     clib_bitmap_foreach (sib_node_index, node->sibling_bitmap, ({
204       sib_node = vec_elt (nm->nodes, sib_node_index);
205       if (sib_node != node)
206         {
207           sib_slot = vlib_node_add_next_with_slot (vm, sib_node_index, next_node_index, slot);
208           ASSERT (sib_slot == slot);
209         }
210     }));
211   }
212
213   return slot;
214 }
215
216 /* Add named next node to given node in given slot. */
217 uword
218 vlib_node_add_named_next_with_slot (vlib_main_t * vm,
219                                     uword node,
220                                     char * name,
221                                     uword slot)
222 {
223   vlib_node_main_t * nm;
224   vlib_node_t * n, * n_next;
225
226   nm = &vm->node_main;
227   n = vlib_get_node (vm, node);
228
229   n_next = vlib_get_node_by_name (vm, (u8 *) name);
230   if (! n_next)
231     {
232       if (nm->flags & VLIB_NODE_MAIN_RUNTIME_STARTED)
233         return ~0;
234
235       if (slot == ~0)
236         slot = clib_max (vec_len (n->next_node_names),
237                          vec_len (n->next_nodes));
238       vec_validate (n->next_node_names, slot);
239       n->next_node_names[slot] = name;
240       return slot;
241     }
242
243   return vlib_node_add_next_with_slot (vm, node, n_next->index, slot);
244 }
245
246 static void node_elog_init (vlib_main_t * vm, uword ni)
247 {
248   elog_event_type_t t;
249
250   memset (&t, 0, sizeof (t));
251
252   /* 2 event types for this node: one when node function is called.
253      One when it returns. */
254   vec_validate (vm->node_call_elog_event_types, ni);
255   vm->node_call_elog_event_types[ni] = t;
256
257   vec_validate (vm->node_return_elog_event_types, ni);
258   vm->node_return_elog_event_types[ni] = t;
259
260   node_set_elog_name (vm, ni);
261 }
262
263 #ifdef CLIB_UNIX
264 #define STACK_ALIGN (clib_mem_get_page_size())
265 #else
266 #define STACK_ALIGN CLIB_CACHE_LINE_BYTES
267 #endif
268
269 static void register_node (vlib_main_t * vm,
270                            vlib_node_registration_t * r)
271 {
272   vlib_node_main_t * nm = &vm->node_main;
273   vlib_node_t * n;
274   u32 page_size = clib_mem_get_page_size();
275   int i;
276
277   if (CLIB_DEBUG > 0)
278     {
279       /* Default (0) type should match INTERNAL. */
280       vlib_node_t zero = {0};
281       ASSERT (VLIB_NODE_TYPE_INTERNAL == zero.type);
282     }
283
284   ASSERT (r->function != 0);
285
286   n = clib_mem_alloc_no_fail (sizeof (n[0]));
287   memset (n, 0, sizeof (n[0]));
288   n->index = vec_len (nm->nodes);
289
290   vec_add1 (nm->nodes, n);
291         
292   /* Name is always a vector so it can be formatted with %v. */
293   if (clib_mem_is_heap_object (vec_header (r->name, 0)))
294     n->name = vec_dup ((u8 *) r->name);
295   else
296     n->name = format (0, "%s", r->name);
297
298   if (! nm->node_by_name)
299     nm->node_by_name = hash_create_vec (/* size */ 32,
300                                         sizeof (n->name[0]),
301                                         sizeof (uword));
302
303   /* Node names must be unique. */
304   {
305     vlib_node_t * o = vlib_get_node_by_name (vm, n->name);
306     if (o)
307       clib_error ("more than one node named `%v'", n->name);
308   }
309
310   hash_set (nm->node_by_name, n->name, n->index);
311
312   r->index = n->index;          /* save index in registration */
313   n->function = r->function;
314
315   /* Node index of next sibling will be filled in by vlib_node_main_init. */
316   n->sibling_of = r->sibling_of;
317
318   if (r->type == VLIB_NODE_TYPE_INTERNAL)
319     ASSERT (r->vector_size > 0);
320
321 #define _(f) n->f = r->f
322
323   _ (type);
324   _ (flags);
325   _ (state);
326   _ (scalar_size);
327   _ (vector_size);
328   _ (format_buffer);
329   _ (unformat_buffer);
330   _ (format_trace);
331   _ (validate_frame);
332
333   /* Register error counters. */
334   vlib_register_errors (vm, n->index, r->n_errors, r->error_strings);
335   node_elog_init (vm, n->index);
336
337   _ (runtime_data_bytes);
338   if (r->runtime_data_bytes > 0)
339     {
340       vec_resize (n->runtime_data, r->runtime_data_bytes);
341       if (r->runtime_data)
342         clib_memcpy (n->runtime_data, r->runtime_data, r->runtime_data_bytes);
343     }
344
345   vec_resize (n->next_node_names, r->n_next_nodes);
346   for (i = 0; i < r->n_next_nodes; i++)
347     n->next_node_names[i] = r->next_nodes[i];
348
349   vec_validate_init_empty (n->next_nodes, r->n_next_nodes - 1, ~0);
350   vec_validate (n->n_vectors_by_next_node, r->n_next_nodes - 1);
351
352   n->owner_node_index = n->owner_next_index = ~0;
353
354   /* Initialize node runtime. */
355   {
356     vlib_node_runtime_t * rt;
357     u32 i;
358
359     if (n->type == VLIB_NODE_TYPE_PROCESS)
360       {
361         vlib_process_t * p;
362         uword log2_n_stack_bytes;
363
364         log2_n_stack_bytes = clib_max (r->process_log2_n_stack_bytes, 15);
365
366 #ifdef CLIB_UNIX
367         /* 
368          * Bump the stack size if running over a kernel with a large page size,
369          * and the stack isn't any too big to begin with. Otherwise, we'll
370          * trip over the stack guard page for sure.
371          */
372         if ((page_size > (4<<10)) && log2_n_stack_bytes < 19)
373           {
374             if ((1<<log2_n_stack_bytes) <= page_size)
375               log2_n_stack_bytes = min_log2 (page_size) + 1;
376             else
377               log2_n_stack_bytes++;
378           }
379 #endif
380
381         p = clib_mem_alloc_aligned_at_offset 
382             (sizeof (p[0]) + (1 << log2_n_stack_bytes),
383              STACK_ALIGN, STRUCT_OFFSET_OF (vlib_process_t, stack));
384         if (p == 0)
385             clib_panic ("failed to allocate process stack (%d bytes)", 1<<log2_n_stack_bytes);
386
387         memset (p, 0, sizeof (p[0]));
388         p->log2_n_stack_bytes = log2_n_stack_bytes;
389
390         /* Process node's runtime index is really index into process
391            pointer vector. */
392         n->runtime_index = vec_len (nm->processes);
393
394         vec_add1 (nm->processes, p);
395
396         /* Paint first stack word with magic number so we can at least
397            detect process stack overruns. */
398         p->stack[0] = VLIB_PROCESS_STACK_MAGIC;
399
400         /* Node runtime is stored inside of process. */
401         rt = &p->node_runtime;
402
403 #ifdef CLIB_UNIX
404         /* 
405          * Disallow writes to the bottom page of the stack, to
406          * catch stack overflows.
407          */
408         if (mprotect (p->stack, page_size, PROT_READ) < 0)
409             clib_unix_warning ("process stack");
410 #endif
411
412       }
413     else
414       {
415         vec_add2_aligned (nm->nodes_by_type[n->type], rt, 1,
416                           /* align */ CLIB_CACHE_LINE_BYTES);
417         n->runtime_index = rt - nm->nodes_by_type[n->type];
418       }
419
420     if (n->type == VLIB_NODE_TYPE_INPUT)
421       nm->input_node_counts_by_state[n->state] += 1;
422
423     rt->function = n->function;
424     rt->flags = n->flags;
425     rt->state = n->state;
426     rt->node_index = n->index;
427
428     rt->n_next_nodes = r->n_next_nodes;
429     rt->next_frame_index = vec_len (nm->next_frames);
430
431     vec_resize (nm->next_frames, rt->n_next_nodes);
432     for (i = 0; i < rt->n_next_nodes; i++)
433       vlib_next_frame_init (nm->next_frames + rt->next_frame_index + i);
434
435     vec_resize (rt->errors, r->n_errors);
436     for (i = 0; i < vec_len (rt->errors); i++)
437       rt->errors[i] = vlib_error_set (n->index, i);
438
439     ASSERT (vec_len (n->runtime_data) <= sizeof (rt->runtime_data));
440     if (vec_len (n->runtime_data) > 0)
441       clib_memcpy (rt->runtime_data, n->runtime_data, vec_len (n->runtime_data));
442
443     vec_free (n->runtime_data);
444   }
445 }
446
447 /* Register new packet processing node. */
448 u32 vlib_register_node (vlib_main_t * vm, vlib_node_registration_t * r)
449 {
450   register_node (vm, r);
451   return r->index;
452 }
453
454 void vlib_register_all_static_nodes (vlib_main_t * vm)
455 {
456   vlib_node_registration_t * r;
457   
458   r = vm->node_main.node_registrations;
459   while (r) {
460     register_node (vm, r);
461     r = r->next_registration;
462   }
463 }
464
465 clib_error_t *
466 vlib_node_main_init (vlib_main_t * vm)
467 {
468   vlib_node_main_t * nm = &vm->node_main;
469   clib_error_t * error = 0;
470   vlib_node_t * n;
471   uword ni;
472
473   nm->flags |= VLIB_NODE_MAIN_RUNTIME_STARTED;
474
475   /* Resolve next names into next indices. */
476   for (ni = 0; ni < vec_len (nm->nodes); ni++)
477     {
478       uword i;
479
480       n = vec_elt (nm->nodes, ni);
481
482       for (i = 0; i < vec_len (n->next_node_names); i++)
483         {
484           char * a = n->next_node_names[i];
485
486           if (! a)
487             continue;
488
489           if (~0 == vlib_node_add_named_next_with_slot (vm, n->index, a, i))
490             {
491               error = clib_error_create
492                 ("node `%v' refers to unknown node `%s'", n->name, a);
493               goto done;
494             }
495         }
496
497       vec_free (n->next_node_names);
498     }
499
500   /* Set previous node pointers. */
501   for (ni = 0; ni < vec_len (nm->nodes); ni++)
502     {
503       vlib_node_t * n_next;
504       uword i;
505
506       n = vec_elt (nm->nodes, ni);
507
508       for (i = 0; i < vec_len (n->next_nodes); i++)
509         {
510           if (n->next_nodes[i] >= vec_len (nm->nodes))
511             continue;
512
513           n_next = vec_elt (nm->nodes, n->next_nodes[i]);
514           n_next->prev_node_bitmap =
515             clib_bitmap_ori (n_next->prev_node_bitmap, n->index);
516         }
517     }
518
519   {
520     vlib_next_frame_t * nf;
521     vlib_node_runtime_t * r;
522     vlib_node_t * next;
523     uword i;
524
525     vec_foreach (r, nm->nodes_by_type[VLIB_NODE_TYPE_INTERNAL])
526       {
527         if (r->n_next_nodes == 0)
528           continue;
529
530         n = vlib_get_node (vm, r->node_index);
531         nf = vec_elt_at_index (nm->next_frames, r->next_frame_index);
532
533         for (i = 0; i < vec_len (n->next_nodes); i++)
534           {
535             next = vlib_get_node (vm, n->next_nodes[i]);
536
537             /* Validate node runtime indices are correctly initialized. */
538             ASSERT (nf[i].node_runtime_index == next->runtime_index);
539
540             nf[i].flags = 0;
541             if (next->flags & VLIB_NODE_FLAG_FRAME_NO_FREE_AFTER_DISPATCH)
542               nf[i].flags |= VLIB_FRAME_NO_FREE_AFTER_DISPATCH;
543           }
544       }
545   }
546
547   /* Generate node sibling relationships. */
548   {
549     vlib_node_t * n, * sib;
550     uword si;
551
552     for (ni = 0; ni < vec_len (nm->nodes); ni++)
553       {
554         n = vec_elt (nm->nodes, ni);
555
556         if (! n->sibling_of)
557           continue;
558
559         sib = vlib_get_node_by_name (vm, (u8 *) n->sibling_of);
560         if (! sib)
561           clib_error ("sibling `%s' not found for node `%v'", n->sibling_of, n->name);
562
563         clib_bitmap_foreach (si, sib->sibling_bitmap, ({
564           vlib_node_t * m = vec_elt (nm->nodes, si);
565
566           /* Connect all of sibling's siblings to us. */
567           m->sibling_bitmap = clib_bitmap_ori (m->sibling_bitmap, n->index);
568
569           /* Connect us to all of sibling's siblings. */
570           n->sibling_bitmap = clib_bitmap_ori (n->sibling_bitmap, si);
571         }));
572
573         /* Connect sibling to us. */
574         sib->sibling_bitmap = clib_bitmap_ori (sib->sibling_bitmap, n->index);
575
576         /* Connect us to sibling. */
577         n->sibling_bitmap = clib_bitmap_ori (n->sibling_bitmap, sib->index);
578       }
579   }
580
581  done:
582   return error;
583 }