perfmon: new perfmon plugin
[vpp.git] / src / vlib / main.c
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 /*
16  * main.c: main vector processing loop
17  *
18  * Copyright (c) 2008 Eliot Dresselhaus
19  *
20  * Permission is hereby granted, free of charge, to any person obtaining
21  * a copy of this software and associated documentation files (the
22  * "Software"), to deal in the Software without restriction, including
23  * without limitation the rights to use, copy, modify, merge, publish,
24  * distribute, sublicense, and/or sell copies of the Software, and to
25  * permit persons to whom the Software is furnished to do so, subject to
26  * the following conditions:
27  *
28  * The above copyright notice and this permission notice shall be
29  * included in all copies or substantial portions of the Software.
30  *
31  *  THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
32  *  EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
33  *  MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
34  *  NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
35  *  LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
36  *  OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
37  *  WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
38  */
39
40 #include <math.h>
41 #include <vppinfra/format.h>
42 #include <vlib/vlib.h>
43 #include <vlib/threads.h>
44 #include <vppinfra/tw_timer_1t_3w_1024sl_ov.h>
45
46 #include <vlib/unix/unix.h>
47
48 /* Actually allocate a few extra slots of vector data to support
49    speculative vector enqueues which overflow vector data in next frame. */
50 #define VLIB_FRAME_SIZE_ALLOC (VLIB_FRAME_SIZE + 4)
51
52 always_inline u32
53 vlib_frame_bytes (u32 n_scalar_bytes, u32 n_vector_bytes)
54 {
55   u32 n_bytes;
56
57   /* Make room for vlib_frame_t plus scalar arguments. */
58   n_bytes = vlib_frame_vector_byte_offset (n_scalar_bytes);
59
60   /* Make room for vector arguments.
61      Allocate a few extra slots of vector data to support
62      speculative vector enqueues which overflow vector data in next frame. */
63 #define VLIB_FRAME_SIZE_EXTRA 4
64   n_bytes += (VLIB_FRAME_SIZE + VLIB_FRAME_SIZE_EXTRA) * n_vector_bytes;
65
66   /* Magic number is first 32bit number after vector data.
67      Used to make sure that vector data is never overrun. */
68 #define VLIB_FRAME_MAGIC (0xabadc0ed)
69   n_bytes += sizeof (u32);
70
71   /* Pad to cache line. */
72   n_bytes = round_pow2 (n_bytes, CLIB_CACHE_LINE_BYTES);
73
74   return n_bytes;
75 }
76
77 always_inline u32 *
78 vlib_frame_find_magic (vlib_frame_t * f, vlib_node_t * node)
79 {
80   void *p = f;
81
82   p += vlib_frame_vector_byte_offset (node->scalar_size);
83
84   p += (VLIB_FRAME_SIZE + VLIB_FRAME_SIZE_EXTRA) * node->vector_size;
85
86   return p;
87 }
88
89 static inline vlib_frame_size_t *
90 get_frame_size_info (vlib_node_main_t * nm,
91                      u32 n_scalar_bytes, u32 n_vector_bytes)
92 {
93 #ifdef VLIB_SUPPORTS_ARBITRARY_SCALAR_SIZES
94   uword key = (n_scalar_bytes << 16) | n_vector_bytes;
95   uword *p, i;
96
97   p = hash_get (nm->frame_size_hash, key);
98   if (p)
99     i = p[0];
100   else
101     {
102       i = vec_len (nm->frame_sizes);
103       vec_validate (nm->frame_sizes, i);
104       hash_set (nm->frame_size_hash, key, i);
105     }
106
107   return vec_elt_at_index (nm->frame_sizes, i);
108 #else
109   ASSERT (vlib_frame_bytes (n_scalar_bytes, n_vector_bytes)
110           == (vlib_frame_bytes (0, 4)));
111   return vec_elt_at_index (nm->frame_sizes, 0);
112 #endif
113 }
114
115 static vlib_frame_t *
116 vlib_frame_alloc_to_node (vlib_main_t * vm, u32 to_node_index,
117                           u32 frame_flags)
118 {
119   vlib_node_main_t *nm = &vm->node_main;
120   vlib_frame_size_t *fs;
121   vlib_node_t *to_node;
122   vlib_frame_t *f;
123   u32 l, n, scalar_size, vector_size;
124
125   to_node = vlib_get_node (vm, to_node_index);
126
127   scalar_size = to_node->scalar_size;
128   vector_size = to_node->vector_size;
129
130   fs = get_frame_size_info (nm, scalar_size, vector_size);
131   n = vlib_frame_bytes (scalar_size, vector_size);
132   if ((l = vec_len (fs->free_frames)) > 0)
133     {
134       /* Allocate from end of free list. */
135       f = fs->free_frames[l - 1];
136       _vec_len (fs->free_frames) = l - 1;
137     }
138   else
139     {
140       f = clib_mem_alloc_aligned_no_fail (n, VLIB_FRAME_ALIGN);
141     }
142
143   /* Poison frame when debugging. */
144   if (CLIB_DEBUG > 0)
145     clib_memset (f, 0xfe, n);
146
147   /* Insert magic number. */
148   {
149     u32 *magic;
150
151     magic = vlib_frame_find_magic (f, to_node);
152     *magic = VLIB_FRAME_MAGIC;
153   }
154
155   f->frame_flags = VLIB_FRAME_IS_ALLOCATED | frame_flags;
156   f->n_vectors = 0;
157   f->scalar_size = scalar_size;
158   f->vector_size = vector_size;
159   f->flags = 0;
160
161   fs->n_alloc_frames += 1;
162
163   return f;
164 }
165
166 /* Allocate a frame for from FROM_NODE to TO_NODE via TO_NEXT_INDEX.
167    Returns frame index. */
168 static vlib_frame_t *
169 vlib_frame_alloc (vlib_main_t * vm, vlib_node_runtime_t * from_node_runtime,
170                   u32 to_next_index)
171 {
172   vlib_node_t *from_node;
173
174   from_node = vlib_get_node (vm, from_node_runtime->node_index);
175   ASSERT (to_next_index < vec_len (from_node->next_nodes));
176
177   return vlib_frame_alloc_to_node (vm, from_node->next_nodes[to_next_index],
178                                    /* frame_flags */ 0);
179 }
180
181 vlib_frame_t *
182 vlib_get_frame_to_node (vlib_main_t * vm, u32 to_node_index)
183 {
184   vlib_frame_t *f = vlib_frame_alloc_to_node (vm, to_node_index,
185                                               /* frame_flags */
186                                               VLIB_FRAME_FREE_AFTER_DISPATCH);
187   return vlib_get_frame (vm, f);
188 }
189
190 static inline void
191 vlib_validate_frame_indices (vlib_frame_t * f)
192 {
193   if (CLIB_DEBUG > 0)
194     {
195       int i;
196       u32 *from = vlib_frame_vector_args (f);
197
198       /* Check for bad buffer index values */
199       for (i = 0; i < f->n_vectors; i++)
200         {
201           if (from[i] == 0)
202             {
203               clib_warning ("BUG: buffer index 0 at index %d", i);
204               ASSERT (0);
205             }
206           else if (from[i] == 0xfefefefe)
207             {
208               clib_warning ("BUG: frame poison pattern at index %d", i);
209               ASSERT (0);
210             }
211         }
212     }
213 }
214
215 void
216 vlib_put_frame_to_node (vlib_main_t * vm, u32 to_node_index, vlib_frame_t * f)
217 {
218   vlib_pending_frame_t *p;
219   vlib_node_t *to_node;
220
221   if (f->n_vectors == 0)
222     return;
223
224   vlib_validate_frame_indices (f);
225
226   to_node = vlib_get_node (vm, to_node_index);
227
228   vec_add2 (vm->node_main.pending_frames, p, 1);
229
230   f->frame_flags |= VLIB_FRAME_PENDING;
231   p->frame = vlib_get_frame (vm, f);
232   p->node_runtime_index = to_node->runtime_index;
233   p->next_frame_index = VLIB_PENDING_FRAME_NO_NEXT_FRAME;
234 }
235
236 /* Free given frame. */
237 void
238 vlib_frame_free (vlib_main_t * vm, vlib_node_runtime_t * r, vlib_frame_t * f)
239 {
240   vlib_node_main_t *nm = &vm->node_main;
241   vlib_node_t *node;
242   vlib_frame_size_t *fs;
243
244   ASSERT (f->frame_flags & VLIB_FRAME_IS_ALLOCATED);
245
246   node = vlib_get_node (vm, r->node_index);
247   fs = get_frame_size_info (nm, node->scalar_size, node->vector_size);
248
249   ASSERT (f->frame_flags & VLIB_FRAME_IS_ALLOCATED);
250
251   /* No next frames may point to freed frame. */
252   if (CLIB_DEBUG > 0)
253     {
254       vlib_next_frame_t *nf;
255       vec_foreach (nf, vm->node_main.next_frames) ASSERT (nf->frame != f);
256     }
257
258   f->frame_flags &= ~(VLIB_FRAME_IS_ALLOCATED | VLIB_FRAME_NO_APPEND);
259
260   vec_add1 (fs->free_frames, f);
261   ASSERT (fs->n_alloc_frames > 0);
262   fs->n_alloc_frames -= 1;
263 }
264
265 static clib_error_t *
266 show_frame_stats (vlib_main_t * vm,
267                   unformat_input_t * input, vlib_cli_command_t * cmd)
268 {
269   vlib_node_main_t *nm = &vm->node_main;
270   vlib_frame_size_t *fs;
271
272   vlib_cli_output (vm, "%=6s%=12s%=12s", "Size", "# Alloc", "# Free");
273   vec_foreach (fs, nm->frame_sizes)
274   {
275     u32 n_alloc = fs->n_alloc_frames;
276     u32 n_free = vec_len (fs->free_frames);
277
278     if (n_alloc + n_free > 0)
279       vlib_cli_output (vm, "%=6d%=12d%=12d",
280                        fs - nm->frame_sizes, n_alloc, n_free);
281   }
282
283   return 0;
284 }
285
286 /* *INDENT-OFF* */
287 VLIB_CLI_COMMAND (show_frame_stats_cli, static) = {
288   .path = "show vlib frame-allocation",
289   .short_help = "Show node dispatch frame statistics",
290   .function = show_frame_stats,
291 };
292 /* *INDENT-ON* */
293
294 /* Change ownership of enqueue rights to given next node. */
295 static void
296 vlib_next_frame_change_ownership (vlib_main_t * vm,
297                                   vlib_node_runtime_t * node_runtime,
298                                   u32 next_index)
299 {
300   vlib_node_main_t *nm = &vm->node_main;
301   vlib_next_frame_t *next_frame;
302   vlib_node_t *node, *next_node;
303
304   node = vec_elt (nm->nodes, node_runtime->node_index);
305
306   /* Only internal & input nodes are allowed to call other nodes. */
307   ASSERT (node->type == VLIB_NODE_TYPE_INTERNAL
308           || node->type == VLIB_NODE_TYPE_INPUT
309           || node->type == VLIB_NODE_TYPE_PROCESS);
310
311   ASSERT (vec_len (node->next_nodes) == node_runtime->n_next_nodes);
312
313   next_frame =
314     vlib_node_runtime_get_next_frame (vm, node_runtime, next_index);
315   next_node = vec_elt (nm->nodes, node->next_nodes[next_index]);
316
317   if (next_node->owner_node_index != VLIB_INVALID_NODE_INDEX)
318     {
319       /* Get frame from previous owner. */
320       vlib_next_frame_t *owner_next_frame;
321       vlib_next_frame_t tmp;
322
323       owner_next_frame =
324         vlib_node_get_next_frame (vm,
325                                   next_node->owner_node_index,
326                                   next_node->owner_next_index);
327
328       /* Swap target next frame with owner's. */
329       tmp = owner_next_frame[0];
330       owner_next_frame[0] = next_frame[0];
331       next_frame[0] = tmp;
332
333       /*
334        * If next_frame is already pending, we have to track down
335        * all pending frames and fix their next_frame_index fields.
336        */
337       if (next_frame->flags & VLIB_FRAME_PENDING)
338         {
339           vlib_pending_frame_t *p;
340           if (next_frame->frame != NULL)
341             {
342               vec_foreach (p, nm->pending_frames)
343               {
344                 if (p->frame == next_frame->frame)
345                   {
346                     p->next_frame_index =
347                       next_frame - vm->node_main.next_frames;
348                   }
349               }
350             }
351         }
352     }
353   else
354     {
355       /* No previous owner. Take ownership. */
356       next_frame->flags |= VLIB_FRAME_OWNER;
357     }
358
359   /* Record new owner. */
360   next_node->owner_node_index = node->index;
361   next_node->owner_next_index = next_index;
362
363   /* Now we should be owner. */
364   ASSERT (next_frame->flags & VLIB_FRAME_OWNER);
365 }
366
367 /* Make sure that magic number is still there.
368    Otherwise, it is likely that caller has overrun frame arguments. */
369 always_inline void
370 validate_frame_magic (vlib_main_t * vm,
371                       vlib_frame_t * f, vlib_node_t * n, uword next_index)
372 {
373   vlib_node_t *next_node = vlib_get_node (vm, n->next_nodes[next_index]);
374   u32 *magic = vlib_frame_find_magic (f, next_node);
375   ASSERT (VLIB_FRAME_MAGIC == magic[0]);
376 }
377
378 vlib_frame_t *
379 vlib_get_next_frame_internal (vlib_main_t * vm,
380                               vlib_node_runtime_t * node,
381                               u32 next_index, u32 allocate_new_next_frame)
382 {
383   vlib_frame_t *f;
384   vlib_next_frame_t *nf;
385   u32 n_used;
386
387   nf = vlib_node_runtime_get_next_frame (vm, node, next_index);
388
389   /* Make sure this next frame owns right to enqueue to destination frame. */
390   if (PREDICT_FALSE (!(nf->flags & VLIB_FRAME_OWNER)))
391     vlib_next_frame_change_ownership (vm, node, next_index);
392
393   /* ??? Don't need valid flag: can use frame_index == ~0 */
394   if (PREDICT_FALSE (!(nf->flags & VLIB_FRAME_IS_ALLOCATED)))
395     {
396       nf->frame = vlib_frame_alloc (vm, node, next_index);
397       nf->flags |= VLIB_FRAME_IS_ALLOCATED;
398     }
399
400   f = nf->frame;
401
402   /* Has frame been removed from pending vector (e.g. finished dispatching)?
403      If so we can reuse frame. */
404   if ((nf->flags & VLIB_FRAME_PENDING)
405       && !(f->frame_flags & VLIB_FRAME_PENDING))
406     {
407       nf->flags &= ~VLIB_FRAME_PENDING;
408       f->n_vectors = 0;
409       f->flags = 0;
410     }
411
412   /* Allocate new frame if current one is marked as no-append or
413      it is already full. */
414   n_used = f->n_vectors;
415   if (n_used >= VLIB_FRAME_SIZE || (allocate_new_next_frame && n_used > 0) ||
416       (f->frame_flags & VLIB_FRAME_NO_APPEND))
417     {
418       /* Old frame may need to be freed after dispatch, since we'll have
419          two redundant frames from node -> next node. */
420       if (!(nf->flags & VLIB_FRAME_NO_FREE_AFTER_DISPATCH))
421         {
422           vlib_frame_t *f_old = vlib_get_frame (vm, nf->frame);
423           f_old->frame_flags |= VLIB_FRAME_FREE_AFTER_DISPATCH;
424         }
425
426       /* Allocate new frame to replace full one. */
427       f = nf->frame = vlib_frame_alloc (vm, node, next_index);
428       n_used = f->n_vectors;
429     }
430
431   /* Should have free vectors in frame now. */
432   ASSERT (n_used < VLIB_FRAME_SIZE);
433
434   if (CLIB_DEBUG > 0)
435     {
436       validate_frame_magic (vm, f,
437                             vlib_get_node (vm, node->node_index), next_index);
438     }
439
440   return f;
441 }
442
443 static void
444 vlib_put_next_frame_validate (vlib_main_t * vm,
445                               vlib_node_runtime_t * rt,
446                               u32 next_index, u32 n_vectors_left)
447 {
448   vlib_node_main_t *nm = &vm->node_main;
449   vlib_next_frame_t *nf;
450   vlib_frame_t *f;
451   vlib_node_runtime_t *next_rt;
452   vlib_node_t *next_node;
453   u32 n_before, n_after;
454
455   nf = vlib_node_runtime_get_next_frame (vm, rt, next_index);
456   f = vlib_get_frame (vm, nf->frame);
457
458   ASSERT (n_vectors_left <= VLIB_FRAME_SIZE);
459
460   vlib_validate_frame_indices (f);
461
462   n_after = VLIB_FRAME_SIZE - n_vectors_left;
463   n_before = f->n_vectors;
464
465   ASSERT (n_after >= n_before);
466
467   next_rt = vec_elt_at_index (nm->nodes_by_type[VLIB_NODE_TYPE_INTERNAL],
468                               nf->node_runtime_index);
469   next_node = vlib_get_node (vm, next_rt->node_index);
470   if (n_after > 0 && next_node->validate_frame)
471     {
472       u8 *msg = next_node->validate_frame (vm, rt, f);
473       if (msg)
474         {
475           clib_warning ("%v", msg);
476           ASSERT (0);
477         }
478       vec_free (msg);
479     }
480 }
481
482 void
483 vlib_put_next_frame (vlib_main_t * vm,
484                      vlib_node_runtime_t * r,
485                      u32 next_index, u32 n_vectors_left)
486 {
487   vlib_node_main_t *nm = &vm->node_main;
488   vlib_next_frame_t *nf;
489   vlib_frame_t *f;
490   u32 n_vectors_in_frame;
491
492   if (CLIB_DEBUG > 0)
493     vlib_put_next_frame_validate (vm, r, next_index, n_vectors_left);
494
495   nf = vlib_node_runtime_get_next_frame (vm, r, next_index);
496   f = vlib_get_frame (vm, nf->frame);
497
498   /* Make sure that magic number is still there.  Otherwise, caller
499      has overrun frame meta data. */
500   if (CLIB_DEBUG > 0)
501     {
502       vlib_node_t *node = vlib_get_node (vm, r->node_index);
503       validate_frame_magic (vm, f, node, next_index);
504     }
505
506   /* Convert # of vectors left -> number of vectors there. */
507   ASSERT (n_vectors_left <= VLIB_FRAME_SIZE);
508   n_vectors_in_frame = VLIB_FRAME_SIZE - n_vectors_left;
509
510   f->n_vectors = n_vectors_in_frame;
511
512   /* If vectors were added to frame, add to pending vector. */
513   if (PREDICT_TRUE (n_vectors_in_frame > 0))
514     {
515       vlib_pending_frame_t *p;
516       u32 v0, v1;
517
518       r->cached_next_index = next_index;
519
520       if (!(f->frame_flags & VLIB_FRAME_PENDING))
521         {
522           __attribute__ ((unused)) vlib_node_t *node;
523           vlib_node_t *next_node;
524           vlib_node_runtime_t *next_runtime;
525
526           node = vlib_get_node (vm, r->node_index);
527           next_node = vlib_get_next_node (vm, r->node_index, next_index);
528           next_runtime = vlib_node_get_runtime (vm, next_node->index);
529
530           vec_add2 (nm->pending_frames, p, 1);
531
532           p->frame = nf->frame;
533           p->node_runtime_index = nf->node_runtime_index;
534           p->next_frame_index = nf - nm->next_frames;
535           nf->flags |= VLIB_FRAME_PENDING;
536           f->frame_flags |= VLIB_FRAME_PENDING;
537
538           /*
539            * If we're going to dispatch this frame on another thread,
540            * force allocation of a new frame. Otherwise, we create
541            * a dangling frame reference. Each thread has its own copy of
542            * the next_frames vector.
543            */
544           if (0 && r->thread_index != next_runtime->thread_index)
545             {
546               nf->frame = NULL;
547               nf->flags &= ~(VLIB_FRAME_PENDING | VLIB_FRAME_IS_ALLOCATED);
548             }
549         }
550
551       /* Copy trace flag from next_frame and from runtime. */
552       nf->flags |=
553         (nf->flags & VLIB_NODE_FLAG_TRACE) | (r->
554                                               flags & VLIB_NODE_FLAG_TRACE);
555
556       v0 = nf->vectors_since_last_overflow;
557       v1 = v0 + n_vectors_in_frame;
558       nf->vectors_since_last_overflow = v1;
559       if (PREDICT_FALSE (v1 < v0))
560         {
561           vlib_node_t *node = vlib_get_node (vm, r->node_index);
562           vec_elt (node->n_vectors_by_next_node, next_index) += v0;
563         }
564     }
565 }
566
567 /* Sync up runtime (32 bit counters) and main node stats (64 bit counters). */
568 never_inline void
569 vlib_node_runtime_sync_stats (vlib_main_t * vm,
570                               vlib_node_runtime_t * r,
571                               uword n_calls, uword n_vectors, uword n_clocks)
572 {
573   vlib_node_t *n = vlib_get_node (vm, r->node_index);
574
575   n->stats_total.calls += n_calls + r->calls_since_last_overflow;
576   n->stats_total.vectors += n_vectors + r->vectors_since_last_overflow;
577   n->stats_total.clocks += n_clocks + r->clocks_since_last_overflow;
578   n->stats_total.max_clock = r->max_clock;
579   n->stats_total.max_clock_n = r->max_clock_n;
580
581   r->calls_since_last_overflow = 0;
582   r->vectors_since_last_overflow = 0;
583   r->clocks_since_last_overflow = 0;
584 }
585
586 always_inline void __attribute__ ((unused))
587 vlib_process_sync_stats (vlib_main_t * vm,
588                          vlib_process_t * p,
589                          uword n_calls, uword n_vectors, uword n_clocks)
590 {
591   vlib_node_runtime_t *rt = &p->node_runtime;
592   vlib_node_t *n = vlib_get_node (vm, rt->node_index);
593   vlib_node_runtime_sync_stats (vm, rt, n_calls, n_vectors, n_clocks);
594   n->stats_total.suspends += p->n_suspends;
595   p->n_suspends = 0;
596 }
597
598 void
599 vlib_node_sync_stats (vlib_main_t * vm, vlib_node_t * n)
600 {
601   vlib_node_runtime_t *rt;
602
603   if (n->type == VLIB_NODE_TYPE_PROCESS)
604     {
605       /* Nothing to do for PROCESS nodes except in main thread */
606       if (vm != &vlib_global_main)
607         return;
608
609       vlib_process_t *p = vlib_get_process_from_node (vm, n);
610       n->stats_total.suspends += p->n_suspends;
611       p->n_suspends = 0;
612       rt = &p->node_runtime;
613     }
614   else
615     rt =
616       vec_elt_at_index (vm->node_main.nodes_by_type[n->type],
617                         n->runtime_index);
618
619   vlib_node_runtime_sync_stats (vm, rt, 0, 0, 0);
620
621   /* Sync up runtime next frame vector counters with main node structure. */
622   {
623     vlib_next_frame_t *nf;
624     uword i;
625     for (i = 0; i < rt->n_next_nodes; i++)
626       {
627         nf = vlib_node_runtime_get_next_frame (vm, rt, i);
628         vec_elt (n->n_vectors_by_next_node, i) +=
629           nf->vectors_since_last_overflow;
630         nf->vectors_since_last_overflow = 0;
631       }
632   }
633 }
634
635 always_inline u32
636 vlib_node_runtime_update_stats (vlib_main_t * vm,
637                                 vlib_node_runtime_t * node,
638                                 uword n_calls,
639                                 uword n_vectors, uword n_clocks)
640 {
641   u32 ca0, ca1, v0, v1, cl0, cl1, r;
642
643   cl0 = cl1 = node->clocks_since_last_overflow;
644   ca0 = ca1 = node->calls_since_last_overflow;
645   v0 = v1 = node->vectors_since_last_overflow;
646
647   ca1 = ca0 + n_calls;
648   v1 = v0 + n_vectors;
649   cl1 = cl0 + n_clocks;
650
651   node->calls_since_last_overflow = ca1;
652   node->clocks_since_last_overflow = cl1;
653   node->vectors_since_last_overflow = v1;
654
655   node->max_clock_n = node->max_clock > n_clocks ?
656     node->max_clock_n : n_vectors;
657   node->max_clock = node->max_clock > n_clocks ? node->max_clock : n_clocks;
658
659   r = vlib_node_runtime_update_main_loop_vector_stats (vm, node, n_vectors);
660
661   if (PREDICT_FALSE (ca1 < ca0 || v1 < v0 || cl1 < cl0))
662     {
663       node->calls_since_last_overflow = ca0;
664       node->clocks_since_last_overflow = cl0;
665       node->vectors_since_last_overflow = v0;
666
667       vlib_node_runtime_sync_stats (vm, node, n_calls, n_vectors, n_clocks);
668     }
669
670   return r;
671 }
672
673 always_inline void
674 vlib_process_update_stats (vlib_main_t * vm,
675                            vlib_process_t * p,
676                            uword n_calls, uword n_vectors, uword n_clocks)
677 {
678   vlib_node_runtime_update_stats (vm, &p->node_runtime,
679                                   n_calls, n_vectors, n_clocks);
680 }
681
682 static clib_error_t *
683 vlib_cli_elog_clear (vlib_main_t * vm,
684                      unformat_input_t * input, vlib_cli_command_t * cmd)
685 {
686   elog_reset_buffer (&vm->elog_main);
687   return 0;
688 }
689
690 /* *INDENT-OFF* */
691 VLIB_CLI_COMMAND (elog_clear_cli, static) = {
692   .path = "event-logger clear",
693   .short_help = "Clear the event log",
694   .function = vlib_cli_elog_clear,
695 };
696 /* *INDENT-ON* */
697
698 #ifdef CLIB_UNIX
699 static clib_error_t *
700 elog_save_buffer (vlib_main_t * vm,
701                   unformat_input_t * input, vlib_cli_command_t * cmd)
702 {
703   elog_main_t *em = &vm->elog_main;
704   char *file, *chroot_file;
705   clib_error_t *error = 0;
706
707   if (!unformat (input, "%s", &file))
708     {
709       vlib_cli_output (vm, "expected file name, got `%U'",
710                        format_unformat_error, input);
711       return 0;
712     }
713
714   /* It's fairly hard to get "../oopsie" through unformat; just in case */
715   if (strstr (file, "..") || index (file, '/'))
716     {
717       vlib_cli_output (vm, "illegal characters in filename '%s'", file);
718       return 0;
719     }
720
721   chroot_file = (char *) format (0, "/tmp/%s%c", file, 0);
722
723   vec_free (file);
724
725   vlib_cli_output (vm, "Saving %wd of %wd events to %s",
726                    elog_n_events_in_buffer (em),
727                    elog_buffer_capacity (em), chroot_file);
728
729   vlib_worker_thread_barrier_sync (vm);
730   error = elog_write_file (em, chroot_file, 1 /* flush ring */ );
731   vlib_worker_thread_barrier_release (vm);
732   vec_free (chroot_file);
733   return error;
734 }
735
736 void
737 vlib_post_mortem_dump (void)
738 {
739   vlib_main_t *vm = &vlib_global_main;
740   elog_main_t *em = &vm->elog_main;
741
742   u8 *filename;
743   clib_error_t *error;
744
745   if ((vm->elog_post_mortem_dump + vm->dispatch_pcap_postmortem) == 0)
746     return;
747
748   if (vm->dispatch_pcap_postmortem)
749     {
750       clib_error_t *error;
751       pcap_main_t *pm = &vm->dispatch_pcap_main;
752
753       pm->n_packets_to_capture = pm->n_packets_captured;
754       pm->file_name = (char *) format (0, "/tmp/dispatch_post_mortem.%d%c",
755                                        getpid (), 0);
756       error = pcap_write (pm);
757       pcap_close (pm);
758       if (error)
759         clib_error_report (error);
760       /*
761        * We're in the middle of crashing. Don't try to free the filename.
762        */
763     }
764
765   if (vm->elog_post_mortem_dump)
766     {
767       filename = format (0, "/tmp/elog_post_mortem.%d%c", getpid (), 0);
768       error = elog_write_file (em, (char *) filename, 1 /* flush ring */ );
769       if (error)
770         clib_error_report (error);
771       /*
772        * We're in the middle of crashing. Don't try to free the filename.
773        */
774     }
775 }
776
777 /* *INDENT-OFF* */
778 VLIB_CLI_COMMAND (elog_save_cli, static) = {
779   .path = "event-logger save",
780   .short_help = "event-logger save <filename> (saves log in /tmp/<filename>)",
781   .function = elog_save_buffer,
782 };
783 /* *INDENT-ON* */
784
785 static clib_error_t *
786 elog_stop (vlib_main_t * vm,
787            unformat_input_t * input, vlib_cli_command_t * cmd)
788 {
789   elog_main_t *em = &vm->elog_main;
790
791   em->n_total_events_disable_limit = em->n_total_events;
792
793   vlib_cli_output (vm, "Stopped the event logger...");
794   return 0;
795 }
796
797 /* *INDENT-OFF* */
798 VLIB_CLI_COMMAND (elog_stop_cli, static) = {
799   .path = "event-logger stop",
800   .short_help = "Stop the event-logger",
801   .function = elog_stop,
802 };
803 /* *INDENT-ON* */
804
805 static clib_error_t *
806 elog_restart (vlib_main_t * vm,
807               unformat_input_t * input, vlib_cli_command_t * cmd)
808 {
809   elog_main_t *em = &vm->elog_main;
810
811   em->n_total_events_disable_limit = ~0;
812
813   vlib_cli_output (vm, "Restarted the event logger...");
814   return 0;
815 }
816
817 /* *INDENT-OFF* */
818 VLIB_CLI_COMMAND (elog_restart_cli, static) = {
819   .path = "event-logger restart",
820   .short_help = "Restart the event-logger",
821   .function = elog_restart,
822 };
823 /* *INDENT-ON* */
824
825 static clib_error_t *
826 elog_resize_command_fn (vlib_main_t * vm,
827                         unformat_input_t * input, vlib_cli_command_t * cmd)
828 {
829   elog_main_t *em = &vm->elog_main;
830   u32 tmp;
831
832   /* Stop the parade */
833   elog_reset_buffer (&vm->elog_main);
834
835   if (unformat (input, "%d", &tmp))
836     {
837       elog_alloc (em, tmp);
838       em->n_total_events_disable_limit = ~0;
839     }
840   else
841     return clib_error_return (0, "Must specify how many events in the ring");
842
843   vlib_cli_output (vm, "Resized ring and restarted the event logger...");
844   return 0;
845 }
846
847 /* *INDENT-OFF* */
848 VLIB_CLI_COMMAND (elog_resize_cli, static) = {
849   .path = "event-logger resize",
850   .short_help = "event-logger resize <nnn>",
851   .function = elog_resize_command_fn,
852 };
853 /* *INDENT-ON* */
854
855 #endif /* CLIB_UNIX */
856
857 static void
858 elog_show_buffer_internal (vlib_main_t * vm, u32 n_events_to_show)
859 {
860   elog_main_t *em = &vm->elog_main;
861   elog_event_t *e, *es;
862   f64 dt;
863
864   /* Show events in VLIB time since log clock starts after VLIB clock. */
865   dt = (em->init_time.cpu - vm->clib_time.init_cpu_time)
866     * vm->clib_time.seconds_per_clock;
867
868   es = elog_peek_events (em);
869   vlib_cli_output (vm, "%d of %d events in buffer, logger %s", vec_len (es),
870                    em->event_ring_size,
871                    em->n_total_events < em->n_total_events_disable_limit ?
872                    "running" : "stopped");
873   vec_foreach (e, es)
874   {
875     vlib_cli_output (vm, "%18.9f: %U",
876                      e->time + dt, format_elog_event, em, e);
877     n_events_to_show--;
878     if (n_events_to_show == 0)
879       break;
880   }
881   vec_free (es);
882
883 }
884
885 static clib_error_t *
886 elog_show_buffer (vlib_main_t * vm,
887                   unformat_input_t * input, vlib_cli_command_t * cmd)
888 {
889   u32 n_events_to_show;
890   clib_error_t *error = 0;
891
892   n_events_to_show = 250;
893   while (unformat_check_input (input) != UNFORMAT_END_OF_INPUT)
894     {
895       if (unformat (input, "%d", &n_events_to_show))
896         ;
897       else if (unformat (input, "all"))
898         n_events_to_show = ~0;
899       else
900         return unformat_parse_error (input);
901     }
902   elog_show_buffer_internal (vm, n_events_to_show);
903   return error;
904 }
905
906 /* *INDENT-OFF* */
907 VLIB_CLI_COMMAND (elog_show_cli, static) = {
908   .path = "show event-logger",
909   .short_help = "Show event logger info",
910   .function = elog_show_buffer,
911 };
912 /* *INDENT-ON* */
913
914 void
915 vlib_gdb_show_event_log (void)
916 {
917   elog_show_buffer_internal (vlib_get_main (), (u32) ~ 0);
918 }
919
920 static inline void
921 vlib_elog_main_loop_event (vlib_main_t * vm,
922                            u32 node_index,
923                            u64 time, u32 n_vectors, u32 is_return)
924 {
925   vlib_main_t *evm = &vlib_global_main;
926   elog_main_t *em = &evm->elog_main;
927   int enabled = evm->elog_trace_graph_dispatch |
928     evm->elog_trace_graph_circuit;
929
930   if (PREDICT_FALSE (enabled && n_vectors))
931     {
932       if (PREDICT_FALSE (!elog_is_enabled (em)))
933         {
934           evm->elog_trace_graph_dispatch = 0;
935           evm->elog_trace_graph_circuit = 0;
936           return;
937         }
938       if (PREDICT_TRUE
939           (evm->elog_trace_graph_dispatch ||
940            (evm->elog_trace_graph_circuit &&
941             node_index == evm->elog_trace_graph_circuit_node_index)))
942         {
943           elog_track (em,
944                       /* event type */
945                       vec_elt_at_index (is_return
946                                         ? evm->node_return_elog_event_types
947                                         : evm->node_call_elog_event_types,
948                                         node_index),
949                       /* track */
950                       (vm->thread_index ?
951                        &vlib_worker_threads[vm->thread_index].elog_track
952                        : &em->default_track),
953                       /* data to log */ n_vectors);
954         }
955     }
956 }
957
958 #if VLIB_BUFFER_TRACE_TRAJECTORY > 0
959 void (*vlib_buffer_trace_trajectory_cb) (vlib_buffer_t * b, u32 node_index);
960 void (*vlib_buffer_trace_trajectory_init_cb) (vlib_buffer_t * b);
961
962 void
963 vlib_buffer_trace_trajectory_init (vlib_buffer_t * b)
964 {
965   if (PREDICT_TRUE (vlib_buffer_trace_trajectory_init_cb != 0))
966     {
967       (*vlib_buffer_trace_trajectory_init_cb) (b);
968     }
969 }
970
971 #endif
972
973 static inline void
974 add_trajectory_trace (vlib_buffer_t * b, u32 node_index)
975 {
976 #if VLIB_BUFFER_TRACE_TRAJECTORY > 0
977   if (PREDICT_TRUE (vlib_buffer_trace_trajectory_cb != 0))
978     {
979       (*vlib_buffer_trace_trajectory_cb) (b, node_index);
980     }
981 #endif
982 }
983
984 u8 *format_vnet_buffer_flags (u8 * s, va_list * args) __attribute__ ((weak));
985 u8 *
986 format_vnet_buffer_flags (u8 * s, va_list * args)
987 {
988   s = format (s, "BUG STUB %s", __FUNCTION__);
989   return s;
990 }
991
992 u8 *format_vnet_buffer_opaque (u8 * s, va_list * args) __attribute__ ((weak));
993 u8 *
994 format_vnet_buffer_opaque (u8 * s, va_list * args)
995 {
996   s = format (s, "BUG STUB %s", __FUNCTION__);
997   return s;
998 }
999
1000 u8 *format_vnet_buffer_opaque2 (u8 * s, va_list * args)
1001   __attribute__ ((weak));
1002 u8 *
1003 format_vnet_buffer_opaque2 (u8 * s, va_list * args)
1004 {
1005   s = format (s, "BUG STUB %s", __FUNCTION__);
1006   return s;
1007 }
1008
1009 static u8 *
1010 format_buffer_metadata (u8 * s, va_list * args)
1011 {
1012   vlib_buffer_t *b = va_arg (*args, vlib_buffer_t *);
1013
1014   s = format (s, "flags: %U\n", format_vnet_buffer_flags, b);
1015   s = format (s, "current_data: %d, current_length: %d\n",
1016               (i32) (b->current_data), (i32) (b->current_length));
1017   s = format
1018     (s,
1019      "current_config_index/punt_reason: %d, flow_id: %x, next_buffer: %x\n",
1020      b->current_config_index, b->flow_id, b->next_buffer);
1021   s =
1022     format (s, "error: %d, ref_count: %d, buffer_pool_index: %d\n",
1023             (u32) (b->error), (u32) (b->ref_count),
1024             (u32) (b->buffer_pool_index));
1025   s =
1026     format (s, "trace_handle: 0x%x, len_not_first_buf: %d\n", b->trace_handle,
1027             b->total_length_not_including_first_buffer);
1028   return s;
1029 }
1030
1031 #define A(x) vec_add1(vm->pcap_buffer, (x))
1032
1033 static void
1034 dispatch_pcap_trace (vlib_main_t * vm,
1035                      vlib_node_runtime_t * node, vlib_frame_t * frame)
1036 {
1037   int i;
1038   vlib_buffer_t *bufs[VLIB_FRAME_SIZE], **bufp, *b;
1039   pcap_main_t *pm = &vlib_global_main.dispatch_pcap_main;
1040   vlib_trace_main_t *tm = &vm->trace_main;
1041   u32 capture_size;
1042   vlib_node_t *n;
1043   i32 n_left;
1044   f64 time_now = vlib_time_now (vm);
1045   u32 *from;
1046   u8 *d;
1047   u8 string_count;
1048
1049   /* Input nodes don't have frames yet */
1050   if (frame == 0 || frame->n_vectors == 0)
1051     return;
1052
1053   from = vlib_frame_vector_args (frame);
1054   vlib_get_buffers (vm, from, bufs, frame->n_vectors);
1055   bufp = bufs;
1056
1057   n = vlib_get_node (vm, node->node_index);
1058
1059   for (i = 0; i < frame->n_vectors; i++)
1060     {
1061       if (PREDICT_TRUE (pm->n_packets_captured < pm->n_packets_to_capture))
1062         {
1063           b = bufp[i];
1064
1065           vec_reset_length (vm->pcap_buffer);
1066           string_count = 0;
1067
1068           /* Version, flags */
1069           A ((u8) VLIB_PCAP_MAJOR_VERSION);
1070           A ((u8) VLIB_PCAP_MINOR_VERSION);
1071           A (0 /* string_count */ );
1072           A (n->protocol_hint);
1073
1074           /* Buffer index (big endian) */
1075           A ((from[i] >> 24) & 0xff);
1076           A ((from[i] >> 16) & 0xff);
1077           A ((from[i] >> 8) & 0xff);
1078           A ((from[i] >> 0) & 0xff);
1079
1080           /* Node name, NULL-terminated ASCII */
1081           vm->pcap_buffer = format (vm->pcap_buffer, "%v%c", n->name, 0);
1082           string_count++;
1083
1084           vm->pcap_buffer = format (vm->pcap_buffer, "%U%c",
1085                                     format_buffer_metadata, b, 0);
1086           string_count++;
1087           vm->pcap_buffer = format (vm->pcap_buffer, "%U%c",
1088                                     format_vnet_buffer_opaque, b, 0);
1089           string_count++;
1090           vm->pcap_buffer = format (vm->pcap_buffer, "%U%c",
1091                                     format_vnet_buffer_opaque2, b, 0);
1092           string_count++;
1093
1094           /* Is this packet traced? */
1095           if (PREDICT_FALSE (b->flags & VLIB_BUFFER_IS_TRACED))
1096             {
1097               vlib_trace_header_t **h
1098                 = pool_elt_at_index (tm->trace_buffer_pool,
1099                                      vlib_buffer_get_trace_index (b));
1100
1101               vm->pcap_buffer = format (vm->pcap_buffer, "%U%c",
1102                                         format_vlib_trace, vm, h[0], 0);
1103               string_count++;
1104             }
1105
1106           /* Save the string count */
1107           vm->pcap_buffer[2] = string_count;
1108
1109           /* Figure out how many bytes in the pcap trace */
1110           capture_size = vec_len (vm->pcap_buffer) +
1111             +vlib_buffer_length_in_chain (vm, b);
1112
1113           clib_spinlock_lock_if_init (&pm->lock);
1114           n_left = clib_min (capture_size, 16384);
1115           d = pcap_add_packet (pm, time_now, n_left, capture_size);
1116
1117           /* Copy the header */
1118           clib_memcpy_fast (d, vm->pcap_buffer, vec_len (vm->pcap_buffer));
1119           d += vec_len (vm->pcap_buffer);
1120
1121           n_left = clib_min
1122             (vlib_buffer_length_in_chain (vm, b),
1123              (16384 - vec_len (vm->pcap_buffer)));
1124           /* Copy the packet data */
1125           while (1)
1126             {
1127               u32 copy_length = clib_min ((u32) n_left, b->current_length);
1128               clib_memcpy_fast (d, b->data + b->current_data, copy_length);
1129               n_left -= b->current_length;
1130               if (n_left <= 0)
1131                 break;
1132               d += b->current_length;
1133               ASSERT (b->flags & VLIB_BUFFER_NEXT_PRESENT);
1134               b = vlib_get_buffer (vm, b->next_buffer);
1135             }
1136           clib_spinlock_unlock_if_init (&pm->lock);
1137         }
1138     }
1139 }
1140
1141 static_always_inline u64
1142 dispatch_node (vlib_main_t * vm,
1143                vlib_node_runtime_t * node,
1144                vlib_node_type_t type,
1145                vlib_node_state_t dispatch_state,
1146                vlib_frame_t * frame, u64 last_time_stamp)
1147 {
1148   uword n, v;
1149   u64 t;
1150   vlib_node_main_t *nm = &vm->node_main;
1151   vlib_next_frame_t *nf;
1152
1153   if (CLIB_DEBUG > 0)
1154     {
1155       vlib_node_t *n = vlib_get_node (vm, node->node_index);
1156       ASSERT (n->type == type);
1157     }
1158
1159   /* Only non-internal nodes may be disabled. */
1160   if (type != VLIB_NODE_TYPE_INTERNAL && node->state != dispatch_state)
1161     {
1162       ASSERT (type != VLIB_NODE_TYPE_INTERNAL);
1163       return last_time_stamp;
1164     }
1165
1166   if ((type == VLIB_NODE_TYPE_PRE_INPUT || type == VLIB_NODE_TYPE_INPUT)
1167       && dispatch_state != VLIB_NODE_STATE_INTERRUPT)
1168     {
1169       u32 c = node->input_main_loops_per_call;
1170       /* Only call node when count reaches zero. */
1171       if (c)
1172         {
1173           node->input_main_loops_per_call = c - 1;
1174           return last_time_stamp;
1175         }
1176     }
1177
1178   /* Speculatively prefetch next frames. */
1179   if (node->n_next_nodes > 0)
1180     {
1181       nf = vec_elt_at_index (nm->next_frames, node->next_frame_index);
1182       CLIB_PREFETCH (nf, 4 * sizeof (nf[0]), WRITE);
1183     }
1184
1185   vm->cpu_time_last_node_dispatch = last_time_stamp;
1186
1187   vlib_elog_main_loop_event (vm, node->node_index,
1188                              last_time_stamp, frame ? frame->n_vectors : 0,
1189                              /* is_after */ 0);
1190
1191   vlib_node_runtime_perf_counter (vm, node, frame, 0, last_time_stamp,
1192                                   VLIB_NODE_RUNTIME_PERF_BEFORE);
1193
1194   /*
1195    * Turn this on if you run into
1196    * "bad monkey" contexts, and you want to know exactly
1197    * which nodes they've visited... See ixge.c...
1198    */
1199   if (VLIB_BUFFER_TRACE_TRAJECTORY && frame)
1200     {
1201       int i;
1202       u32 *from;
1203       from = vlib_frame_vector_args (frame);
1204       for (i = 0; i < frame->n_vectors; i++)
1205         {
1206           vlib_buffer_t *b = vlib_get_buffer (vm, from[i]);
1207           add_trajectory_trace (b, node->node_index);
1208         }
1209       if (PREDICT_FALSE (vm->dispatch_pcap_enable))
1210         dispatch_pcap_trace (vm, node, frame);
1211
1212       if (PREDICT_TRUE (vm->dispatch_wrapper_fn == 0))
1213         n = node->function (vm, node, frame);
1214       else
1215         n = vm->dispatch_wrapper_fn (vm, node, frame);
1216     }
1217   else
1218     {
1219       if (PREDICT_FALSE (vm->dispatch_pcap_enable))
1220         dispatch_pcap_trace (vm, node, frame);
1221
1222       if (PREDICT_TRUE (vm->dispatch_wrapper_fn == 0))
1223         n = node->function (vm, node, frame);
1224       else
1225         n = vm->dispatch_wrapper_fn (vm, node, frame);
1226     }
1227
1228   t = clib_cpu_time_now ();
1229
1230   vlib_node_runtime_perf_counter (vm, node, frame, n, t,
1231                                   VLIB_NODE_RUNTIME_PERF_AFTER);
1232
1233   vlib_elog_main_loop_event (vm, node->node_index, t, n, 1 /* is_after */ );
1234
1235   vm->main_loop_vectors_processed += n;
1236   vm->main_loop_nodes_processed += n > 0;
1237
1238   v = vlib_node_runtime_update_stats (vm, node,
1239                                       /* n_calls */ 1,
1240                                       /* n_vectors */ n,
1241                                       /* n_clocks */ t - last_time_stamp);
1242
1243   /* When in interrupt mode and vector rate crosses threshold switch to
1244      polling mode. */
1245   if (PREDICT_FALSE ((dispatch_state == VLIB_NODE_STATE_INTERRUPT)
1246                      || (dispatch_state == VLIB_NODE_STATE_POLLING
1247                          && (node->flags
1248                              &
1249                              VLIB_NODE_FLAG_SWITCH_FROM_INTERRUPT_TO_POLLING_MODE))))
1250     {
1251       /* *INDENT-OFF* */
1252       ELOG_TYPE_DECLARE (e) =
1253         {
1254           .function = (char *) __FUNCTION__,
1255           .format = "%s vector length %d, switching to %s",
1256           .format_args = "T4i4t4",
1257           .n_enum_strings = 2,
1258           .enum_strings = {
1259             "interrupt", "polling",
1260           },
1261         };
1262       /* *INDENT-ON* */
1263       struct
1264       {
1265         u32 node_name, vector_length, is_polling;
1266       } *ed;
1267
1268       if ((dispatch_state == VLIB_NODE_STATE_INTERRUPT
1269            && v >= nm->polling_threshold_vector_length) &&
1270           !(node->flags &
1271             VLIB_NODE_FLAG_SWITCH_FROM_INTERRUPT_TO_POLLING_MODE))
1272         {
1273           vlib_node_t *n = vlib_get_node (vm, node->node_index);
1274           n->state = VLIB_NODE_STATE_POLLING;
1275           node->state = VLIB_NODE_STATE_POLLING;
1276           node->flags &=
1277             ~VLIB_NODE_FLAG_SWITCH_FROM_POLLING_TO_INTERRUPT_MODE;
1278           node->flags |= VLIB_NODE_FLAG_SWITCH_FROM_INTERRUPT_TO_POLLING_MODE;
1279           nm->input_node_counts_by_state[VLIB_NODE_STATE_INTERRUPT] -= 1;
1280           nm->input_node_counts_by_state[VLIB_NODE_STATE_POLLING] += 1;
1281
1282           if (PREDICT_FALSE (vlib_global_main.elog_trace_graph_dispatch))
1283             {
1284               vlib_worker_thread_t *w = vlib_worker_threads
1285                 + vm->thread_index;
1286
1287               ed = ELOG_TRACK_DATA (&vlib_global_main.elog_main, e,
1288                                     w->elog_track);
1289               ed->node_name = n->name_elog_string;
1290               ed->vector_length = v;
1291               ed->is_polling = 1;
1292             }
1293         }
1294       else if (dispatch_state == VLIB_NODE_STATE_POLLING
1295                && v <= nm->interrupt_threshold_vector_length)
1296         {
1297           vlib_node_t *n = vlib_get_node (vm, node->node_index);
1298           if (node->flags &
1299               VLIB_NODE_FLAG_SWITCH_FROM_POLLING_TO_INTERRUPT_MODE)
1300             {
1301               /* Switch to interrupt mode after dispatch in polling one more time.
1302                  This allows driver to re-enable interrupts. */
1303               n->state = VLIB_NODE_STATE_INTERRUPT;
1304               node->state = VLIB_NODE_STATE_INTERRUPT;
1305               node->flags &=
1306                 ~VLIB_NODE_FLAG_SWITCH_FROM_INTERRUPT_TO_POLLING_MODE;
1307               nm->input_node_counts_by_state[VLIB_NODE_STATE_POLLING] -= 1;
1308               nm->input_node_counts_by_state[VLIB_NODE_STATE_INTERRUPT] += 1;
1309
1310             }
1311           else
1312             {
1313               vlib_worker_thread_t *w = vlib_worker_threads
1314                 + vm->thread_index;
1315               node->flags |=
1316                 VLIB_NODE_FLAG_SWITCH_FROM_POLLING_TO_INTERRUPT_MODE;
1317               if (PREDICT_FALSE (vlib_global_main.elog_trace_graph_dispatch))
1318                 {
1319                   ed = ELOG_TRACK_DATA (&vlib_global_main.elog_main, e,
1320                                         w->elog_track);
1321                   ed->node_name = n->name_elog_string;
1322                   ed->vector_length = v;
1323                   ed->is_polling = 0;
1324                 }
1325             }
1326         }
1327     }
1328
1329   return t;
1330 }
1331
1332 static u64
1333 dispatch_pending_node (vlib_main_t * vm, uword pending_frame_index,
1334                        u64 last_time_stamp)
1335 {
1336   vlib_node_main_t *nm = &vm->node_main;
1337   vlib_frame_t *f;
1338   vlib_next_frame_t *nf, nf_placeholder;
1339   vlib_node_runtime_t *n;
1340   vlib_frame_t *restore_frame;
1341   vlib_pending_frame_t *p;
1342
1343   /* See comment below about dangling references to nm->pending_frames */
1344   p = nm->pending_frames + pending_frame_index;
1345
1346   n = vec_elt_at_index (nm->nodes_by_type[VLIB_NODE_TYPE_INTERNAL],
1347                         p->node_runtime_index);
1348
1349   f = vlib_get_frame (vm, p->frame);
1350   if (p->next_frame_index == VLIB_PENDING_FRAME_NO_NEXT_FRAME)
1351     {
1352       /* No next frame: so use placeholder on stack. */
1353       nf = &nf_placeholder;
1354       nf->flags = f->frame_flags & VLIB_NODE_FLAG_TRACE;
1355       nf->frame = NULL;
1356     }
1357   else
1358     nf = vec_elt_at_index (nm->next_frames, p->next_frame_index);
1359
1360   ASSERT (f->frame_flags & VLIB_FRAME_IS_ALLOCATED);
1361
1362   /* Force allocation of new frame while current frame is being
1363      dispatched. */
1364   restore_frame = NULL;
1365   if (nf->frame == p->frame)
1366     {
1367       nf->frame = NULL;
1368       nf->flags &= ~VLIB_FRAME_IS_ALLOCATED;
1369       if (!(n->flags & VLIB_NODE_FLAG_FRAME_NO_FREE_AFTER_DISPATCH))
1370         restore_frame = p->frame;
1371     }
1372
1373   /* Frame must be pending. */
1374   ASSERT (f->frame_flags & VLIB_FRAME_PENDING);
1375   ASSERT (f->n_vectors > 0);
1376
1377   /* Copy trace flag from next frame to node.
1378      Trace flag indicates that at least one vector in the dispatched
1379      frame is traced. */
1380   n->flags &= ~VLIB_NODE_FLAG_TRACE;
1381   n->flags |= (nf->flags & VLIB_FRAME_TRACE) ? VLIB_NODE_FLAG_TRACE : 0;
1382   nf->flags &= ~VLIB_FRAME_TRACE;
1383
1384   last_time_stamp = dispatch_node (vm, n,
1385                                    VLIB_NODE_TYPE_INTERNAL,
1386                                    VLIB_NODE_STATE_POLLING,
1387                                    f, last_time_stamp);
1388   /* Internal node vector-rate accounting, for summary stats */
1389   vm->internal_node_vectors += f->n_vectors;
1390   vm->internal_node_calls++;
1391   vm->internal_node_last_vectors_per_main_loop =
1392     (f->n_vectors > vm->internal_node_last_vectors_per_main_loop) ?
1393     f->n_vectors : vm->internal_node_last_vectors_per_main_loop;
1394
1395   f->frame_flags &= ~(VLIB_FRAME_PENDING | VLIB_FRAME_NO_APPEND);
1396
1397   /* Frame is ready to be used again, so restore it. */
1398   if (restore_frame != NULL)
1399     {
1400       /*
1401        * We musn't restore a frame that is flagged to be freed. This
1402        * shouldn't happen since frames to be freed post dispatch are
1403        * those used when the to-node frame becomes full i.e. they form a
1404        * sort of queue of frames to a single node. If we get here then
1405        * the to-node frame and the pending frame *were* the same, and so
1406        * we removed the to-node frame.  Therefore this frame is no
1407        * longer part of the queue for that node and hence it cannot be
1408        * it's overspill.
1409        */
1410       ASSERT (!(f->frame_flags & VLIB_FRAME_FREE_AFTER_DISPATCH));
1411
1412       /*
1413        * NB: dispatching node n can result in the creation and scheduling
1414        * of new frames, and hence in the reallocation of nm->pending_frames.
1415        * Recompute p, or no supper. This was broken for more than 10 years.
1416        */
1417       p = nm->pending_frames + pending_frame_index;
1418
1419       /*
1420        * p->next_frame_index can change during node dispatch if node
1421        * function decides to change graph hook up.
1422        */
1423       nf = vec_elt_at_index (nm->next_frames, p->next_frame_index);
1424       nf->flags |= VLIB_FRAME_IS_ALLOCATED;
1425
1426       if (NULL == nf->frame)
1427         {
1428           /* no new frame has been assigned to this node, use the saved one */
1429           nf->frame = restore_frame;
1430           f->n_vectors = 0;
1431         }
1432       else
1433         {
1434           /* The node has gained a frame, implying packets from the current frame
1435              were re-queued to this same node. we don't need the saved one
1436              anymore */
1437           vlib_frame_free (vm, n, f);
1438         }
1439     }
1440   else
1441     {
1442       if (f->frame_flags & VLIB_FRAME_FREE_AFTER_DISPATCH)
1443         {
1444           ASSERT (!(n->flags & VLIB_NODE_FLAG_FRAME_NO_FREE_AFTER_DISPATCH));
1445           vlib_frame_free (vm, n, f);
1446         }
1447     }
1448
1449   return last_time_stamp;
1450 }
1451
1452 always_inline uword
1453 vlib_process_stack_is_valid (vlib_process_t * p)
1454 {
1455   return p->stack[0] == VLIB_PROCESS_STACK_MAGIC;
1456 }
1457
1458 typedef struct
1459 {
1460   vlib_main_t *vm;
1461   vlib_process_t *process;
1462   vlib_frame_t *frame;
1463 } vlib_process_bootstrap_args_t;
1464
1465 /* Called in process stack. */
1466 static uword
1467 vlib_process_bootstrap (uword _a)
1468 {
1469   vlib_process_bootstrap_args_t *a;
1470   vlib_main_t *vm;
1471   vlib_node_runtime_t *node;
1472   vlib_frame_t *f;
1473   vlib_process_t *p;
1474   uword n;
1475
1476   a = uword_to_pointer (_a, vlib_process_bootstrap_args_t *);
1477
1478   vm = a->vm;
1479   p = a->process;
1480   vlib_process_finish_switch_stack (vm);
1481
1482   f = a->frame;
1483   node = &p->node_runtime;
1484
1485   n = node->function (vm, node, f);
1486
1487   ASSERT (vlib_process_stack_is_valid (p));
1488
1489   vlib_process_start_switch_stack (vm, 0);
1490   clib_longjmp (&p->return_longjmp, n);
1491
1492   return n;
1493 }
1494
1495 /* Called in main stack. */
1496 static_always_inline uword
1497 vlib_process_startup (vlib_main_t * vm, vlib_process_t * p, vlib_frame_t * f)
1498 {
1499   vlib_process_bootstrap_args_t a;
1500   uword r;
1501
1502   a.vm = vm;
1503   a.process = p;
1504   a.frame = f;
1505
1506   r = clib_setjmp (&p->return_longjmp, VLIB_PROCESS_RETURN_LONGJMP_RETURN);
1507   if (r == VLIB_PROCESS_RETURN_LONGJMP_RETURN)
1508     {
1509       vlib_process_start_switch_stack (vm, p);
1510       r = clib_calljmp (vlib_process_bootstrap, pointer_to_uword (&a),
1511                         (void *) p->stack + (1 << p->log2_n_stack_bytes));
1512     }
1513   else
1514     vlib_process_finish_switch_stack (vm);
1515
1516   return r;
1517 }
1518
1519 static_always_inline uword
1520 vlib_process_resume (vlib_main_t * vm, vlib_process_t * p)
1521 {
1522   uword r;
1523   p->flags &= ~(VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_CLOCK
1524                 | VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_EVENT
1525                 | VLIB_PROCESS_RESUME_PENDING);
1526   r = clib_setjmp (&p->return_longjmp, VLIB_PROCESS_RETURN_LONGJMP_RETURN);
1527   if (r == VLIB_PROCESS_RETURN_LONGJMP_RETURN)
1528     {
1529       vlib_process_start_switch_stack (vm, p);
1530       clib_longjmp (&p->resume_longjmp, VLIB_PROCESS_RESUME_LONGJMP_RESUME);
1531     }
1532   else
1533     vlib_process_finish_switch_stack (vm);
1534   return r;
1535 }
1536
1537 static u64
1538 dispatch_process (vlib_main_t * vm,
1539                   vlib_process_t * p, vlib_frame_t * f, u64 last_time_stamp)
1540 {
1541   vlib_node_main_t *nm = &vm->node_main;
1542   vlib_node_runtime_t *node_runtime = &p->node_runtime;
1543   vlib_node_t *node = vlib_get_node (vm, node_runtime->node_index);
1544   u32 old_process_index;
1545   u64 t;
1546   uword n_vectors, is_suspend;
1547
1548   if (node->state != VLIB_NODE_STATE_POLLING
1549       || (p->flags & (VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_CLOCK
1550                       | VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_EVENT)))
1551     return last_time_stamp;
1552
1553   p->flags |= VLIB_PROCESS_IS_RUNNING;
1554
1555   t = last_time_stamp;
1556   vlib_elog_main_loop_event (vm, node_runtime->node_index, t,
1557                              f ? f->n_vectors : 0, /* is_after */ 0);
1558
1559   /* Save away current process for suspend. */
1560   old_process_index = nm->current_process_index;
1561   nm->current_process_index = node->runtime_index;
1562
1563   vlib_node_runtime_perf_counter (vm, node_runtime, f, 0, last_time_stamp,
1564                                   VLIB_NODE_RUNTIME_PERF_BEFORE);
1565
1566   n_vectors = vlib_process_startup (vm, p, f);
1567
1568   nm->current_process_index = old_process_index;
1569
1570   ASSERT (n_vectors != VLIB_PROCESS_RETURN_LONGJMP_RETURN);
1571   is_suspend = n_vectors == VLIB_PROCESS_RETURN_LONGJMP_SUSPEND;
1572   if (is_suspend)
1573     {
1574       vlib_pending_frame_t *pf;
1575
1576       n_vectors = 0;
1577       pool_get (nm->suspended_process_frames, pf);
1578       pf->node_runtime_index = node->runtime_index;
1579       pf->frame = f;
1580       pf->next_frame_index = ~0;
1581
1582       p->n_suspends += 1;
1583       p->suspended_process_frame_index = pf - nm->suspended_process_frames;
1584
1585       if (p->flags & VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_CLOCK)
1586         {
1587           TWT (tw_timer_wheel) * tw =
1588             (TWT (tw_timer_wheel) *) nm->timing_wheel;
1589           p->stop_timer_handle =
1590             TW (tw_timer_start) (tw,
1591                                  vlib_timing_wheel_data_set_suspended_process
1592                                  (node->runtime_index) /* [sic] pool idex */ ,
1593                                  0 /* timer_id */ ,
1594                                  p->resume_clock_interval);
1595         }
1596     }
1597   else
1598     p->flags &= ~VLIB_PROCESS_IS_RUNNING;
1599
1600   t = clib_cpu_time_now ();
1601
1602   vlib_elog_main_loop_event (vm, node_runtime->node_index, t, is_suspend,
1603                              /* is_after */ 1);
1604
1605   vlib_node_runtime_perf_counter (vm, node_runtime, f, n_vectors, t,
1606                                   VLIB_NODE_RUNTIME_PERF_AFTER);
1607
1608   vlib_process_update_stats (vm, p,
1609                              /* n_calls */ !is_suspend,
1610                              /* n_vectors */ n_vectors,
1611                              /* n_clocks */ t - last_time_stamp);
1612
1613   return t;
1614 }
1615
1616 void
1617 vlib_start_process (vlib_main_t * vm, uword process_index)
1618 {
1619   vlib_node_main_t *nm = &vm->node_main;
1620   vlib_process_t *p = vec_elt (nm->processes, process_index);
1621   dispatch_process (vm, p, /* frame */ 0, /* cpu_time_now */ 0);
1622 }
1623
1624 static u64
1625 dispatch_suspended_process (vlib_main_t * vm,
1626                             uword process_index, u64 last_time_stamp)
1627 {
1628   vlib_node_main_t *nm = &vm->node_main;
1629   vlib_node_runtime_t *node_runtime;
1630   vlib_node_t *node;
1631   vlib_frame_t *f;
1632   vlib_process_t *p;
1633   vlib_pending_frame_t *pf;
1634   u64 t, n_vectors, is_suspend;
1635
1636   t = last_time_stamp;
1637
1638   p = vec_elt (nm->processes, process_index);
1639   if (PREDICT_FALSE (!(p->flags & VLIB_PROCESS_IS_RUNNING)))
1640     return last_time_stamp;
1641
1642   ASSERT (p->flags & (VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_CLOCK
1643                       | VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_EVENT));
1644
1645   pf = pool_elt_at_index (nm->suspended_process_frames,
1646                           p->suspended_process_frame_index);
1647
1648   node_runtime = &p->node_runtime;
1649   node = vlib_get_node (vm, node_runtime->node_index);
1650   f = pf->frame;
1651
1652   vlib_elog_main_loop_event (vm, node_runtime->node_index, t,
1653                              f ? f->n_vectors : 0, /* is_after */ 0);
1654
1655   /* Save away current process for suspend. */
1656   nm->current_process_index = node->runtime_index;
1657
1658   vlib_node_runtime_perf_counter (vm, node_runtime, f, 0, last_time_stamp,
1659                                   VLIB_NODE_RUNTIME_PERF_BEFORE);
1660
1661   n_vectors = vlib_process_resume (vm, p);
1662   t = clib_cpu_time_now ();
1663
1664   nm->current_process_index = ~0;
1665
1666   is_suspend = n_vectors == VLIB_PROCESS_RETURN_LONGJMP_SUSPEND;
1667   if (is_suspend)
1668     {
1669       /* Suspend it again. */
1670       n_vectors = 0;
1671       p->n_suspends += 1;
1672       if (p->flags & VLIB_PROCESS_IS_SUSPENDED_WAITING_FOR_CLOCK)
1673         {
1674           p->stop_timer_handle =
1675             TW (tw_timer_start) ((TWT (tw_timer_wheel) *) nm->timing_wheel,
1676                                  vlib_timing_wheel_data_set_suspended_process
1677                                  (node->runtime_index) /* [sic] pool idex */ ,
1678                                  0 /* timer_id */ ,
1679                                  p->resume_clock_interval);
1680         }
1681     }
1682   else
1683     {
1684       p->flags &= ~VLIB_PROCESS_IS_RUNNING;
1685       pool_put_index (nm->suspended_process_frames,
1686                       p->suspended_process_frame_index);
1687       p->suspended_process_frame_index = ~0;
1688     }
1689
1690   t = clib_cpu_time_now ();
1691   vlib_elog_main_loop_event (vm, node_runtime->node_index, t, !is_suspend,
1692                              /* is_after */ 1);
1693
1694   vlib_node_runtime_perf_counter (vm, node_runtime, f, n_vectors, t,
1695                                   VLIB_NODE_RUNTIME_PERF_AFTER);
1696
1697   vlib_process_update_stats (vm, p,
1698                              /* n_calls */ !is_suspend,
1699                              /* n_vectors */ n_vectors,
1700                              /* n_clocks */ t - last_time_stamp);
1701
1702   return t;
1703 }
1704
1705 void vl_api_send_pending_rpc_requests (vlib_main_t *) __attribute__ ((weak));
1706 void
1707 vl_api_send_pending_rpc_requests (vlib_main_t * vm)
1708 {
1709 }
1710
1711 static_always_inline u64
1712 dispatch_pending_interrupts (vlib_main_t * vm, vlib_node_main_t * nm,
1713                              u64 cpu_time_now,
1714                              vlib_node_interrupt_t * interrupts)
1715 {
1716   vlib_node_runtime_t *n;
1717
1718   for (int i = 0; i < _vec_len (interrupts); i++)
1719     {
1720       vlib_node_interrupt_t *in;
1721       in = vec_elt_at_index (interrupts, i);
1722       n = vec_elt_at_index (nm->nodes_by_type[VLIB_NODE_TYPE_INPUT],
1723                             in->node_runtime_index);
1724       n->interrupt_data = in->data;
1725       cpu_time_now = dispatch_node (vm, n, VLIB_NODE_TYPE_INPUT,
1726                                     VLIB_NODE_STATE_INTERRUPT, /* frame */ 0,
1727                                     cpu_time_now);
1728     }
1729   return cpu_time_now;
1730 }
1731
1732 static inline void
1733 pcap_postmortem_reset (vlib_main_t * vm)
1734 {
1735   pcap_main_t *pm = &vm->dispatch_pcap_main;
1736
1737   /* Reset the trace buffer and capture count */
1738   clib_spinlock_lock_if_init (&pm->lock);
1739   vec_reset_length (pm->pcap_data);
1740   pm->n_packets_captured = 0;
1741   clib_spinlock_unlock_if_init (&pm->lock);
1742 }
1743
1744
1745 static_always_inline void
1746 vlib_main_or_worker_loop (vlib_main_t * vm, int is_main)
1747 {
1748   vlib_node_main_t *nm = &vm->node_main;
1749   vlib_thread_main_t *tm = vlib_get_thread_main ();
1750   uword i;
1751   u64 cpu_time_now;
1752   f64 now;
1753   vlib_frame_queue_main_t *fqm;
1754   u32 frame_queue_check_counter = 0;
1755   vlib_node_interrupt_t *empty_int_list = 0;
1756
1757   /* Initialize pending node vector. */
1758   if (is_main)
1759     {
1760       vec_resize (nm->pending_frames, 32);
1761       _vec_len (nm->pending_frames) = 0;
1762     }
1763
1764   /* Mark time of main loop start. */
1765   if (is_main)
1766     {
1767       cpu_time_now = vm->clib_time.last_cpu_time;
1768       vm->cpu_time_main_loop_start = cpu_time_now;
1769     }
1770   else
1771     cpu_time_now = clib_cpu_time_now ();
1772
1773   /* Pre-allocate interupt runtime indices and lock. */
1774   vec_alloc (nm->pending_local_interrupts, 32);
1775   vec_alloc (nm->pending_remote_interrupts, 32);
1776   vec_alloc (empty_int_list, 32);
1777   vec_alloc_aligned (nm->pending_remote_interrupts_notify, 1,
1778                      CLIB_CACHE_LINE_BYTES);
1779   clib_spinlock_init (&nm->pending_interrupt_lock);
1780
1781   /* Pre-allocate expired nodes. */
1782   if (!nm->polling_threshold_vector_length)
1783     nm->polling_threshold_vector_length = 10;
1784   if (!nm->interrupt_threshold_vector_length)
1785     nm->interrupt_threshold_vector_length = 5;
1786
1787   vm->cpu_id = clib_get_current_cpu_id ();
1788   vm->numa_node = clib_get_current_numa_node ();
1789   os_set_numa_index (vm->numa_node);
1790
1791   /* Start all processes. */
1792   if (is_main)
1793     {
1794       uword i;
1795
1796       /*
1797        * Perform an initial barrier sync. Pays no attention to
1798        * the barrier sync hold-down timer scheme, which won't work
1799        * at this point in time.
1800        */
1801       vlib_worker_thread_initial_barrier_sync_and_release (vm);
1802
1803       nm->current_process_index = ~0;
1804       for (i = 0; i < vec_len (nm->processes); i++)
1805         cpu_time_now = dispatch_process (vm, nm->processes[i], /* frame */ 0,
1806                                          cpu_time_now);
1807     }
1808
1809   while (1)
1810     {
1811       vlib_node_runtime_t *n;
1812
1813       if (PREDICT_FALSE (_vec_len (vm->pending_rpc_requests) > 0))
1814         {
1815           if (!is_main)
1816             vl_api_send_pending_rpc_requests (vm);
1817         }
1818
1819       if (!is_main)
1820         vlib_worker_thread_barrier_check ();
1821
1822       if (PREDICT_FALSE (vm->check_frame_queues + frame_queue_check_counter))
1823         {
1824           u32 processed = 0;
1825
1826           if (vm->check_frame_queues)
1827             {
1828               frame_queue_check_counter = 100;
1829               vm->check_frame_queues = 0;
1830             }
1831
1832           vec_foreach (fqm, tm->frame_queue_mains)
1833             processed += vlib_frame_queue_dequeue (vm, fqm);
1834
1835           /* No handoff queue work found? */
1836           if (processed)
1837             frame_queue_check_counter = 100;
1838           else
1839             frame_queue_check_counter--;
1840         }
1841
1842       if (PREDICT_FALSE (vec_len (vm->worker_thread_main_loop_callbacks)))
1843         clib_call_callbacks (vm->worker_thread_main_loop_callbacks, vm,
1844                              cpu_time_now);
1845
1846       /*
1847        * When trying to understand aggravating, hard-to-reproduce
1848        * bugs: reset / restart the pcap dispatch trace once per
1849        * main thread dispatch cycle. All threads share the same
1850        * (spinlock-protected) dispatch trace buffer. It might take
1851        * a few tries to capture a good post-mortem trace of
1852        * a multi-thread issue. Best we can do without a big refactor job.
1853        */
1854       if (is_main && PREDICT_FALSE (vm->dispatch_pcap_postmortem != 0))
1855         pcap_postmortem_reset (vm);
1856
1857       /* Process pre-input nodes. */
1858       cpu_time_now = clib_cpu_time_now ();
1859       vec_foreach (n, nm->nodes_by_type[VLIB_NODE_TYPE_PRE_INPUT])
1860         cpu_time_now = dispatch_node (vm, n,
1861                                       VLIB_NODE_TYPE_PRE_INPUT,
1862                                       VLIB_NODE_STATE_POLLING,
1863                                       /* frame */ 0,
1864                                       cpu_time_now);
1865
1866       /* Next process input nodes. */
1867       vec_foreach (n, nm->nodes_by_type[VLIB_NODE_TYPE_INPUT])
1868         cpu_time_now = dispatch_node (vm, n,
1869                                       VLIB_NODE_TYPE_INPUT,
1870                                       VLIB_NODE_STATE_POLLING,
1871                                       /* frame */ 0,
1872                                       cpu_time_now);
1873
1874       if (PREDICT_TRUE (is_main && vm->queue_signal_pending == 0))
1875         vm->queue_signal_callback (vm);
1876
1877       /* handle local interruots */
1878       if (_vec_len (nm->pending_local_interrupts))
1879         {
1880           vlib_node_interrupt_t *interrupts = nm->pending_local_interrupts;
1881           nm->pending_local_interrupts = empty_int_list;
1882           cpu_time_now = dispatch_pending_interrupts (vm, nm, cpu_time_now,
1883                                                       interrupts);
1884           empty_int_list = interrupts;
1885           vec_reset_length (empty_int_list);
1886         }
1887
1888       /* handle remote interruots */
1889       if (PREDICT_FALSE (_vec_len (nm->pending_remote_interrupts)))
1890         {
1891           vlib_node_interrupt_t *interrupts;
1892
1893           /* at this point it is known that
1894            * vec_len (nm->pending_local_interrupts) is zero so we quickly swap
1895            * local and remote vector under the spinlock */
1896           clib_spinlock_lock (&nm->pending_interrupt_lock);
1897           interrupts = nm->pending_remote_interrupts;
1898           nm->pending_remote_interrupts = empty_int_list;
1899           *nm->pending_remote_interrupts_notify = 0;
1900           clib_spinlock_unlock (&nm->pending_interrupt_lock);
1901
1902           cpu_time_now = dispatch_pending_interrupts (vm, nm, cpu_time_now,
1903                                                       interrupts);
1904           empty_int_list = interrupts;
1905           vec_reset_length (empty_int_list);
1906         }
1907
1908       /* Input nodes may have added work to the pending vector.
1909          Process pending vector until there is nothing left.
1910          All pending vectors will be processed from input -> output. */
1911       for (i = 0; i < _vec_len (nm->pending_frames); i++)
1912         cpu_time_now = dispatch_pending_node (vm, i, cpu_time_now);
1913       /* Reset pending vector for next iteration. */
1914       _vec_len (nm->pending_frames) = 0;
1915
1916       if (is_main)
1917         {
1918           /* *INDENT-OFF* */
1919           ELOG_TYPE_DECLARE (es) =
1920             {
1921               .format = "process tw start",
1922               .format_args = "",
1923             };
1924           ELOG_TYPE_DECLARE (ee) =
1925             {
1926               .format = "process tw end: %d",
1927               .format_args = "i4",
1928             };
1929           /* *INDENT-ON* */
1930
1931           struct
1932           {
1933             int nready_procs;
1934           } *ed;
1935
1936           /* Check if process nodes have expired from timing wheel. */
1937           ASSERT (nm->data_from_advancing_timing_wheel != 0);
1938
1939           if (PREDICT_FALSE (vm->elog_trace_graph_dispatch))
1940             ed = ELOG_DATA (&vlib_global_main.elog_main, es);
1941
1942           nm->data_from_advancing_timing_wheel =
1943             TW (tw_timer_expire_timers_vec)
1944             ((TWT (tw_timer_wheel) *) nm->timing_wheel, vlib_time_now (vm),
1945              nm->data_from_advancing_timing_wheel);
1946
1947           ASSERT (nm->data_from_advancing_timing_wheel != 0);
1948
1949           if (PREDICT_FALSE (vm->elog_trace_graph_dispatch))
1950             {
1951               ed = ELOG_DATA (&vlib_global_main.elog_main, ee);
1952               ed->nready_procs =
1953                 _vec_len (nm->data_from_advancing_timing_wheel);
1954             }
1955
1956           if (PREDICT_FALSE
1957               (_vec_len (nm->data_from_advancing_timing_wheel) > 0))
1958             {
1959               uword i;
1960
1961               for (i = 0; i < _vec_len (nm->data_from_advancing_timing_wheel);
1962                    i++)
1963                 {
1964                   u32 d = nm->data_from_advancing_timing_wheel[i];
1965                   u32 di = vlib_timing_wheel_data_get_index (d);
1966
1967                   if (vlib_timing_wheel_data_is_timed_event (d))
1968                     {
1969                       vlib_signal_timed_event_data_t *te =
1970                         pool_elt_at_index (nm->signal_timed_event_data_pool,
1971                                            di);
1972                       vlib_node_t *n =
1973                         vlib_get_node (vm, te->process_node_index);
1974                       vlib_process_t *p =
1975                         vec_elt (nm->processes, n->runtime_index);
1976                       void *data;
1977                       data =
1978                         vlib_process_signal_event_helper (nm, n, p,
1979                                                           te->event_type_index,
1980                                                           te->n_data_elts,
1981                                                           te->n_data_elt_bytes);
1982                       if (te->n_data_bytes < sizeof (te->inline_event_data))
1983                         clib_memcpy_fast (data, te->inline_event_data,
1984                                           te->n_data_bytes);
1985                       else
1986                         {
1987                           clib_memcpy_fast (data, te->event_data_as_vector,
1988                                             te->n_data_bytes);
1989                           vec_free (te->event_data_as_vector);
1990                         }
1991                       pool_put (nm->signal_timed_event_data_pool, te);
1992                     }
1993                   else
1994                     {
1995                       cpu_time_now = clib_cpu_time_now ();
1996                       cpu_time_now =
1997                         dispatch_suspended_process (vm, di, cpu_time_now);
1998                     }
1999                 }
2000               _vec_len (nm->data_from_advancing_timing_wheel) = 0;
2001             }
2002         }
2003       vlib_increment_main_loop_counter (vm);
2004       /* Record time stamp in case there are no enabled nodes and above
2005          calls do not update time stamp. */
2006       cpu_time_now = clib_cpu_time_now ();
2007       vm->loops_this_reporting_interval++;
2008       now = clib_time_now_internal (&vm->clib_time, cpu_time_now);
2009       /* Time to update loops_per_second? */
2010       if (PREDICT_FALSE (now >= vm->loop_interval_end))
2011         {
2012           /* Next sample ends in 20ms */
2013           if (vm->loop_interval_start)
2014             {
2015               f64 this_loops_per_second;
2016
2017               this_loops_per_second =
2018                 ((f64) vm->loops_this_reporting_interval) / (now -
2019                                                              vm->loop_interval_start);
2020
2021               vm->loops_per_second =
2022                 vm->loops_per_second * vm->damping_constant +
2023                 (1.0 - vm->damping_constant) * this_loops_per_second;
2024               if (vm->loops_per_second != 0.0)
2025                 vm->seconds_per_loop = 1.0 / vm->loops_per_second;
2026               else
2027                 vm->seconds_per_loop = 0.0;
2028             }
2029           /* New interval starts now, and ends in 20ms */
2030           vm->loop_interval_start = now;
2031           vm->loop_interval_end = now + 2e-4;
2032           vm->loops_this_reporting_interval = 0;
2033         }
2034     }
2035 }
2036
2037 static void
2038 vlib_main_loop (vlib_main_t * vm)
2039 {
2040   vlib_main_or_worker_loop (vm, /* is_main */ 1);
2041 }
2042
2043 void
2044 vlib_worker_loop (vlib_main_t * vm)
2045 {
2046   vlib_main_or_worker_loop (vm, /* is_main */ 0);
2047 }
2048
2049 vlib_main_t vlib_global_main;
2050
2051 static clib_error_t *
2052 vlib_main_configure (vlib_main_t * vm, unformat_input_t * input)
2053 {
2054   int turn_on_mem_trace = 0;
2055
2056   while (unformat_check_input (input) != UNFORMAT_END_OF_INPUT)
2057     {
2058       if (unformat (input, "memory-trace"))
2059         turn_on_mem_trace = 1;
2060
2061       else if (unformat (input, "elog-events %d",
2062                          &vm->configured_elog_ring_size))
2063         vm->configured_elog_ring_size =
2064           1 << max_log2 (vm->configured_elog_ring_size);
2065       else if (unformat (input, "elog-post-mortem-dump"))
2066         vm->elog_post_mortem_dump = 1;
2067       else if (unformat (input, "buffer-alloc-success-rate %f",
2068                          &vm->buffer_alloc_success_rate))
2069         {
2070           if (VLIB_BUFFER_ALLOC_FAULT_INJECTOR == 0)
2071             return clib_error_return
2072               (0, "Buffer fault injection not configured");
2073         }
2074       else if (unformat (input, "buffer-alloc-success-seed %u",
2075                          &vm->buffer_alloc_success_seed))
2076         {
2077           if (VLIB_BUFFER_ALLOC_FAULT_INJECTOR == 0)
2078             return clib_error_return
2079               (0, "Buffer fault injection not configured");
2080         }
2081       else
2082         return unformat_parse_error (input);
2083     }
2084
2085   unformat_free (input);
2086
2087   /* Enable memory trace as early as possible. */
2088   if (turn_on_mem_trace)
2089     clib_mem_trace (1);
2090
2091   return 0;
2092 }
2093
2094 VLIB_EARLY_CONFIG_FUNCTION (vlib_main_configure, "vlib");
2095
2096 static void
2097 placeholder_queue_signal_callback (vlib_main_t * vm)
2098 {
2099 }
2100
2101 #define foreach_weak_reference_stub             \
2102 _(vlib_map_stat_segment_init)                   \
2103 _(vpe_api_init)                                 \
2104 _(vlibmemory_init)                              \
2105 _(map_api_segment_init)
2106
2107 #define _(name)                                                 \
2108 clib_error_t *name (vlib_main_t *vm) __attribute__((weak));     \
2109 clib_error_t *name (vlib_main_t *vm) { return 0; }
2110 foreach_weak_reference_stub;
2111 #undef _
2112
2113 void vl_api_set_elog_main (elog_main_t * m) __attribute__ ((weak));
2114 void
2115 vl_api_set_elog_main (elog_main_t * m)
2116 {
2117   clib_warning ("STUB");
2118 }
2119
2120 int vl_api_set_elog_trace_api_messages (int enable) __attribute__ ((weak));
2121 int
2122 vl_api_set_elog_trace_api_messages (int enable)
2123 {
2124   clib_warning ("STUB");
2125   return 0;
2126 }
2127
2128 int vl_api_get_elog_trace_api_messages (void) __attribute__ ((weak));
2129 int
2130 vl_api_get_elog_trace_api_messages (void)
2131 {
2132   clib_warning ("STUB");
2133   return 0;
2134 }
2135
2136 /* Main function. */
2137 int
2138 vlib_main (vlib_main_t * volatile vm, unformat_input_t * input)
2139 {
2140   clib_error_t *volatile error;
2141   vlib_node_main_t *nm = &vm->node_main;
2142
2143   vm->queue_signal_callback = placeholder_queue_signal_callback;
2144
2145   /* Reconfigure event log which is enabled very early */
2146   if (vm->configured_elog_ring_size &&
2147       vm->configured_elog_ring_size != vm->elog_main.event_ring_size)
2148     elog_resize (&vm->elog_main, vm->configured_elog_ring_size);
2149   vl_api_set_elog_main (&vm->elog_main);
2150   (void) vl_api_set_elog_trace_api_messages (1);
2151
2152   /* Default name. */
2153   if (!vm->name)
2154     vm->name = "VLIB";
2155
2156   if ((error = vlib_physmem_init (vm)))
2157     {
2158       clib_error_report (error);
2159       goto done;
2160     }
2161
2162   if ((error = vlib_map_stat_segment_init (vm)))
2163     {
2164       clib_error_report (error);
2165       goto done;
2166     }
2167
2168   if ((error = vlib_buffer_main_init (vm)))
2169     {
2170       clib_error_report (error);
2171       goto done;
2172     }
2173
2174   if ((error = vlib_thread_init (vm)))
2175     {
2176       clib_error_report (error);
2177       goto done;
2178     }
2179
2180   /* Register static nodes so that init functions may use them. */
2181   vlib_register_all_static_nodes (vm);
2182
2183   /* Set seed for random number generator.
2184      Allow user to specify seed to make random sequence deterministic. */
2185   if (!unformat (input, "seed %wd", &vm->random_seed))
2186     vm->random_seed = clib_cpu_time_now ();
2187   clib_random_buffer_init (&vm->random_buffer, vm->random_seed);
2188
2189   /* Initialize node graph. */
2190   if ((error = vlib_node_main_init (vm)))
2191     {
2192       /* Arrange for graph hook up error to not be fatal when debugging. */
2193       if (CLIB_DEBUG > 0)
2194         clib_error_report (error);
2195       else
2196         goto done;
2197     }
2198
2199   /* Direct call / weak reference, for vlib standalone use-cases */
2200   if ((error = vpe_api_init (vm)))
2201     {
2202       clib_error_report (error);
2203       goto done;
2204     }
2205
2206   if ((error = vlibmemory_init (vm)))
2207     {
2208       clib_error_report (error);
2209       goto done;
2210     }
2211
2212   if ((error = map_api_segment_init (vm)))
2213     {
2214       clib_error_report (error);
2215       goto done;
2216     }
2217
2218   /* See unix/main.c; most likely already set up */
2219   if (vm->init_functions_called == 0)
2220     vm->init_functions_called = hash_create (0, /* value bytes */ 0);
2221   if ((error = vlib_call_all_init_functions (vm)))
2222     goto done;
2223
2224   nm->timing_wheel = clib_mem_alloc_aligned (sizeof (TWT (tw_timer_wheel)),
2225                                              CLIB_CACHE_LINE_BYTES);
2226
2227   vec_validate (nm->data_from_advancing_timing_wheel, 10);
2228   _vec_len (nm->data_from_advancing_timing_wheel) = 0;
2229
2230   /* Create the process timing wheel */
2231   TW (tw_timer_wheel_init) ((TWT (tw_timer_wheel) *) nm->timing_wheel,
2232                             0 /* no callback */ ,
2233                             10e-6 /* timer period 10us */ ,
2234                             ~0 /* max expirations per call */ );
2235
2236   vec_validate (vm->pending_rpc_requests, 0);
2237   _vec_len (vm->pending_rpc_requests) = 0;
2238   vec_validate (vm->processing_rpc_requests, 0);
2239   _vec_len (vm->processing_rpc_requests) = 0;
2240
2241   /* Default params for the buffer allocator fault injector, if configured */
2242   if (VLIB_BUFFER_ALLOC_FAULT_INJECTOR > 0)
2243     {
2244       vm->buffer_alloc_success_seed = 0xdeaddabe;
2245       vm->buffer_alloc_success_rate = 0.80;
2246     }
2247
2248   if ((error = vlib_call_all_config_functions (vm, input, 0 /* is_early */ )))
2249     goto done;
2250
2251   /*
2252    * Use exponential smoothing, with a half-life of 1 second
2253    * reported_rate(t) = reported_rate(t-1) * K + rate(t)*(1-K)
2254    *
2255    * Sample every 20ms, aka 50 samples per second
2256    * K = exp (-1.0/20.0);
2257    * K = 0.95
2258    */
2259   vm->damping_constant = exp (-1.0 / 20.0);
2260
2261   /* Sort per-thread init functions before we start threads */
2262   vlib_sort_init_exit_functions (&vm->worker_init_function_registrations);
2263
2264   /* Call all main loop enter functions. */
2265   {
2266     clib_error_t *sub_error;
2267     sub_error = vlib_call_all_main_loop_enter_functions (vm);
2268     if (sub_error)
2269       clib_error_report (sub_error);
2270   }
2271
2272   switch (clib_setjmp (&vm->main_loop_exit, VLIB_MAIN_LOOP_EXIT_NONE))
2273     {
2274     case VLIB_MAIN_LOOP_EXIT_NONE:
2275       vm->main_loop_exit_set = 1;
2276       break;
2277
2278     case VLIB_MAIN_LOOP_EXIT_CLI:
2279       goto done;
2280
2281     default:
2282       error = vm->main_loop_error;
2283       goto done;
2284     }
2285
2286   vlib_main_loop (vm);
2287
2288 done:
2289   /* Call all exit functions. */
2290   {
2291     clib_error_t *sub_error;
2292     sub_error = vlib_call_all_main_loop_exit_functions (vm);
2293     if (sub_error)
2294       clib_error_report (sub_error);
2295   }
2296
2297   if (error)
2298     clib_error_report (error);
2299
2300   return 0;
2301 }
2302
2303 int
2304 vlib_pcap_dispatch_trace_configure (vlib_pcap_dispatch_trace_args_t * a)
2305 {
2306   vlib_main_t *vm = vlib_get_main ();
2307   pcap_main_t *pm = &vm->dispatch_pcap_main;
2308   vlib_trace_main_t *tm;
2309   vlib_trace_node_t *tn;
2310
2311   if (a->status)
2312     {
2313       if (vm->dispatch_pcap_enable)
2314         {
2315           int i;
2316           vlib_cli_output
2317             (vm, "pcap dispatch capture enabled: %d of %d pkts...",
2318              pm->n_packets_captured, pm->n_packets_to_capture);
2319           vlib_cli_output (vm, "capture to file %s", pm->file_name);
2320
2321           for (i = 0; i < vec_len (vm->dispatch_buffer_trace_nodes); i++)
2322             {
2323               vlib_cli_output (vm,
2324                                "Buffer trace of %d pkts from %U enabled...",
2325                                a->buffer_traces_to_capture,
2326                                format_vlib_node_name, vm,
2327                                vm->dispatch_buffer_trace_nodes[i]);
2328             }
2329         }
2330       else
2331         vlib_cli_output (vm, "pcap dispatch capture disabled");
2332       return 0;
2333     }
2334
2335   /* Consistency checks */
2336
2337   /* Enable w/ capture already enabled not allowed */
2338   if (vm->dispatch_pcap_enable && a->enable)
2339     return -7;                  /* VNET_API_ERROR_INVALID_VALUE */
2340
2341   /* Disable capture with capture already disabled, not interesting */
2342   if (vm->dispatch_pcap_enable == 0 && a->enable == 0)
2343     return -81;                 /* VNET_API_ERROR_VALUE_EXIST */
2344
2345   /* Change number of packets to capture while capturing */
2346   if (vm->dispatch_pcap_enable && a->enable
2347       && (pm->n_packets_to_capture != a->packets_to_capture))
2348     return -8;                  /* VNET_API_ERROR_INVALID_VALUE_2 */
2349
2350   /* Independent of enable/disable, to allow buffer trace multi nodes */
2351   if (a->buffer_trace_node_index != ~0)
2352     {
2353       /* *INDENT-OFF* */
2354       foreach_vlib_main ((
2355         {
2356           tm = &this_vlib_main->trace_main;
2357           tm->verbose = 0;  /* not sure this ever did anything... */
2358           vec_validate (tm->nodes, a->buffer_trace_node_index);
2359           tn = tm->nodes + a->buffer_trace_node_index;
2360           tn->limit += a->buffer_traces_to_capture;
2361           if (a->post_mortem)
2362             {
2363               tm->filter_flag = FILTER_FLAG_POST_MORTEM;
2364               tm->filter_count = ~0;
2365             }
2366           tm->trace_enable = 1;
2367         }));
2368       /* *INDENT-ON* */
2369       vec_add1 (vm->dispatch_buffer_trace_nodes, a->buffer_trace_node_index);
2370     }
2371
2372   if (a->enable)
2373     {
2374       /* Clean up from previous run, if any */
2375       vec_free (pm->file_name);
2376       vec_free (pm->pcap_data);
2377       memset (pm, 0, sizeof (*pm));
2378
2379       vec_validate_aligned (vnet_trace_placeholder, 2048,
2380                             CLIB_CACHE_LINE_BYTES);
2381       if (pm->lock == 0)
2382         clib_spinlock_init (&(pm->lock));
2383
2384       if (a->filename == 0)
2385         a->filename = format (0, "/tmp/dispatch.pcap%c", 0);
2386
2387       pm->file_name = (char *) a->filename;
2388       pm->n_packets_captured = 0;
2389       pm->packet_type = PCAP_PACKET_TYPE_vpp;
2390       pm->n_packets_to_capture = a->packets_to_capture;
2391       vm->dispatch_pcap_postmortem = a->post_mortem;
2392       /* *INDENT-OFF* */
2393       foreach_vlib_main (({ this_vlib_main->dispatch_pcap_enable = 1;}));
2394       /* *INDENT-ON* */
2395     }
2396   else
2397     {
2398       /* *INDENT-OFF* */
2399       foreach_vlib_main ((
2400         {
2401           this_vlib_main->dispatch_pcap_enable = 0;
2402           this_vlib_main->dispatch_pcap_postmortem = 0;
2403           tm = &this_vlib_main->trace_main;
2404           tm->filter_flag = 0;
2405           tm->filter_count = 0;
2406           tm->trace_enable = 0;
2407         }));
2408       /* *INDENT-ON* */
2409       vec_reset_length (vm->dispatch_buffer_trace_nodes);
2410       if (pm->n_packets_captured)
2411         {
2412           clib_error_t *error;
2413           pm->n_packets_to_capture = pm->n_packets_captured;
2414           vlib_cli_output (vm, "Write %d packets to %s, and stop capture...",
2415                            pm->n_packets_captured, pm->file_name);
2416           error = pcap_write (pm);
2417           if (pm->flags & PCAP_MAIN_INIT_DONE)
2418             pcap_close (pm);
2419           /* Report I/O errors... */
2420           if (error)
2421             {
2422               clib_error_report (error);
2423               return -11;       /* VNET_API_ERROR_SYSCALL_ERROR_1 */
2424             }
2425           return 0;
2426         }
2427       else
2428         return -6;              /* VNET_API_ERROR_NO_SUCH_ENTRY */
2429     }
2430
2431   return 0;
2432 }
2433
2434 static clib_error_t *
2435 dispatch_trace_command_fn (vlib_main_t * vm,
2436                            unformat_input_t * input, vlib_cli_command_t * cmd)
2437 {
2438   unformat_input_t _line_input, *line_input = &_line_input;
2439   vlib_pcap_dispatch_trace_args_t _a, *a = &_a;
2440   u8 *filename = 0;
2441   u32 max = 1000;
2442   int rv;
2443   int enable = 0;
2444   int status = 0;
2445   int post_mortem = 0;
2446   u32 node_index = ~0, buffer_traces_to_capture = 100;
2447
2448   /* Get a line of input. */
2449   if (!unformat_user (input, unformat_line_input, line_input))
2450     return 0;
2451
2452   while (unformat_check_input (line_input) != UNFORMAT_END_OF_INPUT)
2453     {
2454       if (unformat (line_input, "on %=", &enable, 1))
2455         ;
2456       else if (unformat (line_input, "enable %=", &enable, 1))
2457         ;
2458       else if (unformat (line_input, "off %=", &enable, 0))
2459         ;
2460       else if (unformat (line_input, "disable %=", &enable, 0))
2461         ;
2462       else if (unformat (line_input, "max %d", &max))
2463         ;
2464       else if (unformat (line_input, "packets-to-capture %d", &max))
2465         ;
2466       else if (unformat (line_input, "file %U", unformat_vlib_tmpfile,
2467                          &filename))
2468         ;
2469       else if (unformat (line_input, "status %=", &status, 1))
2470         ;
2471       else if (unformat (line_input, "buffer-trace %U %d",
2472                          unformat_vlib_node, vm, &node_index,
2473                          &buffer_traces_to_capture))
2474         ;
2475       else if (unformat (line_input, "post-mortem %=", &post_mortem, 1))
2476         ;
2477       else
2478         {
2479           return clib_error_return (0, "unknown input `%U'",
2480                                     format_unformat_error, line_input);
2481         }
2482     }
2483
2484   unformat_free (line_input);
2485
2486   /* no need for memset (a, 0, sizeof (*a)), set all fields here. */
2487   a->filename = filename;
2488   a->enable = enable;
2489   a->status = status;
2490   a->packets_to_capture = max;
2491   a->buffer_trace_node_index = node_index;
2492   a->buffer_traces_to_capture = buffer_traces_to_capture;
2493   a->post_mortem = post_mortem;
2494
2495   rv = vlib_pcap_dispatch_trace_configure (a);
2496
2497   switch (rv)
2498     {
2499     case 0:
2500       break;
2501
2502     case -7:
2503       return clib_error_return (0, "dispatch trace already enabled...");
2504
2505     case -81:
2506       return clib_error_return (0, "dispatch trace already disabled...");
2507
2508     case -8:
2509       return clib_error_return
2510         (0, "can't change number of records to capture while tracing...");
2511
2512     case -11:
2513       return clib_error_return (0, "I/O writing trace capture...");
2514
2515     case -6:
2516       return clib_error_return (0, "No packets captured...");
2517
2518     default:
2519       vlib_cli_output (vm, "WARNING: trace configure returned %d", rv);
2520       break;
2521     }
2522   return 0;
2523 }
2524
2525 /*?
2526  * This command is used to start or stop pcap dispatch trace capture, or show
2527  * the capture status.
2528  *
2529  * This command has the following optional parameters:
2530  *
2531  * - <b>on|off</b> - Used to start or stop capture.
2532  *
2533  * - <b>max <nn></b> - Depth of local buffer. Once '<em>nn</em>' number
2534  *   of packets have been received, buffer is flushed to file. Once another
2535  *   '<em>nn</em>' number of packets have been received, buffer is flushed
2536  *   to file, overwriting previous write. If not entered, value defaults
2537  *   to 100. Can only be updated if packet capture is off.
2538  *
2539  * - <b>file <name></b> - Used to specify the output filename. The file will
2540  *   be placed in the '<em>/tmp</em>' directory, so only the filename is
2541  *   supported. Directory should not be entered. If file already exists, file
2542  *   will be overwritten. If no filename is provided, '<em>/tmp/vpe.pcap</em>'
2543  *   will be used. Can only be updated if packet capture is off.
2544  *
2545  * - <b>status</b> - Displays the current status and configured attributes
2546  *   associated with a packet capture. If packet capture is in progress,
2547  *   '<em>status</em>' also will return the number of packets currently in
2548  *   the local buffer. All additional attributes entered on command line
2549  *   with '<em>status</em>' will be ignored and not applied.
2550  *
2551  * @cliexpar
2552  * Example of how to display the status of capture when off:
2553  * @cliexstart{pcap dispatch trace status}
2554  * max is 100, for any interface to file /tmp/vpe.pcap
2555  * pcap dispatch capture is off...
2556  * @cliexend
2557  * Example of how to start a dispatch trace capture:
2558  * @cliexstart{pcap dispatch trace on max 35 file dispatchTrace.pcap}
2559  * pcap dispatch capture on...
2560  * @cliexend
2561  * Example of how to start a dispatch trace capture with buffer tracing
2562  * @cliexstart{pcap dispatch trace on max 10000 file dispatchTrace.pcap buffer-trace dpdk-input 1000}
2563  * pcap dispatch capture on...
2564  * @cliexend
2565  * Example of how to display the status of a tx packet capture in progress:
2566  * @cliexstart{pcap tx trace status}
2567  * max is 35, dispatch trace to file /tmp/vppTest.pcap
2568  * pcap tx capture is on: 20 of 35 pkts...
2569  * @cliexend
2570  * Example of how to stop a tx packet capture:
2571  * @cliexstart{vppctl pcap dispatch trace off}
2572  * captured 21 pkts...
2573  * saved to /tmp/dispatchTrace.pcap...
2574  * Example of how to start a post-mortem dispatch trace:
2575  * pcap dispatch trace on max 20000 buffer-trace
2576  *     dpdk-input 3000000000 post-mortem
2577  * @cliexend
2578 ?*/
2579 /* *INDENT-OFF* */
2580 VLIB_CLI_COMMAND (pcap_dispatch_trace_command, static) = {
2581     .path = "pcap dispatch trace",
2582     .short_help =
2583     "pcap dispatch trace [on|off] [max <nn>] [file <name>] [status]\n"
2584     "              [buffer-trace <input-node-name> <nn>][post-mortem]",
2585     .function = dispatch_trace_command_fn,
2586 };
2587 /* *INDENT-ON* */
2588
2589 vlib_main_t *
2590 vlib_get_main_not_inline (void)
2591 {
2592   return vlib_get_main ();
2593 }
2594
2595 elog_main_t *
2596 vlib_get_elog_main_not_inline ()
2597 {
2598   return &vlib_global_main.elog_main;
2599 }
2600
2601 /*
2602  * fd.io coding-style-patch-verification: ON
2603  *
2604  * Local Variables:
2605  * eval: (c-set-style "gnu")
2606  * End:
2607  */