766c9ec3756ee1e90caf27074c9e2ef4402fb20e
[vpp.git] / src / vlib / main.h
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 /*
16  * main.h: VLIB main data structure
17  *
18  * Copyright (c) 2008 Eliot Dresselhaus
19  *
20  * Permission is hereby granted, free of charge, to any person obtaining
21  * a copy of this software and associated documentation files (the
22  * "Software"), to deal in the Software without restriction, including
23  * without limitation the rights to use, copy, modify, merge, publish,
24  * distribute, sublicense, and/or sell copies of the Software, and to
25  * permit persons to whom the Software is furnished to do so, subject to
26  * the following conditions:
27  *
28  * The above copyright notice and this permission notice shall be
29  * included in all copies or substantial portions of the Software.
30  *
31  *  THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
32  *  EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
33  *  MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
34  *  NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
35  *  LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
36  *  OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
37  *  WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
38  */
39
40 #ifndef included_vlib_main_h
41 #define included_vlib_main_h
42
43 #include <vppinfra/callback_data.h>
44 #include <vppinfra/elog.h>
45 #include <vppinfra/format.h>
46 #include <vppinfra/longjmp.h>
47 #include <vppinfra/pool.h>
48 #include <vppinfra/random_buffer.h>
49 #include <vppinfra/time.h>
50 #include <vppinfra/pmc.h>
51 #include <vppinfra/pcap.h>
52
53 #include <pthread.h>
54
55
56 /* By default turn off node/error event logging.
57    Override with -DVLIB_ELOG_MAIN_LOOP */
58 #ifndef VLIB_ELOG_MAIN_LOOP
59 #define VLIB_ELOG_MAIN_LOOP 0
60 #endif
61
62 typedef struct
63 {
64   /* Trace RX pkts */
65   u8 pcap_rx_enable;
66   /* Trace TX pkts */
67   u8 pcap_tx_enable;
68   /* Trace drop pkts */
69   u8 pcap_drop_enable;
70   u8 pad1;
71   u32 max_bytes_per_pkt;
72   u32 pcap_sw_if_index;
73   pcap_main_t pcap_main;
74   u32 filter_classify_table_index;
75 } vnet_pcap_t;
76
77 typedef struct
78 {
79   u8 trace_filter_enable;
80   u32 trace_classify_table_index;
81   u32 trace_filter_set_index;
82 } vlib_trace_filter_t;
83
84 typedef enum
85 {
86   VLIB_NODE_RUNTIME_PERF_BEFORE,
87   VLIB_NODE_RUNTIME_PERF_AFTER,
88   VLIB_NODE_RUNTIME_PERF_RESET,
89 } vlib_node_runtime_perf_call_type_t;
90
91 typedef struct
92 {
93   struct vlib_main_t *vm;
94   vlib_node_runtime_t *node;
95   vlib_frame_t *frame;
96   uword packets;
97   u64 cpu_time_now;
98   vlib_node_runtime_perf_call_type_t call_type;
99 } vlib_node_runtime_perf_callback_args_t;
100
101 struct vlib_node_runtime_perf_callback_data_t;
102
103 typedef void (*vlib_node_runtime_perf_callback_fp_t)
104   (struct vlib_node_runtime_perf_callback_data_t * data,
105    vlib_node_runtime_perf_callback_args_t * args);
106
107 typedef struct vlib_node_runtime_perf_callback_data_t
108 {
109   vlib_node_runtime_perf_callback_fp_t fp;
110   union
111   {
112     void *v;
113     u64 u;
114   } u[3];
115 } vlib_node_runtime_perf_callback_data_t;
116
117 clib_callback_data_typedef (vlib_node_runtime_perf_callback_set_t,
118                             vlib_node_runtime_perf_callback_data_t);
119
120 typedef struct vlib_main_t
121 {
122   CLIB_CACHE_LINE_ALIGN_MARK (cacheline0);
123   /* Instruction level timing state. */
124   clib_time_t clib_time;
125   /* Offset from main thread time */
126   f64 time_offset;
127   f64 time_last_barrier_release;
128
129   /* Time stamp of last node dispatch. */
130   u64 cpu_time_last_node_dispatch;
131
132   /* Time stamp when main loop was entered (time 0). */
133   u64 cpu_time_main_loop_start;
134
135   /* Incremented once for each main loop. */
136   volatile u32 main_loop_count;
137
138   /* Count of vectors processed this main loop. */
139   u32 main_loop_vectors_processed;
140   u32 main_loop_nodes_processed;
141
142   /* Internal node vectors, calls */
143   u64 internal_node_vectors;
144   u64 internal_node_calls;
145   u64 internal_node_vectors_last_clear;
146   u64 internal_node_calls_last_clear;
147
148   /* Instantaneous vector rate */
149   u32 internal_node_last_vectors_per_main_loop;
150
151   /* Main loop hw / sw performance counters */
152   vlib_node_runtime_perf_callback_set_t vlib_node_runtime_perf_callbacks;
153
154   /* Every so often we switch to the next counter. */
155 #define VLIB_LOG2_MAIN_LOOPS_PER_STATS_UPDATE 7
156
157   /* Jump target to exit main loop with given code. */
158   u32 main_loop_exit_set;
159   /* Set e.g. in the SIGTERM signal handler, checked in a safe place... */
160   volatile u32 main_loop_exit_now;
161   clib_longjmp_t main_loop_exit;
162 #define VLIB_MAIN_LOOP_EXIT_NONE 0
163 #define VLIB_MAIN_LOOP_EXIT_PANIC 1
164   /* Exit via CLI. */
165 #define VLIB_MAIN_LOOP_EXIT_CLI 2
166
167   /* Error marker to use when exiting main loop. */
168   clib_error_t *main_loop_error;
169
170   /* Name for e.g. syslog. */
171   char *name;
172
173   /* Start of the heap. */
174   void *heap_base;
175
176   /* Truncated version, to create frame indices */
177   void *heap_aligned_base;
178
179   /* Size of the heap */
180   uword heap_size;
181
182   /* buffer main structure. */
183   vlib_buffer_main_t *buffer_main;
184
185   /* physical memory main structure. */
186   vlib_physmem_main_t physmem_main;
187
188   /* Node graph main structure. */
189   vlib_node_main_t node_main;
190
191   /* Command line interface. */
192   vlib_cli_main_t cli_main;
193
194   /* Packet trace buffer. */
195   vlib_trace_main_t trace_main;
196
197   /* Pcap dispatch trace main */
198   pcap_main_t dispatch_pcap_main;
199   uword dispatch_pcap_enable;
200   uword dispatch_pcap_postmortem;
201   u32 *dispatch_buffer_trace_nodes;
202   u8 *pcap_buffer;
203
204   /* pcap rx / tx tracing */
205   vnet_pcap_t pcap;
206
207   /* Packet trace capture filter */
208   vlib_trace_filter_t trace_filter;
209
210   /* Error handling. */
211   vlib_error_main_t error_main;
212
213   /* Punt packets to underlying operating system for when fast switching
214      code does not know what to do. */
215   void (*os_punt_frame) (struct vlib_main_t * vm,
216                          struct vlib_node_runtime_t * node,
217                          vlib_frame_t * frame);
218
219   /* Stream index to use for distribution when MC is enabled. */
220   u32 mc_stream_index;
221
222   vlib_one_time_waiting_process_t *procs_waiting_for_mc_stream_join;
223
224   /* Event logger. */
225   elog_main_t elog_main;
226   u32 configured_elog_ring_size;
227
228   /* Event logger trace flags */
229   int elog_trace_api_messages;
230   int elog_trace_cli_commands;
231   int elog_trace_graph_dispatch;
232   int elog_trace_graph_circuit;
233   u32 elog_trace_graph_circuit_node_index;
234
235   /* Node call and return event types. */
236   elog_event_type_t *node_call_elog_event_types;
237   elog_event_type_t *node_return_elog_event_types;
238
239   elog_event_type_t *error_elog_event_types;
240
241   /* Seed for random number generator. */
242   uword random_seed;
243
244   /* Buffer of random data for various uses. */
245   clib_random_buffer_t random_buffer;
246
247   /* Hash table to record which init functions have been called. */
248   uword *init_functions_called;
249
250   /* thread, cpu and numa_node indices */
251   u32 thread_index;
252   u32 cpu_id;
253   u32 numa_node;
254
255   /* List of init functions to call, setup by constructors */
256   _vlib_init_function_list_elt_t *init_function_registrations;
257   _vlib_init_function_list_elt_t *worker_init_function_registrations;
258   _vlib_init_function_list_elt_t *main_loop_enter_function_registrations;
259   _vlib_init_function_list_elt_t *main_loop_exit_function_registrations;
260   _vlib_init_function_list_elt_t *api_init_function_registrations;
261   vlib_config_function_runtime_t *config_function_registrations;
262
263   /* control-plane API queue signal pending, length indication */
264   volatile u32 queue_signal_pending;
265   volatile u32 api_queue_nonempty;
266   void (*queue_signal_callback) (struct vlib_main_t *);
267   u8 **argv;
268
269   /* Top of (worker) dispatch loop callback */
270   void (**volatile worker_thread_main_loop_callbacks)
271     (struct vlib_main_t *, u64 t);
272   void (**volatile worker_thread_main_loop_callback_tmp)
273     (struct vlib_main_t *, u64 t);
274   clib_spinlock_t worker_thread_main_loop_callback_lock;
275
276   /* debugging */
277   volatile int parked_at_barrier;
278
279   /* Attempt to do a post-mortem elog dump */
280   int elog_post_mortem_dump;
281
282   /*
283    * Need to call vlib_worker_thread_node_runtime_update before
284    * releasing worker thread barrier. Only valid in vlib_global_main.
285    */
286   int need_vlib_worker_thread_node_runtime_update;
287
288   /* Dispatch loop time accounting */
289   u64 loops_this_reporting_interval;
290   f64 loop_interval_end;
291   f64 loop_interval_start;
292   f64 loops_per_second;
293   f64 seconds_per_loop;
294   f64 damping_constant;
295
296   /*
297    * Barrier epoch - Set to current time, each time barrier_sync or
298    * barrier_release is called with zero recursion.
299    */
300   f64 barrier_epoch;
301
302   /* Earliest barrier can be closed again */
303   f64 barrier_no_close_before;
304
305   /* Barrier counter callback */
306   void (**volatile barrier_perf_callbacks)
307     (struct vlib_main_t *, u64 t, int leave);
308   void (**volatile barrier_perf_callbacks_tmp)
309     (struct vlib_main_t *, u64 t, int leave);
310
311   /* Need to check the frame queues */
312   volatile uword check_frame_queues;
313
314   /* RPC requests, main thread only */
315   uword *pending_rpc_requests;
316   uword *processing_rpc_requests;
317   clib_spinlock_t pending_rpc_lock;
318
319   /* buffer fault injector */
320   u32 buffer_alloc_success_seed;
321   f64 buffer_alloc_success_rate;
322
323 #ifdef CLIB_SANITIZE_ADDR
324   /* address sanitizer stack save */
325   void *asan_stack_save;
326 #endif
327 } vlib_main_t;
328
329 /* Global main structure. */
330 extern vlib_main_t vlib_global_main;
331
332 void vlib_worker_loop (vlib_main_t * vm);
333
334 always_inline f64
335 vlib_time_now (vlib_main_t * vm)
336 {
337 #if CLIB_DEBUG > 0
338   extern __thread uword __os_thread_index;
339 #endif
340   /*
341    * Make sure folks don't pass &vlib_global_main from a worker thread.
342    */
343   ASSERT (vm->thread_index == __os_thread_index);
344   return clib_time_now (&vm->clib_time) + vm->time_offset;
345 }
346
347 always_inline f64
348 vlib_time_now_ticks (vlib_main_t * vm, u64 n)
349 {
350   return clib_time_now_internal (&vm->clib_time, n);
351 }
352
353 /* Busy wait for specified time. */
354 always_inline void
355 vlib_time_wait (vlib_main_t * vm, f64 wait)
356 {
357   f64 t = vlib_time_now (vm);
358   f64 limit = t + wait;
359   while (t < limit)
360     t = vlib_time_now (vm);
361 }
362
363 /* Time a piece of code. */
364 #define vlib_time_code(vm,body)                 \
365 do {                                            \
366     f64 _t[2];                                  \
367     _t[0] = vlib_time_now (vm);                 \
368     do { body; } while (0);                     \
369     _t[1] = vlib_time_now (vm);                 \
370     clib_warning ("%.7e", _t[1] - _t[0]);       \
371 } while (0)
372
373 #define vlib_wait_with_timeout(vm,suspend_time,timeout_time,test)       \
374 ({                                                                      \
375     uword __vlib_wait_with_timeout = 0;                                 \
376     f64 __vlib_wait_time = 0;                                           \
377     while (! (__vlib_wait_with_timeout = (test))                        \
378            && __vlib_wait_time < (timeout_time))                        \
379       {                                                                 \
380         vlib_process_suspend (vm, suspend_time);                        \
381         __vlib_wait_time += suspend_time;                               \
382       }                                                                 \
383     __vlib_wait_with_timeout;                                           \
384 })
385
386 always_inline void
387 vlib_panic_with_error (vlib_main_t * vm, clib_error_t * error)
388 {
389   vm->main_loop_error = error;
390   clib_longjmp (&vm->main_loop_exit, VLIB_MAIN_LOOP_EXIT_PANIC);
391 }
392
393 #define vlib_panic_with_msg(vm,args...) \
394   vlib_panic_with_error (vm, clib_error_return (0, args))
395
396 always_inline void
397 vlib_panic (vlib_main_t * vm)
398 {
399   vlib_panic_with_error (vm, 0);
400 }
401
402
403 always_inline f64
404 vlib_internal_node_vector_rate (vlib_main_t * vm)
405 {
406   u64 vectors;
407   u64 calls;
408
409   calls = vm->internal_node_calls - vm->internal_node_calls_last_clear;
410
411   if (PREDICT_FALSE (calls == 0))
412     return 0.0;
413
414   vectors = vm->internal_node_vectors - vm->internal_node_vectors_last_clear;
415
416   return (f64) vectors / (f64) calls;
417 }
418
419 always_inline void
420 vlib_clear_internal_node_vector_rate (vlib_main_t * vm)
421 {
422   vm->internal_node_calls_last_clear = vm->internal_node_calls;
423   vm->internal_node_vectors_last_clear = vm->internal_node_vectors;
424 }
425
426 always_inline void
427 vlib_increment_main_loop_counter (vlib_main_t * vm)
428 {
429   vm->main_loop_count++;
430   vm->internal_node_last_vectors_per_main_loop = 0;
431
432   if (PREDICT_FALSE (vm->main_loop_exit_now))
433     clib_longjmp (&vm->main_loop_exit, VLIB_MAIN_LOOP_EXIT_CLI);
434 }
435
436 always_inline u32
437 vlib_last_vectors_per_main_loop (vlib_main_t * vm)
438 {
439   return vm->internal_node_last_vectors_per_main_loop;
440 }
441
442 always_inline void
443 vlib_node_runtime_perf_counter (vlib_main_t * vm, vlib_node_runtime_t * node,
444                                 vlib_frame_t * frame, uword n, u64 t,
445                                 vlib_node_runtime_perf_call_type_t call_type)
446 {
447   vlib_node_runtime_perf_callback_data_t *v =
448     clib_callback_data_check_and_get (&vm->vlib_node_runtime_perf_callbacks);
449   if (vec_len (v))
450     {
451       vlib_node_runtime_perf_callback_args_t args = {
452         .vm = vm,
453         .node = node,
454         .frame = frame,
455         .packets = n,
456         .cpu_time_now = t,
457         .call_type = call_type,
458       };
459       clib_callback_data_call_vec (v, &args);
460     }
461 }
462
463 always_inline void vlib_set_queue_signal_callback
464   (vlib_main_t * vm, void (*fp) (vlib_main_t *))
465 {
466   vm->queue_signal_callback = fp;
467 }
468
469 /* Main routine. */
470 int vlib_main (vlib_main_t * vm, unformat_input_t * input);
471
472 /* Thread stacks, for os_get_thread_index */
473 extern u8 **vlib_thread_stacks;
474
475 /* Number of thread stacks that the application needs */
476 u32 vlib_app_num_thread_stacks_needed (void) __attribute__ ((weak));
477
478 extern void vlib_node_sync_stats (vlib_main_t * vm, vlib_node_t * n);
479
480 #define VLIB_PCAP_MAJOR_VERSION 1
481 #define VLIB_PCAP_MINOR_VERSION 0
482
483 typedef struct
484 {
485   u8 *filename;
486   int enable;
487   int status;
488   int post_mortem;
489   u32 packets_to_capture;
490   u32 buffer_trace_node_index;
491   u32 buffer_traces_to_capture;
492 } vlib_pcap_dispatch_trace_args_t;
493
494 int vlib_pcap_dispatch_trace_configure (vlib_pcap_dispatch_trace_args_t *);
495 vlib_main_t *vlib_get_main_not_inline (void);
496 elog_main_t *vlib_get_elog_main_not_inline ();
497
498 #endif /* included_vlib_main_h */
499
500 /*
501  * fd.io coding-style-patch-verification: ON
502  *
503  * Local Variables:
504  * eval: (c-set-style "gnu")
505  * End:
506  */