vlib: vfio code rework
[vpp.git] / src / vlib / buffer.c
1 /*
2  * Copyright (c) 2015 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15 /*
16  * buffer.c: allocate/free network buffers.
17  *
18  * Copyright (c) 2008 Eliot Dresselhaus
19  *
20  * Permission is hereby granted, free of charge, to any person obtaining
21  * a copy of this software and associated documentation files (the
22  * "Software"), to deal in the Software without restriction, including
23  * without limitation the rights to use, copy, modify, merge, publish,
24  * distribute, sublicense, and/or sell copies of the Software, and to
25  * permit persons to whom the Software is furnished to do so, subject to
26  * the following conditions:
27  *
28  * The above copyright notice and this permission notice shall be
29  * included in all copies or substantial portions of the Software.
30  *
31  *  THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
32  *  EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
33  *  MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
34  *  NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
35  *  LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
36  *  OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
37  *  WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
38  */
39
40 /**
41  * @file
42  *
43  * Allocate/free network buffers.
44  */
45
46 #include <vlib/vlib.h>
47 #include <vlib/unix/unix.h>
48
49 vlib_buffer_callbacks_t *vlib_buffer_callbacks = 0;
50 static u32 vlib_buffer_physmem_sz = 32 << 20;
51
52 uword
53 vlib_buffer_length_in_chain_slow_path (vlib_main_t * vm,
54                                        vlib_buffer_t * b_first)
55 {
56   vlib_buffer_t *b = b_first;
57   uword l_first = b_first->current_length;
58   uword l = 0;
59   while (b->flags & VLIB_BUFFER_NEXT_PRESENT)
60     {
61       b = vlib_get_buffer (vm, b->next_buffer);
62       l += b->current_length;
63     }
64   b_first->total_length_not_including_first_buffer = l;
65   b_first->flags |= VLIB_BUFFER_TOTAL_LENGTH_VALID;
66   return l + l_first;
67 }
68
69 u8 *
70 format_vlib_buffer (u8 * s, va_list * args)
71 {
72   vlib_buffer_t *b = va_arg (*args, vlib_buffer_t *);
73   u32 indent = format_get_indent (s);
74   u8 *a = 0;
75
76 #define _(bit, name, v) \
77   if (v && (b->flags & VLIB_BUFFER_##name)) \
78     a = format (a, "%s ", v);
79   foreach_vlib_buffer_flag
80 #undef _
81     s = format (s, "current data %d, length %d, free-list %d, clone-count %u",
82                 b->current_data, b->current_length,
83                 vlib_buffer_get_free_list_index (b), b->n_add_refs);
84
85   if (b->flags & VLIB_BUFFER_TOTAL_LENGTH_VALID)
86     s = format (s, ", totlen-nifb %d",
87                 b->total_length_not_including_first_buffer);
88
89   if (b->flags & VLIB_BUFFER_IS_TRACED)
90     s = format (s, ", trace 0x%x", b->trace_index);
91
92   if (a)
93     s = format (s, "\n%U%v", format_white_space, indent, a);
94   vec_free (a);
95
96   while (b->flags & VLIB_BUFFER_NEXT_PRESENT)
97     {
98       vlib_main_t *vm = vlib_get_main ();
99       u32 next_buffer = b->next_buffer;
100       b = vlib_get_buffer (vm, next_buffer);
101
102       s =
103         format (s, "\n%Unext-buffer 0x%x, segment length %d, clone-count %u",
104                 format_white_space, indent, next_buffer, b->current_length,
105                 b->n_add_refs);
106     }
107
108   return s;
109 }
110
111 u8 *
112 format_vlib_buffer_and_data (u8 * s, va_list * args)
113 {
114   vlib_buffer_t *b = va_arg (*args, vlib_buffer_t *);
115
116   s = format (s, "%U, %U",
117               format_vlib_buffer, b,
118               format_hex_bytes, vlib_buffer_get_current (b), 64);
119
120   return s;
121 }
122
123 static u8 *
124 format_vlib_buffer_known_state (u8 * s, va_list * args)
125 {
126   vlib_buffer_known_state_t state = va_arg (*args, vlib_buffer_known_state_t);
127   char *t;
128
129   switch (state)
130     {
131     case VLIB_BUFFER_UNKNOWN:
132       t = "unknown";
133       break;
134
135     case VLIB_BUFFER_KNOWN_ALLOCATED:
136       t = "known-allocated";
137       break;
138
139     case VLIB_BUFFER_KNOWN_FREE:
140       t = "known-free";
141       break;
142
143     default:
144       t = "invalid";
145       break;
146     }
147
148   return format (s, "%s", t);
149 }
150
151 u8 *
152 format_vlib_buffer_contents (u8 * s, va_list * va)
153 {
154   vlib_main_t *vm = va_arg (*va, vlib_main_t *);
155   vlib_buffer_t *b = va_arg (*va, vlib_buffer_t *);
156
157   while (1)
158     {
159       vec_add (s, vlib_buffer_get_current (b), b->current_length);
160       if (!(b->flags & VLIB_BUFFER_NEXT_PRESENT))
161         break;
162       b = vlib_get_buffer (vm, b->next_buffer);
163     }
164
165   return s;
166 }
167
168 static u8 *
169 vlib_validate_buffer_helper (vlib_main_t * vm,
170                              u32 bi,
171                              uword follow_buffer_next, uword ** unique_hash)
172 {
173   vlib_buffer_t *b = vlib_get_buffer (vm, bi);
174   vlib_buffer_main_t *bm = vm->buffer_main;
175   vlib_buffer_free_list_t *fl;
176
177   if (pool_is_free_index
178       (bm->buffer_free_list_pool, vlib_buffer_get_free_list_index (b)))
179     return format (0, "unknown free list 0x%x",
180                    vlib_buffer_get_free_list_index (b));
181
182   fl =
183     pool_elt_at_index (bm->buffer_free_list_pool,
184                        vlib_buffer_get_free_list_index (b));
185
186   if ((signed) b->current_data < (signed) -VLIB_BUFFER_PRE_DATA_SIZE)
187     return format (0, "current data %d before pre-data", b->current_data);
188
189   if (b->current_data + b->current_length > fl->n_data_bytes)
190     return format (0, "%d-%d beyond end of buffer %d",
191                    b->current_data, b->current_length, fl->n_data_bytes);
192
193   if (follow_buffer_next && (b->flags & VLIB_BUFFER_NEXT_PRESENT))
194     {
195       vlib_buffer_known_state_t k;
196       u8 *msg, *result;
197
198       k = vlib_buffer_is_known (b->next_buffer);
199       if (k != VLIB_BUFFER_KNOWN_ALLOCATED)
200         return format (0, "next 0x%x: %U",
201                        b->next_buffer, format_vlib_buffer_known_state, k);
202
203       if (unique_hash)
204         {
205           if (hash_get (*unique_hash, b->next_buffer))
206             return format (0, "duplicate buffer 0x%x", b->next_buffer);
207
208           hash_set1 (*unique_hash, b->next_buffer);
209         }
210
211       msg = vlib_validate_buffer (vm, b->next_buffer, follow_buffer_next);
212       if (msg)
213         {
214           result = format (0, "next 0x%x: %v", b->next_buffer, msg);
215           vec_free (msg);
216           return result;
217         }
218     }
219
220   return 0;
221 }
222
223 u8 *
224 vlib_validate_buffer (vlib_main_t * vm, u32 bi, uword follow_buffer_next)
225 {
226   return vlib_validate_buffer_helper (vm, bi, follow_buffer_next,
227                                       /* unique_hash */ 0);
228 }
229
230 u8 *
231 vlib_validate_buffers (vlib_main_t * vm,
232                        u32 * buffers,
233                        uword next_buffer_stride,
234                        uword n_buffers,
235                        vlib_buffer_known_state_t known_state,
236                        uword follow_buffer_next)
237 {
238   uword i, *hash;
239   u32 bi, *b = buffers;
240   vlib_buffer_known_state_t k;
241   u8 *msg = 0, *result = 0;
242
243   hash = hash_create (0, 0);
244   for (i = 0; i < n_buffers; i++)
245     {
246       bi = b[0];
247       b += next_buffer_stride;
248
249       /* Buffer is not unique. */
250       if (hash_get (hash, bi))
251         {
252           msg = format (0, "not unique");
253           goto done;
254         }
255
256       k = vlib_buffer_is_known (bi);
257       if (k != known_state)
258         {
259           msg = format (0, "is %U; expected %U",
260                         format_vlib_buffer_known_state, k,
261                         format_vlib_buffer_known_state, known_state);
262           goto done;
263         }
264
265       msg = vlib_validate_buffer_helper (vm, bi, follow_buffer_next, &hash);
266       if (msg)
267         goto done;
268
269       hash_set1 (hash, bi);
270     }
271
272 done:
273   if (msg)
274     {
275       result = format (0, "0x%x: %v", bi, msg);
276       vec_free (msg);
277     }
278   hash_free (hash);
279   return result;
280 }
281
282 /*
283  * Hand-craft a static vector w/ length 1, so vec_len(vlib_mains) =1
284  * and vlib_mains[0] = &vlib_global_main from the beginning of time.
285  *
286  * The only place which should ever expand vlib_mains is start_workers()
287  * in threads.c. It knows about the bootstrap vector.
288  */
289 /* *INDENT-OFF* */
290 static struct
291 {
292   vec_header_t h;
293   vlib_main_t *vm;
294 } __attribute__ ((packed)) __bootstrap_vlib_main_vector
295   __attribute__ ((aligned (CLIB_CACHE_LINE_BYTES))) =
296 {
297   .h.len = 1,
298   .vm = &vlib_global_main,
299 };
300 /* *INDENT-ON* */
301
302 vlib_main_t **vlib_mains = &__bootstrap_vlib_main_vector.vm;
303
304
305 /* When dubugging validate that given buffers are either known allocated
306    or known free. */
307 void
308 vlib_buffer_validate_alloc_free (vlib_main_t * vm,
309                                  u32 * buffers,
310                                  uword n_buffers,
311                                  vlib_buffer_known_state_t expected_state)
312 {
313   u32 *b;
314   uword i, bi, is_free;
315
316   if (CLIB_DEBUG == 0)
317     return;
318
319   if (vlib_buffer_callbacks)
320     return;
321
322   is_free = expected_state == VLIB_BUFFER_KNOWN_ALLOCATED;
323   b = buffers;
324   for (i = 0; i < n_buffers; i++)
325     {
326       vlib_buffer_known_state_t known;
327
328       bi = b[0];
329       b += 1;
330       known = vlib_buffer_is_known (bi);
331       if (known != expected_state)
332         {
333           ASSERT (0);
334           vlib_panic_with_msg
335             (vm, "%s %U buffer 0x%x",
336              is_free ? "freeing" : "allocating",
337              format_vlib_buffer_known_state, known, bi);
338         }
339
340       vlib_buffer_set_known_state
341         (bi, is_free ? VLIB_BUFFER_KNOWN_FREE : VLIB_BUFFER_KNOWN_ALLOCATED);
342     }
343 }
344
345 void
346 vlib_buffer_merge_free_lists (vlib_buffer_free_list_t * dst,
347                               vlib_buffer_free_list_t * src)
348 {
349   uword l;
350   u32 *d;
351
352   l = vec_len (src->buffers);
353   if (l > 0)
354     {
355       vec_add2_aligned (dst->buffers, d, l, CLIB_CACHE_LINE_BYTES);
356       clib_memcpy (d, src->buffers, l * sizeof (d[0]));
357       vec_free (src->buffers);
358     }
359 }
360
361 /* Add buffer free list. */
362 static vlib_buffer_free_list_index_t
363 vlib_buffer_create_free_list_helper (vlib_main_t * vm,
364                                      u32 n_data_bytes,
365                                      u32 is_public, u32 is_default, u8 * name)
366 {
367   vlib_buffer_main_t *bm = vm->buffer_main;
368   vlib_buffer_free_list_t *f;
369   int i;
370
371   ASSERT (vlib_get_thread_index () == 0);
372
373   if (!is_default && pool_elts (bm->buffer_free_list_pool) == 0)
374     {
375       vlib_buffer_free_list_index_t default_free_free_list_index;
376
377       /* *INDENT-OFF* */
378       default_free_free_list_index =
379         vlib_buffer_create_free_list_helper
380         (vm,
381          /* default buffer size */ VLIB_BUFFER_DEFAULT_FREE_LIST_BYTES,
382          /* is_public */ 1,
383          /* is_default */ 1,
384          (u8 *) "default");
385       /* *INDENT-ON* */
386       ASSERT (default_free_free_list_index ==
387               VLIB_BUFFER_DEFAULT_FREE_LIST_INDEX);
388
389       if (n_data_bytes == VLIB_BUFFER_DEFAULT_FREE_LIST_BYTES && is_public)
390         return default_free_free_list_index;
391     }
392
393   pool_get_aligned (bm->buffer_free_list_pool, f, CLIB_CACHE_LINE_BYTES);
394
395   memset (f, 0, sizeof (f[0]));
396   f->index = f - bm->buffer_free_list_pool;
397   f->n_data_bytes = vlib_buffer_round_size (n_data_bytes);
398   f->min_n_buffers_each_physmem_alloc = VLIB_FRAME_SIZE;
399   f->name = clib_mem_is_vec (name) ? name : format (0, "%s", name);
400
401   /* Setup free buffer template. */
402   vlib_buffer_set_free_list_index (&f->buffer_init_template, f->index);
403   f->buffer_init_template.n_add_refs = 0;
404
405   if (is_public)
406     {
407       uword *p = hash_get (bm->free_list_by_size, f->n_data_bytes);
408       if (!p)
409         hash_set (bm->free_list_by_size, f->n_data_bytes, f->index);
410     }
411
412   clib_spinlock_init (&f->global_buffers_lock);
413
414   for (i = 1; i < vec_len (vlib_mains); i++)
415     {
416       vlib_buffer_main_t *wbm = vlib_mains[i]->buffer_main;
417       vlib_buffer_free_list_t *wf;
418       pool_get_aligned (wbm->buffer_free_list_pool,
419                         wf, CLIB_CACHE_LINE_BYTES);
420       ASSERT (f - bm->buffer_free_list_pool ==
421               wf - wbm->buffer_free_list_pool);
422       wf[0] = f[0];
423       wf->buffers = 0;
424       wf->n_alloc = 0;
425     }
426
427   return f->index;
428 }
429
430 vlib_buffer_free_list_index_t
431 vlib_buffer_create_free_list (vlib_main_t * vm, u32 n_data_bytes,
432                               char *fmt, ...)
433 {
434   va_list va;
435   u8 *name;
436
437   va_start (va, fmt);
438   name = va_format (0, fmt, &va);
439   va_end (va);
440
441   return vlib_buffer_create_free_list_helper (vm, n_data_bytes,
442                                               /* is_public */ 0,
443                                               /* is_default */ 0,
444                                               name);
445 }
446
447 vlib_buffer_free_list_index_t
448 vlib_buffer_get_or_create_free_list (vlib_main_t * vm, u32 n_data_bytes,
449                                      char *fmt, ...)
450 {
451   u32 i = vlib_buffer_get_free_list_with_size (vm, n_data_bytes);
452
453   if (i == ~0)
454     {
455       va_list va;
456       u8 *name;
457
458       va_start (va, fmt);
459       name = va_format (0, fmt, &va);
460       va_end (va);
461
462       i = vlib_buffer_create_free_list_helper (vm, n_data_bytes,
463                                                /* is_public */ 1,
464                                                /* is_default */ 0,
465                                                name);
466     }
467
468   return i;
469 }
470
471 static void
472 del_free_list (vlib_main_t * vm, vlib_buffer_free_list_t * f)
473 {
474   u32 i;
475
476   for (i = 0; i < vec_len (f->buffer_memory_allocated); i++)
477     vm->os_physmem_free (vm, vm->buffer_main->buffer_pools[0].physmem_region,
478                          f->buffer_memory_allocated[i]);
479   vec_free (f->name);
480   vec_free (f->buffer_memory_allocated);
481   vec_free (f->buffers);
482 }
483
484 /* Add buffer free list. */
485 void
486 vlib_buffer_delete_free_list_internal (vlib_main_t * vm,
487                                        vlib_buffer_free_list_index_t index)
488 {
489   vlib_buffer_main_t *bm = vm->buffer_main;
490   vlib_buffer_free_list_t *f;
491   vlib_buffer_free_list_index_t merge_index;
492   int i;
493
494   ASSERT (vlib_get_thread_index () == 0);
495
496   f = vlib_buffer_get_free_list (vm, index);
497
498   ASSERT (vec_len (f->buffers) == f->n_alloc);
499   merge_index = vlib_buffer_get_free_list_with_size (vm, f->n_data_bytes);
500   if (merge_index != (vlib_buffer_free_list_index_t) ~ 0
501       && merge_index != index)
502     {
503       vlib_buffer_merge_free_lists (pool_elt_at_index
504                                     (bm->buffer_free_list_pool, merge_index),
505                                     f);
506     }
507
508   del_free_list (vm, f);
509
510   /* Poison it. */
511   memset (f, 0xab, sizeof (f[0]));
512
513   pool_put (bm->buffer_free_list_pool, f);
514
515   for (i = 1; i < vec_len (vlib_mains); i++)
516     {
517       bm = vlib_mains[i]->buffer_main;
518       f = vlib_buffer_get_free_list (vlib_mains[i], index);;
519       memset (f, 0xab, sizeof (f[0]));
520       pool_put (bm->buffer_free_list_pool, f);
521     }
522 }
523
524 /* Make sure free list has at least given number of free buffers. */
525 static uword
526 vlib_buffer_fill_free_list_internal (vlib_main_t * vm,
527                                      vlib_buffer_free_list_t * fl,
528                                      uword min_free_buffers)
529 {
530   vlib_buffer_t *buffers, *b;
531   vlib_buffer_free_list_t *mfl;
532   int n, n_bytes, i;
533   u32 *bi;
534   u32 n_remaining, n_alloc, n_this_chunk;
535
536   /* Already have enough free buffers on free list? */
537   n = min_free_buffers - vec_len (fl->buffers);
538   if (n <= 0)
539     return min_free_buffers;
540
541   mfl = vlib_buffer_get_free_list (vlib_mains[0], fl->index);
542   if (vec_len (mfl->global_buffers) > 0)
543     {
544       int n_copy, n_left;
545       clib_spinlock_lock (&mfl->global_buffers_lock);
546       n_copy = clib_min (vec_len (mfl->global_buffers), n);
547       n_left = vec_len (mfl->global_buffers) - n_copy;
548       vec_add_aligned (fl->buffers, mfl->global_buffers + n_left, n_copy,
549                        CLIB_CACHE_LINE_BYTES);
550       _vec_len (mfl->global_buffers) = n_left;
551       clib_spinlock_unlock (&mfl->global_buffers_lock);
552       n = min_free_buffers - vec_len (fl->buffers);
553       if (n <= 0)
554         return min_free_buffers;
555     }
556
557   /* Always allocate round number of buffers. */
558   n = round_pow2 (n, CLIB_CACHE_LINE_BYTES / sizeof (u32));
559
560   /* Always allocate new buffers in reasonably large sized chunks. */
561   n = clib_max (n, fl->min_n_buffers_each_physmem_alloc);
562
563   n_remaining = n;
564   n_alloc = 0;
565   while (n_remaining > 0)
566     {
567       vlib_buffer_pool_t *bp = &vm->buffer_main->buffer_pools[0];
568       n_this_chunk = clib_min (n_remaining, bp->alloc_chunk_size);
569
570       n_bytes = n_this_chunk * (sizeof (b[0]) + fl->n_data_bytes);
571
572       /* drb: removed power-of-2 ASSERT */
573       buffers =
574         vm->os_physmem_alloc_aligned (vm, bp->physmem_region, n_bytes,
575                                       sizeof (vlib_buffer_t));
576       if (!buffers)
577         return n_alloc;
578
579       /* Record chunk as being allocated so we can free it later. */
580       vec_add1 (fl->buffer_memory_allocated, buffers);
581
582       fl->n_alloc += n_this_chunk;
583       n_alloc += n_this_chunk;
584       n_remaining -= n_this_chunk;
585
586       b = buffers;
587       vec_add2_aligned (fl->buffers, bi, n_this_chunk, CLIB_CACHE_LINE_BYTES);
588       for (i = 0; i < n_this_chunk; i++)
589         {
590           bi[i] = vlib_get_buffer_index (vm, b);
591
592           if (CLIB_DEBUG > 0)
593             vlib_buffer_set_known_state (bi[i], VLIB_BUFFER_KNOWN_FREE);
594           b = vlib_buffer_next_contiguous (b, fl->n_data_bytes);
595         }
596
597       memset (buffers, 0, n_bytes);
598
599       /* Initialize all new buffers. */
600       b = buffers;
601       for (i = 0; i < n_this_chunk; i++)
602         {
603           vlib_buffer_init_for_free_list (b, fl);
604           b = vlib_buffer_next_contiguous (b, fl->n_data_bytes);
605         }
606
607       if (fl->buffer_init_function)
608         fl->buffer_init_function (vm, fl, bi, n_this_chunk);
609     }
610   return n_alloc;
611 }
612
613 void *
614 vlib_set_buffer_free_callback (vlib_main_t * vm, void *fp)
615 {
616   vlib_buffer_main_t *bm = vm->buffer_main;
617   void *rv = bm->buffer_free_callback;
618
619   bm->buffer_free_callback = fp;
620   return rv;
621 }
622
623 static_always_inline void
624 vlib_buffer_free_inline (vlib_main_t * vm,
625                          u32 * buffers, u32 n_buffers, u32 follow_buffer_next)
626 {
627   vlib_buffer_main_t *bm = vm->buffer_main;
628   vlib_buffer_free_list_t *fl;
629   vlib_buffer_free_list_index_t fi;
630   int i;
631   u32 (*cb) (vlib_main_t * vm, u32 * buffers, u32 n_buffers,
632              u32 follow_buffer_next);
633
634   cb = bm->buffer_free_callback;
635
636   if (PREDICT_FALSE (cb != 0))
637     n_buffers = (*cb) (vm, buffers, n_buffers, follow_buffer_next);
638
639   if (!n_buffers)
640     return;
641
642   for (i = 0; i < n_buffers; i++)
643     {
644       vlib_buffer_t *b;
645       u32 bi = buffers[i];
646
647       b = vlib_get_buffer (vm, bi);
648       VLIB_BUFFER_TRACE_TRAJECTORY_INIT (b);
649       fl = vlib_buffer_get_buffer_free_list (vm, b, &fi);
650
651       /* The only current use of this callback: multicast recycle */
652       if (PREDICT_FALSE (fl->buffers_added_to_freelist_function != 0))
653         {
654           int j;
655
656           vlib_buffer_add_to_free_list
657             (vm, fl, buffers[i], (b->flags & VLIB_BUFFER_RECYCLE) == 0);
658
659           for (j = 0; j < vec_len (bm->announce_list); j++)
660             {
661               if (fl == bm->announce_list[j])
662                 goto already_announced;
663             }
664           vec_add1 (bm->announce_list, fl);
665         already_announced:
666           ;
667         }
668       else
669         {
670           if (PREDICT_TRUE ((b->flags & VLIB_BUFFER_RECYCLE) == 0))
671             {
672               u32 flags, next;
673
674               do
675                 {
676                   vlib_buffer_t *nb = vlib_get_buffer (vm, bi);
677                   flags = nb->flags;
678                   next = nb->next_buffer;
679                   if (nb->n_add_refs)
680                     nb->n_add_refs--;
681                   else
682                     {
683                       vlib_buffer_validate_alloc_free (vm, &bi, 1,
684                                                        VLIB_BUFFER_KNOWN_ALLOCATED);
685                       vlib_buffer_add_to_free_list (vm, fl, bi, 1);
686                     }
687                   bi = next;
688                 }
689               while (follow_buffer_next
690                      && (flags & VLIB_BUFFER_NEXT_PRESENT));
691
692             }
693         }
694     }
695   if (vec_len (bm->announce_list))
696     {
697       vlib_buffer_free_list_t *fl;
698       for (i = 0; i < vec_len (bm->announce_list); i++)
699         {
700           fl = bm->announce_list[i];
701           fl->buffers_added_to_freelist_function (vm, fl);
702         }
703       _vec_len (bm->announce_list) = 0;
704     }
705 }
706
707 static void
708 vlib_buffer_free_internal (vlib_main_t * vm, u32 * buffers, u32 n_buffers)
709 {
710   vlib_buffer_free_inline (vm, buffers, n_buffers,      /* follow_buffer_next */
711                            1);
712 }
713
714 static void
715 vlib_buffer_free_no_next_internal (vlib_main_t * vm, u32 * buffers,
716                                    u32 n_buffers)
717 {
718   vlib_buffer_free_inline (vm, buffers, n_buffers,      /* follow_buffer_next */
719                            0);
720 }
721
722 /* Copy template packet data into buffers as they are allocated. */
723 static void __attribute__ ((unused))
724 vlib_packet_template_buffer_init (vlib_main_t * vm,
725                                   vlib_buffer_free_list_t * fl,
726                                   u32 * buffers, u32 n_buffers)
727 {
728   vlib_packet_template_t *t =
729     uword_to_pointer (fl->buffer_init_function_opaque,
730                       vlib_packet_template_t *);
731   uword i;
732
733   for (i = 0; i < n_buffers; i++)
734     {
735       vlib_buffer_t *b = vlib_get_buffer (vm, buffers[i]);
736       ASSERT (b->current_length == vec_len (t->packet_data));
737       clib_memcpy (vlib_buffer_get_current (b), t->packet_data,
738                    b->current_length);
739     }
740 }
741
742 void
743 vlib_packet_template_init (vlib_main_t * vm,
744                            vlib_packet_template_t * t,
745                            void *packet_data,
746                            uword n_packet_data_bytes,
747                            uword min_n_buffers_each_physmem_alloc,
748                            char *fmt, ...)
749 {
750   vlib_buffer_main_t *bm = vm->buffer_main;
751   va_list va;
752   u8 *name;
753   vlib_buffer_free_list_t *fl;
754
755   va_start (va, fmt);
756   name = va_format (0, fmt, &va);
757   va_end (va);
758
759   if (bm->cb.vlib_packet_template_init_cb)
760     bm->cb.vlib_packet_template_init_cb (vm, (void *) t, packet_data,
761                                          n_packet_data_bytes,
762                                          min_n_buffers_each_physmem_alloc,
763                                          name);
764
765   vlib_worker_thread_barrier_sync (vm);
766
767   memset (t, 0, sizeof (t[0]));
768
769   vec_add (t->packet_data, packet_data, n_packet_data_bytes);
770   t->min_n_buffers_each_physmem_alloc = min_n_buffers_each_physmem_alloc;
771
772   t->free_list_index = vlib_buffer_create_free_list_helper
773     (vm, n_packet_data_bytes,
774      /* is_public */ 1,
775      /* is_default */ 0,
776      name);
777
778   ASSERT (t->free_list_index != 0);
779   fl = vlib_buffer_get_free_list (vm, t->free_list_index);
780   fl->min_n_buffers_each_physmem_alloc = t->min_n_buffers_each_physmem_alloc;
781
782   fl->buffer_init_function = vlib_packet_template_buffer_init;
783   fl->buffer_init_function_opaque = pointer_to_uword (t);
784
785   fl->buffer_init_template.current_data = 0;
786   fl->buffer_init_template.current_length = n_packet_data_bytes;
787   fl->buffer_init_template.flags = 0;
788   fl->buffer_init_template.n_add_refs = 0;
789   vlib_worker_thread_barrier_release (vm);
790 }
791
792 void *
793 vlib_packet_template_get_packet (vlib_main_t * vm,
794                                  vlib_packet_template_t * t, u32 * bi_result)
795 {
796   u32 bi;
797   vlib_buffer_t *b;
798
799   if (vlib_buffer_alloc (vm, &bi, 1) != 1)
800     return 0;
801
802   *bi_result = bi;
803
804   b = vlib_get_buffer (vm, bi);
805   clib_memcpy (vlib_buffer_get_current (b),
806                t->packet_data, vec_len (t->packet_data));
807   b->current_length = vec_len (t->packet_data);
808
809   return b->data;
810 }
811
812 void
813 vlib_packet_template_get_packet_helper (vlib_main_t * vm,
814                                         vlib_packet_template_t * t)
815 {
816   word n = t->min_n_buffers_each_physmem_alloc;
817   word l = vec_len (t->packet_data);
818   word n_alloc;
819
820   ASSERT (l > 0);
821   ASSERT (vec_len (t->free_buffers) == 0);
822
823   vec_validate (t->free_buffers, n - 1);
824   n_alloc = vlib_buffer_alloc_from_free_list (vm, t->free_buffers,
825                                               n, t->free_list_index);
826   _vec_len (t->free_buffers) = n_alloc;
827 }
828
829 /* Append given data to end of buffer, possibly allocating new buffers. */
830 u32
831 vlib_buffer_add_data (vlib_main_t * vm,
832                       vlib_buffer_free_list_index_t free_list_index,
833                       u32 buffer_index, void *data, u32 n_data_bytes)
834 {
835   u32 n_buffer_bytes, n_left, n_left_this_buffer, bi;
836   vlib_buffer_t *b;
837   void *d;
838
839   bi = buffer_index;
840   if (bi == 0
841       && 1 != vlib_buffer_alloc_from_free_list (vm, &bi, 1, free_list_index))
842     goto out_of_buffers;
843
844   d = data;
845   n_left = n_data_bytes;
846   n_buffer_bytes = vlib_buffer_free_list_buffer_size (vm, free_list_index);
847
848   b = vlib_get_buffer (vm, bi);
849   b->flags &= ~VLIB_BUFFER_TOTAL_LENGTH_VALID;
850
851   /* Get to the end of the chain before we try to append data... */
852   while (b->flags & VLIB_BUFFER_NEXT_PRESENT)
853     b = vlib_get_buffer (vm, b->next_buffer);
854
855   while (1)
856     {
857       u32 n;
858
859       ASSERT (n_buffer_bytes >= b->current_length);
860       n_left_this_buffer =
861         n_buffer_bytes - (b->current_data + b->current_length);
862       n = clib_min (n_left_this_buffer, n_left);
863       clib_memcpy (vlib_buffer_get_current (b) + b->current_length, d, n);
864       b->current_length += n;
865       n_left -= n;
866       if (n_left == 0)
867         break;
868
869       d += n;
870       if (1 !=
871           vlib_buffer_alloc_from_free_list (vm, &b->next_buffer, 1,
872                                             free_list_index))
873         goto out_of_buffers;
874
875       b->flags |= VLIB_BUFFER_NEXT_PRESENT;
876
877       b = vlib_get_buffer (vm, b->next_buffer);
878     }
879
880   return bi;
881
882 out_of_buffers:
883   clib_error ("out of buffers");
884   return bi;
885 }
886
887 u16
888 vlib_buffer_chain_append_data_with_alloc (vlib_main_t * vm,
889                                           vlib_buffer_free_list_index_t
890                                           free_list_index,
891                                           vlib_buffer_t * first,
892                                           vlib_buffer_t ** last, void *data,
893                                           u16 data_len)
894 {
895   vlib_buffer_t *l = *last;
896   u32 n_buffer_bytes =
897     vlib_buffer_free_list_buffer_size (vm, free_list_index);
898   u16 copied = 0;
899   ASSERT (n_buffer_bytes >= l->current_length + l->current_data);
900   while (data_len)
901     {
902       u16 max = n_buffer_bytes - l->current_length - l->current_data;
903       if (max == 0)
904         {
905           if (1 !=
906               vlib_buffer_alloc_from_free_list (vm, &l->next_buffer, 1,
907                                                 free_list_index))
908             return copied;
909           *last = l = vlib_buffer_chain_buffer (vm, first, l, l->next_buffer);
910           max = n_buffer_bytes - l->current_length - l->current_data;
911         }
912
913       u16 len = (data_len > max) ? max : data_len;
914       clib_memcpy (vlib_buffer_get_current (l) + l->current_length,
915                    data + copied, len);
916       vlib_buffer_chain_increase_length (first, l, len);
917       data_len -= len;
918       copied += len;
919     }
920   return copied;
921 }
922
923 u8
924 vlib_buffer_add_physmem_region (vlib_main_t * vm,
925                                 vlib_physmem_region_index_t pri)
926 {
927   vlib_buffer_main_t *bm = vm->buffer_main;
928   vlib_physmem_region_t *pr = vlib_physmem_get_region (vm, pri);
929   vlib_buffer_pool_t *p;
930   uword start = pointer_to_uword (pr->mem);
931   uword size = pr->size;
932
933   if (bm->buffer_mem_size == 0)
934     {
935       bm->buffer_mem_start = start;
936       bm->buffer_mem_size = size;
937     }
938   else if (start < bm->buffer_mem_start)
939     {
940       bm->buffer_mem_size += bm->buffer_mem_start - start;
941       bm->buffer_mem_start = start;
942       if (size > bm->buffer_mem_size)
943         bm->buffer_mem_size = size;
944     }
945   else if (start > bm->buffer_mem_start)
946     {
947       uword new_size = start - bm->buffer_mem_start + size;
948       if (new_size > bm->buffer_mem_size)
949         bm->buffer_mem_size = new_size;
950     }
951
952   if ((u64) bm->buffer_mem_size >
953       ((u64) 1 << (32 + CLIB_LOG2_CACHE_LINE_BYTES)))
954     {
955       clib_panic ("buffer memory size out of range!");
956     }
957
958   vec_add2 (bm->buffer_pools, p, 1);
959   p->start = start;
960   p->size = size;
961   p->physmem_region = pri;
962   p->alloc_chunk_size = (pr->log2_page_size > 18) ? 16 : 1;
963   return p - bm->buffer_pools;
964 }
965
966 static u8 *
967 format_vlib_buffer_free_list (u8 * s, va_list * va)
968 {
969   vlib_buffer_free_list_t *f = va_arg (*va, vlib_buffer_free_list_t *);
970   u32 threadnum = va_arg (*va, u32);
971   uword bytes_alloc, bytes_free, n_free, size;
972
973   if (!f)
974     return format (s, "%=7s%=30s%=12s%=12s%=12s%=12s%=12s%=12s",
975                    "Thread", "Name", "Index", "Size", "Alloc", "Free",
976                    "#Alloc", "#Free");
977
978   size = sizeof (vlib_buffer_t) + f->n_data_bytes;
979   n_free = vec_len (f->buffers);
980   bytes_alloc = size * f->n_alloc;
981   bytes_free = size * n_free;
982
983   s = format (s, "%7d%30v%12d%12d%=12U%=12U%=12d%=12d", threadnum,
984               f->name, f->index, f->n_data_bytes,
985               format_memory_size, bytes_alloc,
986               format_memory_size, bytes_free, f->n_alloc, n_free);
987
988   return s;
989 }
990
991 static clib_error_t *
992 show_buffers (vlib_main_t * vm,
993               unformat_input_t * input, vlib_cli_command_t * cmd)
994 {
995   vlib_buffer_main_t *bm;
996   vlib_buffer_free_list_t *f;
997   vlib_main_t *curr_vm;
998   u32 vm_index = 0;
999
1000   vlib_cli_output (vm, "%U", format_vlib_buffer_free_list, 0, 0);
1001
1002   do
1003     {
1004       curr_vm = vlib_mains[vm_index];
1005       bm = curr_vm->buffer_main;
1006
1007     /* *INDENT-OFF* */
1008     pool_foreach (f, bm->buffer_free_list_pool, ({
1009       vlib_cli_output (vm, "%U", format_vlib_buffer_free_list, f, vm_index);
1010     }));
1011     /* *INDENT-ON* */
1012
1013       vm_index++;
1014     }
1015   while (vm_index < vec_len (vlib_mains));
1016
1017   return 0;
1018 }
1019
1020 /* *INDENT-OFF* */
1021 VLIB_CLI_COMMAND (show_buffers_command, static) = {
1022   .path = "show buffers",
1023   .short_help = "Show packet buffer allocation",
1024   .function = show_buffers,
1025 };
1026 /* *INDENT-ON* */
1027
1028 clib_error_t *
1029 vlib_buffer_main_init (struct vlib_main_t * vm)
1030 {
1031   vlib_buffer_main_t *bm;
1032   vlib_physmem_region_index_t pri;
1033   clib_error_t *error;
1034
1035   vec_validate (vm->buffer_main, 0);
1036   bm = vm->buffer_main;
1037
1038   if (vlib_buffer_callbacks)
1039     {
1040       /* external plugin has registered own buffer callbacks
1041          so we just copy them  and quit */
1042       vlib_buffer_main_t *bm = vm->buffer_main;
1043       clib_memcpy (&bm->cb, vlib_buffer_callbacks,
1044                    sizeof (vlib_buffer_callbacks_t));
1045       bm->callbacks_registered = 1;
1046       return 0;
1047     }
1048
1049   bm->cb.vlib_buffer_fill_free_list_cb = &vlib_buffer_fill_free_list_internal;
1050   bm->cb.vlib_buffer_free_cb = &vlib_buffer_free_internal;
1051   bm->cb.vlib_buffer_free_no_next_cb = &vlib_buffer_free_no_next_internal;
1052   bm->cb.vlib_buffer_delete_free_list_cb =
1053     &vlib_buffer_delete_free_list_internal;
1054   clib_spinlock_init (&bm->buffer_known_hash_lockp);
1055
1056   /* allocate default region */
1057   error = vlib_physmem_region_alloc (vm, "buffers",
1058                                      vlib_buffer_physmem_sz, 0,
1059                                      VLIB_PHYSMEM_F_SHARED |
1060                                      VLIB_PHYSMEM_F_HUGETLB |
1061                                      VLIB_PHYSMEM_F_INIT_MHEAP, &pri);
1062
1063   if (error == 0)
1064     goto done;
1065
1066   clib_error_free (error);
1067
1068   error = vlib_physmem_region_alloc (vm, "buffers",
1069                                      vlib_buffer_physmem_sz, 0,
1070                                      VLIB_PHYSMEM_F_SHARED |
1071                                      VLIB_PHYSMEM_F_INIT_MHEAP, &pri);
1072 done:
1073   if (error == 0)
1074     vlib_buffer_add_physmem_region (vm, pri);
1075   return error;
1076 }
1077
1078 static clib_error_t *
1079 vlib_buffers_configure (vlib_main_t * vm, unformat_input_t * input)
1080 {
1081   u32 size_in_mb;
1082
1083   while (unformat_check_input (input) != UNFORMAT_END_OF_INPUT)
1084     {
1085       if (unformat (input, "memory-size-in-mb %d", &size_in_mb))
1086         vlib_buffer_physmem_sz = size_in_mb << 20;
1087       else
1088         return unformat_parse_error (input);
1089     }
1090
1091   unformat_free (input);
1092   return 0;
1093 }
1094
1095 VLIB_EARLY_CONFIG_FUNCTION (vlib_buffers_configure, "buffers");
1096
1097
1098 /** @endcond */
1099 /*
1100  * fd.io coding-style-patch-verification: ON
1101  *
1102  * Local Variables:
1103  * eval: (c-set-style "gnu")
1104  * End:
1105  */