physmem: keep physmem VA in 39-bit address space on x86_64
[vpp.git] / src / vppinfra / pmalloc.c
1 /*
2  * Copyright (c) 2018 Cisco and/or its affiliates.
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #define _GNU_SOURCE
17 #include <stdlib.h>
18 #include <sys/types.h>
19 #include <sys/stat.h>
20 #include <fcntl.h>
21 #include <linux/mempolicy.h>
22 #include <linux/memfd.h>
23
24 #include <vppinfra/format.h>
25 #include <vppinfra/linux/syscall.h>
26 #include <vppinfra/linux/sysfs.h>
27 #include <vppinfra/mem.h>
28 #include <vppinfra/hash.h>
29 #include <vppinfra/pmalloc.h>
30
31 #if __SIZEOF_POINTER__ >= 8
32 #define DEFAULT_RESERVED_MB 16384
33 #else
34 #define DEFAULT_RESERVED_MB 256
35 #endif
36
37 static inline clib_pmalloc_chunk_t *
38 get_chunk (clib_pmalloc_page_t * pp, u32 index)
39 {
40   return pool_elt_at_index (pp->chunks, index);
41 }
42
43 static inline uword
44 pmalloc_size2pages (uword size, u32 log2_page_sz)
45 {
46   return round_pow2 (size, 1ULL << log2_page_sz) >> log2_page_sz;
47 }
48
49 static inline int
50 pmalloc_validate_numa_node (u32 * numa_node)
51 {
52   if (*numa_node == CLIB_PMALLOC_NUMA_LOCAL)
53     {
54       u32 cpu;
55       if (getcpu (&cpu, numa_node, 0) != 0)
56         return 1;
57     }
58   return 0;
59 }
60
61 int
62 clib_pmalloc_init (clib_pmalloc_main_t * pm, uword base_addr, uword size)
63 {
64   uword off, pagesize;
65   u64 *pt = 0;
66   int mmap_flags;
67
68   ASSERT (pm->error == 0);
69
70   pagesize = clib_mem_get_default_hugepage_size ();
71   pm->def_log2_page_sz = min_log2 (pagesize);
72   pm->sys_log2_page_sz = min_log2 (sysconf (_SC_PAGESIZE));
73   pm->lookup_log2_page_sz = pm->def_log2_page_sz;
74
75   /* check if pagemap is accessible */
76   pt = clib_mem_vm_get_paddr (&pt, pm->sys_log2_page_sz, 1);
77   if (pt == 0 || pt[0] == 0)
78     pm->flags |= CLIB_PMALLOC_F_NO_PAGEMAP;
79
80   size = size ? size : ((u64) DEFAULT_RESERVED_MB) << 20;
81   size = round_pow2 (size, pagesize);
82
83   pm->max_pages = size >> pm->def_log2_page_sz;
84
85   /* reserve VA space for future growth */
86   mmap_flags = MAP_PRIVATE | MAP_ANONYMOUS;
87
88   if (base_addr)
89     mmap_flags |= MAP_FIXED;
90
91   pm->base = mmap (uword_to_pointer (base_addr, void *), size + pagesize,
92                    PROT_NONE, mmap_flags, -1, 0);
93
94   if (pm->base == MAP_FAILED)
95     {
96       pm->error = clib_error_return_unix (0, "failed to reserve %u pages");
97       return -1;
98     }
99
100   off = round_pow2 (pointer_to_uword (pm->base), pagesize) -
101     pointer_to_uword (pm->base);
102
103   /* trim start and end of reservation to be page aligned */
104   if (off)
105     {
106       munmap (pm->base, off);
107       pm->base += off;
108     }
109
110   munmap (pm->base + ((uword) pm->max_pages * pagesize), pagesize - off);
111   return 0;
112 }
113
114 static inline void *
115 alloc_chunk_from_page (clib_pmalloc_main_t * pm, clib_pmalloc_page_t * pp,
116                        u32 n_blocks, u32 block_align, u32 numa_node)
117 {
118   clib_pmalloc_chunk_t *c = 0;
119   clib_pmalloc_arena_t *a;
120   void *va;
121   u32 off;
122   u32 alloc_chunk_index;
123
124   a = pool_elt_at_index (pm->arenas, pp->arena_index);
125
126   if (pp->chunks == 0)
127     {
128       u32 i, start = 0, prev = ~0;
129
130       for (i = 0; i < a->subpages_per_page; i++)
131         {
132           pool_get (pp->chunks, c);
133           c->start = start;
134           c->prev = prev;
135           c->size = pp->n_free_blocks / a->subpages_per_page;
136           start += c->size;
137           if (prev == ~0)
138             pp->first_chunk_index = c - pp->chunks;
139           else
140             pp->chunks[prev].next = c - pp->chunks;
141           prev = c - pp->chunks;
142         }
143       c->next = ~0;
144       pp->n_free_chunks = a->subpages_per_page;
145     }
146
147   if (pp->n_free_blocks < n_blocks)
148     return 0;
149
150   alloc_chunk_index = pp->first_chunk_index;
151
152 next_chunk:
153   c = pool_elt_at_index (pp->chunks, alloc_chunk_index);
154   off = (block_align - (c->start & (block_align - 1))) & (block_align - 1);
155
156   if (c->used || n_blocks + off > c->size)
157     {
158       if (c->next == ~0)
159         return 0;
160       alloc_chunk_index = c->next;
161       goto next_chunk;
162     }
163
164   /* if alignment is needed create new empty chunk */
165   if (off)
166     {
167       u32 offset_chunk_index;
168       clib_pmalloc_chunk_t *co;
169       pool_get (pp->chunks, c);
170       pp->n_free_chunks++;
171       offset_chunk_index = alloc_chunk_index;
172       alloc_chunk_index = c - pp->chunks;
173
174       co = pool_elt_at_index (pp->chunks, offset_chunk_index);
175       c->size = co->size - off;
176       c->next = co->next;
177       c->start = co->start + off;
178       c->prev = offset_chunk_index;
179       co->size = off;
180       co->next = alloc_chunk_index;
181     }
182
183   c->used = 1;
184   if (c->size > n_blocks)
185     {
186       u32 tail_chunk_index;
187       clib_pmalloc_chunk_t *ct;
188       pool_get (pp->chunks, ct);
189       pp->n_free_chunks++;
190       tail_chunk_index = ct - pp->chunks;
191       c = pool_elt_at_index (pp->chunks, alloc_chunk_index);
192       ct->size = c->size - n_blocks;
193       ct->next = c->next;
194       ct->prev = alloc_chunk_index;
195       ct->start = c->start + n_blocks;
196
197       c->size = n_blocks;
198       c->next = tail_chunk_index;
199       if (ct->next != ~0)
200         pool_elt_at_index (pp->chunks, ct->next)->prev = tail_chunk_index;
201     }
202   else if (c->next != ~0)
203     pool_elt_at_index (pp->chunks, c->next)->prev = alloc_chunk_index;
204
205   c = get_chunk (pp, alloc_chunk_index);
206   va = pm->base + ((pp - pm->pages) << pm->def_log2_page_sz) +
207     (c->start << PMALLOC_LOG2_BLOCK_SZ);
208   hash_set (pm->chunk_index_by_va, pointer_to_uword (va), alloc_chunk_index);
209   pp->n_free_blocks -= n_blocks;
210   pp->n_free_chunks--;
211   return va;
212 }
213
214 static void
215 pmalloc_update_lookup_table (clib_pmalloc_main_t * pm, u32 first, u32 count)
216 {
217   uword seek, va, pa, p;
218   int fd;
219   u32 elts_per_page = 1U << (pm->def_log2_page_sz - pm->lookup_log2_page_sz);
220
221   vec_validate_aligned (pm->lookup_table, vec_len (pm->pages) *
222                         elts_per_page - 1, CLIB_CACHE_LINE_BYTES);
223
224   p = (uword) first *elts_per_page;
225   if (pm->flags & CLIB_PMALLOC_F_NO_PAGEMAP)
226     {
227       while (p < (uword) elts_per_page * count)
228         {
229           pm->lookup_table[p] = pointer_to_uword (pm->base) +
230             (p << pm->lookup_log2_page_sz);
231           p++;
232         }
233       return;
234     }
235
236   fd = open ((char *) "/proc/self/pagemap", O_RDONLY);
237   while (p < (uword) elts_per_page * count)
238     {
239       va = pointer_to_uword (pm->base) + (p << pm->lookup_log2_page_sz);
240       pa = 0;
241       seek = (va >> pm->sys_log2_page_sz) * sizeof (pa);
242       if (fd != -1 && lseek (fd, seek, SEEK_SET) == seek &&
243           read (fd, &pa, sizeof (pa)) == (sizeof (pa)) &&
244           pa & (1ULL << 63) /* page present bit */ )
245         {
246           pa = (pa & pow2_mask (55)) << pm->sys_log2_page_sz;
247         }
248       pm->lookup_table[p] = va - pa;
249       p++;
250     }
251
252   if (fd != -1)
253     close (fd);
254 }
255
256 static inline clib_pmalloc_page_t *
257 pmalloc_map_pages (clib_pmalloc_main_t * pm, clib_pmalloc_arena_t * a,
258                    u32 numa_node, u32 n_pages)
259 {
260   clib_pmalloc_page_t *pp = 0;
261   int status, rv, i, mmap_flags;
262   void *va;
263   int old_mpol = -1;
264   long unsigned int mask[16] = { 0 };
265   long unsigned int old_mask[16] = { 0 };
266   uword size = (uword) n_pages << pm->def_log2_page_sz;
267
268   clib_error_free (pm->error);
269
270   if (pm->max_pages <= vec_len (pm->pages))
271     {
272       pm->error = clib_error_return (0, "maximum number of pages reached");
273       return 0;
274     }
275
276   if (a->log2_subpage_sz != pm->sys_log2_page_sz)
277     {
278       pm->error = clib_sysfs_prealloc_hugepages (numa_node,
279                                                  a->log2_subpage_sz, n_pages);
280
281       if (pm->error)
282         return 0;
283     }
284
285   rv = get_mempolicy (&old_mpol, old_mask, sizeof (old_mask) * 8 + 1, 0, 0);
286   /* failure to get mempolicy means we can only proceed with numa 0 maps */
287   if (rv == -1 && numa_node != 0)
288     {
289       pm->error = clib_error_return_unix (0, "failed to get mempolicy");
290       return 0;
291     }
292
293   mask[0] = 1 << numa_node;
294   rv = set_mempolicy (MPOL_BIND, mask, sizeof (mask) * 8 + 1);
295   if (rv == -1 && numa_node != 0)
296     {
297       pm->error = clib_error_return_unix (0, "failed to set mempolicy for "
298                                           "numa node %u", numa_node);
299       return 0;
300     }
301
302   mmap_flags = MAP_FIXED;
303
304   if ((pm->flags & CLIB_PMALLOC_F_NO_PAGEMAP) == 0)
305     mmap_flags |= MAP_LOCKED;
306
307   if (a->flags & CLIB_PMALLOC_ARENA_F_SHARED_MEM)
308     {
309       mmap_flags |= MAP_SHARED;
310       if (a->log2_subpage_sz != pm->sys_log2_page_sz)
311         pm->error = clib_mem_create_hugetlb_fd ((char *) a->name, &a->fd);
312       else
313         pm->error = clib_mem_create_fd ((char *) a->name, &a->fd);
314       if (a->fd == -1)
315         goto error;
316       if ((ftruncate (a->fd, size)) == -1)
317         goto error;
318     }
319   else
320     {
321       if (a->log2_subpage_sz != pm->sys_log2_page_sz)
322         mmap_flags |= MAP_HUGETLB;
323
324       mmap_flags |= MAP_PRIVATE | MAP_ANONYMOUS;
325       a->fd = -1;
326     }
327
328   va = pm->base + (((uword) vec_len (pm->pages)) << pm->def_log2_page_sz);
329   if (mmap (va, size, PROT_READ | PROT_WRITE, mmap_flags, a->fd, 0) ==
330       MAP_FAILED)
331     {
332       pm->error = clib_error_return_unix (0, "failed to mmap %u pages at %p "
333                                           "fd %d numa %d flags 0x%x", n_pages,
334                                           va, a->fd, numa_node, mmap_flags);
335       goto error;
336     }
337
338   clib_memset (va, 0, size);
339
340   rv = set_mempolicy (old_mpol, old_mask, sizeof (old_mask) * 8 + 1);
341   if (rv == -1 && numa_node != 0)
342     {
343       pm->error = clib_error_return_unix (0, "failed to restore mempolicy");
344       goto error;
345     }
346
347   /* we tolerate move_pages failure only if request os for numa node 0
348      to support non-numa kernels */
349   rv = move_pages (0, 1, &va, 0, &status, 0);
350   if ((rv == 0 && status != numa_node) || (rv != 0 && numa_node != 0))
351     {
352       pm->error = rv == -1 ?
353         clib_error_return_unix (0, "page allocated on wrong node, numa node "
354                                 "%u status %d", numa_node, status) :
355         clib_error_return (0, "page allocated on wrong node, numa node "
356                            "%u status %d", numa_node, status);
357
358       /* unmap & reesrve */
359       munmap (va, size);
360       mmap (va, size, PROT_NONE, MAP_FIXED | MAP_PRIVATE | MAP_ANONYMOUS,
361             -1, 0);
362       goto error;
363     }
364
365   for (i = 0; i < n_pages; i++)
366     {
367       vec_add2 (pm->pages, pp, 1);
368       pp->n_free_blocks = 1 << (pm->def_log2_page_sz - PMALLOC_LOG2_BLOCK_SZ);
369       pp->index = pp - pm->pages;
370       pp->arena_index = a->index;
371       vec_add1 (a->page_indices, pp->index);
372       a->n_pages++;
373     }
374
375
376   /* if new arena is using smaller page size, we need to rebuild whole
377      lookup table */
378   if (a->log2_subpage_sz < pm->lookup_log2_page_sz)
379     {
380       pm->lookup_log2_page_sz = a->log2_subpage_sz;
381       pmalloc_update_lookup_table (pm, vec_len (pm->pages) - n_pages,
382                                    n_pages);
383     }
384   else
385     pmalloc_update_lookup_table (pm, 0, vec_len (pm->pages));
386
387   /* return pointer to 1st page */
388   return pp - (n_pages - 1);
389
390 error:
391   if (a->fd != -1)
392     close (a->fd);
393   return 0;
394 }
395
396 void *
397 clib_pmalloc_create_shared_arena (clib_pmalloc_main_t * pm, char *name,
398                                   uword size, u32 log2_page_sz, u32 numa_node)
399 {
400   clib_pmalloc_arena_t *a;
401   clib_pmalloc_page_t *pp;
402   u32 n_pages;
403
404   clib_error_free (pm->error);
405
406   if (log2_page_sz == 0)
407     log2_page_sz = pm->def_log2_page_sz;
408   else if (log2_page_sz != pm->def_log2_page_sz &&
409            log2_page_sz != pm->sys_log2_page_sz)
410     {
411       pm->error = clib_error_create ("unsupported page size (%uKB)",
412                                      1 << (log2_page_sz - 10));
413       return 0;
414     }
415
416   n_pages = pmalloc_size2pages (size, pm->def_log2_page_sz);
417
418   if (n_pages + vec_len (pm->pages) > pm->max_pages)
419     return 0;
420
421   if (pmalloc_validate_numa_node (&numa_node))
422     return 0;
423
424   pool_get (pm->arenas, a);
425   a->index = a - pm->arenas;
426   a->name = format (0, "%s%c", name, 0);
427   a->numa_node = numa_node;
428   a->flags = CLIB_PMALLOC_ARENA_F_SHARED_MEM;
429   a->log2_subpage_sz = log2_page_sz;
430   a->subpages_per_page = 1U << (pm->def_log2_page_sz - log2_page_sz);
431
432   if ((pp = pmalloc_map_pages (pm, a, numa_node, n_pages)) == 0)
433     {
434       vec_free (a->name);
435       memset (a, 0, sizeof (*a));
436       pool_put (pm->arenas, a);
437       return 0;
438     }
439
440   return pm->base + ((uword) pp->index << pm->def_log2_page_sz);
441 }
442
443 static inline void *
444 clib_pmalloc_alloc_inline (clib_pmalloc_main_t * pm, clib_pmalloc_arena_t * a,
445                            uword size, uword align, u32 numa_node)
446 {
447   clib_pmalloc_page_t *pp;
448   u32 n_blocks, block_align, *page_index;
449
450   ASSERT (is_pow2 (align));
451
452   if (pmalloc_validate_numa_node (&numa_node))
453     return 0;
454
455   if (a == 0)
456     {
457       if (size > 1ULL << pm->def_log2_page_sz)
458         return 0;
459
460       vec_validate_init_empty (pm->default_arena_for_numa_node,
461                                numa_node, ~0);
462       if (pm->default_arena_for_numa_node[numa_node] == ~0)
463         {
464           pool_get (pm->arenas, a);
465           pm->default_arena_for_numa_node[numa_node] = a - pm->arenas;
466           a->name = format (0, "default-numa-%u%c", numa_node, 0);
467           a->numa_node = numa_node;
468           a->log2_subpage_sz = pm->def_log2_page_sz;
469           a->subpages_per_page = 1;
470         }
471       else
472         a = pool_elt_at_index (pm->arenas,
473                                pm->default_arena_for_numa_node[numa_node]);
474     }
475   else if (size > 1ULL << a->log2_subpage_sz)
476     return 0;
477
478   n_blocks = round_pow2 (size, PMALLOC_BLOCK_SZ) / PMALLOC_BLOCK_SZ;
479   block_align = align >> PMALLOC_LOG2_BLOCK_SZ;
480
481   vec_foreach (page_index, a->page_indices)
482   {
483     pp = vec_elt_at_index (pm->pages, *page_index);
484     void *rv = alloc_chunk_from_page (pm, pp, n_blocks, block_align,
485                                       numa_node);
486
487     if (rv)
488       return rv;
489   }
490
491   if ((a->flags & CLIB_PMALLOC_ARENA_F_SHARED_MEM) == 0 &&
492       (pp = pmalloc_map_pages (pm, a, numa_node, 1)))
493     return alloc_chunk_from_page (pm, pp, n_blocks, block_align, numa_node);
494
495   return 0;
496 }
497
498 void *
499 clib_pmalloc_alloc_aligned_on_numa (clib_pmalloc_main_t * pm, uword size,
500                                     uword align, u32 numa_node)
501 {
502   return clib_pmalloc_alloc_inline (pm, 0, size, align, numa_node);
503 }
504
505 void *
506 clib_pmalloc_alloc_aligned (clib_pmalloc_main_t * pm, uword size, uword align)
507 {
508   return clib_pmalloc_alloc_inline (pm, 0, size, align,
509                                     CLIB_PMALLOC_NUMA_LOCAL);
510 }
511
512 void *
513 clib_pmalloc_alloc_from_arena (clib_pmalloc_main_t * pm, void *arena_va,
514                                uword size, uword align)
515 {
516   clib_pmalloc_arena_t *a = clib_pmalloc_get_arena (pm, arena_va);
517   return clib_pmalloc_alloc_inline (pm, a, size, align, 0);
518 }
519
520 static inline int
521 pmalloc_chunks_mergeable (clib_pmalloc_arena_t * a, clib_pmalloc_page_t * pp,
522                           u32 ci1, u32 ci2)
523 {
524   clib_pmalloc_chunk_t *c1, *c2;
525
526   if (ci1 == ~0 || ci2 == ~0)
527     return 0;
528
529   c1 = get_chunk (pp, ci1);
530   c2 = get_chunk (pp, ci2);
531
532   if (c1->used || c2->used)
533     return 0;
534
535   if (c1->start >> (a->log2_subpage_sz - PMALLOC_LOG2_BLOCK_SZ) !=
536       c2->start >> (a->log2_subpage_sz - PMALLOC_LOG2_BLOCK_SZ))
537     return 0;
538
539   return 1;
540 }
541
542 void
543 clib_pmalloc_free (clib_pmalloc_main_t * pm, void *va)
544 {
545   clib_pmalloc_page_t *pp;
546   clib_pmalloc_chunk_t *c;
547   clib_pmalloc_arena_t *a;
548   uword *p;
549   u32 chunk_index, page_index;
550
551   p = hash_get (pm->chunk_index_by_va, pointer_to_uword (va));
552
553   if (p == 0)
554     os_panic ();
555
556   chunk_index = p[0];
557   page_index = clib_pmalloc_get_page_index (pm, va);
558   hash_unset (pm->chunk_index_by_va, pointer_to_uword (va));
559
560   pp = vec_elt_at_index (pm->pages, page_index);
561   c = pool_elt_at_index (pp->chunks, chunk_index);
562   a = pool_elt_at_index (pm->arenas, pp->arena_index);
563   c->used = 0;
564   pp->n_free_blocks += c->size;
565   pp->n_free_chunks++;
566
567   /* merge with next if free */
568   if (pmalloc_chunks_mergeable (a, pp, chunk_index, c->next))
569     {
570       clib_pmalloc_chunk_t *next = get_chunk (pp, c->next);
571       c->size += next->size;
572       c->next = next->next;
573       if (next->next != ~0)
574         get_chunk (pp, next->next)->prev = chunk_index;
575       memset (next, 0, sizeof (*next));
576       pool_put (pp->chunks, next);
577       pp->n_free_chunks--;
578     }
579
580   /* merge with prev if free */
581   if (pmalloc_chunks_mergeable (a, pp, c->prev, chunk_index))
582     {
583       clib_pmalloc_chunk_t *prev = get_chunk (pp, c->prev);
584       prev->size += c->size;
585       prev->next = c->next;
586       if (c->next != ~0)
587         get_chunk (pp, c->next)->prev = c->prev;
588       memset (c, 0, sizeof (*c));
589       pool_put (pp->chunks, c);
590       pp->n_free_chunks--;
591     }
592 }
593
594 static u8 *
595 format_log2_page_size (u8 * s, va_list * va)
596 {
597   u32 log2_page_sz = va_arg (*va, u32);
598
599   if (log2_page_sz >= 30)
600     return format (s, "%uGB", 1 << (log2_page_sz - 30));
601
602   if (log2_page_sz >= 20)
603     return format (s, "%uMB", 1 << (log2_page_sz - 20));
604
605   if (log2_page_sz >= 10)
606     return format (s, "%uKB", 1 << (log2_page_sz - 10));
607
608   return format (s, "%uB", 1 << log2_page_sz);
609 }
610
611
612 static u8 *
613 format_pmalloc_page (u8 * s, va_list * va)
614 {
615   clib_pmalloc_page_t *pp = va_arg (*va, clib_pmalloc_page_t *);
616   int verbose = va_arg (*va, int);
617   u32 indent = format_get_indent (s);
618
619   if (pp->chunks == 0)
620     return s;
621
622   s = format (s, "free %u chunks %u free-chunks %d ",
623               (pp->n_free_blocks) << PMALLOC_LOG2_BLOCK_SZ,
624               pool_elts (pp->chunks), pp->n_free_chunks);
625
626   if (verbose >= 2)
627     {
628       clib_pmalloc_chunk_t *c;
629       c = pool_elt_at_index (pp->chunks, pp->first_chunk_index);
630       s = format (s, "\n%U%12s%12s%8s%8s%8s%8s",
631                   format_white_space, indent + 2,
632                   "chunk offset", "size", "used", "index", "prev", "next");
633       while (1)
634         {
635           s = format (s, "\n%U%12u%12u%8s%8d%8d%8d",
636                       format_white_space, indent + 2,
637                       c->start << PMALLOC_LOG2_BLOCK_SZ,
638                       c->size << PMALLOC_LOG2_BLOCK_SZ,
639                       c->used ? "yes" : "no",
640                       c - pp->chunks, c->prev, c->next);
641           if (c->next == ~0)
642             break;
643           c = pool_elt_at_index (pp->chunks, c->next);
644         }
645     }
646   return s;
647 }
648
649 u8 *
650 format_pmalloc (u8 * s, va_list * va)
651 {
652   clib_pmalloc_main_t *pm = va_arg (*va, clib_pmalloc_main_t *);
653   int verbose = va_arg (*va, int);
654   u32 indent = format_get_indent (s);
655
656   clib_pmalloc_page_t *pp;
657   clib_pmalloc_arena_t *a;
658
659   s = format (s, "used-pages %u reserved-pages %u default-page-size %U "
660               "lookup-page-size %U%s", vec_len (pm->pages), pm->max_pages,
661               format_log2_page_size, pm->def_log2_page_sz,
662               format_log2_page_size, pm->lookup_log2_page_sz,
663               pm->flags & CLIB_PMALLOC_F_NO_PAGEMAP ? " no-pagemap" : "");
664
665
666   if (verbose >= 2)
667     s = format (s, " va-start %p", pm->base);
668
669   if (pm->error)
670     s = format (s, "\n%Ulast-error: %U", format_white_space, indent + 2,
671                 format_clib_error, pm->error);
672
673
674   /* *INDENT-OFF* */
675   pool_foreach (a, pm->arenas,
676     {
677       u32 *page_index;
678       s = format (s, "\n%Uarena '%s' pages %u subpage-size %U numa-node %u",
679                   format_white_space, indent + 2, a->name,
680                   vec_len (a->page_indices), format_log2_page_size,
681                   a->log2_subpage_sz, a->numa_node);
682       if (a->fd != -1)
683         s = format (s, " shared fd %d", a->fd);
684       if (verbose >= 1)
685         vec_foreach (page_index, a->page_indices)
686           {
687             pp = vec_elt_at_index (pm->pages, *page_index);
688             s = format (s, "\n%U%U", format_white_space, indent + 4,
689                         format_pmalloc_page, pp, verbose);
690           }
691     });
692   /* *INDENT-ON* */
693
694   return s;
695 }
696
697 u8 *
698 format_pmalloc_map (u8 * s, va_list * va)
699 {
700   clib_pmalloc_main_t *pm = va_arg (*va, clib_pmalloc_main_t *);
701
702   u32 index;
703   s = format (s, "%16s %13s %8s", "virtual-addr", "physical-addr", "size");
704   vec_foreach_index (index, pm->lookup_table)
705   {
706     uword *lookup_val, pa, va;
707     lookup_val = vec_elt_at_index (pm->lookup_table, index);
708     va =
709       pointer_to_uword (pm->base) +
710       ((uword) index << pm->lookup_log2_page_sz);
711     pa = va - *lookup_val;
712     s =
713       format (s, "\n %16p %13p %8U", uword_to_pointer (va, u64),
714               uword_to_pointer (pa, u64), format_log2_page_size,
715               pm->lookup_log2_page_sz);
716   }
717   return s;
718 }
719
720 /*
721  * fd.io coding-style-patch-verification: ON
722  *
723  * Local Variables:
724  * eval: (c-set-style "gnu")
725  * End:
726  */