vppinfra: bihash improvements
[vpp.git] / src / vppinfra / test_bihash_template.c
index bdcf2cd..86039d8 100644 (file)
@@ -17,6 +17,7 @@
 #include <vppinfra/error.h>
 #include <sys/resource.h>
 #include <stdio.h>
+#include <pthread.h>
 
 #include <vppinfra/bihash_8_8.h>
 #include <vppinfra/bihash_template.h>
 
 typedef struct
 {
+  volatile u32 thread_barrier;
+  volatile u32 threads_running;
+  volatile u64 sequence_number;
   u64 seed;
   u32 nbuckets;
   u32 nitems;
   u32 ncycles;
   u32 report_every_n;
   u32 search_iter;
+  u32 noverwritten;
   int careful_delete_tests;
   int verbose;
   int non_random_keys;
+  u32 nthreads;
   uword *key_hash;
   u64 *keys;
   uword hash_memory_size;
     BVT (clib_bihash) hash;
   clib_time_t clib_time;
+  void *global_heap;
 
   unformat_input_t *input;
 
@@ -65,7 +72,13 @@ test_bihash_vec64 (test_main_t * tm)
 
   h = &tm->hash;
 
+#if BIHASH_32_64_SVM
+  BV (clib_bihash_master_init_svm) (h, "test", user_buckets,
+                                   0x30000000 /* base_addr */ ,
+                                   user_memory_size);
+#else
   BV (clib_bihash_init) (h, "test", user_buckets, user_memory_size);
+#endif
 
   before = clib_time_now (&tm->clib_time);
 
@@ -89,6 +102,152 @@ test_bihash_vec64 (test_main_t * tm)
   return 0;
 }
 
+static int
+stale_cb (BVT (clib_bihash_kv) * kv, void *ctx)
+{
+  test_main_t *tm = ctx;
+
+  tm->noverwritten++;
+
+  return 1;
+}
+
+static clib_error_t *
+test_bihash_stale_overwrite (test_main_t * tm)
+{
+  BVT (clib_bihash) * h;
+  BVT (clib_bihash_kv) kv;
+  int i;
+  tm->noverwritten = 0;
+
+  h = &tm->hash;
+
+#if BIHASH_32_64_SVM
+  BV (clib_bihash_master_init_svm) (h, "test", tm->nbuckets,
+                                   0x30000000 /* base_addr */ ,
+                                   tm->hash_memory_size);
+#else
+  BV (clib_bihash_init) (h, "test", tm->nbuckets, tm->hash_memory_size);
+#endif
+
+  fformat (stdout, "Add %d items to %d buckets\n", tm->nitems, tm->nbuckets);
+
+  for (i = 0; i < tm->nitems; i++)
+    {
+      kv.key = i;
+      kv.value = 1;
+
+      BV (clib_bihash_add_or_overwrite_stale) (h, &kv, stale_cb, tm);
+    }
+
+  fformat (stdout, "%d items overwritten\n", tm->noverwritten);
+  fformat (stdout, "%U", BV (format_bihash), h, 0);
+
+  return 0;
+}
+
+void *
+test_bihash_thread_fn (void *arg)
+{
+  BVT (clib_bihash) * h;
+  BVT (clib_bihash_kv) kv;
+  test_main_t *tm = &test_main;
+
+  int i, j;
+
+  u32 my_thread_index = (u32) (u64) arg;
+  __os_thread_index = my_thread_index;
+  clib_mem_set_per_cpu_heap (tm->global_heap);
+
+  while (tm->thread_barrier)
+    ;
+
+  h = &tm->hash;
+
+  for (i = 0; i < tm->ncycles; i++)
+    {
+      for (j = 0; j < tm->nitems; j++)
+       {
+         kv.key = ((u64) my_thread_index << 32) | (u64) j;
+         kv.value = ((u64) my_thread_index << 32) | (u64) j;
+         (void) __atomic_add_fetch (&tm->sequence_number, 1,
+                                    __ATOMIC_ACQUIRE);
+         BV (clib_bihash_add_del) (h, &kv, 1 /* is_add */ );
+       }
+      for (j = 0; j < tm->nitems; j++)
+       {
+         kv.key = ((u64) my_thread_index << 32) | (u64) j;
+         kv.value = ((u64) my_thread_index << 32) | (u64) j;
+         (void) __atomic_add_fetch (&tm->sequence_number, 1,
+                                    __ATOMIC_ACQUIRE);
+         BV (clib_bihash_add_del) (h, &kv, 0 /* is_add */ );
+       }
+    }
+
+  (void) __atomic_sub_fetch (&tm->threads_running, 1, __ATOMIC_ACQUIRE);
+  while (1)
+    {
+      struct timespec ts, tsrem;
+      ts.tv_sec = 1;
+      ts.tv_nsec = 0;
+
+      while (nanosleep (&ts, &tsrem) < 0)
+       ts = tsrem;
+    }
+  return (0);                  /* not so much */
+}
+
+static clib_error_t *
+test_bihash_threads (test_main_t * tm)
+{
+  int i;
+  pthread_t handle;
+  BVT (clib_bihash) * h;
+  int rv;
+
+  h = &tm->hash;
+
+#if BIHASH_32_64_SVM
+  BV (clib_bihash_master_init_svm) (h, "test", tm->nbuckets,
+                                   0x30000000 /* base_addr */ ,
+                                   tm->hash_memory_size);
+#else
+  BV (clib_bihash_init) (h, "test", tm->nbuckets, tm->hash_memory_size);
+#endif
+
+  tm->thread_barrier = 1;
+
+  /* Start the worker threads */
+  for (i = 0; i < tm->nthreads; i++)
+    {
+      rv = pthread_create (&handle, NULL, test_bihash_thread_fn,
+                          (void *) (u64) i);
+      if (rv)
+       {
+         clib_unix_warning ("pthread_create returned %d", rv);
+       }
+    }
+  tm->threads_running = i;
+  tm->sequence_number = 0;
+  CLIB_MEMORY_BARRIER ();
+
+  /* start the workers */
+  tm->thread_barrier = 0;
+
+  while (tm->threads_running)
+    {
+      struct timespec ts, tsrem;
+      ts.tv_sec = 0;
+      ts.tv_nsec = 20 * 1000 * 1000;   /* sleep for 20ms at a time */
+
+      while (nanosleep (&ts, &tsrem) < 0)
+       ts = tsrem;
+    }
+
+  return 0;
+}
+
+
 static clib_error_t *
 test_bihash (test_main_t * tm)
 {
@@ -102,7 +261,13 @@ test_bihash (test_main_t * tm)
 
   h = &tm->hash;
 
+#if BIHASH_32_64_SVM
+  BV (clib_bihash_master_init_svm) (h, "test", tm->nbuckets,
+                                   0x30000000 /* base_addr */ ,
+                                   tm->hash_memory_size);
+#else
   BV (clib_bihash_init) (h, "test", tm->nbuckets, tm->hash_memory_size);
+#endif
 
   for (acycle = 0; acycle < tm->ncycles; acycle++)
     {
@@ -172,6 +337,16 @@ test_bihash (test_main_t * tm)
        {
          for (i = 0; i < tm->nitems; i++)
            {
+             /* Prefetch buckets 8 iterations ahead */
+             if (1 && (i < (tm->nitems - 8)))
+               {
+                 BVT (clib_bihash_kv) pref_kv;
+                 u64 pref_hash;
+                 pref_kv.key = tm->keys[i + 8];
+                 pref_hash = BV (clib_bihash_hash) (&pref_kv);
+                 BV (clib_bihash_prefetch_bucket) (h, pref_hash);
+               }
+
              kv.key = tm->keys[i];
              if (BV (clib_bihash_search) (h, &kv, &kv) < 0)
                if (BV (clib_bihash_search) (h, &kv, &kv) < 0)
@@ -191,8 +366,10 @@ test_bihash (test_main_t * tm)
          total_searches = (uword) tm->search_iter * (uword) tm->nitems;
 
          if (delta > 0)
-           fformat (stdout, "%.f searches per second\n",
-                    ((f64) total_searches) / delta);
+           fformat (stdout,
+                    "%.f searches per second, %.2f nsec per search\n",
+                    ((f64) total_searches) / delta,
+                    1e9 * (delta / ((f64) total_searches)));
 
          fformat (stdout, "%lld searches in %.6f seconds\n", total_searches,
                   delta);
@@ -244,6 +421,16 @@ test_bihash (test_main_t * tm)
            {
              for (j = 0; j < tm->nitems; j++)
                {
+                 /* Prefetch buckets 8 iterations ahead */
+                 if (1 && (j < (tm->nitems - 8)))
+                   {
+                     BVT (clib_bihash_kv) pref_kv;
+                     u64 pref_hash;
+                     pref_kv.key = tm->keys[j + 8];
+                     pref_hash = BV (clib_bihash_hash) (&pref_kv);
+                     BV (clib_bihash_prefetch_bucket) (h, pref_hash);
+                   }
+
                  kv.key = tm->keys[j];
                  rv = BV (clib_bihash_search) (h, &kv, &kv);
                  if (j <= i && rv >= 0)
@@ -279,38 +466,8 @@ test_bihash (test_main_t * tm)
   fformat (stdout, "End of run, should be empty...\n");
 
   fformat (stdout, "%U", BV (format_bihash), h, 0 /* very verbose */ );
-  return 0;
-}
-
-clib_error_t *
-test_bihash_cache (test_main_t * tm)
-{
-  u32 lru;
-  BVT (clib_bihash_bucket) _b, *b = &_b;
-
-  BV (clib_bihash_reset_cache) (b);
-
-  fformat (stdout, "Initial LRU config: %U\n", BV (format_bihash_lru), b);
-
-  BV (clib_bihash_update_lru_not_inline) (b, 3);
 
-  fformat (stdout, "use slot 3, LRU config: %U\n", BV (format_bihash_lru), b);
-
-  BV (clib_bihash_update_lru) (b, 1);
-
-  fformat (stdout, "use slot 1 LRU config: %U\n", BV (format_bihash_lru), b);
-
-  lru = BV (clib_bihash_get_lru) (b);
-
-  fformat (stdout, "least-recently-used is %d\n", lru);
-
-  BV (clib_bihash_update_lru) (b, 4);
-
-  fformat (stdout, "use slot 4 LRU config: %U\n", BV (format_bihash_lru), b);
-
-  lru = BV (clib_bihash_get_lru) (b);
-
-  fformat (stdout, "least-recently-used is %d\n", lru);
+  BV (clib_bihash_free) (h);
 
   return 0;
 }
@@ -323,7 +480,7 @@ test_bihash_main (test_main_t * tm)
   int which = 0;
 
   tm->report_every_n = 1;
-  tm->hash_memory_size = 4095ULL << 20;
+  tm->hash_memory_size = 1ULL << 30;
 
   while (unformat_check_input (i) != UNFORMAT_END_OF_INPUT)
     {
@@ -351,11 +508,12 @@ test_bihash_main (test_main_t * tm)
        ;
       else if (unformat (i, "vec64"))
        which = 1;
-      else if (unformat (i, "cache"))
+      else if (unformat (i, "threads %u", &tm->nthreads))
        which = 2;
-
       else if (unformat (i, "verbose"))
        tm->verbose = 1;
+      else if (unformat (i, "stale-overwrite"))
+       which = 3;
       else
        return clib_error_return (0, "unknown input '%U'",
                                  format_unformat_error, i);
@@ -378,7 +536,11 @@ test_bihash_main (test_main_t * tm)
       break;
 
     case 2:
-      error = test_bihash_cache (tm);
+      error = test_bihash_threads (tm);
+      break;
+
+    case 3:
+      error = test_bihash_stale_overwrite (tm);
       break;
 
     default:
@@ -398,6 +560,8 @@ main (int argc, char *argv[])
 
   clib_mem_init (0, 4095ULL << 20);
 
+  tm->global_heap = clib_mem_get_per_cpu_heap ();
+
   tm->input = &i;
   tm->seed = 0xdeaddabe;