Add the bihash_vec8_8 variant 09/9109/2
authorDave Barach <dave@barachs.net>
Mon, 30 Oct 2017 13:42:54 +0000 (09:42 -0400)
committerFlorin Coras <florin.coras@gmail.com>
Mon, 30 Oct 2017 19:03:52 +0000 (19:03 +0000)
This is an all-purpose octet-vector memory hash, intended as a
thread-safe replacement for hash_create_mem / hash_create_string.  All
u8 * key vectors are memorized by the hash table.

Change-Id: I22944daea8fda07dde8ba118a6529a6d382491f9
Signed-off-by: Dave Barach <dave@barachs.net>
src/vppinfra.am
src/vppinfra/bihash_vec8_8.h [new file with mode: 0644]
src/vppinfra/test_bihash_vec88.c [new file with mode: 0644]

index 96766e8..25cf144 100644 (file)
 
 lib_LTLIBRARIES += libvppinfra.la
 
-TESTS = test_cuckoo_template \
-        test_bihash_template \
-       test_cuckoo_bihash
+TESTS = 
 
 if ENABLE_TESTS
 TESTS  +=  test_bihash_template \
+           test_bihash_vec88 \
+          test_cuckoo_bihash \
+          test_cuckoo_template\
           test_dlist \
           test_elf \
           test_elog \
@@ -49,6 +50,7 @@ noinst_PROGRAMS = $(TESTS)
 check_PROGRAMS = $(TESTS)
 
 test_bihash_template_SOURCES = vppinfra/test_bihash_template.c
+test_bihash_vec88_SOURCES = vppinfra/test_bihash_vec88.c
 test_cuckoo_template_SOURCES = vppinfra/test_cuckoo_template.c
 test_cuckoo_bihash_SOURCES = vppinfra/test_cuckoo_bihash.c
 test_dlist_SOURCES = vppinfra/test_dlist.c
@@ -79,6 +81,7 @@ test_zvec_SOURCES = vppinfra/test_zvec.c
 # All unit tests use ASSERT for failure
 # So we'll need -DDEBUG to enable ASSERTs
 test_bihash_template_CPPFLAGS =        $(AM_CPPFLAGS) -DCLIB_DEBUG
+test_bihash_vec88_CPPFLAGS =   $(AM_CPPFLAGS) -DCLIB_DEBUG
 test_cuckoo_template_CPPFLAGS =        $(AM_CPPFLAGS) -DCLIB_DEBUG
 test_cuckoo_bihash_CPPFLAGS =  $(AM_CPPFLAGS) -DCLIB_DEBUG
 test_dlist_CPPFLAGS =  $(AM_CPPFLAGS) -DCLIB_DEBUG
@@ -107,6 +110,7 @@ test_vec_CPPFLAGS = $(AM_CPPFLAGS) -DCLIB_DEBUG
 test_zvec_CPPFLAGS =   $(AM_CPPFLAGS) -DCLIB_DEBUG
 
 test_bihash_template_LDADD =   libvppinfra.la
+test_bihash_vec88_LDADD =      libvppinfra.la
 test_cuckoo_template_LDADD =   libvppinfra.la
 test_cuckoo_bihash_LDADD =     libvppinfra.la
 test_dlist_LDADD =     libvppinfra.la
@@ -135,6 +139,7 @@ test_vec_LDADD =    libvppinfra.la
 test_zvec_LDADD =      libvppinfra.la
 
 test_bihash_template_LDFLAGS = -static
+test_bihash_vec88_LDFLAGS = -static
 test_cuckoo_template_LDFLAGS = -static
 test_cuckoo_bihash_LDFLAGS = -static -lpthread
 test_dlist_LDFLAGS = -static
@@ -172,6 +177,7 @@ nobase_include_HEADERS = \
   vppinfra/asm_mips.h \
   vppinfra/asm_x86.h \
   vppinfra/bihash_8_8.h \
+  vppinfra/bihash_vec8_8.h \
   vppinfra/bihash_16_8.h \
   vppinfra/bihash_24_8.h \
   vppinfra/bihash_48_8.h \
@@ -253,6 +259,7 @@ CLIB_CORE = \
   vppinfra/asm_x86.c \
   vppinfra/backtrace.c \
   vppinfra/bihash_8_8.h \
+  vppinfra/bihash_vec8_8.h \
   vppinfra/bihash_24_8.h \
   vppinfra/bihash_template.h \
   vppinfra/cpu.c \
diff --git a/src/vppinfra/bihash_vec8_8.h b/src/vppinfra/bihash_vec8_8.h
new file mode 100644 (file)
index 0000000..cc78f1d
--- /dev/null
@@ -0,0 +1,123 @@
+/*
+ * Copyright (c) 2017 Cisco and/or its affiliates.
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at:
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#undef BIHASH_TYPE
+#undef BIHASH_KVP_CACHE_SIZE
+#undef BIHASH_KVP_PER_PAGE
+
+#define BIHASH_TYPE _vec8_8
+#define BIHASH_KVP_PER_PAGE 4
+#define BIHASH_KVP_CACHE_SIZE 0
+
+#ifndef __included_bihash_vec8_8_h__
+#define __included_bihash_vec8_8_h__
+
+#include <vppinfra/heap.h>
+#include <vppinfra/format.h>
+#include <vppinfra/pool.h>
+#include <vppinfra/xxhash.h>
+#include <vppinfra/crc32.h>
+
+/** 8 octet key, 8 octet key value pair */
+typedef struct
+{
+  u64 key;                     /**< the key */
+  u64 value;                   /**< the value */
+} clib_bihash_kv_vec8_8_t;
+
+/** Decide if a clib_bihash_kv_vec8_8_t instance is free
+    @param v- pointer to the (key,value) pair
+*/
+static inline int
+clib_bihash_is_free_vec8_8 (clib_bihash_kv_vec8_8_t * v)
+{
+  if (v->key == ~0ULL && v->value == ~0ULL)
+    return 1;
+  return 0;
+}
+
+/** Hash a clib_bihash_kv_vec8_8_t instance
+    @param v - pointer to the (key,value) pair, hash the key (only)
+*/
+static inline u64
+clib_bihash_hash_vec8_8 (clib_bihash_kv_vec8_8_t * v)
+{
+  u8 *keyp = (u8 *) (v->key);
+  /* Note: to torture-test linear scan, make this fn return a constant */
+#ifdef clib_crc32c_uses_intrinsics
+  return clib_crc32c (keyp, vec_len (keyp));
+#else
+  {
+    int i, j;
+    u64 sum = 0;
+
+    for (i = 0, j = 0; i < vec_len (keyp); i++)
+      {
+       sum ^= keyp[i] << (j * 8);
+       j++;
+       if (j == 4)
+         j = 0;
+      }
+
+    return clib_xxhash (sum);
+  }
+#endif
+}
+
+/** Format a clib_bihash_kv_vec8_8_t instance
+    @param s - u8 * vector under construction
+    @param args (vararg) - the (key,value) pair to format
+    @return s - the u8 * vector under construction
+*/
+static inline u8 *
+format_bihash_kvp_vec8_8 (u8 * s, va_list * args)
+{
+  clib_bihash_kv_vec8_8_t *v = va_arg (*args, clib_bihash_kv_vec8_8_t *);
+
+  s = format (s, "key %U value %llu",
+             format_hex_bytes, v->key, vec_len ((u8 *) (v->key)), v->value);
+  return s;
+}
+
+/** Compare two clib_bihash_kv_vec8_8_t instances
+    @param a - first key
+    @param b - second key
+*/
+static inline int
+clib_bihash_key_compare_vec8_8 (u64 a_arg, u64 b_arg)
+{
+  u8 *a = (u8 *) a_arg;
+  u8 *b = (u8 *) b_arg;
+
+  if (a_arg == ~0ULL || b_arg == ~0ULL)
+    return 0;
+
+  if (vec_len (a) != vec_len (b))
+    return 0;
+
+  return memcmp (a, b, vec_len (a)) == 0;
+}
+
+#undef __included_bihash_template_h__
+#include <vppinfra/bihash_template.h>
+
+#endif /* __included_bihash_vec8_8_h__ */
+
+/*
+ * fd.io coding-style-patch-verification: ON
+ *
+ * Local Variables:
+ * eval: (c-set-style "gnu")
+ * End:
+ */
diff --git a/src/vppinfra/test_bihash_vec88.c b/src/vppinfra/test_bihash_vec88.c
new file mode 100644 (file)
index 0000000..a57ceec
--- /dev/null
@@ -0,0 +1,302 @@
+/*
+ * Copyright (c) 2017 Cisco and/or its affiliates.
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at:
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#include <vppinfra/time.h>
+#include <vppinfra/cache.h>
+#include <vppinfra/error.h>
+
+#include <vppinfra/bihash_vec8_8.h>
+#include <vppinfra/bihash_template.h>
+
+#include <vppinfra/bihash_template.c>
+
+typedef struct
+{
+  u32 seed;
+  u32 nbuckets;
+  u32 nitems;
+  u32 search_iter;
+  int careful_delete_tests;
+  int verbose;
+  int non_random_keys;
+  uword *key_hash;
+  u8 **keys;
+    BVT (clib_bihash) hash;
+  clib_time_t clib_time;
+
+  unformat_input_t *input;
+
+} test_main_t;
+
+test_main_t test_main;
+
+uword
+vl (void *v)
+{
+  return vec_len (v);
+}
+
+static clib_error_t *
+test_bihash (test_main_t * tm)
+{
+  int i, j;
+  uword *p;
+  uword total_searches;
+  f64 before, delta;
+  BVT (clib_bihash) * h;
+  BVT (clib_bihash_kv) kv;
+
+  h = &tm->hash;
+
+  BV (clib_bihash_init) (h, "test", tm->nbuckets, 3ULL << 30);
+
+  fformat (stdout, "Pick %lld unique %s keys...\n",
+          tm->nitems, tm->non_random_keys ? "non-random" : "random");
+
+  for (i = 0; i < tm->nitems; i++)
+    {
+      u8 *random_vec8;
+
+      if (tm->non_random_keys == 0)
+       {
+         u32 len;
+
+       again:
+         do
+           {
+             len = random_u32 (&tm->seed);
+             len %= 64;
+           }
+         while (len == 0);
+
+         random_vec8 = random_string (&tm->seed, len);
+         vec_add1 (random_vec8, 0);
+
+         p = hash_get_mem (tm->key_hash, random_vec8);
+         if (p)
+           goto again;
+       }
+      else
+       {
+         random_vec8 = format (0, "String%d%c", i, 0);
+       }
+
+      hash_set_mem (tm->key_hash, random_vec8, i + 1);
+      vec_add1 (tm->keys, random_vec8);
+    }
+
+  fformat (stdout, "Add items...\n");
+  for (i = 0; i < tm->nitems; i++)
+    {
+      kv.key = (u64) tm->keys[i];
+      kv.value = i + 1;
+
+      BV (clib_bihash_add_del) (h, &kv, 1 /* is_add */ );
+
+      if (tm->verbose > 1)
+       {
+         fformat (stdout, "--------------------\n");
+         fformat (stdout, "After adding key %llu value %lld...\n",
+                  tm->keys[i], (u64) (i + 1));
+         fformat (stdout, "%U", BV (format_bihash), h,
+                  2 /* very verbose */ );
+       }
+    }
+
+  fformat (stdout, "%U", BV (format_bihash), h, 0 /* very verbose */ );
+
+  fformat (stdout, "Search for items %d times...\n", tm->search_iter);
+
+  before = clib_time_now (&tm->clib_time);
+
+  for (j = 0; j < tm->search_iter; j++)
+    {
+      for (i = 0; i < tm->nitems; i++)
+       {
+         kv.key = (u64) tm->keys[i];
+         if (BV (clib_bihash_search) (h, &kv, &kv) < 0)
+           if (BV (clib_bihash_search) (h, &kv, &kv) < 0)
+             clib_warning ("[%d] search for key %lld failed unexpectedly\n",
+                           i, tm->keys[i]);
+         if (kv.value != (u64) (i + 1))
+           clib_warning
+             ("[%d] search for key %lld returned %lld, not %lld\n", i,
+              tm->keys, kv.value, (u64) (i + 1));
+       }
+    }
+
+  delta = clib_time_now (&tm->clib_time) - before;
+  total_searches = (uword) tm->search_iter * (uword) tm->nitems;
+
+  if (delta > 0)
+    fformat (stdout, "%.f searches per second\n",
+            ((f64) total_searches) / delta);
+
+  fformat (stdout, "%lld searches in %.6f seconds\n", total_searches, delta);
+
+  fformat (stdout, "Standard E-hash search for items %d times...\n",
+          tm->search_iter);
+
+  before = clib_time_now (&tm->clib_time);
+
+  for (j = 0; j < tm->search_iter; j++)
+    {
+      for (i = 0; i < tm->nitems; i++)
+       {
+         p = hash_get_mem (tm->key_hash, tm->keys[i]);
+         if (p == 0 || p[0] != (uword) (i + 1))
+           clib_warning ("ugh, couldn't find %lld\n", tm->keys[i]);
+       }
+    }
+
+  delta = clib_time_now (&tm->clib_time) - before;
+  total_searches = (uword) tm->search_iter * (uword) tm->nitems;
+
+  fformat (stdout, "%lld searches in %.6f seconds\n", total_searches, delta);
+
+  if (delta > 0)
+    fformat (stdout, "%.f searches per second\n",
+            ((f64) total_searches) / delta);
+
+  fformat (stdout, "Delete items...\n");
+
+  for (i = 0; i < tm->nitems; i++)
+    {
+      int j;
+      int rv;
+
+      kv.key = (u64) tm->keys[i];
+      kv.value = (u64) (i + 1);
+      rv = BV (clib_bihash_add_del) (h, &kv, 0 /* is_add */ );
+
+      if (rv < 0)
+       clib_warning ("delete key %lld not ok but should be", tm->keys[i]);
+
+      if (tm->careful_delete_tests)
+       {
+         for (j = 0; j < tm->nitems; j++)
+           {
+             kv.key = (u64) tm->keys[j];
+             rv = BV (clib_bihash_search) (h, &kv, &kv);
+             if (j <= i && rv >= 0)
+               {
+                 clib_warning
+                   ("i %d j %d search ok but should not be, value %lld",
+                    i, j, kv.value);
+               }
+             if (j > i && rv < 0)
+               {
+                 clib_warning ("i %d j %d search not ok but should be",
+                               i, j);
+               }
+           }
+       }
+    }
+
+  fformat (stdout, "After deletions, should be empty...\n");
+
+  fformat (stdout, "%U", BV (format_bihash), h, 0 /* very verbose */ );
+  return 0;
+}
+
+clib_error_t *
+test_bihash_main (test_main_t * tm)
+{
+  unformat_input_t *i = tm->input;
+  clib_error_t *error;
+  int which = 0;
+
+  while (unformat_check_input (i) != UNFORMAT_END_OF_INPUT)
+    {
+      if (unformat (i, "seed %u", &tm->seed))
+       ;
+
+      else if (unformat (i, "nbuckets %d", &tm->nbuckets))
+       ;
+      else if (unformat (i, "non-random-keys"))
+       tm->non_random_keys = 1;
+      else if (unformat (i, "nitems %d", &tm->nitems))
+       ;
+      else if (unformat (i, "careful %d", &tm->careful_delete_tests))
+       ;
+      else if (unformat (i, "verbose %d", &tm->verbose))
+       ;
+      else if (unformat (i, "search %d", &tm->search_iter))
+       ;
+      else if (unformat (i, "vec64"))
+       which = 1;
+      else if (unformat (i, "cache"))
+       which = 2;
+
+      else if (unformat (i, "verbose"))
+       tm->verbose = 1;
+      else
+       return clib_error_return (0, "unknown input '%U'",
+                                 format_unformat_error, i);
+    }
+
+  switch (which)
+    {
+    case 0:
+      error = test_bihash (tm);
+      break;
+
+    default:
+      return clib_error_return (0, "no such test?");
+    }
+
+  return error;
+}
+
+#ifdef CLIB_UNIX
+int
+main (int argc, char *argv[])
+{
+  unformat_input_t i;
+  clib_error_t *error;
+  test_main_t *tm = &test_main;
+
+  clib_mem_init (0, 3ULL << 30);
+
+  tm->input = &i;
+  tm->seed = 0xdeaddabe;
+
+  tm->nbuckets = 2;
+  tm->nitems = 5;
+  tm->verbose = 1;
+  tm->search_iter = 1;
+  tm->careful_delete_tests = 0;
+  tm->key_hash = hash_create_string (0, sizeof (uword));
+  clib_time_init (&tm->clib_time);
+
+  unformat_init_command_line (&i, argv);
+  error = test_bihash_main (tm);
+  unformat_free (&i);
+
+  if (error)
+    {
+      clib_error_report (error);
+      return 1;
+    }
+  return 0;
+}
+#endif /* CLIB_UNIX */
+
+/*
+ * fd.io coding-style-patch-verification: ON
+ *
+ * Local Variables:
+ * eval: (c-set-style "gnu")
+ * End:
+ */