memif: contention between memif_disconnect and memif RX/TX threads
[vpp.git] / src / plugins / memif / memif.c
index eee38f0..22f3e3d 100644 (file)
@@ -100,6 +100,8 @@ memif_disconnect (memif_if_t * mif, clib_error_t * err)
   memif_region_t *mr;
   memif_queue_t *mq;
   int i;
+  vlib_main_t *vm = vlib_get_main ();
+  int with_barrier = 0;
 
   if (mif == 0)
     return;
@@ -141,6 +143,12 @@ memif_disconnect (memif_if_t * mif, clib_error_t * err)
       clib_mem_free (mif->sock);
     }
 
+  if (vlib_worker_thread_barrier_held () == 0)
+    {
+      with_barrier = 1;
+      vlib_worker_thread_barrier_sync (vm);
+    }
+
   /* *INDENT-OFF* */
   vec_foreach_index (i, mif->rx_queues)
     {
@@ -198,6 +206,9 @@ memif_disconnect (memif_if_t * mif, clib_error_t * err)
   vec_free (mif->remote_name);
   vec_free (mif->remote_if_name);
   clib_fifo_free (mif->msg_queue);
+
+  if (with_barrier)
+    vlib_worker_thread_barrier_release (vm);
 }
 
 static clib_error_t *
@@ -301,6 +312,37 @@ memif_connect (memif_if_t * mif)
       mq->queue_index =
        vnet_hw_if_register_tx_queue (vnm, mif->hw_if_index, i);
       clib_spinlock_init (&mq->lockp);
+
+      if (mif->flags & MEMIF_IF_FLAG_USE_DMA)
+       {
+         memif_dma_info_t *dma_info;
+         mq->dma_head = 0;
+         mq->dma_tail = 0;
+         mq->dma_info_head = 0;
+         mq->dma_info_tail = 0;
+         mq->dma_info_size = MEMIF_DMA_INFO_SIZE;
+         vec_validate_aligned (mq->dma_info, MEMIF_DMA_INFO_SIZE,
+                               CLIB_CACHE_LINE_BYTES);
+
+         vec_foreach (dma_info, mq->dma_info)
+           {
+             vec_validate_aligned (dma_info->data.desc_data,
+                                   pow2_mask (max_log2_ring_sz),
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_validate_aligned (dma_info->data.desc_len,
+                                   pow2_mask (max_log2_ring_sz),
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_validate_aligned (dma_info->data.desc_status,
+                                   pow2_mask (max_log2_ring_sz),
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_validate_aligned (dma_info->data.copy_ops, 0,
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_reset_length (dma_info->data.copy_ops);
+             vec_validate_aligned (dma_info->data.buffers, 0,
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_reset_length (dma_info->data.buffers);
+           }
+       }
     }
 
   if (vec_len (mif->tx_queues) > 0)
@@ -331,6 +373,37 @@ memif_connect (memif_if_t * mif)
       qi = vnet_hw_if_register_rx_queue (vnm, mif->hw_if_index, i,
                                         VNET_HW_IF_RXQ_THREAD_ANY);
       mq->queue_index = qi;
+
+      if (mif->flags & MEMIF_IF_FLAG_USE_DMA)
+       {
+         memif_dma_info_t *dma_info;
+         mq->dma_head = 0;
+         mq->dma_tail = 0;
+         mq->dma_info_head = 0;
+         mq->dma_info_tail = 0;
+         mq->dma_info_size = MEMIF_DMA_INFO_SIZE;
+         vec_validate_aligned (mq->dma_info, MEMIF_DMA_INFO_SIZE,
+                               CLIB_CACHE_LINE_BYTES);
+         vec_foreach (dma_info, mq->dma_info)
+           {
+             vec_validate_aligned (dma_info->data.desc_data,
+                                   pow2_mask (max_log2_ring_sz),
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_validate_aligned (dma_info->data.desc_len,
+                                   pow2_mask (max_log2_ring_sz),
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_validate_aligned (dma_info->data.desc_status,
+                                   pow2_mask (max_log2_ring_sz),
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_validate_aligned (dma_info->data.copy_ops, 0,
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_reset_length (dma_info->data.copy_ops);
+             vec_validate_aligned (dma_info->data.buffers, 0,
+                                   CLIB_CACHE_LINE_BYTES);
+             vec_reset_length (dma_info->data.buffers);
+           }
+       }
+
       if (mq->int_fd > -1)
        {
          template.file_descriptor = mq->int_fd;
@@ -681,6 +754,36 @@ VLIB_REGISTER_NODE (memif_process_node,static) = {
   .name = "memif-process",
 };
 
+/*
+ * Returns an unused socket id, and ~0 if it can't find one.
+ */
+u32
+memif_get_unused_socket_id ()
+{
+  memif_main_t *mm = &memif_main;
+  uword *p;
+  int i, j;
+
+  static u32 seed = 0;
+  /* limit to 1M tries */
+  for (j = 0; j < 1 << 10; j++)
+    {
+      seed = random_u32 (&seed);
+      for (i = 0; i < 1 << 10; i++)
+       {
+         /* look around randomly generated id */
+         seed += (2 * (i % 2) - 1) * i;
+         if (seed == (u32) ~0)
+           continue;
+         p = hash_get (mm->socket_file_index_by_sock_id, seed);
+         if (!p)
+           return seed;
+       }
+    }
+
+  return ~0;
+}
+
 clib_error_t *
 memif_socket_filename_add_del (u8 is_add, u32 sock_id, char *sock_filename)
 {
@@ -872,6 +975,16 @@ VNET_HW_INTERFACE_CLASS (memif_ip_hw_if_class, static) = {
 };
 /* *INDENT-ON* */
 
+static void
+memif_prepare_dma_args (vlib_dma_config_t *args)
+{
+  args->max_batches = 256;
+  args->max_transfer_size = VLIB_BUFFER_DEFAULT_DATA_SIZE;
+  args->barrier_before_last = 1;
+  args->sw_fallback = 1;
+  args->callback_fn = NULL;
+}
+
 clib_error_t *
 memif_create_if (vlib_main_t *vm, memif_create_if_args_t *args)
 {
@@ -959,6 +1072,20 @@ memif_create_if (vlib_main_t *vm, memif_create_if_args_t *args)
   if (args->secret)
     mif->secret = vec_dup (args->secret);
 
+  /* register dma config if enabled */
+  if (args->use_dma)
+    {
+      vlib_dma_config_t dma_args;
+      bzero (&dma_args, sizeof (dma_args));
+      memif_prepare_dma_args (&dma_args);
+
+      dma_args.max_transfers = 1 << args->log2_ring_size;
+      dma_args.callback_fn = memif_dma_completion_cb;
+      mif->dma_input_config = vlib_dma_config_add (vm, &dma_args);
+      dma_args.callback_fn = memif_tx_dma_completion_cb;
+      mif->dma_tx_config = vlib_dma_config_add (vm, &dma_args);
+    }
+
   if (mif->mode == MEMIF_INTERFACE_MODE_ETHERNET)
     {
 
@@ -1047,6 +1174,9 @@ memif_create_if (vlib_main_t *vm, memif_create_if_args_t *args)
        mif->flags |= MEMIF_IF_FLAG_ZERO_COPY;
     }
 
+  if (args->use_dma)
+    mif->flags |= MEMIF_IF_FLAG_USE_DMA;
+
   vnet_hw_if_set_caps (vnm, mif->hw_if_index, VNET_HW_IF_CAP_INT_MODE);
   vnet_hw_if_set_input_node (vnm, mif->hw_if_index, memif_input_node.index);
   mhash_set (&msf->dev_instance_by_id, &mif->id, mif->dev_instance, 0);