New upstream version 18.02
[deb_dpdk.git] / examples / server_node_efd / server / init.c
1 /* SPDX-License-Identifier: BSD-3-Clause
2  * Copyright(c) 2016-2017 Intel Corporation
3  */
4
5 #include <stdint.h>
6 #include <stdio.h>
7 #include <string.h>
8 #include <sys/queue.h>
9 #include <errno.h>
10 #include <stdarg.h>
11 #include <inttypes.h>
12
13 #include <rte_common.h>
14 #include <rte_memory.h>
15 #include <rte_memzone.h>
16 #include <rte_eal.h>
17 #include <rte_byteorder.h>
18 #include <rte_atomic.h>
19 #include <rte_launch.h>
20 #include <rte_per_lcore.h>
21 #include <rte_lcore.h>
22 #include <rte_branch_prediction.h>
23 #include <rte_debug.h>
24 #include <rte_ring.h>
25 #include <rte_log.h>
26 #include <rte_mempool.h>
27 #include <rte_memcpy.h>
28 #include <rte_mbuf.h>
29 #include <rte_interrupts.h>
30 #include <rte_ether.h>
31 #include <rte_ethdev.h>
32 #include <rte_malloc.h>
33 #include <rte_string_fns.h>
34 #include <rte_cycles.h>
35 #include <rte_efd.h>
36 #include <rte_hash.h>
37
38 #include "common.h"
39 #include "args.h"
40 #include "init.h"
41
42 #define MBUFS_PER_NODE 1536
43 #define MBUFS_PER_PORT 1536
44 #define MBUF_CACHE_SIZE 512
45
46 #define RTE_MP_RX_DESC_DEFAULT 512
47 #define RTE_MP_TX_DESC_DEFAULT 512
48 #define NODE_QUEUE_RINGSIZE 128
49
50 #define NO_FLAGS 0
51
52 /* The mbuf pool for packet rx */
53 struct rte_mempool *pktmbuf_pool;
54
55 /* array of info/queues for nodes */
56 struct node *nodes;
57
58 /* EFD table */
59 struct rte_efd_table *efd_table;
60
61 /* Shared info between server and nodes */
62 struct shared_info *info;
63
64 /**
65  * Initialise the mbuf pool for packet reception for the NIC, and any other
66  * buffer pools needed by the app - currently none.
67  */
68 static int
69 init_mbuf_pools(void)
70 {
71         const unsigned int num_mbufs = (num_nodes * MBUFS_PER_NODE) +
72                         (info->num_ports * MBUFS_PER_PORT);
73
74         /*
75          * Don't pass single-producer/single-consumer flags to mbuf create as it
76          * seems faster to use a cache instead
77          */
78         printf("Creating mbuf pool '%s' [%u mbufs] ...\n",
79                         PKTMBUF_POOL_NAME, num_mbufs);
80         pktmbuf_pool = rte_pktmbuf_pool_create(PKTMBUF_POOL_NAME, num_mbufs,
81                 MBUF_CACHE_SIZE, 0, RTE_MBUF_DEFAULT_BUF_SIZE, rte_socket_id());
82
83         return pktmbuf_pool == NULL; /* 0  on success */
84 }
85
86 /**
87  * Initialise an individual port:
88  * - configure number of rx and tx rings
89  * - set up each rx ring, to pull from the main mbuf pool
90  * - set up each tx ring
91  * - start the port and report its status to stdout
92  */
93 static int
94 init_port(uint16_t port_num)
95 {
96         /* for port configuration all features are off by default */
97         struct rte_eth_conf port_conf = {
98                 .rxmode = {
99                         .mq_mode = ETH_MQ_RX_RSS,
100                         .ignore_offload_bitfield = 1,
101                 },
102         };
103         const uint16_t rx_rings = 1, tx_rings = num_nodes;
104         uint16_t rx_ring_size = RTE_MP_RX_DESC_DEFAULT;
105         uint16_t tx_ring_size = RTE_MP_TX_DESC_DEFAULT;
106         struct rte_eth_dev_info dev_info;
107         struct rte_eth_txconf txconf;
108
109         uint16_t q;
110         int retval;
111
112         printf("Port %u init ... ", port_num);
113         fflush(stdout);
114
115         rte_eth_dev_info_get(port_num, &dev_info);
116         if (dev_info.tx_offload_capa & DEV_TX_OFFLOAD_MBUF_FAST_FREE)
117                 port_conf.txmode.offloads |=
118                         DEV_TX_OFFLOAD_MBUF_FAST_FREE;
119
120         /*
121          * Standard DPDK port initialisation - config port, then set up
122          * rx and tx rings.
123          */
124         retval = rte_eth_dev_configure(port_num, rx_rings, tx_rings, &port_conf);
125         if (retval != 0)
126                 return retval;
127
128         retval = rte_eth_dev_adjust_nb_rx_tx_desc(port_num, &rx_ring_size,
129                         &tx_ring_size);
130         if (retval != 0)
131                 return retval;
132
133         for (q = 0; q < rx_rings; q++) {
134                 retval = rte_eth_rx_queue_setup(port_num, q, rx_ring_size,
135                                 rte_eth_dev_socket_id(port_num),
136                                 NULL, pktmbuf_pool);
137                 if (retval < 0)
138                         return retval;
139         }
140
141         txconf = dev_info.default_txconf;
142         txconf.txq_flags = ETH_TXQ_FLAGS_IGNORE;
143         txconf.offloads = port_conf.txmode.offloads;
144         for (q = 0; q < tx_rings; q++) {
145                 retval = rte_eth_tx_queue_setup(port_num, q, tx_ring_size,
146                                 rte_eth_dev_socket_id(port_num),
147                                 &txconf);
148                 if (retval < 0)
149                         return retval;
150         }
151
152         rte_eth_promiscuous_enable(port_num);
153
154         retval = rte_eth_dev_start(port_num);
155         if (retval < 0)
156                 return retval;
157
158         printf("done:\n");
159
160         return 0;
161 }
162
163 /**
164  * Set up the DPDK rings which will be used to pass packets, via
165  * pointers, between the multi-process server and node processes.
166  * Each node needs one RX queue.
167  */
168 static int
169 init_shm_rings(void)
170 {
171         unsigned int i;
172         unsigned int socket_id;
173         const char *q_name;
174         const unsigned int ringsize = NODE_QUEUE_RINGSIZE;
175
176         nodes = rte_malloc("node details",
177                 sizeof(*nodes) * num_nodes, 0);
178         if (nodes == NULL)
179                 rte_exit(EXIT_FAILURE, "Cannot allocate memory for "
180                                 "node program details\n");
181
182         for (i = 0; i < num_nodes; i++) {
183                 /* Create an RX queue for each node */
184                 socket_id = rte_socket_id();
185                 q_name = get_rx_queue_name(i);
186                 nodes[i].rx_q = rte_ring_create(q_name,
187                                 ringsize, socket_id,
188                                 RING_F_SP_ENQ | RING_F_SC_DEQ);
189                 if (nodes[i].rx_q == NULL)
190                         rte_exit(EXIT_FAILURE, "Cannot create rx ring queue "
191                                         "for node %u\n", i);
192         }
193         return 0;
194 }
195
196 /*
197  * Create EFD table which will contain all the flows
198  * that will be distributed among the nodes
199  */
200 static void
201 create_efd_table(void)
202 {
203         uint8_t socket_id = rte_socket_id();
204
205         /* create table */
206         efd_table = rte_efd_create("flow table", num_flows * 2, sizeof(uint32_t),
207                         1 << socket_id, socket_id);
208
209         if (efd_table == NULL)
210                 rte_exit(EXIT_FAILURE, "Problem creating the flow table\n");
211 }
212
213 static void
214 populate_efd_table(void)
215 {
216         unsigned int i;
217         int32_t ret;
218         uint32_t ip_dst;
219         uint8_t socket_id = rte_socket_id();
220         uint64_t node_id;
221
222         /* Add flows in table */
223         for (i = 0; i < num_flows; i++) {
224                 node_id = i % num_nodes;
225
226                 ip_dst = rte_cpu_to_be_32(i);
227                 ret = rte_efd_update(efd_table, socket_id,
228                                 (void *)&ip_dst, (efd_value_t)node_id);
229                 if (ret < 0)
230                         rte_exit(EXIT_FAILURE, "Unable to add entry %u in "
231                                         "EFD table\n", i);
232         }
233
234         printf("EFD table: Adding 0x%x keys\n", num_flows);
235 }
236
237 /* Check the link status of all ports in up to 9s, and print them finally */
238 static void
239 check_all_ports_link_status(uint16_t port_num, uint32_t port_mask)
240 {
241 #define CHECK_INTERVAL 100 /* 100ms */
242 #define MAX_CHECK_TIME 90 /* 9s (90 * 100ms) in total */
243         uint8_t count, all_ports_up, print_flag = 0;
244         uint16_t portid;
245         struct rte_eth_link link;
246
247         printf("\nChecking link status");
248         fflush(stdout);
249         for (count = 0; count <= MAX_CHECK_TIME; count++) {
250                 all_ports_up = 1;
251                 for (portid = 0; portid < port_num; portid++) {
252                         if ((port_mask & (1 << info->id[portid])) == 0)
253                                 continue;
254                         memset(&link, 0, sizeof(link));
255                         rte_eth_link_get_nowait(info->id[portid], &link);
256                         /* print link status if flag set */
257                         if (print_flag == 1) {
258                                 if (link.link_status)
259                                         printf(
260                                         "Port%d Link Up. Speed %u Mbps - %s\n",
261                                                 info->id[portid],
262                                                 link.link_speed,
263                                 (link.link_duplex == ETH_LINK_FULL_DUPLEX) ?
264                                         ("full-duplex") : ("half-duplex\n"));
265                                 else
266                                         printf("Port %d Link Down\n",
267                                                 info->id[portid]);
268                                 continue;
269                         }
270                         /* clear all_ports_up flag if any link down */
271                         if (link.link_status == ETH_LINK_DOWN) {
272                                 all_ports_up = 0;
273                                 break;
274                         }
275                 }
276                 /* after finally printing all link status, get out */
277                 if (print_flag == 1)
278                         break;
279
280                 if (all_ports_up == 0) {
281                         printf(".");
282                         fflush(stdout);
283                         rte_delay_ms(CHECK_INTERVAL);
284                 }
285
286                 /* set the print_flag if all ports up or timeout */
287                 if (all_ports_up == 1 || count == (MAX_CHECK_TIME - 1)) {
288                         print_flag = 1;
289                         printf("done\n");
290                 }
291         }
292 }
293
294 /**
295  * Main init function for the multi-process server app,
296  * calls subfunctions to do each stage of the initialisation.
297  */
298 int
299 init(int argc, char *argv[])
300 {
301         int retval;
302         const struct rte_memzone *mz;
303         uint8_t i, total_ports;
304
305         /* init EAL, parsing EAL args */
306         retval = rte_eal_init(argc, argv);
307         if (retval < 0)
308                 return -1;
309         argc -= retval;
310         argv += retval;
311
312         /* get total number of ports */
313         total_ports = rte_eth_dev_count();
314
315         /* set up array for port data */
316         mz = rte_memzone_reserve(MZ_SHARED_INFO, sizeof(*info),
317                                 rte_socket_id(), NO_FLAGS);
318         if (mz == NULL)
319                 rte_exit(EXIT_FAILURE, "Cannot reserve memory zone "
320                                 "for port information\n");
321         memset(mz->addr, 0, sizeof(*info));
322         info = mz->addr;
323
324         /* parse additional, application arguments */
325         retval = parse_app_args(total_ports, argc, argv);
326         if (retval != 0)
327                 return -1;
328
329         /* initialise mbuf pools */
330         retval = init_mbuf_pools();
331         if (retval != 0)
332                 rte_exit(EXIT_FAILURE, "Cannot create needed mbuf pools\n");
333
334         /* now initialise the ports we will use */
335         for (i = 0; i < info->num_ports; i++) {
336                 retval = init_port(info->id[i]);
337                 if (retval != 0)
338                         rte_exit(EXIT_FAILURE, "Cannot initialise port %u\n",
339                                         (unsigned int) i);
340         }
341
342         check_all_ports_link_status(info->num_ports, (~0x0));
343
344         /* initialise the node queues/rings for inter-eu comms */
345         init_shm_rings();
346
347         /* Create the EFD table */
348         create_efd_table();
349
350         /* Populate the EFD table */
351         populate_efd_table();
352
353         /* Share the total number of nodes */
354         info->num_nodes = num_nodes;
355
356         /* Share the total number of flows */
357         info->num_flows = num_flows;
358         return 0;
359 }