New upstream version 18.11-rc1
[deb_dpdk.git] / examples / kni / main.c
1 /* SPDX-License-Identifier: BSD-3-Clause
2  * Copyright(c) 2010-2014 Intel Corporation
3  */
4
5 #include <stdio.h>
6 #include <stdlib.h>
7 #include <stdint.h>
8 #include <inttypes.h>
9 #include <string.h>
10 #include <sys/queue.h>
11 #include <stdarg.h>
12 #include <errno.h>
13 #include <getopt.h>
14
15 #include <netinet/in.h>
16 #include <linux/if.h>
17 #include <linux/if_tun.h>
18 #include <fcntl.h>
19 #include <sys/ioctl.h>
20 #include <unistd.h>
21 #include <signal.h>
22
23 #include <rte_common.h>
24 #include <rte_log.h>
25 #include <rte_memory.h>
26 #include <rte_memcpy.h>
27 #include <rte_eal.h>
28 #include <rte_per_lcore.h>
29 #include <rte_launch.h>
30 #include <rte_atomic.h>
31 #include <rte_lcore.h>
32 #include <rte_branch_prediction.h>
33 #include <rte_interrupts.h>
34 #include <rte_bus_pci.h>
35 #include <rte_debug.h>
36 #include <rte_ether.h>
37 #include <rte_ethdev.h>
38 #include <rte_mempool.h>
39 #include <rte_mbuf.h>
40 #include <rte_string_fns.h>
41 #include <rte_cycles.h>
42 #include <rte_malloc.h>
43 #include <rte_kni.h>
44
45 /* Macros for printing using RTE_LOG */
46 #define RTE_LOGTYPE_APP RTE_LOGTYPE_USER1
47
48 /* Max size of a single packet */
49 #define MAX_PACKET_SZ           2048
50
51 /* Size of the data buffer in each mbuf */
52 #define MBUF_DATA_SZ (MAX_PACKET_SZ + RTE_PKTMBUF_HEADROOM)
53
54 /* Number of mbufs in mempool that is created */
55 #define NB_MBUF                 (8192 * 16)
56
57 /* How many packets to attempt to read from NIC in one go */
58 #define PKT_BURST_SZ            32
59
60 /* How many objects (mbufs) to keep in per-lcore mempool cache */
61 #define MEMPOOL_CACHE_SZ        PKT_BURST_SZ
62
63 /* Number of RX ring descriptors */
64 #define NB_RXD                  1024
65
66 /* Number of TX ring descriptors */
67 #define NB_TXD                  1024
68
69 /* Total octets in ethernet header */
70 #define KNI_ENET_HEADER_SIZE    14
71
72 /* Total octets in the FCS */
73 #define KNI_ENET_FCS_SIZE       4
74
75 #define KNI_US_PER_SECOND       1000000
76 #define KNI_SECOND_PER_DAY      86400
77
78 #define KNI_MAX_KTHREAD 32
79 /*
80  * Structure of port parameters
81  */
82 struct kni_port_params {
83         uint16_t port_id;/* Port ID */
84         unsigned lcore_rx; /* lcore ID for RX */
85         unsigned lcore_tx; /* lcore ID for TX */
86         uint32_t nb_lcore_k; /* Number of lcores for KNI multi kernel threads */
87         uint32_t nb_kni; /* Number of KNI devices to be created */
88         unsigned lcore_k[KNI_MAX_KTHREAD]; /* lcore ID list for kthreads */
89         struct rte_kni *kni[KNI_MAX_KTHREAD]; /* KNI context pointers */
90 } __rte_cache_aligned;
91
92 static struct kni_port_params *kni_port_params_array[RTE_MAX_ETHPORTS];
93
94
95 /* Options for configuring ethernet port */
96 static struct rte_eth_conf port_conf = {
97         .txmode = {
98                 .mq_mode = ETH_MQ_TX_NONE,
99         },
100 };
101
102 /* Mempool for mbufs */
103 static struct rte_mempool * pktmbuf_pool = NULL;
104
105 /* Mask of enabled ports */
106 static uint32_t ports_mask = 0;
107 /* Ports set in promiscuous mode off by default. */
108 static int promiscuous_on = 0;
109 /* Monitor link status continually. off by default. */
110 static int monitor_links;
111
112 /* Structure type for recording kni interface specific stats */
113 struct kni_interface_stats {
114         /* number of pkts received from NIC, and sent to KNI */
115         uint64_t rx_packets;
116
117         /* number of pkts received from NIC, but failed to send to KNI */
118         uint64_t rx_dropped;
119
120         /* number of pkts received from KNI, and sent to NIC */
121         uint64_t tx_packets;
122
123         /* number of pkts received from KNI, but failed to send to NIC */
124         uint64_t tx_dropped;
125 };
126
127 /* kni device statistics array */
128 static struct kni_interface_stats kni_stats[RTE_MAX_ETHPORTS];
129
130 static int kni_change_mtu(uint16_t port_id, unsigned int new_mtu);
131 static int kni_config_network_interface(uint16_t port_id, uint8_t if_up);
132 static int kni_config_mac_address(uint16_t port_id, uint8_t mac_addr[]);
133
134 static rte_atomic32_t kni_stop = RTE_ATOMIC32_INIT(0);
135
136 /* Print out statistics on packets handled */
137 static void
138 print_stats(void)
139 {
140         uint16_t i;
141
142         printf("\n**KNI example application statistics**\n"
143                "======  ==============  ============  ============  ============  ============\n"
144                " Port    Lcore(RX/TX)    rx_packets    rx_dropped    tx_packets    tx_dropped\n"
145                "------  --------------  ------------  ------------  ------------  ------------\n");
146         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
147                 if (!kni_port_params_array[i])
148                         continue;
149
150                 printf("%7d %10u/%2u %13"PRIu64" %13"PRIu64" %13"PRIu64" "
151                                                         "%13"PRIu64"\n", i,
152                                         kni_port_params_array[i]->lcore_rx,
153                                         kni_port_params_array[i]->lcore_tx,
154                                                 kni_stats[i].rx_packets,
155                                                 kni_stats[i].rx_dropped,
156                                                 kni_stats[i].tx_packets,
157                                                 kni_stats[i].tx_dropped);
158         }
159         printf("======  ==============  ============  ============  ============  ============\n");
160 }
161
162 /* Custom handling of signals to handle stats and kni processing */
163 static void
164 signal_handler(int signum)
165 {
166         /* When we receive a USR1 signal, print stats */
167         if (signum == SIGUSR1) {
168                 print_stats();
169         }
170
171         /* When we receive a USR2 signal, reset stats */
172         if (signum == SIGUSR2) {
173                 memset(&kni_stats, 0, sizeof(kni_stats));
174                 printf("\n** Statistics have been reset **\n");
175                 return;
176         }
177
178         /* When we receive a RTMIN or SIGINT signal, stop kni processing */
179         if (signum == SIGRTMIN || signum == SIGINT){
180                 printf("\nSIGRTMIN/SIGINT received. KNI processing stopping.\n");
181                 rte_atomic32_inc(&kni_stop);
182                 return;
183         }
184 }
185
186 static void
187 kni_burst_free_mbufs(struct rte_mbuf **pkts, unsigned num)
188 {
189         unsigned i;
190
191         if (pkts == NULL)
192                 return;
193
194         for (i = 0; i < num; i++) {
195                 rte_pktmbuf_free(pkts[i]);
196                 pkts[i] = NULL;
197         }
198 }
199
200 /**
201  * Interface to burst rx and enqueue mbufs into rx_q
202  */
203 static void
204 kni_ingress(struct kni_port_params *p)
205 {
206         uint8_t i;
207         uint16_t port_id;
208         unsigned nb_rx, num;
209         uint32_t nb_kni;
210         struct rte_mbuf *pkts_burst[PKT_BURST_SZ];
211
212         if (p == NULL)
213                 return;
214
215         nb_kni = p->nb_kni;
216         port_id = p->port_id;
217         for (i = 0; i < nb_kni; i++) {
218                 /* Burst rx from eth */
219                 nb_rx = rte_eth_rx_burst(port_id, 0, pkts_burst, PKT_BURST_SZ);
220                 if (unlikely(nb_rx > PKT_BURST_SZ)) {
221                         RTE_LOG(ERR, APP, "Error receiving from eth\n");
222                         return;
223                 }
224                 /* Burst tx to kni */
225                 num = rte_kni_tx_burst(p->kni[i], pkts_burst, nb_rx);
226                 if (num)
227                         kni_stats[port_id].rx_packets += num;
228
229                 rte_kni_handle_request(p->kni[i]);
230                 if (unlikely(num < nb_rx)) {
231                         /* Free mbufs not tx to kni interface */
232                         kni_burst_free_mbufs(&pkts_burst[num], nb_rx - num);
233                         kni_stats[port_id].rx_dropped += nb_rx - num;
234                 }
235         }
236 }
237
238 /**
239  * Interface to dequeue mbufs from tx_q and burst tx
240  */
241 static void
242 kni_egress(struct kni_port_params *p)
243 {
244         uint8_t i;
245         uint16_t port_id;
246         unsigned nb_tx, num;
247         uint32_t nb_kni;
248         struct rte_mbuf *pkts_burst[PKT_BURST_SZ];
249
250         if (p == NULL)
251                 return;
252
253         nb_kni = p->nb_kni;
254         port_id = p->port_id;
255         for (i = 0; i < nb_kni; i++) {
256                 /* Burst rx from kni */
257                 num = rte_kni_rx_burst(p->kni[i], pkts_burst, PKT_BURST_SZ);
258                 if (unlikely(num > PKT_BURST_SZ)) {
259                         RTE_LOG(ERR, APP, "Error receiving from KNI\n");
260                         return;
261                 }
262                 /* Burst tx to eth */
263                 nb_tx = rte_eth_tx_burst(port_id, 0, pkts_burst, (uint16_t)num);
264                 if (nb_tx)
265                         kni_stats[port_id].tx_packets += nb_tx;
266                 if (unlikely(nb_tx < num)) {
267                         /* Free mbufs not tx to NIC */
268                         kni_burst_free_mbufs(&pkts_burst[nb_tx], num - nb_tx);
269                         kni_stats[port_id].tx_dropped += num - nb_tx;
270                 }
271         }
272 }
273
274 static int
275 main_loop(__rte_unused void *arg)
276 {
277         uint16_t i;
278         int32_t f_stop;
279         const unsigned lcore_id = rte_lcore_id();
280         enum lcore_rxtx {
281                 LCORE_NONE,
282                 LCORE_RX,
283                 LCORE_TX,
284                 LCORE_MAX
285         };
286         enum lcore_rxtx flag = LCORE_NONE;
287
288         RTE_ETH_FOREACH_DEV(i) {
289                 if (!kni_port_params_array[i])
290                         continue;
291                 if (kni_port_params_array[i]->lcore_rx == (uint8_t)lcore_id) {
292                         flag = LCORE_RX;
293                         break;
294                 } else if (kni_port_params_array[i]->lcore_tx ==
295                                                 (uint8_t)lcore_id) {
296                         flag = LCORE_TX;
297                         break;
298                 }
299         }
300
301         if (flag == LCORE_RX) {
302                 RTE_LOG(INFO, APP, "Lcore %u is reading from port %d\n",
303                                         kni_port_params_array[i]->lcore_rx,
304                                         kni_port_params_array[i]->port_id);
305                 while (1) {
306                         f_stop = rte_atomic32_read(&kni_stop);
307                         if (f_stop)
308                                 break;
309                         kni_ingress(kni_port_params_array[i]);
310                 }
311         } else if (flag == LCORE_TX) {
312                 RTE_LOG(INFO, APP, "Lcore %u is writing to port %d\n",
313                                         kni_port_params_array[i]->lcore_tx,
314                                         kni_port_params_array[i]->port_id);
315                 while (1) {
316                         f_stop = rte_atomic32_read(&kni_stop);
317                         if (f_stop)
318                                 break;
319                         kni_egress(kni_port_params_array[i]);
320                 }
321         } else
322                 RTE_LOG(INFO, APP, "Lcore %u has nothing to do\n", lcore_id);
323
324         return 0;
325 }
326
327 /* Display usage instructions */
328 static void
329 print_usage(const char *prgname)
330 {
331         RTE_LOG(INFO, APP, "\nUsage: %s [EAL options] -- -p PORTMASK -P -m "
332                    "[--config (port,lcore_rx,lcore_tx,lcore_kthread...)"
333                    "[,(port,lcore_rx,lcore_tx,lcore_kthread...)]]\n"
334                    "    -p PORTMASK: hex bitmask of ports to use\n"
335                    "    -P : enable promiscuous mode\n"
336                    "    -m : enable monitoring of port carrier state\n"
337                    "    --config (port,lcore_rx,lcore_tx,lcore_kthread...): "
338                    "port and lcore configurations\n",
339                    prgname);
340 }
341
342 /* Convert string to unsigned number. 0 is returned if error occurs */
343 static uint32_t
344 parse_unsigned(const char *portmask)
345 {
346         char *end = NULL;
347         unsigned long num;
348
349         num = strtoul(portmask, &end, 16);
350         if ((portmask[0] == '\0') || (end == NULL) || (*end != '\0'))
351                 return 0;
352
353         return (uint32_t)num;
354 }
355
356 static void
357 print_config(void)
358 {
359         uint32_t i, j;
360         struct kni_port_params **p = kni_port_params_array;
361
362         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
363                 if (!p[i])
364                         continue;
365                 RTE_LOG(DEBUG, APP, "Port ID: %d\n", p[i]->port_id);
366                 RTE_LOG(DEBUG, APP, "Rx lcore ID: %u, Tx lcore ID: %u\n",
367                                         p[i]->lcore_rx, p[i]->lcore_tx);
368                 for (j = 0; j < p[i]->nb_lcore_k; j++)
369                         RTE_LOG(DEBUG, APP, "Kernel thread lcore ID: %u\n",
370                                                         p[i]->lcore_k[j]);
371         }
372 }
373
374 static int
375 parse_config(const char *arg)
376 {
377         const char *p, *p0 = arg;
378         char s[256], *end;
379         unsigned size;
380         enum fieldnames {
381                 FLD_PORT = 0,
382                 FLD_LCORE_RX,
383                 FLD_LCORE_TX,
384                 _NUM_FLD = KNI_MAX_KTHREAD + 3,
385         };
386         int i, j, nb_token;
387         char *str_fld[_NUM_FLD];
388         unsigned long int_fld[_NUM_FLD];
389         uint16_t port_id, nb_kni_port_params = 0;
390
391         memset(&kni_port_params_array, 0, sizeof(kni_port_params_array));
392         while (((p = strchr(p0, '(')) != NULL) &&
393                 nb_kni_port_params < RTE_MAX_ETHPORTS) {
394                 p++;
395                 if ((p0 = strchr(p, ')')) == NULL)
396                         goto fail;
397                 size = p0 - p;
398                 if (size >= sizeof(s)) {
399                         printf("Invalid config parameters\n");
400                         goto fail;
401                 }
402                 snprintf(s, sizeof(s), "%.*s", size, p);
403                 nb_token = rte_strsplit(s, sizeof(s), str_fld, _NUM_FLD, ',');
404                 if (nb_token <= FLD_LCORE_TX) {
405                         printf("Invalid config parameters\n");
406                         goto fail;
407                 }
408                 for (i = 0; i < nb_token; i++) {
409                         errno = 0;
410                         int_fld[i] = strtoul(str_fld[i], &end, 0);
411                         if (errno != 0 || end == str_fld[i]) {
412                                 printf("Invalid config parameters\n");
413                                 goto fail;
414                         }
415                 }
416
417                 i = 0;
418                 port_id = int_fld[i++];
419                 if (port_id >= RTE_MAX_ETHPORTS) {
420                         printf("Port ID %d could not exceed the maximum %d\n",
421                                                 port_id, RTE_MAX_ETHPORTS);
422                         goto fail;
423                 }
424                 if (kni_port_params_array[port_id]) {
425                         printf("Port %d has been configured\n", port_id);
426                         goto fail;
427                 }
428                 kni_port_params_array[port_id] =
429                         rte_zmalloc("KNI_port_params",
430                                     sizeof(struct kni_port_params), RTE_CACHE_LINE_SIZE);
431                 kni_port_params_array[port_id]->port_id = port_id;
432                 kni_port_params_array[port_id]->lcore_rx =
433                                         (uint8_t)int_fld[i++];
434                 kni_port_params_array[port_id]->lcore_tx =
435                                         (uint8_t)int_fld[i++];
436                 if (kni_port_params_array[port_id]->lcore_rx >= RTE_MAX_LCORE ||
437                 kni_port_params_array[port_id]->lcore_tx >= RTE_MAX_LCORE) {
438                         printf("lcore_rx %u or lcore_tx %u ID could not "
439                                                 "exceed the maximum %u\n",
440                                 kni_port_params_array[port_id]->lcore_rx,
441                                 kni_port_params_array[port_id]->lcore_tx,
442                                                 (unsigned)RTE_MAX_LCORE);
443                         goto fail;
444                 }
445                 for (j = 0; i < nb_token && j < KNI_MAX_KTHREAD; i++, j++)
446                         kni_port_params_array[port_id]->lcore_k[j] =
447                                                 (uint8_t)int_fld[i];
448                 kni_port_params_array[port_id]->nb_lcore_k = j;
449         }
450         print_config();
451
452         return 0;
453
454 fail:
455         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
456                 if (kni_port_params_array[i]) {
457                         rte_free(kni_port_params_array[i]);
458                         kni_port_params_array[i] = NULL;
459                 }
460         }
461
462         return -1;
463 }
464
465 static int
466 validate_parameters(uint32_t portmask)
467 {
468         uint32_t i;
469
470         if (!portmask) {
471                 printf("No port configured in port mask\n");
472                 return -1;
473         }
474
475         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
476                 if (((portmask & (1 << i)) && !kni_port_params_array[i]) ||
477                         (!(portmask & (1 << i)) && kni_port_params_array[i]))
478                         rte_exit(EXIT_FAILURE, "portmask is not consistent "
479                                 "to port ids specified in --config\n");
480
481                 if (kni_port_params_array[i] && !rte_lcore_is_enabled(\
482                         (unsigned)(kni_port_params_array[i]->lcore_rx)))
483                         rte_exit(EXIT_FAILURE, "lcore id %u for "
484                                         "port %d receiving not enabled\n",
485                                         kni_port_params_array[i]->lcore_rx,
486                                         kni_port_params_array[i]->port_id);
487
488                 if (kni_port_params_array[i] && !rte_lcore_is_enabled(\
489                         (unsigned)(kni_port_params_array[i]->lcore_tx)))
490                         rte_exit(EXIT_FAILURE, "lcore id %u for "
491                                         "port %d transmitting not enabled\n",
492                                         kni_port_params_array[i]->lcore_tx,
493                                         kni_port_params_array[i]->port_id);
494
495         }
496
497         return 0;
498 }
499
500 #define CMDLINE_OPT_CONFIG  "config"
501
502 /* Parse the arguments given in the command line of the application */
503 static int
504 parse_args(int argc, char **argv)
505 {
506         int opt, longindex, ret = 0;
507         const char *prgname = argv[0];
508         static struct option longopts[] = {
509                 {CMDLINE_OPT_CONFIG, required_argument, NULL, 0},
510                 {NULL, 0, NULL, 0}
511         };
512
513         /* Disable printing messages within getopt() */
514         opterr = 0;
515
516         /* Parse command line */
517         while ((opt = getopt_long(argc, argv, "p:Pm", longopts,
518                                                 &longindex)) != EOF) {
519                 switch (opt) {
520                 case 'p':
521                         ports_mask = parse_unsigned(optarg);
522                         break;
523                 case 'P':
524                         promiscuous_on = 1;
525                         break;
526                 case 'm':
527                         monitor_links = 1;
528                         break;
529                 case 0:
530                         if (!strncmp(longopts[longindex].name,
531                                      CMDLINE_OPT_CONFIG,
532                                      sizeof(CMDLINE_OPT_CONFIG))) {
533                                 ret = parse_config(optarg);
534                                 if (ret) {
535                                         printf("Invalid config\n");
536                                         print_usage(prgname);
537                                         return -1;
538                                 }
539                         }
540                         break;
541                 default:
542                         print_usage(prgname);
543                         rte_exit(EXIT_FAILURE, "Invalid option specified\n");
544                 }
545         }
546
547         /* Check that options were parsed ok */
548         if (validate_parameters(ports_mask) < 0) {
549                 print_usage(prgname);
550                 rte_exit(EXIT_FAILURE, "Invalid parameters\n");
551         }
552
553         return ret;
554 }
555
556 /* Initialize KNI subsystem */
557 static void
558 init_kni(void)
559 {
560         unsigned int num_of_kni_ports = 0, i;
561         struct kni_port_params **params = kni_port_params_array;
562
563         /* Calculate the maximum number of KNI interfaces that will be used */
564         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
565                 if (kni_port_params_array[i]) {
566                         num_of_kni_ports += (params[i]->nb_lcore_k ?
567                                 params[i]->nb_lcore_k : 1);
568                 }
569         }
570
571         /* Invoke rte KNI init to preallocate the ports */
572         rte_kni_init(num_of_kni_ports);
573 }
574
575 /* Initialise a single port on an Ethernet device */
576 static void
577 init_port(uint16_t port)
578 {
579         int ret;
580         uint16_t nb_rxd = NB_RXD;
581         uint16_t nb_txd = NB_TXD;
582         struct rte_eth_dev_info dev_info;
583         struct rte_eth_rxconf rxq_conf;
584         struct rte_eth_txconf txq_conf;
585         struct rte_eth_conf local_port_conf = port_conf;
586
587         /* Initialise device and RX/TX queues */
588         RTE_LOG(INFO, APP, "Initialising port %u ...\n", (unsigned)port);
589         fflush(stdout);
590         rte_eth_dev_info_get(port, &dev_info);
591         if (dev_info.tx_offload_capa & DEV_TX_OFFLOAD_MBUF_FAST_FREE)
592                 local_port_conf.txmode.offloads |=
593                         DEV_TX_OFFLOAD_MBUF_FAST_FREE;
594         ret = rte_eth_dev_configure(port, 1, 1, &local_port_conf);
595         if (ret < 0)
596                 rte_exit(EXIT_FAILURE, "Could not configure port%u (%d)\n",
597                             (unsigned)port, ret);
598
599         ret = rte_eth_dev_adjust_nb_rx_tx_desc(port, &nb_rxd, &nb_txd);
600         if (ret < 0)
601                 rte_exit(EXIT_FAILURE, "Could not adjust number of descriptors "
602                                 "for port%u (%d)\n", (unsigned)port, ret);
603
604         rxq_conf = dev_info.default_rxconf;
605         rxq_conf.offloads = local_port_conf.rxmode.offloads;
606         ret = rte_eth_rx_queue_setup(port, 0, nb_rxd,
607                 rte_eth_dev_socket_id(port), &rxq_conf, pktmbuf_pool);
608         if (ret < 0)
609                 rte_exit(EXIT_FAILURE, "Could not setup up RX queue for "
610                                 "port%u (%d)\n", (unsigned)port, ret);
611
612         txq_conf = dev_info.default_txconf;
613         txq_conf.offloads = local_port_conf.txmode.offloads;
614         ret = rte_eth_tx_queue_setup(port, 0, nb_txd,
615                 rte_eth_dev_socket_id(port), &txq_conf);
616         if (ret < 0)
617                 rte_exit(EXIT_FAILURE, "Could not setup up TX queue for "
618                                 "port%u (%d)\n", (unsigned)port, ret);
619
620         ret = rte_eth_dev_start(port);
621         if (ret < 0)
622                 rte_exit(EXIT_FAILURE, "Could not start port%u (%d)\n",
623                                                 (unsigned)port, ret);
624
625         if (promiscuous_on)
626                 rte_eth_promiscuous_enable(port);
627 }
628
629 /* Check the link status of all ports in up to 9s, and print them finally */
630 static void
631 check_all_ports_link_status(uint32_t port_mask)
632 {
633 #define CHECK_INTERVAL 100 /* 100ms */
634 #define MAX_CHECK_TIME 90 /* 9s (90 * 100ms) in total */
635         uint16_t portid;
636         uint8_t count, all_ports_up, print_flag = 0;
637         struct rte_eth_link link;
638
639         printf("\nChecking link status\n");
640         fflush(stdout);
641         for (count = 0; count <= MAX_CHECK_TIME; count++) {
642                 all_ports_up = 1;
643                 RTE_ETH_FOREACH_DEV(portid) {
644                         if ((port_mask & (1 << portid)) == 0)
645                                 continue;
646                         memset(&link, 0, sizeof(link));
647                         rte_eth_link_get_nowait(portid, &link);
648                         /* print link status if flag set */
649                         if (print_flag == 1) {
650                                 if (link.link_status)
651                                         printf(
652                                         "Port%d Link Up - speed %uMbps - %s\n",
653                                                 portid, link.link_speed,
654                                 (link.link_duplex == ETH_LINK_FULL_DUPLEX) ?
655                                         ("full-duplex") : ("half-duplex\n"));
656                                 else
657                                         printf("Port %d Link Down\n", portid);
658                                 continue;
659                         }
660                         /* clear all_ports_up flag if any link down */
661                         if (link.link_status == ETH_LINK_DOWN) {
662                                 all_ports_up = 0;
663                                 break;
664                         }
665                 }
666                 /* after finally printing all link status, get out */
667                 if (print_flag == 1)
668                         break;
669
670                 if (all_ports_up == 0) {
671                         printf(".");
672                         fflush(stdout);
673                         rte_delay_ms(CHECK_INTERVAL);
674                 }
675
676                 /* set the print_flag if all ports up or timeout */
677                 if (all_ports_up == 1 || count == (MAX_CHECK_TIME - 1)) {
678                         print_flag = 1;
679                         printf("done\n");
680                 }
681         }
682 }
683
684 static void
685 log_link_state(struct rte_kni *kni, int prev, struct rte_eth_link *link)
686 {
687         if (kni == NULL || link == NULL)
688                 return;
689
690         if (prev == ETH_LINK_DOWN && link->link_status == ETH_LINK_UP) {
691                 RTE_LOG(INFO, APP, "%s NIC Link is Up %d Mbps %s %s.\n",
692                         rte_kni_get_name(kni),
693                         link->link_speed,
694                         link->link_autoneg ?  "(AutoNeg)" : "(Fixed)",
695                         link->link_duplex ?  "Full Duplex" : "Half Duplex");
696         } else if (prev == ETH_LINK_UP && link->link_status == ETH_LINK_DOWN) {
697                 RTE_LOG(INFO, APP, "%s NIC Link is Down.\n",
698                         rte_kni_get_name(kni));
699         }
700 }
701
702 /*
703  * Monitor the link status of all ports and update the
704  * corresponding KNI interface(s)
705  */
706 static void *
707 monitor_all_ports_link_status(void *arg)
708 {
709         uint16_t portid;
710         struct rte_eth_link link;
711         unsigned int i;
712         struct kni_port_params **p = kni_port_params_array;
713         int prev;
714         (void) arg;
715
716         while (monitor_links) {
717                 rte_delay_ms(500);
718                 RTE_ETH_FOREACH_DEV(portid) {
719                         if ((ports_mask & (1 << portid)) == 0)
720                                 continue;
721                         memset(&link, 0, sizeof(link));
722                         rte_eth_link_get_nowait(portid, &link);
723                         for (i = 0; i < p[portid]->nb_kni; i++) {
724                                 prev = rte_kni_update_link(p[portid]->kni[i],
725                                                 link.link_status);
726                                 log_link_state(p[portid]->kni[i], prev, &link);
727                         }
728                 }
729         }
730         return NULL;
731 }
732
733 /* Callback for request of changing MTU */
734 static int
735 kni_change_mtu(uint16_t port_id, unsigned int new_mtu)
736 {
737         int ret;
738         uint16_t nb_rxd = NB_RXD;
739         struct rte_eth_conf conf;
740         struct rte_eth_dev_info dev_info;
741         struct rte_eth_rxconf rxq_conf;
742
743         if (!rte_eth_dev_is_valid_port(port_id)) {
744                 RTE_LOG(ERR, APP, "Invalid port id %d\n", port_id);
745                 return -EINVAL;
746         }
747
748         RTE_LOG(INFO, APP, "Change MTU of port %d to %u\n", port_id, new_mtu);
749
750         /* Stop specific port */
751         rte_eth_dev_stop(port_id);
752
753         memcpy(&conf, &port_conf, sizeof(conf));
754         /* Set new MTU */
755         if (new_mtu > ETHER_MAX_LEN)
756                 conf.rxmode.offloads |= DEV_RX_OFFLOAD_JUMBO_FRAME;
757         else
758                 conf.rxmode.offloads &= ~DEV_RX_OFFLOAD_JUMBO_FRAME;
759
760         /* mtu + length of header + length of FCS = max pkt length */
761         conf.rxmode.max_rx_pkt_len = new_mtu + KNI_ENET_HEADER_SIZE +
762                                                         KNI_ENET_FCS_SIZE;
763         ret = rte_eth_dev_configure(port_id, 1, 1, &conf);
764         if (ret < 0) {
765                 RTE_LOG(ERR, APP, "Fail to reconfigure port %d\n", port_id);
766                 return ret;
767         }
768
769         ret = rte_eth_dev_adjust_nb_rx_tx_desc(port_id, &nb_rxd, NULL);
770         if (ret < 0)
771                 rte_exit(EXIT_FAILURE, "Could not adjust number of descriptors "
772                                 "for port%u (%d)\n", (unsigned int)port_id,
773                                 ret);
774
775         rte_eth_dev_info_get(port_id, &dev_info);
776         rxq_conf = dev_info.default_rxconf;
777         rxq_conf.offloads = conf.rxmode.offloads;
778         ret = rte_eth_rx_queue_setup(port_id, 0, nb_rxd,
779                 rte_eth_dev_socket_id(port_id), &rxq_conf, pktmbuf_pool);
780         if (ret < 0) {
781                 RTE_LOG(ERR, APP, "Fail to setup Rx queue of port %d\n",
782                                 port_id);
783                 return ret;
784         }
785
786         /* Restart specific port */
787         ret = rte_eth_dev_start(port_id);
788         if (ret < 0) {
789                 RTE_LOG(ERR, APP, "Fail to restart port %d\n", port_id);
790                 return ret;
791         }
792
793         return 0;
794 }
795
796 /* Callback for request of configuring network interface up/down */
797 static int
798 kni_config_network_interface(uint16_t port_id, uint8_t if_up)
799 {
800         int ret = 0;
801
802         if (!rte_eth_dev_is_valid_port(port_id)) {
803                 RTE_LOG(ERR, APP, "Invalid port id %d\n", port_id);
804                 return -EINVAL;
805         }
806
807         RTE_LOG(INFO, APP, "Configure network interface of %d %s\n",
808                                         port_id, if_up ? "up" : "down");
809
810         if (if_up != 0) { /* Configure network interface up */
811                 rte_eth_dev_stop(port_id);
812                 ret = rte_eth_dev_start(port_id);
813         } else /* Configure network interface down */
814                 rte_eth_dev_stop(port_id);
815
816         if (ret < 0)
817                 RTE_LOG(ERR, APP, "Failed to start port %d\n", port_id);
818
819         return ret;
820 }
821
822 static void
823 print_ethaddr(const char *name, struct ether_addr *mac_addr)
824 {
825         char buf[ETHER_ADDR_FMT_SIZE];
826         ether_format_addr(buf, ETHER_ADDR_FMT_SIZE, mac_addr);
827         RTE_LOG(INFO, APP, "\t%s%s\n", name, buf);
828 }
829
830 /* Callback for request of configuring mac address */
831 static int
832 kni_config_mac_address(uint16_t port_id, uint8_t mac_addr[])
833 {
834         int ret = 0;
835
836         if (!rte_eth_dev_is_valid_port(port_id)) {
837                 RTE_LOG(ERR, APP, "Invalid port id %d\n", port_id);
838                 return -EINVAL;
839         }
840
841         RTE_LOG(INFO, APP, "Configure mac address of %d\n", port_id);
842         print_ethaddr("Address:", (struct ether_addr *)mac_addr);
843
844         ret = rte_eth_dev_default_mac_addr_set(port_id,
845                                                (struct ether_addr *)mac_addr);
846         if (ret < 0)
847                 RTE_LOG(ERR, APP, "Failed to config mac_addr for port %d\n",
848                         port_id);
849
850         return ret;
851 }
852
853 static int
854 kni_alloc(uint16_t port_id)
855 {
856         uint8_t i;
857         struct rte_kni *kni;
858         struct rte_kni_conf conf;
859         struct kni_port_params **params = kni_port_params_array;
860
861         if (port_id >= RTE_MAX_ETHPORTS || !params[port_id])
862                 return -1;
863
864         params[port_id]->nb_kni = params[port_id]->nb_lcore_k ?
865                                 params[port_id]->nb_lcore_k : 1;
866
867         for (i = 0; i < params[port_id]->nb_kni; i++) {
868                 /* Clear conf at first */
869                 memset(&conf, 0, sizeof(conf));
870                 if (params[port_id]->nb_lcore_k) {
871                         snprintf(conf.name, RTE_KNI_NAMESIZE,
872                                         "vEth%u_%u", port_id, i);
873                         conf.core_id = params[port_id]->lcore_k[i];
874                         conf.force_bind = 1;
875                 } else
876                         snprintf(conf.name, RTE_KNI_NAMESIZE,
877                                                 "vEth%u", port_id);
878                 conf.group_id = port_id;
879                 conf.mbuf_size = MAX_PACKET_SZ;
880                 /*
881                  * The first KNI device associated to a port
882                  * is the master, for multiple kernel thread
883                  * environment.
884                  */
885                 if (i == 0) {
886                         struct rte_kni_ops ops;
887                         struct rte_eth_dev_info dev_info;
888                         const struct rte_pci_device *pci_dev;
889                         const struct rte_bus *bus = NULL;
890
891                         memset(&dev_info, 0, sizeof(dev_info));
892                         rte_eth_dev_info_get(port_id, &dev_info);
893
894                         if (dev_info.device)
895                                 bus = rte_bus_find_by_device(dev_info.device);
896                         if (bus && !strcmp(bus->name, "pci")) {
897                                 pci_dev = RTE_DEV_TO_PCI(dev_info.device);
898                                 conf.addr = pci_dev->addr;
899                                 conf.id = pci_dev->id;
900                         }
901                         /* Get the interface default mac address */
902                         rte_eth_macaddr_get(port_id,
903                                         (struct ether_addr *)&conf.mac_addr);
904
905                         rte_eth_dev_get_mtu(port_id, &conf.mtu);
906
907                         memset(&ops, 0, sizeof(ops));
908                         ops.port_id = port_id;
909                         ops.change_mtu = kni_change_mtu;
910                         ops.config_network_if = kni_config_network_interface;
911                         ops.config_mac_address = kni_config_mac_address;
912
913                         kni = rte_kni_alloc(pktmbuf_pool, &conf, &ops);
914                 } else
915                         kni = rte_kni_alloc(pktmbuf_pool, &conf, NULL);
916
917                 if (!kni)
918                         rte_exit(EXIT_FAILURE, "Fail to create kni for "
919                                                 "port: %d\n", port_id);
920                 params[port_id]->kni[i] = kni;
921         }
922
923         return 0;
924 }
925
926 static int
927 kni_free_kni(uint16_t port_id)
928 {
929         uint8_t i;
930         struct kni_port_params **p = kni_port_params_array;
931
932         if (port_id >= RTE_MAX_ETHPORTS || !p[port_id])
933                 return -1;
934
935         for (i = 0; i < p[port_id]->nb_kni; i++) {
936                 if (rte_kni_release(p[port_id]->kni[i]))
937                         printf("Fail to release kni\n");
938                 p[port_id]->kni[i] = NULL;
939         }
940         rte_eth_dev_stop(port_id);
941
942         return 0;
943 }
944
945 /* Initialise ports/queues etc. and start main loop on each core */
946 int
947 main(int argc, char** argv)
948 {
949         int ret;
950         uint16_t nb_sys_ports, port;
951         unsigned i;
952         void *retval;
953         pthread_t kni_link_tid;
954         int pid;
955
956         /* Associate signal_hanlder function with USR signals */
957         signal(SIGUSR1, signal_handler);
958         signal(SIGUSR2, signal_handler);
959         signal(SIGRTMIN, signal_handler);
960         signal(SIGINT, signal_handler);
961
962         /* Initialise EAL */
963         ret = rte_eal_init(argc, argv);
964         if (ret < 0)
965                 rte_exit(EXIT_FAILURE, "Could not initialise EAL (%d)\n", ret);
966         argc -= ret;
967         argv += ret;
968
969         /* Parse application arguments (after the EAL ones) */
970         ret = parse_args(argc, argv);
971         if (ret < 0)
972                 rte_exit(EXIT_FAILURE, "Could not parse input parameters\n");
973
974         /* Create the mbuf pool */
975         pktmbuf_pool = rte_pktmbuf_pool_create("mbuf_pool", NB_MBUF,
976                 MEMPOOL_CACHE_SZ, 0, MBUF_DATA_SZ, rte_socket_id());
977         if (pktmbuf_pool == NULL) {
978                 rte_exit(EXIT_FAILURE, "Could not initialise mbuf pool\n");
979                 return -1;
980         }
981
982         /* Get number of ports found in scan */
983         nb_sys_ports = rte_eth_dev_count_avail();
984         if (nb_sys_ports == 0)
985                 rte_exit(EXIT_FAILURE, "No supported Ethernet device found\n");
986
987         /* Check if the configured port ID is valid */
988         for (i = 0; i < RTE_MAX_ETHPORTS; i++)
989                 if (kni_port_params_array[i] && !rte_eth_dev_is_valid_port(i))
990                         rte_exit(EXIT_FAILURE, "Configured invalid "
991                                                 "port ID %u\n", i);
992
993         /* Initialize KNI subsystem */
994         init_kni();
995
996         /* Initialise each port */
997         RTE_ETH_FOREACH_DEV(port) {
998                 /* Skip ports that are not enabled */
999                 if (!(ports_mask & (1 << port)))
1000                         continue;
1001                 init_port(port);
1002
1003                 if (port >= RTE_MAX_ETHPORTS)
1004                         rte_exit(EXIT_FAILURE, "Can not use more than "
1005                                 "%d ports for kni\n", RTE_MAX_ETHPORTS);
1006
1007                 kni_alloc(port);
1008         }
1009         check_all_ports_link_status(ports_mask);
1010
1011         pid = getpid();
1012         RTE_LOG(INFO, APP, "========================\n");
1013         RTE_LOG(INFO, APP, "KNI Running\n");
1014         RTE_LOG(INFO, APP, "kill -SIGUSR1 %d\n", pid);
1015         RTE_LOG(INFO, APP, "    Show KNI Statistics.\n");
1016         RTE_LOG(INFO, APP, "kill -SIGUSR2 %d\n", pid);
1017         RTE_LOG(INFO, APP, "    Zero KNI Statistics.\n");
1018         RTE_LOG(INFO, APP, "========================\n");
1019         fflush(stdout);
1020
1021         ret = rte_ctrl_thread_create(&kni_link_tid,
1022                                      "KNI link status check", NULL,
1023                                      monitor_all_ports_link_status, NULL);
1024         if (ret < 0)
1025                 rte_exit(EXIT_FAILURE,
1026                         "Could not create link status thread!\n");
1027
1028         /* Launch per-lcore function on every lcore */
1029         rte_eal_mp_remote_launch(main_loop, NULL, CALL_MASTER);
1030         RTE_LCORE_FOREACH_SLAVE(i) {
1031                 if (rte_eal_wait_lcore(i) < 0)
1032                         return -1;
1033         }
1034         monitor_links = 0;
1035         pthread_join(kni_link_tid, &retval);
1036
1037         /* Release resources */
1038         RTE_ETH_FOREACH_DEV(port) {
1039                 if (!(ports_mask & (1 << port)))
1040                         continue;
1041                 kni_free_kni(port);
1042         }
1043         for (i = 0; i < RTE_MAX_ETHPORTS; i++)
1044                 if (kni_port_params_array[i]) {
1045                         rte_free(kni_port_params_array[i]);
1046                         kni_port_params_array[i] = NULL;
1047                 }
1048
1049         return 0;
1050 }