New upstream version 18.11-rc1
[deb_dpdk.git] / doc / guides / nics / pcap_ring.rst
1 ..  SPDX-License-Identifier: BSD-3-Clause
2     Copyright(c) 2010-2015 Intel Corporation.
3
4 Libpcap and Ring Based Poll Mode Drivers
5 ========================================
6
7 In addition to Poll Mode Drivers (PMDs) for physical and virtual hardware,
8 the DPDK also includes pure-software PMDs, two of these drivers are:
9
10 *   A libpcap -based PMD (librte_pmd_pcap) that reads and writes packets using libpcap,
11     - both from files on disk, as well as from physical NIC devices using standard Linux kernel drivers.
12
13 *   A ring-based PMD (librte_pmd_ring) that allows a set of software FIFOs (that is, rte_ring)
14     to be accessed using the PMD APIs, as though they were physical NICs.
15
16 .. note::
17
18     The libpcap -based PMD is disabled by default in the build configuration files,
19     owing to an external dependency on the libpcap development files which must be installed on the board.
20     Once the libpcap development files are installed,
21     the library can be enabled by setting CONFIG_RTE_LIBRTE_PMD_PCAP=y and recompiling the DPDK.
22
23 Using the Drivers from the EAL Command Line
24 -------------------------------------------
25
26 For ease of use, the DPDK EAL also has been extended to allow pseudo-Ethernet devices,
27 using one or more of these drivers,
28 to be created at application startup time during EAL initialization.
29
30 To do so, the --vdev= parameter must be passed to the EAL.
31 This takes take options to allow ring and pcap-based Ethernet to be allocated and used transparently by the application.
32 This can be used, for example, for testing on a virtual machine where there are no Ethernet ports.
33
34 Libpcap-based PMD
35 ~~~~~~~~~~~~~~~~~
36
37 Pcap-based devices can be created using the virtual device --vdev option.
38 The device name must start with the net_pcap prefix followed by numbers or letters.
39 The name is unique for each device. Each device can have multiple stream options and multiple devices can be used.
40 Multiple device definitions can be arranged using multiple --vdev.
41 Device name and stream options must be separated by commas as shown below:
42
43 .. code-block:: console
44
45    $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
46        --vdev 'net_pcap0,stream_opt0=..,stream_opt1=..' \
47        --vdev='net_pcap1,stream_opt0=..'
48
49 Device Streams
50 ^^^^^^^^^^^^^^
51
52 Multiple ways of stream definitions can be assessed and combined as long as the following two rules are respected:
53
54 *   A device is provided with two different streams - reception and transmission.
55
56 *   A device is provided with one network interface name used for reading and writing packets.
57
58 The different stream types are:
59
60 *   rx_pcap: Defines a reception stream based on a pcap file.
61     The driver reads each packet within the given pcap file as if it was receiving it from the wire.
62     The value is a path to a valid pcap file.
63
64         rx_pcap=/path/to/file.pcap
65
66 *   tx_pcap: Defines a transmission stream based on a pcap file.
67     The driver writes each received packet to the given pcap file.
68     The value is a path to a pcap file.
69     The file is overwritten if it already exists and it is created if it does not.
70
71         tx_pcap=/path/to/file.pcap
72
73 *   rx_iface: Defines a reception stream based on a network interface name.
74     The driver reads packets from the given interface using the Linux kernel driver for that interface.
75     The driver captures both the incoming and outgoing packets on that interface.
76     The value is an interface name.
77
78         rx_iface=eth0
79
80 *   rx_iface_in: Defines a reception stream based on a network interface name.
81     The driver reads packets from the given interface using the Linux kernel driver for that interface.
82     The driver captures only the incoming packets on that interface.
83     The value is an interface name.
84
85         rx_iface_in=eth0
86
87 *   tx_iface: Defines a transmission stream based on a network interface name.
88     The driver sends packets to the given interface using the Linux kernel driver for that interface.
89     The value is an interface name.
90
91         tx_iface=eth0
92
93 *   iface: Defines a device mapping a network interface.
94     The driver both reads and writes packets from and to the given interface.
95     The value is an interface name.
96
97         iface=eth0
98
99 Runtime Config Options
100 ^^^^^^^^^^^^^^^^^^^^^^
101
102 - Use PCAP interface physical MAC
103
104  In case ``iface=`` configuration is set, user may want to use the selected interface's physical MAC
105  address. This can be done with a ``devarg`` ``phy_mac``, for example::
106
107    --vdev 'net_pcap0,iface=eth0,phy_mac=1'
108
109 Examples of Usage
110 ^^^^^^^^^^^^^^^^^
111
112 Read packets from one pcap file and write them to another:
113
114 .. code-block:: console
115
116     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
117         --vdev 'net_pcap0,rx_pcap=file_rx.pcap,tx_pcap=file_tx.pcap' \
118         -- --port-topology=chained
119
120 Read packets from a network interface and write them to a pcap file:
121
122 .. code-block:: console
123
124     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
125         --vdev 'net_pcap0,rx_iface=eth0,tx_pcap=file_tx.pcap' \
126         -- --port-topology=chained
127
128 Read packets from a pcap file and write them to a network interface:
129
130 .. code-block:: console
131
132     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
133         --vdev 'net_pcap0,rx_pcap=file_rx.pcap,tx_iface=eth1' \
134         -- --port-topology=chained
135
136 Forward packets through two network interfaces:
137
138 .. code-block:: console
139
140     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
141         --vdev 'net_pcap0,iface=eth0' --vdev='net_pcap1;iface=eth1'
142
143 Enable 2 tx queues on a network interface:
144
145 .. code-block:: console
146
147     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
148         --vdev 'net_pcap0,rx_iface=eth1,tx_iface=eth1,tx_iface=eth1' \
149         -- --txq 2
150
151 Read only incoming packets from a network interface and write them back to the same network interface:
152
153 .. code-block:: console
154
155     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
156         --vdev 'net_pcap0,rx_iface_in=eth1,tx_iface=eth1'
157
158 Using libpcap-based PMD with the testpmd Application
159 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
160
161 One of the first things that testpmd does before starting to forward packets is to flush the RX streams
162 by reading the first 512 packets on every RX stream and discarding them.
163 When using a libpcap-based PMD this behavior can be turned off using the following command line option:
164
165 .. code-block:: console
166
167     --no-flush-rx
168
169 It is also available in the runtime command line:
170
171 .. code-block:: console
172
173     set flush_rx on/off
174
175 It is useful for the case where the rx_pcap is being used and no packets are meant to be discarded.
176 Otherwise, the first 512 packets from the input pcap file will be discarded by the RX flushing operation.
177
178 .. code-block:: console
179
180     $RTE_TARGET/app/testpmd -l 0-3 -n 4 \
181         --vdev 'net_pcap0,rx_pcap=file_rx.pcap,tx_pcap=file_tx.pcap' \
182         -- --port-topology=chained --no-flush-rx
183
184 .. note::
185
186    The network interface provided to the PMD should be up. The PMD will return
187    an error if interface is down, and the PMD itself won't change the status
188    of the external network interface.
189
190
191 Rings-based PMD
192 ~~~~~~~~~~~~~~~
193
194 To run a DPDK application on a machine without any Ethernet devices, a pair of ring-based rte_ethdevs can be used as below.
195 The device names passed to the --vdev option must start with net_ring and take no additional parameters.
196 Multiple devices may be specified, separated by commas.
197
198 .. code-block:: console
199
200     ./testpmd -l 1-3 -n 4 --vdev=net_ring0 --vdev=net_ring1 -- -i
201     EAL: Detected lcore 1 as core 1 on socket 0
202     ...
203
204     Interactive-mode selected
205     Configuring Port 0 (socket 0)
206     Configuring Port 1 (socket 0)
207     Checking link statuses...
208     Port 0 Link Up - speed 10000 Mbps - full-duplex
209     Port 1 Link Up - speed 10000 Mbps - full-duplex
210     Done
211
212     testpmd> start tx_first
213     io packet forwarding - CRC stripping disabled - packets/burst=16
214     nb forwarding cores=1 - nb forwarding ports=2
215     RX queues=1 - RX desc=128 - RX free threshold=0
216     RX threshold registers: pthresh=8 hthresh=8 wthresh=4
217     TX queues=1 - TX desc=512 - TX free threshold=0
218     TX threshold registers: pthresh=36 hthresh=0 wthresh=0
219     TX RS bit threshold=0 - TXQ flags=0x0
220
221     testpmd> stop
222     Telling cores to stop...
223     Waiting for lcores to finish...
224
225 .. image:: img/forward_stats.*
226
227 .. code-block:: console
228
229     +++++++++++++++ Accumulated forward statistics for allports++++++++++
230     RX-packets: 462384736  RX-dropped: 0 RX-total: 462384736
231     TX-packets: 462384768  TX-dropped: 0 TX-total: 462384768
232     +++++++++++++++++++++++++++++++++++++++++++++++++++++
233
234     Done.
235
236
237 Using the Poll Mode Driver from an Application
238 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
239
240 Both drivers can provide similar APIs to allow the user to create a PMD, that is,
241 rte_ethdev structure, instances at run-time in the end-application,
242 for example, using rte_eth_from_rings() or rte_eth_from_pcaps() APIs.
243 For the rings-based PMD, this functionality could be used, for example,
244 to allow data exchange between cores using rings to be done in exactly the
245 same way as sending or receiving packets from an Ethernet device.
246 For the libpcap-based PMD, it allows an application to open one or more pcap files
247 and use these as a source of packet input to the application.
248
249 Usage Examples
250 ^^^^^^^^^^^^^^
251
252 To create two pseudo-Ethernet ports where all traffic sent to a port is looped back
253 for reception on the same port (error handling omitted for clarity):
254
255 .. code-block:: c
256
257     #define RING_SIZE 256
258     #define NUM_RINGS 2
259     #define SOCKET0 0
260
261     struct rte_ring *ring[NUM_RINGS];
262     int port0, port1;
263
264     ring[0] = rte_ring_create("R0", RING_SIZE, SOCKET0, RING_F_SP_ENQ|RING_F_SC_DEQ);
265     ring[1] = rte_ring_create("R1", RING_SIZE, SOCKET0, RING_F_SP_ENQ|RING_F_SC_DEQ);
266
267     /* create two ethdev's */
268
269     port0 = rte_eth_from_rings("net_ring0", ring, NUM_RINGS, ring, NUM_RINGS, SOCKET0);
270     port1 = rte_eth_from_rings("net_ring1", ring, NUM_RINGS, ring, NUM_RINGS, SOCKET0);
271
272
273 To create two pseudo-Ethernet ports where the traffic is switched between them,
274 that is, traffic sent to port 0 is read back from port 1 and vice-versa,
275 the final two lines could be changed as below:
276
277 .. code-block:: c
278
279     port0 = rte_eth_from_rings("net_ring0", &ring[0], 1, &ring[1], 1, SOCKET0);
280     port1 = rte_eth_from_rings("net_ring1", &ring[1], 1, &ring[0], 1, SOCKET0);
281
282 This type of configuration could be useful in a pipeline model, for example,
283 where one may want to have inter-core communication using pseudo Ethernet devices rather than raw rings,
284 for reasons of API consistency.
285
286 Enqueuing and dequeuing items from an rte_ring using the rings-based PMD may be slower than using the native rings API.
287 This is because DPDK Ethernet drivers make use of function pointers to call the appropriate enqueue or dequeue functions,
288 while the rte_ring specific functions are direct function calls in the code and are often inlined by the compiler.
289
290    Once an ethdev has been created, for either a ring or a pcap-based PMD,
291    it should be configured and started in the same way as a regular Ethernet device, that is,
292    by calling rte_eth_dev_configure() to set the number of receive and transmit queues,
293    then calling rte_eth_rx_queue_setup() / tx_queue_setup() for each of those queues and
294    finally calling rte_eth_dev_start() to allow transmission and reception of packets to begin.