6a7499c825983064687d1695de6b72d3d37274a4
[csit.git] / docs / content / release_notes / current / vpp_performance.md
1 ---
2 title: "VPP Performance"
3 weight: 1
4 ---
5
6 # CSIT 23.10 - VPP Performance
7
8 1. TEST FRAMEWORK
9    - **CSIT test environment** version has been updated to ver. 13, see
10      [Environment Versioning]({{< ref "../../../infrastructure/fdio_csit_testbed_versioning" >}}).
11    - **General Code Housekeeping**: Ongoing code optimizations and bug fixes.
12    - **Trending**: Ndrpdr tests use newer code (MLRsearch 1.2.1) and configuration,
13      gaining more stability and speed. Release results still use the old code
14      to keep comparability with RC1 and RC2 results.
15 2. VPP PERFORMANCE TESTS
16    - Added 2n-c6in testbed.
17 3. PRESENTATION AND ANALYTICS LAYER
18    - [Performance dashboard](https://csit.fd.io/) got updated with graphs
19      presenting bandwidth in bits per second for MRR and NDRPDR tests.
20
21 # Known Issues
22
23 These are issues that cause test failures or otherwise limit usefulness of CSIT
24 testing.
25
26 ## New
27
28 Any issue listed here may have been present also in a previous release,
29 but was not detected/recognized/reported enough back then.
30
31 **#** | **JiraID**                                       | **Issue Description**
32 ------|--------------------------------------------------|--------------------------------------------------------------
33  1    |                                                  |
34
35 ## Previous
36
37 Issues reported in previous releases which still affect the current results.
38
39 **#** | **JiraID**                                       | **Issue Description**
40 ------|--------------------------------------------------|--------------------------------------------------------------
41   1   | [CSIT-1782](https://jira.fd.io/browse/CSIT-1782) | Multicore AVF tests are failing when trying to create interface. Frequency is reduced by CSIT workaround, but occasional failures do still happen.
42   2   | [CSIT-1785](https://jira.fd.io/browse/CSIT-1785) | NAT44ED tests failing to establish all TCP sessions. At least for max scale, in allotted time (limited by session 500s timeout) due to worse slow path performance than previously measured and calibrated for. CSIT removed the max scale NAT tests to avoid this issue.
43   3   | [CSIT-1795](https://jira.fd.io/browse/CSIT-1795) | Ocassionally not all DET44 sessions have been established: 4128767 != 4128768
44   4   | [CSIT-1802](https://jira.fd.io/browse/CSIT-1802) | All testbeds: AF-XDP - NDR tests failing from time to time on small loss
45   5   | [CSIT-1804](https://jira.fd.io/browse/CSIT-1804) | All testbeds: NDR tests failing from time to time.
46   6   | [CSIT-1808](https://jira.fd.io/browse/CSIT-1808) | All tests with 9000B payload frames not forwarded over memif interfaces.
47   7   | [CSIT-1827](https://jira.fd.io/browse/CSIT-1827) | 3n-icx, 3n-skx: all AVF crypto tests sporadically fail. 1518B with no traffic, IMIX with excessive packet loss
48   8   | [CSIT-1849](https://jira.fd.io/browse/CSIT-1849) | 2n-skx, 2n-clx, 2n-icx: UDP 16m TPUT tests fail to create all sessions.
49   9   | [CSIT-1864](https://jira.fd.io/browse/CSIT-1864) | 2n-clx: half of the packets lost on PDR tests.
50  10   | [CSIT-1881](https://jira.fd.io/browse/CSIT-1881) | 2n-icx: NFV density tests ocassionally breaks VPP which fails to start.
51  11   | [CSIT-1883](https://jira.fd.io/browse/CSIT-1883) | 3n-snr: All hwasync wireguard tests failing when trying to verify device.
52  12   | [CSIT-1886](https://jira.fd.io/browse/CSIT-1886) | 3n-icx: Wireguard tests with 100 and more tunnels are failing PDR criteria.
53  13   | [CSIT-1892](https://jira.fd.io/browse/CSIT-1892) | 3n-alt: two-band structure of ipsec and vxlan.
54  14   | [CSIT-1896](https://jira.fd.io/browse/CSIT-1896) | Depending on topology, l3fwd avoids dut-dut link.
55  15   | [CSIT-1901](https://jira.fd.io/browse/CSIT-1901) | 3n-icx: negative ipackets on TB38 AVF 4c l2patch.
56  16   | [CSIT-1904](https://jira.fd.io/browse/CSIT-1904) | DPDK 23.03 testpmd startup fails on some testbeds.
57  17   | [CSIT-1906](https://jira.fd.io/browse/CSIT-1906) | Zero traffic with cx7 rdma. Cause not know yet, trending uses mlx5-core for cx7 and cx6.
58  18   | [VPP-2077](https://jira.fd.io/browse/VPP-2077)   | IP fragmentation: running_fragment_id is not thread safe. Causes reduced performance and failures in gtpu reassembly tests.
59  19   | [CSIT-1914](https://jira.fd.io/browse/CSIT-1914) | TRex does not produce latency data on ICE NICs.
60  20   | [CSIT-1915](https://jira.fd.io/browse/CSIT-1915) | 2n-icx testbeds to not have the same performance
61  21   | [CSIT-1916](https://jira.fd.io/browse/CSIT-1916) | Poor CPU scaling on 2n-zn2 RDMA.
62  22   | [CSIT-1917](https://jira.fd.io/browse/CSIT-1917) | TRex STL performance is unstable at high pps due to unsent packets.
63  23   | [CSIT-1922](https://jira.fd.io/browse/CSIT-1922) | 2n-tx2: af_xdp mrr failures. On other testbeds MRR regressions and PDR failures.
64  24   | [CSIT-1923](https://jira.fd.io/browse/CSIT-1923) | 3n-icx, 3n-snr: first few swasync scheduler tests timing out in runtime stat.
65  25   | [CSIT-1924](https://jira.fd.io/browse/CSIT-1924) | l3fwd error in 200Ge2P1Cx7Veat-Mlx5 test with 9000B.
66
67 ## Fixed
68
69 Issues reported in previous releases which were fixed in this release:
70
71 **#** | **JiraID**                                       | **Issue Description**
72 ------|--------------------------------------------------|--------------------------------------------------------------
73  1    | [CSIT-1800](https://jira.fd.io/browse/CSIT-1800) | All Geneve L3 mode scale tests (1024 tunnels) are failing.
74  2    | [CSIT-1801](https://jira.fd.io/browse/CSIT-1801) | 9000B payload frames not forwarded over tunnels due to violating supported Max Frame Size (VxLAN, LISP, SRv6)
75  3    | [CSIT-1809](https://jira.fd.io/browse/CSIT-1809) | All tests with 9000B payload frames not forwarded over vhost-user interfaces.
76  4    | [CSIT-1884](https://jira.fd.io/browse/CSIT-1884) | 2n-clx, 2n-icx: All NAT44DET NDR PDR IMIX over 1M sessions BIDIR tests failing to create enough sessions.
77  5    | [CSIT-1885](https://jira.fd.io/browse/CSIT-1885) | 3n-icx: 9000b ip4 ip6 l2 NDRPDR AVF tests are failing to forward traffic.
78
79 # Root Cause Analysis for Regressions
80
81 List of RCAs in CSIT 23.10 for VPP performance regressions.
82 Not listing differences caused by known issues (uneven worker load
83 due to randomized RSS or other per-worker issues).
84 Also not listing tests which historically show large performance variance.
85
86 Contrary to issues, these genuine regressions do not limit usefulness
87 of CSIT testing. So even if they are not fixed
88 (e.g. when the regression is an expected consequence of added functionality),
89 they will not be re-listed in the next release report.
90
91 **#** | **JiraID**                                       | **Issue Description**
92 ------|--------------------------------------------------|--------------------------------------------------------------
93  1    | [CSIT-1933](https://jira.fd.io/browse/CSIT-1933) | Regresion in nat44ed tests around 2023-09-07
94  2    | [CSIT-1934](https://jira.fd.io/browse/CSIT-1934) | rls 2310: Regression in nginx rps around 2023-10-09
95  3    | [CSIT-1935](https://jira.fd.io/browse/CSIT-1935) | rls 2310: Zero traffic reported in udpquic tests