Skip bad testbeds in reservation
[csit.git] / resources / libraries / bash / function / common.sh
1 # Copyright (c) 2019 Cisco and/or its affiliates.
2 # Copyright (c) 2019 PANTHEON.tech and/or its affiliates.
3 # Licensed under the Apache License, Version 2.0 (the "License");
4 # you may not use this file except in compliance with the License.
5 # You may obtain a copy of the License at:
6 #
7 #     http://www.apache.org/licenses/LICENSE-2.0
8 #
9 # Unless required by applicable law or agreed to in writing, software
10 # distributed under the License is distributed on an "AS IS" BASIS,
11 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12 # See the License for the specific language governing permissions and
13 # limitations under the License.
14
15 set -exuo pipefail
16
17 # This library defines functions used by multiple entry scripts.
18 # Keep functions ordered alphabetically, please.
19
20 # TODO: Add a link to bash style guide.
21 # TODO: Consider putting every die into a {} block,
22 #   the code might become more readable (but longer).
23
24
25 function activate_docker_topology () {
26
27     # Create virtual vpp-device topology. Output of the function is topology
28     # file describing created environment saved to a file.
29     #
30     # Variables read:
31     # - BASH_FUNCTION_DIR - Path to existing directory this file is located in.
32     # - TOPOLOGIES - Available topologies.
33     # - NODENESS - Node multiplicity of desired testbed.
34     # - FLAVOR - Node flavor string, usually describing the processor.
35     # - IMAGE_VER_FILE - Name of file that contains the image version.
36     # - CSIT_DIR - Directory where ${IMAGE_VER_FILE} is located.
37     # Variables set:
38     # - WORKING_TOPOLOGY - Path to topology file.
39
40     set -exuo pipefail
41
42     source "${BASH_FUNCTION_DIR}/device.sh" || {
43         die "Source failed!"
44     }
45
46     device_image="$(< ${CSIT_DIR}/${IMAGE_VER_FILE})"
47     case_text="${NODENESS}_${FLAVOR}"
48     case "${case_text}" in
49         "1n_skx" | "1n_tx2")
50             # We execute reservation over csit-shim-dcr (ssh) which runs sourced
51             # script's functions. Env variables are read from ssh output
52             # back to localhost for further processing.
53             hostname=$(grep search /etc/resolv.conf | cut -d' ' -f3) || die
54             ssh="ssh root@${hostname} -p 6022"
55             run="activate_wrapper ${NODENESS} ${FLAVOR} ${device_image}"
56             # backtics to avoid https://midnight-commander.org/ticket/2142
57             env_vars=`${ssh} "$(declare -f); ${run}"` || {
58                 die "Topology reservation via shim-dcr failed!"
59             }
60             set -a
61             source <(echo "$env_vars" | grep -v /usr/bin/docker) || {
62                 die "Source failed!"
63             }
64             set +a
65             ;;
66         "1n_vbox")
67             # We execute reservation on localhost. Sourced script automatially
68             # sets environment variables for further processing.
69             activate_wrapper "${NODENESS}" "${FLAVOR}" "${device_image}" || die
70             ;;
71         *)
72             die "Unknown specification: ${case_text}!"
73     esac
74
75     trap 'deactivate_docker_topology' EXIT || {
76          die "Trap attempt failed, please cleanup manually. Aborting!"
77     }
78
79     # Replace all variables in template with those in environment.
80     source <(echo 'cat <<EOF >topo.yml'; cat ${TOPOLOGIES[0]}; echo EOF;) || {
81         die "Topology file create failed!"
82     }
83
84     WORKING_TOPOLOGY="/tmp/topology.yaml"
85     mv topo.yml "${WORKING_TOPOLOGY}" || {
86         die "Topology move failed!"
87     }
88     cat ${WORKING_TOPOLOGY} | grep -v password || {
89         die "Topology read failed!"
90     }
91 }
92
93
94 function activate_virtualenv () {
95
96     # Update virtualenv pip package, delete and create virtualenv directory,
97     # activate the virtualenv, install requirements, set PYTHONPATH.
98
99     # Arguments:
100     # - ${1} - Path to existing directory for creating virtualenv in.
101     #          If missing or empty, ${CSIT_DIR} is used.
102     # - ${2} - Path to requirements file, ${CSIT_DIR}/requirements.txt if empty.
103     # Variables read:
104     # - CSIT_DIR - Path to existing root of local CSIT git repository.
105     # Variables exported:
106     # - PYTHONPATH - CSIT_DIR, as CSIT Python scripts usually need this.
107     # Functions called:
108     # - die - Print to stderr and exit.
109
110     set -exuo pipefail
111
112     root_path="${1-$CSIT_DIR}"
113     env_dir="${root_path}/env"
114     req_path=${2-$CSIT_DIR/requirements.txt}
115     rm -rf "${env_dir}" || die "Failed to clean previous virtualenv."
116     pip install --upgrade virtualenv || {
117         die "Virtualenv package install failed."
118     }
119     virtualenv "${env_dir}" || {
120         die "Virtualenv creation failed."
121     }
122     set +u
123     source "${env_dir}/bin/activate" || die "Virtualenv activation failed."
124     set -u
125     pip install --upgrade -r "${req_path}" || {
126         die "Requirements installation failed."
127     }
128     # Most CSIT Python scripts assume PYTHONPATH is set and exported.
129     export PYTHONPATH="${CSIT_DIR}" || die "Export failed."
130 }
131
132
133 function archive_tests () {
134
135     # Create .tar.xz of generated/tests for archiving.
136     # To be run after generate_tests, kept separate to offer more flexibility.
137
138     # Directory read:
139     # - ${GENERATED_DIR}/tests - Tree of executed suites to archive.
140     # File rewriten:
141     # - ${ARCHIVE_DIR}/tests.tar.xz - Archive of generated tests.
142
143     set -exuo pipefail
144
145     tar c "${GENERATED_DIR}/tests" | xz -9e > "${ARCHIVE_DIR}/tests.tar.xz" || {
146         die "Error creating archive of generated tests."
147     }
148 }
149
150
151 function check_download_dir () {
152
153     # Fail if there are no files visible in ${DOWNLOAD_DIR}.
154     #
155     # Variables read:
156     # - DOWNLOAD_DIR - Path to directory pybot takes the build to test from.
157     # Directories read:
158     # - ${DOWNLOAD_DIR} - Has to be non-empty to proceed.
159     # Functions called:
160     # - die - Print to stderr and exit.
161
162     set -exuo pipefail
163
164     if [[ ! "$(ls -A "${DOWNLOAD_DIR}")" ]]; then
165         die "No artifacts downloaded!"
166     fi
167 }
168
169
170 function check_prerequisites () {
171
172     # Fail if prerequisites are not met.
173     #
174     # Functions called:
175     # - installed - Check if application is installed/present in system.
176     # - die - Print to stderr and exit.
177
178     set -exuo pipefail
179
180     if ! installed sshpass; then
181         die "Please install sshpass before continue!"
182     fi
183 }
184
185 function cleanup_topo () {
186
187     # Variables read:
188     # - WORKING_TOPOLOGY - Path to topology yaml file of the reserved testbed.
189     # - PYTHON_SCRIPTS_DIR - Path to directory holding the reservation script.
190
191     set -exuo pipefail
192
193     python "${PYTHON_SCRIPTS_DIR}/topo_cleanup.py" -t "${WORKING_TOPOLOGY}"
194     # Not using "|| die" as some callers might want to ignore errors,
195     # e.g. in teardowns, such as unreserve.
196 }
197
198
199 function common_dirs () {
200
201     # Set global variables, create some directories (without touching content).
202
203     # Variables set:
204     # - BASH_FUNCTION_DIR - Path to existing directory this file is located in.
205     # - CSIT_DIR - Path to existing root of local CSIT git repository.
206     # - TOPOLOGIES_DIR - Path to existing directory with available tpologies.
207     # - RESOURCES_DIR - Path to existing CSIT subdirectory "resources".
208     # - TOOLS_DIR - Path to existing resources subdirectory "tools".
209     # - PYTHON_SCRIPTS_DIR - Path to existing tools subdirectory "scripts".
210     # - ARCHIVE_DIR - Path to created CSIT subdirectory "archive".
211     # - DOWNLOAD_DIR - Path to created CSIT subdirectory "download_dir".
212     # - GENERATED_DIR - Path to created CSIT subdirectory "generated".
213     # Directories created if not present:
214     # ARCHIVE_DIR, DOWNLOAD_DIR, GENERATED_DIR.
215     # Functions called:
216     # - die - Print to stderr and exit.
217
218     set -exuo pipefail
219
220     this_file=$(readlink -e "${BASH_SOURCE[0]}") || {
221         die "Some error during locating of this source file."
222     }
223     BASH_FUNCTION_DIR=$(dirname "${this_file}") || {
224         die "Some error during dirname call."
225     }
226     # Current working directory could be in a different repo, e.g. VPP.
227     pushd "${BASH_FUNCTION_DIR}" || die "Pushd failed"
228     relative_csit_dir=$(git rev-parse --show-toplevel) || {
229         die "Git rev-parse failed."
230     }
231     CSIT_DIR=$(readlink -e "${relative_csit_dir}") || die "Readlink failed."
232     popd || die "Popd failed."
233     TOPOLOGIES_DIR=$(readlink -e "${CSIT_DIR}/topologies/available") || {
234         die "Readlink failed."
235     }
236     RESOURCES_DIR=$(readlink -e "${CSIT_DIR}/resources") || {
237         die "Readlink failed."
238     }
239     TOOLS_DIR=$(readlink -e "${RESOURCES_DIR}/tools") || {
240         die "Readlink failed."
241     }
242     PYTHON_SCRIPTS_DIR=$(readlink -e "${TOOLS_DIR}/scripts") || {
243         die "Readlink failed."
244     }
245
246     ARCHIVE_DIR=$(readlink -f "${CSIT_DIR}/archive") || {
247         die "Readlink failed."
248     }
249     mkdir -p "${ARCHIVE_DIR}" || die "Mkdir failed."
250     DOWNLOAD_DIR=$(readlink -f "${CSIT_DIR}/download_dir") || {
251         die "Readlink failed."
252     }
253     mkdir -p "${DOWNLOAD_DIR}" || die "Mkdir failed."
254     GENERATED_DIR=$(readlink -f "${CSIT_DIR}/generated") || {
255         die "Readlink failed."
256     }
257     mkdir -p "${GENERATED_DIR}" || die "Mkdir failed."
258 }
259
260
261 function compose_pybot_arguments () {
262
263     # Variables read:
264     # - WORKING_TOPOLOGY - Path to topology yaml file of the reserved testbed.
265     # - DUT - CSIT test/ subdirectory, set while processing tags.
266     # - TAGS - Array variable holding selected tag boolean expressions.
267     # - TOPOLOGIES_TAGS - Tag boolean expression filtering tests for topology.
268     # - TEST_CODE - The test selection string from environment or argument.
269     # Variables set:
270     # - PYBOT_ARGS - String holding part of all arguments for pybot.
271     # - EXPANDED_TAGS - Array of strings pybot arguments compiled from tags.
272
273     set -exuo pipefail
274
275     # No explicit check needed with "set -u".
276     PYBOT_ARGS=("--loglevel" "TRACE")
277     PYBOT_ARGS+=("--variable" "TOPOLOGY_PATH:${WORKING_TOPOLOGY}")
278
279     case "${TEST_CODE}" in
280         *"device"*)
281             PYBOT_ARGS+=("--suite" "tests.${DUT}.device")
282             ;;
283         *"func"*)
284             PYBOT_ARGS+=("--suite" "tests.${DUT}.func")
285             ;;
286         *"perf"*)
287             PYBOT_ARGS+=("--suite" "tests.${DUT}.perf")
288             ;;
289         *)
290             die "Unknown specification: ${TEST_CODE}"
291     esac
292
293     EXPANDED_TAGS=()
294     for tag in "${TAGS[@]}"; do
295         if [[ ${tag} == "!"* ]]; then
296             EXPANDED_TAGS+=("--exclude" "${tag#$"!"}")
297         else
298             EXPANDED_TAGS+=("--include" "${TOPOLOGIES_TAGS}AND${tag}")
299         fi
300     done
301 }
302
303
304 function copy_archives () {
305
306     # Create additional archive if workspace variable is set.
307     # This way if script is running in jenkins all will be
308     # automatically archived to logs.fd.io.
309     #
310     # Variables read:
311     # - WORKSPACE - Jenkins workspace, copy only if the value is not empty.
312     #   Can be unset, then it speeds up manual testing.
313     # - ARCHIVE_DIR - Path to directory with content to be copied.
314     # Directories updated:
315     # - ${WORKSPACE}/archives/ - Created if does not exist.
316     #   Content of ${ARCHIVE_DIR}/ is copied here.
317     # Functions called:
318     # - die - Print to stderr and exit.
319
320     set -exuo pipefail
321
322     if [[ -n "${WORKSPACE-}" ]]; then
323         mkdir -p "${WORKSPACE}/archives/" || die "Archives dir create failed."
324         cp -rf "${ARCHIVE_DIR}"/* "${WORKSPACE}/archives" || die "Copy failed."
325     fi
326 }
327
328
329 function deactivate_docker_topology () {
330
331     # Deactivate virtual vpp-device topology by removing containers.
332     #
333     # Variables read:
334     # - NODENESS - Node multiplicity of desired testbed.
335     # - FLAVOR - Node flavor string, usually describing the processor.
336
337     set -exuo pipefail
338
339     case_text="${NODENESS}_${FLAVOR}"
340     case "${case_text}" in
341         "1n_skx" | "1n_tx2")
342             hostname=$(grep search /etc/resolv.conf | cut -d' ' -f3) || die
343             ssh="ssh root@${hostname} -p 6022"
344             env_vars=$(env | grep CSIT_ | tr '\n' ' ' ) || die
345             ${ssh} "$(declare -f); deactivate_wrapper ${env_vars}" || {
346                 die "Topology cleanup via shim-dcr failed!"
347             }
348             ;;
349         "1n_vbox")
350             enter_mutex || die
351             clean_environment || {
352                 die "Topology cleanup locally failed!"
353             }
354             exit_mutex || die
355             ;;
356         *)
357             die "Unknown specification: ${case_text}!"
358     esac
359 }
360
361
362 function die () {
363
364     # Print the message to standard error end exit with error code specified
365     # by the second argument.
366     #
367     # Hardcoded values:
368     # - The default error message.
369     # Arguments:
370     # - ${1} - The whole error message, be sure to quote. Optional
371     # - ${2} - the code to exit with, default: 1.
372
373     set -x
374     set +eu
375     warn "${1:-Unspecified run-time error occurred!}"
376     exit "${2:-1}"
377 }
378
379
380 function die_on_pybot_error () {
381
382     # Source this fragment if you want to abort on any failed test case.
383     #
384     # Variables read:
385     # - PYBOT_EXIT_STATUS - Set by a pybot running fragment.
386     # Functions called:
387     # - die - Print to stderr and exit.
388
389     set -exuo pipefail
390
391     if [[ "${PYBOT_EXIT_STATUS}" != "0" ]]; then
392         die "Test failures are present!" "${PYBOT_EXIT_STATUS}"
393     fi
394 }
395
396
397 function generate_tests () {
398
399     # Populate ${GENERATED_DIR}/tests based on ${CSIT_DIR}/tests/.
400     # Any previously existing content of ${GENERATED_DIR}/tests is wiped before.
401     # The generation is done by executing any *.py executable
402     # within any subdirectory after copying.
403
404     # This is a separate function, because this code is called
405     # both by autogen checker and entries calling run_pybot.
406
407     # Directories read:
408     # - ${CSIT_DIR}/tests - Used as templates for the generated tests.
409     # Directories replaced:
410     # - ${GENERATED_DIR}/tests - Overwritten by the generated tests.
411
412     set -exuo pipefail
413
414     rm -rf "${GENERATED_DIR}/tests" || die
415     cp -r "${CSIT_DIR}/tests" "${GENERATED_DIR}/tests" || die
416     cmd_line=("find" "${GENERATED_DIR}/tests" "-type" "f")
417     cmd_line+=("-executable" "-name" "*.py")
418     file_list=$("${cmd_line[@]}") || die
419
420     for gen in ${file_list}; do
421         directory="$(dirname "${gen}")" || die
422         filename="$(basename "${gen}")" || die
423         pushd "${directory}" || die
424         ./"${filename}" || die
425         popd || die
426     done
427 }
428
429
430 function get_test_code () {
431
432     # Arguments:
433     # - ${1} - Optional, argument of entry script (or empty as unset).
434     #   Test code value to override job name from environment.
435     # Variables read:
436     # - JOB_NAME - String affecting test selection, default if not argument.
437     # Variables set:
438     # - TEST_CODE - The test selection string from environment or argument.
439     # - NODENESS - Node multiplicity of desired testbed.
440     # - FLAVOR - Node flavor string, usually describing the processor.
441
442     set -exuo pipefail
443
444     TEST_CODE="${1-}" || die "Reading optional argument failed, somehow."
445     if [[ -z "${TEST_CODE}" ]]; then
446         TEST_CODE="${JOB_NAME-}" || die "Reading job name failed, somehow."
447     fi
448
449     case "${TEST_CODE}" in
450         *"1n-vbox"*)
451             NODENESS="1n"
452             FLAVOR="vbox"
453             ;;
454         *"1n-skx"*)
455             NODENESS="1n"
456             FLAVOR="skx"
457             ;;
458        *"1n-tx2"*)
459             NODENESS="1n"
460             FLAVOR="tx2"
461             ;;
462         *"2n-skx"*)
463             NODENESS="2n"
464             FLAVOR="skx"
465             ;;
466         *"3n-skx"*)
467             NODENESS="3n"
468             FLAVOR="skx"
469             ;;
470         *"2n-dnv"*)
471             NODENESS="2n"
472             FLAVOR="dnv"
473             ;;
474         *"3n-dnv"*)
475             NODENESS="3n"
476             FLAVOR="dnv"
477             ;;
478         *"3n-tsh"*)
479             NODENESS="3n"
480             FLAVOR="tsh"
481             ;;
482         *)
483             # Fallback to 3-node Haswell by default (backward compatibility)
484             NODENESS="3n"
485             FLAVOR="hsw"
486             ;;
487     esac
488 }
489
490
491 function get_test_tag_string () {
492
493     # Variables read:
494     # - GERRIT_EVENT_TYPE - Event type set by gerrit, can be unset.
495     # - GERRIT_EVENT_COMMENT_TEXT - Comment text, read for "comment-added" type.
496     # - TEST_CODE - The test selection string from environment or argument.
497     # Variables set:
498     # - TEST_TAG_STRING - The string following trigger word in gerrit comment.
499     #   May be empty, not set on event types not adding comment.
500
501     # TODO: ci-management scripts no longer need to perform this.
502
503     set -exuo pipefail
504
505     trigger=""
506     if [[ "${GERRIT_EVENT_TYPE-}" == "comment-added" ]]; then
507         case "${TEST_CODE}" in
508             *"device"*)
509                 # On parsing error, ${trigger} stays empty.
510                 trigger="$(echo "${GERRIT_EVENT_COMMENT_TEXT}" \
511                     | grep -oE '(devicetest$|devicetest[[:space:]].+$)')" \
512                     || true
513                 # Set test tags as string.
514                 TEST_TAG_STRING="${trigger#$"devicetest"}"
515                 ;;
516             *"perf"*)
517                 # On parsing error, ${trigger} stays empty.
518                 comment="${GERRIT_EVENT_COMMENT_TEXT}"
519                 # As "perftest" can be followed by something, we substitute it.
520                 comment="${comment/perftest-2n/perftest}"
521                 comment="${comment/perftest-3n/perftest}"
522                 comment="${comment/perftest-hsw/perftest}"
523                 comment="${comment/perftest-skx/perftest}"
524                 comment="${comment/perftest-dnv/perftest}"
525                 comment="${comment/perftest-tsh/perftest}"
526                 tag_string="$(echo "${comment}" \
527                     | grep -oE '(perftest$|perftest[[:space:]].+$)' || true)"
528                 # Set test tags as string.
529                 TEST_TAG_STRING="${tag_string#$"perftest"}"
530                 ;;
531             *)
532                 die "Unknown specification: ${TEST_CODE}"
533         esac
534     fi
535 }
536
537
538 function installed () {
539
540     # Check if the given utility is installed. Fail if not installed.
541     #
542     # Duplicate of common.sh function, as this file is also used standalone.
543     #
544     # Arguments:
545     # - ${1} - Utility to check.
546     # Returns:
547     # - 0 - If command is installed.
548     # - 1 - If command is not installed.
549
550     set -exuo pipefail
551
552     command -v "${1}"
553 }
554
555
556 function remove_topo () {
557
558     # Remove the argument from list of available topologies.
559     #
560     # Just a de-duplicated block of code
561     #
562     # Argument:
563     # - ${1} - The topology item to remove. Required.
564     # Variable read and re-written:
565     # - TOPOLOGIES - Array of paths to topologies, with failed cleanups removed.
566
567     set -exuo pipefail
568
569     warn "Testbed ${topo} seems unsuitable, removing from the list."
570
571     # Build new topology array.
572     #   TOPOLOGIES=("${TOPOLOGIES[@]/$topo}")
573     # does not really work, see:
574     # https://stackoverflow.com/questions/16860877/remove-an-element-from-a-bash-array
575
576     new_topologies=()
577     for item in "${TOPOLOGIES[@]}"; do
578         if [[ "${item}" != "${1}" ]]; then
579             new_topologies+=("${item}")
580         fi
581     done
582     TOPOLOGIES=("${new_topologies[@]}")
583 }
584
585
586 function reserve_and_cleanup_testbed () {
587
588     # Reserve physical testbed, perform cleanup, register trap to unreserve.
589     # When cleanup fails, remove from topologies and keep retrying
590     # until all topologies are removed.
591     #
592     # Variables read:
593     # - TOPOLOGIES - Array of paths to topology yaml to attempt reservation on.
594     # - PYTHON_SCRIPTS_DIR - Path to directory holding the reservation script.
595     # - BUILD_TAG - Any string suitable as filename, identifying
596     #   test run executing this function. May be unset.
597     # - BUILD_URL - Any string suitable as URL, identifying
598     #   test run executing this function. May be unset.
599     # Variables set:
600     # - TOPOLOGIES - Array of paths to topologies, with failed cleanups removed.
601     # - WORKING_TOPOLOGY - Path to topology yaml file of the reserved testbed.
602     # Functions called:
603     # - die - Print to stderr and exit.
604     # Traps registered:
605     # - EXIT - Calls cancel_all for ${WORKING_TOPOLOGY}.
606
607     set -exuo pipefail
608
609     while true; do
610         for topo in "${TOPOLOGIES[@]}"; do
611             set +e
612             scrpt="${PYTHON_SCRIPTS_DIR}/topo_reservation.py"
613             opts=("-t" "${topo}" "-r" "${BUILD_TAG:-Unknown}")
614             opts+=("-u" "${BUILD_URL:-Unknown}")
615             python "${scrpt}" "${opts[@]}"
616             result="$?"
617             set -e
618             if [[ "${result}" == "0" ]]; then
619                 # Trap unreservation before cleanup check,
620                 # so multiple jobs showing failed cleanup improve chances
621                 # of humans to notice and fix.
622                 WORKING_TOPOLOGY="${topo}"
623                 echo "Reserved: ${WORKING_TOPOLOGY}"
624                 trap "untrap_and_unreserve_testbed" EXIT || {
625                     message="TRAP ATTEMPT AND UNRESERVE FAILED, FIX MANUALLY."
626                     untrap_and_unreserve_testbed "${message}" || {
627                         die "Teardown should have died, not failed."
628                     }
629                     die "Trap attempt failed, unreserve succeeded. Aborting."
630                 }
631                 # Cleanup check.
632                 set +e
633                 cleanup_topo
634                 result="$?"
635                 set -e
636                 if [[ "${result}" == "0" ]]; then
637                     break
638                 fi
639                 warn "Testbed cleanup failed: ${topo}"
640                 untrap_and_unreserve_testbed "Fail of unreserve after cleanup."
641                 # WORKING_TOPOLOGY is now empty again.
642                 remove_topo "${topo}"
643             elif [[ "${result}" != "2" ]]; then
644                 # 1 or unexpected return code, testbed is probably unusable.
645                 remove_topo "${topo}"
646             fi
647             # Else testbed is accessible but currently reserved, moving on.
648         done
649
650         if [[ -n "${WORKING_TOPOLOGY-}" ]]; then
651             # Exit the infinite while loop if we made a reservation.
652             warn "Reservation and cleanup successful."
653             break
654         fi
655
656         if [[ "${#TOPOLOGIES[@]}" == "0" ]]; then
657             die "Run out of operational testbeds!"
658         fi
659
660         # Wait ~3minutes before next try.
661         sleep_time="$[ ( ${RANDOM} % 20 ) + 180 ]s" || {
662             die "Sleep time calculation failed."
663         }
664         echo "Sleeping ${sleep_time}"
665         sleep "${sleep_time}" || die "Sleep failed."
666     done
667 }
668
669
670 function run_pybot () {
671
672     # Run pybot with options based on input variables. Create output_info.xml
673     #
674     # Variables read:
675     # - CSIT_DIR - Path to existing root of local CSIT git repository.
676     # - ARCHIVE_DIR - Path to store robot result files in.
677     # - PYBOT_ARGS, EXPANDED_TAGS - See compose_pybot_arguments.sh
678     # - GENERATED_DIR - Tests are assumed to be generated under there.
679     # Variables set:
680     # - PYBOT_EXIT_STATUS - Exit status of most recent pybot invocation.
681     # Functions called:
682     # - die - Print to stderr and exit.
683
684     set -exuo pipefail
685
686     all_options=("--outputdir" "${ARCHIVE_DIR}" "${PYBOT_ARGS[@]}")
687     all_options+=("--noncritical" "EXPECTED_FAILING")
688     all_options+=("${EXPANDED_TAGS[@]}")
689
690     pushd "${CSIT_DIR}" || die "Change directory operation failed."
691     set +e
692     pybot "${all_options[@]}" "${GENERATED_DIR}/tests/"
693     PYBOT_EXIT_STATUS="$?"
694     set -e
695
696     # Generate INFO level output_info.xml for post-processing.
697     all_options=("--loglevel" "INFO")
698     all_options+=("--log" "none")
699     all_options+=("--report" "none")
700     all_options+=("--output" "${ARCHIVE_DIR}/output_info.xml")
701     all_options+=("${ARCHIVE_DIR}/output.xml")
702     rebot "${all_options[@]}" || true
703     popd || die "Change directory operation failed."
704 }
705
706
707 function select_arch_os () {
708
709     # Set variables affected by local CPU architecture and operating system.
710     #
711     # Variables set:
712     # - VPP_VER_FILE - Name of file in CSIT dir containing vpp stable version.
713     # - IMAGE_VER_FILE - Name of file in CSIT dir containing the image name.
714     # - PKG_SUFFIX - Suffix of OS package file name, "rpm" or "deb."
715
716     set -exuo pipefail
717
718     os_id=$(grep '^ID=' /etc/os-release | cut -f2- -d= | sed -e 's/\"//g') || {
719         die "Get OS release failed."
720     }
721
722     case "${os_id}" in
723         "ubuntu"*)
724             IMAGE_VER_FILE="VPP_DEVICE_IMAGE_UBUNTU"
725             VPP_VER_FILE="VPP_STABLE_VER_UBUNTU_BIONIC"
726             PKG_SUFFIX="deb"
727             ;;
728         "centos"*)
729             IMAGE_VER_FILE="VPP_DEVICE_IMAGE_CENTOS"
730             VPP_VER_FILE="VPP_STABLE_VER_CENTOS"
731             PKG_SUFFIX="rpm"
732             ;;
733         *)
734             die "Unable to identify distro or os from ${os_id}"
735             ;;
736     esac
737
738     arch=$(uname -m) || {
739         die "Get CPU architecture failed."
740     }
741
742     case "${arch}" in
743         "aarch64")
744             IMAGE_VER_FILE="${IMAGE_VER_FILE}_ARM"
745             ;;
746         *)
747             ;;
748     esac
749 }
750
751
752 function select_tags () {
753
754     # Variables read:
755     # - WORKING_TOPOLOGY - Path to topology yaml file of the reserved testbed.
756     # - TEST_CODE - String affecting test selection, usually jenkins job name.
757     # - TEST_TAG_STRING - String selecting tags, from gerrit comment.
758     #   Can be unset.
759     # - TOPOLOGIES_DIR - Path to existing directory with available tpologies.
760     # - BASH_FUNCTION_DIR - Directory with input files to process.
761     # Variables set:
762     # - TAGS - Array of processed tag boolean expressions.
763
764     set -exuo pipefail
765
766     # NIC SELECTION
767     start_pattern='^  TG:'
768     end_pattern='^ \? \?[A-Za-z0-9]\+:'
769     # Remove the TG section from topology file
770     sed_command="/${start_pattern}/,/${end_pattern}/d"
771     # All topologies DUT NICs
772     available=$(sed "${sed_command}" "${TOPOLOGIES_DIR}"/* \
773                 | grep -hoP "model: \K.*" | sort -u)
774     # Selected topology DUT NICs
775     reserved=$(sed "${sed_command}" "${WORKING_TOPOLOGY}" \
776                | grep -hoP "model: \K.*" | sort -u)
777     # All topologies DUT NICs - Selected topology DUT NICs
778     exclude_nics=($(comm -13 <(echo "${reserved}") <(echo "${available}"))) || {
779         die "Computation of excluded NICs failed."
780     }
781
782     # Select default NIC tag.
783     case "${TEST_CODE}" in
784         *"3n-dnv"* | *"2n-dnv"*)
785             default_nic="nic_intel-x553"
786             ;;
787         *"3n-tsh"*)
788             default_nic="nic_intel-x520-da2"
789             ;;
790         *)
791             default_nic="nic_intel-x710"
792             ;;
793     esac
794
795     sed_nic_sub_cmd="sed s/\${default_nic}/${default_nic}/"
796     # Tag file directory shorthand.
797     tfd="${BASH_FUNCTION_DIR}"
798     case "${TEST_CODE}" in
799         # Select specific performance tests based on jenkins job type variable.
800         *"ndrpdr-weekly"* )
801             readarray -t test_tag_array < "${tfd}/mlr-weekly.txt" || die
802             ;;
803         *"mrr-daily"* )
804             readarray -t test_tag_array <<< $(${sed_nic_sub_cmd} \
805                 ${tfd}/mrr-daily-${FLAVOR}.txt) || die
806             ;;
807         *"mrr-weekly"* )
808             readarray -t test_tag_array < "${tfd}/mrr-weekly.txt" || die
809             ;;
810         * )
811             if [[ -z "${TEST_TAG_STRING-}" ]]; then
812                 # If nothing is specified, we will run pre-selected tests by
813                 # following tags.
814                 test_tag_array=("mrrAND${default_nic}AND1cAND64bANDip4base"
815                                 "mrrAND${default_nic}AND1cAND78bANDip6base"
816                                 "mrrAND${default_nic}AND1cAND64bANDl2bdbase"
817                                 "mrrAND${default_nic}AND1cAND64bANDl2xcbase"
818                                 "!dot1q" "!drv_avf")
819             else
820                 # If trigger contains tags, split them into array.
821                 test_tag_array=(${TEST_TAG_STRING//:/ })
822             fi
823             ;;
824     esac
825
826     # Blacklisting certain tags per topology.
827     #
828     # Reasons for blacklisting:
829     # - ipsechw - Blacklisted on testbeds without crypto hardware accelerator.
830     # TODO: Add missing reasons here (if general) or where used (if specific).
831     case "${TEST_CODE}" in
832         *"2n-skx"*)
833             test_tag_array+=("!ipsechw")
834             ;;
835         *"3n-skx"*)
836             test_tag_array+=("!ipsechw")
837             # Not enough nic_intel-xxv710 to support double link tests.
838             test_tag_array+=("!3_node_double_link_topoANDnic_intel-xxv710")
839             ;;
840         *"2n-dnv"*)
841             test_tag_array+=("!ipsechw")
842             test_tag_array+=("!memif")
843             test_tag_array+=("!srv6_proxy")
844             test_tag_array+=("!vhost")
845             test_tag_array+=("!vts")
846             test_tag_array+=("!drv_avf")
847             ;;
848         *"3n-dnv"*)
849             test_tag_array+=("!memif")
850             test_tag_array+=("!srv6_proxy")
851             test_tag_array+=("!vhost")
852             test_tag_array+=("!vts")
853             test_tag_array+=("!drv_avf")
854             ;;
855         *"3n-tsh"*)
856             # 3n-tsh only has x520 NICs which don't work with AVF
857             test_tag_array+=("!drv_avf")
858             test_tag_array+=("!ipsechw")
859             ;;
860         *"3n-hsw"*)
861             # TODO: Introduce NOIOMMU version of AVF tests.
862             # TODO: Make (both) AVF tests work on Haswell,
863             # or document why (some of) it is not possible.
864             # https://github.com/FDio/vpp/blob/master/src/plugins/avf/README.md
865             test_tag_array+=("!drv_avf")
866             # All cards have access to QAT. But only one card (xl710)
867             # resides in same NUMA as QAT. Other cards must go over QPI
868             # which we do not want to even run.
869             test_tag_array+=("!ipsechwNOTnic_intel-xl710")
870             ;;
871         *)
872             # Default to 3n-hsw due to compatibility.
873             test_tag_array+=("!drv_avf")
874             test_tag_array+=("!ipsechwNOTnic_intel-xl710")
875             ;;
876     esac
877
878     # We will add excluded NICs.
879     test_tag_array+=("${exclude_nics[@]/#/!NIC_}")
880
881     TAGS=()
882
883     # We will prefix with perftest to prevent running other tests
884     # (e.g. Functional).
885     prefix="perftestAND"
886     set +x
887     if [[ "${TEST_CODE}" == "vpp-"* ]]; then
888         # Automatic prefixing for VPP jobs to limit the NIC used and
889         # traffic evaluation to MRR.
890         if [[ "${TEST_TAG_STRING-}" == *"nic_"* ]]; then
891             prefix="${prefix}mrrAND"
892         else
893             prefix="${prefix}mrrAND${default_nic}AND"
894         fi
895     fi
896     for tag in "${test_tag_array[@]}"; do
897         if [[ "${tag}" == "!"* ]]; then
898             # Exclude tags are not prefixed.
899             TAGS+=("${tag}")
900         elif [[ "${tag}" != "" && "${tag}" != "#"* ]]; then
901             # Empty and comment lines are skipped.
902             # Other lines are normal tags, they are to be prefixed.
903             TAGS+=("${prefix}${tag}")
904         fi
905     done
906     set -x
907 }
908
909
910 function select_topology () {
911
912     # Variables read:
913     # - NODENESS - Node multiplicity of testbed, either "2n" or "3n".
914     # - FLAVOR - Node flavor string, currently either "hsw" or "skx".
915     # - CSIT_DIR - Path to existing root of local CSIT git repository.
916     # - TOPOLOGIES_DIR - Path to existing directory with available topologies.
917     # Variables set:
918     # - TOPOLOGIES - Array of paths to suitable topology yaml files.
919     # - TOPOLOGIES_TAGS - Tag expression selecting tests for the topology.
920     # Functions called:
921     # - die - Print to stderr and exit.
922
923     set -exuo pipefail
924
925     case_text="${NODENESS}_${FLAVOR}"
926     case "${case_text}" in
927         # TODO: Move tags to "# Blacklisting certain tags per topology" section.
928         # TODO: Double link availability depends on NIC used.
929         "1n_vbox")
930             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*vpp_device*.template )
931             TOPOLOGIES_TAGS="2_node_single_link_topo"
932             ;;
933         "1n_skx" | "1n_tx2")
934             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*vpp_device*.template )
935             TOPOLOGIES_TAGS="2_node_single_link_topo"
936             ;;
937         "2n_skx")
938             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*2n_skx*.yaml )
939             TOPOLOGIES_TAGS="2_node_*_link_topo"
940             ;;
941         "3n_skx")
942             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*3n_skx*.yaml )
943             TOPOLOGIES_TAGS="3_node_*_link_topo"
944             ;;
945         "2n_dnv")
946             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*2n_dnv*.yaml )
947             TOPOLOGIES_TAGS="2_node_single_link_topo"
948             ;;
949         "3n_dnv")
950             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*3n_dnv*.yaml )
951             TOPOLOGIES_TAGS="3_node_single_link_topo"
952             ;;
953         "3n_hsw")
954             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*3n_hsw*.yaml )
955             TOPOLOGIES_TAGS="3_node_single_link_topo"
956             ;;
957         "3n_tsh")
958             TOPOLOGIES=( "${TOPOLOGIES_DIR}"/*3n_tsh*.yaml )
959             TOPOLOGIES_TAGS="3_node_single_link_topo"
960             ;;
961         *)
962             # No falling back to 3n_hsw default, that should have been done
963             # by the function which has set NODENESS and FLAVOR.
964             die "Unknown specification: ${case_text}"
965     esac
966
967     if [[ -z "${TOPOLOGIES-}" ]]; then
968         die "No applicable topology found!"
969     fi
970 }
971
972
973 function select_vpp_device_tags () {
974
975     # Variables read:
976     # - TEST_CODE - String affecting test selection, usually jenkins job name.
977     # - TEST_TAG_STRING - String selecting tags, from gerrit comment.
978     #   Can be unset.
979     # Variables set:
980     # - TAGS - Array of processed tag boolean expressions.
981
982     set -exuo pipefail
983
984     case "${TEST_CODE}" in
985         # Select specific device tests based on jenkins job type variable.
986         * )
987             if [[ -z "${TEST_TAG_STRING-}" ]]; then
988                 # If nothing is specified, we will run pre-selected tests by
989                 # following tags. Items of array will be concatenated by OR
990                 # in Robot Framework.
991                 test_tag_array=()
992             else
993                 # If trigger contains tags, split them into array.
994                 test_tag_array=(${TEST_TAG_STRING//:/ })
995             fi
996             ;;
997     esac
998
999     # Blacklisting certain tags per topology.
1000     #
1001     # Reasons for blacklisting:
1002     # - avf - AVF is not possible to run on enic driver of VirtualBox.
1003     # - vhost - VirtualBox does not support nesting virtualization on Intel CPU.
1004     case "${TEST_CODE}" in
1005         *"1n-vbox"*)
1006             test_tag_array+=("!avf")
1007             test_tag_array+=("!vhost")
1008             ;;
1009         *)
1010             ;;
1011     esac
1012
1013     TAGS=()
1014
1015     # We will prefix with devicetest to prevent running other tests
1016     # (e.g. Functional).
1017     prefix="devicetestAND"
1018     if [[ "${TEST_CODE}" == "vpp-"* ]]; then
1019         # Automatic prefixing for VPP jobs to limit testing.
1020         prefix="${prefix}"
1021     fi
1022     for tag in "${test_tag_array[@]}"; do
1023         if [[ ${tag} == "!"* ]]; then
1024             # Exclude tags are not prefixed.
1025             TAGS+=("${tag}")
1026         else
1027             TAGS+=("${prefix}${tag}")
1028         fi
1029     done
1030 }
1031
1032 function untrap_and_unreserve_testbed () {
1033
1034     # Use this as a trap function to ensure testbed does not remain reserved.
1035     # Perhaps call directly before script exit, to free testbed for other jobs.
1036     # This function is smart enough to avoid multiple unreservations (so safe).
1037     # Topo cleanup is executed (call it best practice), ignoring failures.
1038     #
1039     # Hardcoded values:
1040     # - default message to die with if testbed might remain reserved.
1041     # Arguments:
1042     # - ${1} - Message to die with if unreservation fails. Default hardcoded.
1043     # Variables read (by inner function):
1044     # - WORKING_TOPOLOGY - Path to topology yaml file of the reserved testbed.
1045     # - PYTHON_SCRIPTS_DIR - Path to directory holding Python scripts.
1046     # Variables written:
1047     # - WORKING_TOPOLOGY - Set to empty string on successful unreservation.
1048     # Trap unregistered:
1049     # - EXIT - Failure to untrap is reported, but ignored otherwise.
1050     # Functions called:
1051     # - die - Print to stderr and exit.
1052
1053     set -xo pipefail
1054     set +eu  # We do not want to exit early in a "teardown" function.
1055     trap - EXIT || echo "Trap deactivation failed, continuing anyway."
1056     wt="${WORKING_TOPOLOGY}"  # Just to avoid too long lines.
1057     if [[ -z "${wt-}" ]]; then
1058         set -eu
1059         warn "Testbed looks unreserved already. Trap removal failed before?"
1060     else
1061         cleanup_topo || true
1062         python "${PYTHON_SCRIPTS_DIR}/topo_reservation.py" -c -t "${wt}" || {
1063             die "${1:-FAILED TO UNRESERVE, FIX MANUALLY.}" 2
1064         }
1065         WORKING_TOPOLOGY=""
1066         set -eu
1067     fi
1068 }
1069
1070
1071 function warn () {
1072
1073     # Print the message to standard error.
1074     #
1075     # Arguments:
1076     # - ${@} - The text of the message.
1077
1078     set -exuo pipefail
1079
1080     echo "$@" >&2
1081 }