CSIT-891: Add data sources for 1801 report
[csit.git] / resources / tools / presentation / utils.py
index cf3005c..7037404 100644 (file)
@@ -14,6 +14,8 @@
 """General purpose utilities.
 """
 
+import numpy as np
+
 from os import walk
 from os.path import join
 from math import sqrt
@@ -60,6 +62,29 @@ def relative_change(nr1, nr2):
     return float(((nr2 - nr1) / nr1) * 100)
 
 
+def remove_outliers(input_data, outlier_const):
+    """
+
+    :param input_data: Data from which the outliers will be removed.
+    :param outlier_const: Outlier constant.
+    :type input_data: list
+    :type outlier_const: float
+    :returns: The input list without outliers.
+    :rtype: list
+    """
+
+    data = np.array(input_data)
+    upper_quartile = np.percentile(data, 75)
+    lower_quartile = np.percentile(data, 25)
+    iqr = (upper_quartile - lower_quartile) * outlier_const
+    quartile_set = (lower_quartile - iqr, upper_quartile + iqr)
+    result_lst = list()
+    for y in data.tolist():
+        if quartile_set[0] <= y <= quartile_set[1]:
+            result_lst.append(y)
+    return result_lst
+
+
 def get_files(path, extension=None, full_path=True):
     """Generates the list of files to process.