hai 6 meses · 84e7847058
--- a/src/preprocessing/synthetic_data.py
+++ b/src/preprocessing/synthetic_data.py
@@ -5,8 +5,9 @@ from scipy.integrate import odeint
 
															 from src.plotter import Plotter
														
 
															+
														
 
															 class SyntheticDeseaseData:
														
 
															-    def __init__(self, simulation_time:int, time_points:int, plotter:Plotter):
														
 
															+    def __init__(self, simulation_time: int, time_points: int, plotter: Plotter):
														
 
															         """This class is the parent class for every class, that is supposed to generate synthetic data.
														
 
															         Args:
														
@@ -29,7 +30,7 @@ class SyntheticDeseaseData:
 
															         """
														
 
															         self.generated = True
														
 
															-    def plot(self, labels: tuple, title:str, file_name:str):
														
 
															+    def plot(self, labels: tuple, title: str, file_name: str, leave_out_indices):
														
 
															         """Plot the data which was generated.
														
 
															         Args:
														
@@ -37,13 +38,20 @@ class SyntheticDeseaseData:
 
															             title (str): The name of the plot.
														
 
															         """
														
 
															         assert len(labels) == len(self.data), 'The number labels needs to be the same as the number of plots.'
														
 
															+        groups = []
														
 
															+        used_labels = []
														
 
															+        for i, group in enumerate(self.data):
														
 
															+            if not i in leave_out_indices:
														
 
															+                groups.append(group)
														
 
															+                used_labels.append(labels[i])
														
 
															         if self.generated:
														
 
															-            self.plotter.plot(self.t, self.data, labels, file_name, title, (6, 6), xlabel='time / days', ylabel='amount of people')
														
 
															-        else: 
														
 
															+            self.plotter.plot(self.t, groups, used_labels, file_name, title, (6, 6), xlabel='time / days', ylabel='amount of people')
														
 
															+        else:
														
 
															             print('Data has to be generated before plotting!')
														
 
															+
														
 
															 class SIR(SyntheticDeseaseData):
														
 
															-    def __init__(self, plotter:Plotter, N=59e6, I_0=1, R_0=0, simulation_time=500, time_points=100, alpha=0.191, beta=0.05) -> None:
														
 
															+    def __init__(self, plotter: Plotter, N=59e6, I_0=1, R_0=0, simulation_time=500, time_points=100, alpha=0.191, beta=0.05) -> None:
														
 
															         """This class is able to generate synthetic data for the SIR model.
														
 
															         Args:
														
@@ -78,8 +86,8 @@ class SIR(SyntheticDeseaseData):
 
															             tuple: Change amount for each group.
														
 
															         """
														
 
															         S, I, _ = y
														
 
															-        dSdt = -self.beta * ((S * I) / self.N) # -self.beta * S * I
														
 
															-        dIdt = self.beta * ((S * I) / self.N) - self.alpha * I # self.beta * S * I - self.alpha * I
														
 
															+        dSdt = -self.beta * ((S * I) / self.N)  # -self.beta * S * I
														
 
															+        dIdt = self.beta * ((S * I) / self.N) - self.alpha * I  # self.beta * S * I - self.alpha * I
														
 
															         dRdt = self.alpha * I
														
 
															         return dSdt, dIdt, dRdt
														
@@ -90,21 +98,22 @@ class SIR(SyntheticDeseaseData):
 
															         self.data = odeint(self.differential_eq, y_0, self.t, args=(self.alpha, self.beta)).T
														
 
															         super().generate()
														
 
															-    def plot(self, title='', file_name='SIR_plot'):
														
 
															+    def plot(self, title='', file_name='SIR_plot', leave_out_indices=[]):
														
 
															         """Plot the data which was generated.
														
 
															         """
														
 
															-        super().plot(('Susceptible', 'Infectious', 'Removed'), title=title, file_name=file_name)
														
 
															+        super().plot(('Susceptible', 'Infectious', 'Removed'), title=title, file_name=file_name, leave_out_indices=leave_out_indices)
														
 
															     def save(self, name=''):
														
 
															         if self.generated:
														
 
															-            COVID_Data = np.asarray([self.t, *self.data]) 
														
 
															+            COVID_Data = np.asarray([self.t, *self.data])
														
 
															             np.savetxt('datasets/SIR_data.csv', COVID_Data, delimiter=",")
														
 
															-        else: 
														
 
															+        else:
														
 
															             print('Data has to be generated before plotting!')
														
 
															+
														
 
															 class I(SyntheticDeseaseData):
														
 
															-    def __init__(self, plotter:Plotter, N:int, C:int, I_0=1, time_points=100, alpha=1/3) -> None:
														
 
															+    def __init__(self, plotter: Plotter, N: int, C: int, I_0=1, time_points=100, alpha=1 / 3) -> None:
														
 
															         """This class is able to generate synthetic data of the SI groups for the reduced SIR model. This is done by utiling the SIR model.
														
 
															         Args:
														
@@ -119,7 +128,7 @@ class I(SyntheticDeseaseData):
 
															         self.N = N
														
 
															         self.C = C
														
 
															         self.I_0 = I_0
														
 
															- 
														
 
															+
														
 
															         self.alpha = alpha
														
 
															         self.t = np.linspace(0, 1, time_points)
														
@@ -129,14 +138,12 @@ class I(SyntheticDeseaseData):
 
															         self.data = None
														
 
															         self.generated = False
														
 
															         self.plotter = plotter
														
 
															-        
														
 
															+
														
 
															     def R_t(self, t):
														
 
															         descaled_t = t * self.t_f
														
 
															         # if descaled_t < threshold1:
														
 
															         return -np.tanh(descaled_t * 0.05 - 2) * 0.4 + 1.35
														
 
															-
														
 
															-            
														
 
															     def differential_eq(self, I, t):
														
 
															         """In this function implements the differential equation of the SIR model will be implemented.
														
@@ -153,10 +160,10 @@ class I(SyntheticDeseaseData):
 
															     def generate(self):
														
 
															         """This funtion generates the data for this configuration of the SIR model.
														
 
															         """
														
 
															-        self.data = odeint(self.differential_eq, self.I_0/self.C, self.t).T
														
 
															+        self.data = odeint(self.differential_eq, self.I_0 / self.C, self.t).T
														
 
															         self.data = self.data[0] * self.C
														
 
															         self.t_counter = 0
														
 
															-        self.generated =True
														
 
															+        self.generated = True
														
 
															     def plot(self, title='', file_name=''):
														
 
															         """Plot the data which was generated.
														
@@ -167,21 +174,20 @@ class I(SyntheticDeseaseData):
 
															             for time in self.t:
														
 
															                 self.reproduction_value.append(self.R_t(time))
														
 
															             self.plotter.plot(t, [np.array(self.reproduction_value)], [r'$\mathcal{R}_t$'], file_name + '_r_t', title + r' $\mathcal{R}_t$', (6, 6), xlabel='time / days')
														
 
															-        else: 
														
 
															+        else:
														
 
															             print('Data has to be generated before plotting!')
														
 
															     def save(self, name=''):
														
 
															         if self.generated:
														
 
															-            COVID_Data = np.asarray([self.t_save, self.data]) 
														
 
															+            COVID_Data = np.asarray([self.t_save, self.data])
														
 
															             np.savetxt('datasets/I_data.csv', COVID_Data, delimiter=",")
														
 
															-        else: 
														
 
															+        else:
														
 
															             print('Data has to be generated before plotting!')
														
 
															-        
														
 
															 class SIDR(SyntheticDeseaseData):
														
 
															-    def __init__(self, plotter:Plotter, N=59e6, I_0=1, D_0=0, R_0=0, simulation_time=500, time_points=100, alpha=0.191, beta=0.05, gamma=0.0294) -> None:
														
 
															+    def __init__(self, plotter: Plotter, N=59e6, I_0=1, D_0=0, R_0=0, simulation_time=500, time_points=100, alpha=0.191, beta=0.05, gamma=0.0294) -> None:
														
 
															         """This class is able to generate synthetic data for the SIDR model.
														
 
															         Args:
														
@@ -207,7 +213,7 @@ class SIDR(SyntheticDeseaseData):
 
															         self.gamma = gamma
														
 
															         super().__init__(simulation_time, time_points, plotter)
														
 
															-    
														
 
															+
														
 
															     def differential_eq(self, y, t, alpha, beta, gamma):
														
 
															         """In this function implements the differential equation of the SIDR model will be implemented.
														
@@ -223,7 +229,7 @@ class SIDR(SyntheticDeseaseData):
 
															         """
														
 
															         S, I, D, R = y
														
 
															         dSdt = - (self.alpha / self.N) * S * I
														
 
															-        dIdt = (self.alpha / self.N) * S * I - self.beta * I - self.gamma * I 
														
 
															+        dIdt = (self.alpha / self.N) * S * I - self.beta * I - self.gamma * I
														
 
															         dDdt = self.gamma * I
														
 
															         dRdt = self.beta * I
														
 
															         return dSdt, dIdt, dDdt, dRdt
														
@@ -242,8 +248,8 @@ class SIDR(SyntheticDeseaseData):
 
															     def save(self, name=''):
														
 
															         if self.generated:
														
 
															-            COVID_Data = np.asarray([self.t, *self.data]) 
														
 
															+            COVID_Data = np.asarray([self.t, *self.data])
														
 
															             np.savetxt('datasets/SIDR_data.csv', COVID_Data, delimiter=",")
														
 
															-        else: 
														
 
															+        else:
														
 
															             print('Data has to be generated before plotting!')
														
--- a/src/preprocessing/transform_data.py
+++ b/src/preprocessing/transform_data.py
@@ -1,72 +1,124 @@
 
															 import numpy as np
														
 
															 import pandas as pd
														
 
															+from datetime import date, timedelta
														
 
															 from src.plotter import Plotter
														
 
															-state_lookup = {'Schleswig Holstein' : (1, 2897000),
														
 
															-                'Hamburg' : (2, 1841000), 
														
 
															-                'Niedersachsen' : (3, 7982000), 
														
 
															-                'Bremen' : (4, 569352),
														
 
															-                'Nordrhein-Westfalen' : (5, 17930000),
														
 
															-                'Hessen' : (6, 6266000),
														
 
															-                'Rheinland-Pfalz' : (7, 4085000),
														
 
															-                'Baden-Württemberg' : (8, 11070000),
														
 
															-                'Bayern' : (9, 13080000),
														
 
															-                'Saarland' : (10, 990509),
														
 
															-                'Berlin' : (11, 3645000),
														
 
															-                'Brandenburg' : (12, 2641000),
														
 
															-                'Mecklenburg-Vorpommern' : (13, 1610000),
														
 
															-                'Sachsen' : (14, 4078000),
														
 
															-                'Sachsen-Anhalt' : (15, 2208000),
														
 
															-                'Thüringen' : (16, 2143000)}
														
 
															-
														
 
															-def transform_data(plotter:Plotter, alpha=1/14, state_name='Germany', time_range=1200, plot_name='', plot_title='', sample_rate=1, model='SIR', plot_size=(12,6), yscale_log=False, plot_legend=True):
														
 
															+state_lookup = {'Schleswig Holstein': (1, 2897000),
														
 
															+                'Hamburg': (2, 1841000),
														
 
															+                'Niedersachsen': (3, 7982000),
														
 
															+                'Bremen': (4, 569352),
														
 
															+                'Nordrhein-Westfalen': (5, 17930000),
														
 
															+                'Hessen': (6, 6266000),
														
 
															+                'Rheinland-Pfalz': (7, 4085000),
														
 
															+                'Baden-Württemberg': (8, 11070000),
														
 
															+                'Bayern': (9, 13080000),
														
 
															+                'Saarland': (10, 990509),
														
 
															+                'Berlin': (11, 3645000),
														
 
															+                'Brandenburg': (12, 2641000),
														
 
															+                'Mecklenburg-Vorpommern': (13, 1610000),
														
 
															+                'Sachsen': (14, 4078000),
														
 
															+                'Sachsen-Anhalt': (15, 2208000),
														
 
															+                'Thüringen': (16, 2143000)}
														
 
															+
														
 
															+
														
 
															+def daterange(start_date: date, end_date: date):
														
 
															+    days = int((end_date - start_date).days)
														
 
															+    for n in range(days):
														
 
															+        yield start_date + timedelta(n)
														
 
															+
														
 
															+
														
 
															+def transform_jh_germany_data(plotter: Plotter,
														
 
															+                              time_range=50,
														
 
															+                              sample_rate=1,
														
 
															+                              model='SIR'):
														
 
															+    N = 83100000
														
 
															+    state_name = 'Germany'
														
 
															+    infections = np.zeros(time_range)
														
 
															+    deaths = np.zeros(time_range)
														
 
															+    recoveries = np.zeros(time_range)
														
 
															+
														
 
															+    # extract data
														
 
															+    data_directory = 'datasets/COVID-19/csse_covid_19_data/csse_covid_19_daily_reports'
														
 
															+    start_date = date(2020, 1, 31)
														
 
															+    end_date = date(2020, 3, 20)
														
 
															+    for i, single_date in enumerate(daterange(start_date, end_date)):
														
 
															+        file_date = single_date.strftime("%m-%d-%Y")
														
 
															+        date_df = pd.read_csv(data_directory + "/" + file_date + ".csv")
														
 
															+        date_df = date_df.loc[date_df['Country/Region'] == state_name]
														
 
															+
														
 
															+        infections[i] = date_df['Confirmed'].fillna(0).astype(int)
														
 
															+        deaths[i] = date_df['Deaths'].fillna(0).astype(int)
														
 
															+        recoveries[i] = date_df['Recovered'].fillna(0).astype(int)
														
 
															+
														
 
															+    S, I, R = np.zeros(infections.shape[0]), np.zeros(
														
 
															+        infections.shape[0]), np.zeros(infections.shape[0])
														
 
															+    S[0] = N - infections[0]
														
 
															+    I[0] = infections[0]
														
 
															+    R[0] = 0
														
 
															+
														
 
															+    for day in range(1, time_range):
														
 
															+        S[day] = S[day - 1] - infections[day]
														
 
															+        I[day] = I[day - 1] + infections[day] - deaths[day] - recoveries[day]
														
 
															+        R[day] = R[day - 1] + deaths[day] + recoveries[day]
														
 
															+        if I[day] < 0:
														
 
															+            I[day] = 0
														
 
															+
														
 
															+    t = np.arange(0, time_range, 1)
														
 
															+
														
 
															+    plotter.plot(t, [I, R], ["I", "R"], "JH_data", "JH Data", (6, 6))
														
 
															+
														
 
															+    groups = [S, I, R]
														
 
															+    COVID_Data = np.asarray([t[0::sample_rate]] +
														
 
															+                            [group[0::sample_rate] for group in groups])
														
 
															+
														
 
															+    np.savetxt(
														
 
															+        f"datasets/{model}_JH_{state_name.replace(' ', '_').replace('-', '_').replace('ü','ue')}_{sample_rate}.csv", COVID_Data, delimiter=",")
														
 
															+
														
 
															+
														
 
															+def transform_data(plotter: Plotter, alpha=1 / 14, state_name='Germany', time_range=1200, sample_rate=1, model='SIR'):
														
 
															     """Function to generate the SIR split from the data in the COVID-19-Todesfaelle_in_Deutschland dataset.
														
 
															     Args:
														
 
															         plotter (Plotter): Plotter object to plot dataset curves.
														
 
															         dataset_path (str, optional): Path to the dataset directory. Defaults to 'datasets/COVID-19-Todesfaelle_in_Deutschland/'.
														
 
															-        plot_name (str, optional): Name of the plot file. Defaults to ''.
														
 
															-        plot_title (str, optional): Title of the plot. Defaults to ''.
														
 
															         sample_rate (int, optional): Sample rate used to sample the timepoints. Defaults to 1.
														
 
															         exclude (list, optional): List of groups that are to excluded from the plot. Defaults to [].
														
 
															-        plot_size (tuple, optional): Size of the plot in (x, y) format. Defaults to (12,6).
														
 
															-        yscale_log (bool, optional): Controls if the y axis of the plot will be scaled in log scale. Defaults to False.
														
 
															-        plot_legend (bool, optional): Controls if the legend is to be plotted. Defaults to True.
														
 
															     """
														
 
															     # read the data
														
 
															-
														
 
															     infections = np.zeros(time_range)
														
 
															     deaths = np.zeros(time_range)
														
 
															     recoveries = np.zeros(time_range)
														
 
															     if state_name == 'Germany':
														
 
															-        df = pd.read_csv('datasets/COVID-19-Todesfaelle_in_Deutschland/COVID-19-Todesfaelle_Deutschland.csv')
														
 
															+        df = pd.read_csv(
														
 
															+            'datasets/COVID-19-Todesfaelle_in_Deutschland/COVID-19-Todesfaelle_Deutschland.csv')
														
 
															         N = 83100000
														
 
															         infections[0] = df['Faelle_gesamt'][0]
														
 
															         deaths[0] = df['Todesfaelle_neu'][0]
														
 
															         recovery_queue = np.zeros(14)
														
 
															         for i in range(1, time_range):
														
 
															-            infections[i] = df['Faelle_gesamt'][i] - df['Faelle_gesamt'][i-1]
														
 
															+            infections[i] = df['Faelle_gesamt'][i] - df['Faelle_gesamt'][i - 1]
														
 
															             deaths[i] = df['Todesfaelle_neu'][i]
														
 
															             recoveries[i] = recovery_queue[0]
														
 
															             recovery_queue[:-1] = recovery_queue[1:]
														
 
															             recovery_queue[-1] = infections[i]
														
 
															     else:
														
 
															-        df = pd.read_csv('datasets/state_data/Aktuell_Deutschland_SarsCov2_Infektionen.csv')
														
 
															+        df = pd.read_csv(
														
 
															+            'datasets/state_data/Aktuell_Deutschland_SarsCov2_Infektionen.csv')
														
 
															         state_ID, N = state_lookup[state_name]
														
 
															         # single out a state
														
 
															         state_IDs = df['IdLandkreis'] // 1000
														
 
															         df = df.loc[state_IDs == state_ID]
														
 
															-        # sort entries by state
														
 
															+        # sort entries by date
														
 
															         df = df.sort_values('Refdatum')
														
 
															         df = df.reset_index(drop=True)
														
 
															-        # collect cases    
														
 
															+        # collect cases
														
 
															         entry_idx = 0
														
 
															         day = 0
														
 
															         date = df['Refdatum'][entry_idx]
														
@@ -78,7 +130,8 @@ def transform_data(plotter:Plotter, alpha=1/14, state_name='Germany', time_range
 
															                 deaths[day] += df['AnzahlTodesfall'][entry_idx]
														
 
															                 entry_idx += 1
														
 
															             # move day index by difference between the current and next date
														
 
															-            day += (pd.to_datetime(df['Refdatum'][entry_idx])-pd.to_datetime(date)).days
														
 
															+            day += (pd.to_datetime(df['Refdatum']
														
 
															+                    [entry_idx]) - pd.to_datetime(date)).days
														
 
															             date = df['Refdatum'][entry_idx]
														
 
															         recovery_queue = np.zeros(14)
														
@@ -89,48 +142,122 @@ def transform_data(plotter:Plotter, alpha=1/14, state_name='Germany', time_range
 
															             recovery_queue[:-1] = recovery_queue[1:]
														
 
															             recovery_queue[-1] = infections[i]
														
 
															             week_counter -= 1
														
 
															-        
														
 
															+
														
 
															     df = df.drop(df.index[time_range:])
														
 
															-    S, I, R = np.zeros(df.shape[0]), np.zeros(df.shape[0]), np.zeros(df.shape[0])
														
 
															+    S, I, R = np.zeros(df.shape[0]), np.zeros(
														
 
															+        df.shape[0]), np.zeros(df.shape[0])
														
 
															     # generate groups
														
 
															     S[0] = N - infections[0]
														
 
															     I[0] = infections[0]
														
 
															     R[0] = 0
														
 
															     if model == 'I':
														
 
															         for day in range(1, time_range):
														
 
															-            S[day] = S[day-1] - infections[day]
														
 
															-            I[day] = I[day-1] + infections[day] - I[day-1] * alpha
														
 
															-            R[day] = R[day-1] + I[day-1] * alpha
														
 
															+            S[day] = S[day - 1] - infections[day]
														
 
															+            I[day] = I[day - 1] + infections[day] - I[day - 1] * alpha
														
 
															+            R[day] = R[day - 1] + I[day - 1] * alpha
														
 
															     else:
														
 
															         for day in range(1, time_range):
														
 
															-            S[day] = S[day-1] - infections[day]
														
 
															-            I[day] = I[day-1] + infections[day] - deaths[day] - recoveries[day]
														
 
															-            R[day] = R[day-1] + deaths[day] + recoveries[day]
														
 
															+            S[day] = S[day - 1] - infections[day]
														
 
															+            I[day] = I[day - 1] + infections[day] - \
														
 
															+                deaths[day] - recoveries[day]
														
 
															+            R[day] = R[day - 1] + deaths[day] + recoveries[day]
														
 
															             if I[day] < 0:
														
 
															                 I[day] = 0
														
 
															-    
														
 
															+
														
 
															     t = np.arange(0, time_range, 1)
														
 
															     # select, which group is to be outputted
														
 
															     groups = []
														
 
															     if 'S' in model:
														
 
															         groups.append(S)
														
 
															-    
														
 
															+
														
 
															     if 'I' in model:
														
 
															         groups.append(I)
														
 
															     if 'R' in model:
														
 
															         groups.append(R)
														
 
															-    plotter.plot(t, 
														
 
															-                 groups, 
														
 
															-                 [*model], 
														
 
															-                 state_name.replace(' ', '_').replace('-', '_').replace('ü','ue') + f"_{model}" + f"_{int(1/alpha)}", 
														
 
															-                 state_name, 
														
 
															-                 (6,6), 
														
 
															-                 xlabel='time / days', 
														
 
															+    plotter.plot(t,
														
 
															+                 groups,
														
 
															+                 [*model],
														
 
															+                 state_name.replace(' ', '_').replace(
														
 
															+                     '-', '_').replace('ü', 'ue') + f"_{model}" + f"_{int(1/alpha)}",
														
 
															+                 state_name,
														
 
															+                 (6, 6),
														
 
															+                 xlabel='time / days',
														
 
															                  ylabel='amount of people')
														
 
															-    COVID_Data = np.asarray([t[0::sample_rate]] + [group[0::sample_rate] for group in groups]) 
														
 
															+    COVID_Data = np.asarray([t[0::sample_rate]] +
														
 
															+                            [group[0::sample_rate] for group in groups])
														
 
															+
														
 
															+    np.savetxt(
														
 
															+        f"datasets/{model}_RKI_{state_name.replace(' ', '_').replace('-', '_').replace('ü','ue')}_{sample_rate}_{int(1/alpha)}.csv", COVID_Data, delimiter=",")
														
 
															+
														
 
															+
														
 
															+def transform_paper_data():
														
 
															+    N = 70000000
														
 
															+    time_range = 36
														
 
															+    alpha = 0.07
														
 
															+    state_name = 'Germany'
														
 
															+
														
 
															+    infections = np.zeros(time_range)
														
 
															+    deaths = np.zeros(time_range)
														
 
															+    recoveries = np.zeros(time_range)
														
 
															+    # Data
														
 
															+    data = [
														
 
															+        [1.30000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [1.40000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [1.50000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [1.60000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [1.70000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [1.80000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [1.90000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.00000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.10000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.20000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.30000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.40000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.50000000e+01, 2.00000000e+00, 1.50000000e+01],
														
 
															+        [2.60000000e+01, 2.00000000e+00, 1.70000000e+01],
														
 
															+        [2.70000000e+01, 2.00000000e+00, 2.10000000e+01],
														
 
															+        [2.80000000e+01, 2.00000000e+00, 4.70000000e+01],
														
 
															+        [2.90000000e+01, 2.00000000e+00, 5.70000000e+01],
														
 
															+        [1.00000000e+00, 3.00000000e+00, 1.11000000e+02],
														
 
															+        [2.00000000e+00, 3.00000000e+00, 1.29000000e+02],
														
 
															+        [3.00000000e+00, 3.00000000e+00, 1.57000000e+02],
														
 
															+        [4.00000000e+00, 3.00000000e+00, 1.96000000e+02],
														
 
															+        [5.00000000e+00, 3.00000000e+00, 2.62000000e+02],
														
 
															+        [6.00000000e+00, 3.00000000e+00, 4.00000000e+02],
														
 
															+        [7.00000000e+00, 3.00000000e+00, 6.84000000e+02],
														
 
															+        [8.00000000e+00, 3.00000000e+00, 8.47000000e+02],
														
 
															+        [9.00000000e+00, 3.00000000e+00, 9.02000000e+02],
														
 
															+        [1.00000000e+01, 3.00000000e+00, 1.13900000e+03],
														
 
															+        [1.10000000e+01, 3.00000000e+00, 1.29600000e+03],
														
 
															+        [1.20000000e+01, 3.00000000e+00, 1.56700000e+03],
														
 
															+        [1.30000000e+01, 3.00000000e+00, 2.36900000e+03],
														
 
															+        [1.40000000e+01, 3.00000000e+00, 3.06200000e+03],
														
 
															+        [1.50000000e+01, 3.00000000e+00, 3.79500000e+03],
														
 
															+        [1.60000000e+01, 3.00000000e+00, 4.83800000e+03],
														
 
															+        [1.70000000e+01, 3.00000000e+00, 6.01200000e+03],
														
 
															+        [1.80000000e+01, 3.00000000e+00, 7.15600000e+03],
														
 
															+        [1.90000000e+01, 3.00000000e+00, 8.19800000e+03],
														
 
															+    ]
														
 
															+
														
 
															+    # Creating a Pandas DataFrame
														
 
															+    df = pd.DataFrame(data, columns=["Day", "Month", "Infected people"])
														
 
															+    S, I, R = np.zeros(df.shape[0]), np.zeros(
														
 
															+        df.shape[0]), np.zeros(df.shape[0])
														
 
															+    # generate groups
														
 
															+    S[0] = N - infections[0]
														
 
															+    I[0] = infections[0]
														
 
															+    R[0] = 0
														
 
															+    for day in range(1, time_range):
														
 
															+        S[day] = S[day - 1] - df["Infected people"][day]
														
 
															+        I[day] = I[day - 1] + df["Infected people"][day] - I[day - 1] * alpha
														
 
															+        R[day] = R[day - 1] + I[day - 1] * alpha
														
 
															+
														
 
															+    COVID_Data = np.asarray([np.arange(0, time_range, 1)] +
														
 
															+                            [S, I, R])
														
 
															-    np.savetxt(f"datasets/{model}_RKI_{state_name.replace(' ', '_').replace('-', '_').replace('ü','ue')}_{sample_rate}_{int(1/alpha)}.csv", COVID_Data, delimiter=",")
														
 
															+    np.savetxt(
														
 
															+        f"datasets/SIR_Paper_{state_name.replace(' ', '_').replace('-', '_').replace('ü','ue')}_{int(1/alpha)}.csv", COVID_Data, delimiter=",")