Add files via upload

2025-09-15 20:17:23 +08:00 · 2025-09-15 20:17:23 +08:00 · bfb8dc3614
commit bfb8dc3614
14 changed files with 1879 additions and 0 deletions
--- a/data_provider/init.py
+++ b/data_provider/init.py
--- a/data_provider/data_factory.py
+++ b/data_provider/data_factory.py
@ -0,0 +1,128 @@
 import numpy as np
 import os
 import torch
 def data_provider(args):
    data = {}
    for category in ['train', 'val', 'test']:
        cat_data = np.load(os.path.join(args.root_path, args.data_path, category + '.npz'),allow_pickle=True)
        data['x_' + category] = torch.Tensor(cat_data['x'].astype(float)).to(torch.device(args.device))
        data['y_' + category] = torch.Tensor(cat_data['y'].astype(float)).to(torch.device(args.device))
    data['train_loader'] = Data_Loader(data['x_train'], data['y_train'], args.batch_size)
    data['val_loader'] = Data_Loader(data['x_val'], data['y_val'], args.batch_size)
    data['test_loader'] = Data_Loader(data['x_test'], data['y_test'], args.batch_size)
    train_loader = data['train_loader']
    vali_loader = data['val_loader']
    test_loader = data['test_loader']
    return train_loader, vali_loader, test_loader
 class Data_Loader(object):
    def __init__(self, xs, ys, batch_size, pad_with_last_sample=False):
        """
        :param xs:
        :param ys:
        :param batch_size:
        :param pad_with_last_sample: pad with the last sample to make number of samples divisible to batch_size.
        """
        self.batch_size = batch_size
        self.current_ind = 0
        if pad_with_last_sample:
            num_padding = (batch_size - (len(xs) % batch_size)) % batch_size
            x_padding = np.repeat(xs[-1:], num_padding, axis=0)
            y_padding = np.repeat(ys[-1:], num_padding, axis=0)
            xs = np.concatenate([xs, x_padding], axis=0)
            ys = np.concatenate([ys, y_padding], axis=0)
        self.size = len(xs)
        self.num_batch = int(self.size // self.batch_size)
        self.xs = xs
        self.ys = ys
    def shuffle(self):
        permutation = np.random.permutation(self.size)
        xs, ys = self.xs[permutation], self.ys[permutation]
        self.xs = xs
        self.ys = ys
    def get_iterator(self):
        self.current_ind = 0
        def _wrapper():
            while self.current_ind < self.num_batch:
                start_ind = self.batch_size * self.current_ind
                end_ind = min(self.size, self.batch_size * (self.current_ind + 1))
                x_i = self.xs[start_ind: end_ind, ...]
                y_i = self.ys[start_ind: end_ind, ...]
                yield (x_i, y_i)
                self.current_ind += 1
        return _wrapper()
 class StandardScaler():
    """
    Standard the input
    """
    def __init__(self, mean, std):
        self.mean = mean
        self.std = std
    def transform(self, data):
        return (data - self.mean) / self.std
    def inverse_transform(self, data):
        return (data * self.std) + self.mean
 class Data_Loader(object):
    def __init__(self, xs, ys, batch_size, pad_with_last_sample=False):
        """
        :param xs:
        :param ys:
        :param batch_size:
        :param pad_with_last_sample: pad with the last sample to make number of samples divisible to batch_size.
        """
        self.batch_size = batch_size
        self.current_ind = 0
        if pad_with_last_sample:
            num_padding = (batch_size - (len(xs) % batch_size)) % batch_size
            x_padding = np.repeat(xs[-1:], num_padding, axis=0)
            y_padding = np.repeat(ys[-1:], num_padding, axis=0)
            xs = np.concatenate([xs, x_padding], axis=0)
            ys = np.concatenate([ys, y_padding], axis=0)
        self.size = len(xs)
        self.num_batch = int(self.size // self.batch_size)
        self.xs = xs
        self.ys = ys
    def shuffle(self):
        permutation = np.random.permutation(self.size)
        xs, ys = self.xs[permutation], self.ys[permutation]
        self.xs = xs
        self.ys = ys
    def get_iterator(self):
        self.current_ind = 0
        def _wrapper():
            while self.current_ind < self.num_batch:
                start_ind = self.batch_size * self.current_ind
                end_ind = min(self.size, self.batch_size * (self.current_ind + 1))
                x_i = self.xs[start_ind: end_ind, ...]
                y_i = self.ys[start_ind: end_ind, ...]
                yield (x_i, y_i)
                self.current_ind += 1
        return _wrapper()
--- a/data_provider/data_loader.py
+++ b/data_provider/data_loader.py
@ -0,0 +1,330 @@
 import os
 import numpy as np
 import pandas as pd
 import os
 import torch
 from torch.utils.data import Dataset, DataLoader
 from sklearn.preprocessing import StandardScaler
 from utils.timefeatures import time_features
 from utils.tools import convert_tsf_to_dataframe
 import warnings
 from pathlib import Path
 warnings.filterwarnings('ignore')
 class Dataset_Custom(Dataset):
    def __init__(self, root_path, flag='train', size=None,
                 features='S', data_path='ETTh1.csv',
                 target='OT', scale=True, timeenc=0, freq='h',
                 percent=10, max_len=-1, train_all=False):
        # size [seq_len, label_len, pred_len]
        # info
        if size == None:
            self.seq_len = 24 * 4 * 4
            self.label_len = 24 * 4
            self.pred_len = 24 * 4
        else:
            self.seq_len = size[0]
            self.label_len = size[1]
            self.pred_len = size[2]
        # init
        assert flag in ['train', 'test', 'val']
        type_map = {'train': 0, 'val': 1, 'test': 2}
        self.set_type = type_map[flag]
        self.features = features
        self.target = target
        self.scale = scale
        self.timeenc = timeenc
        self.freq = freq
        self.percent = percent
        self.root_path = root_path
        self.data_path = data_path
        self.__read_data__()
        self.enc_in = self.data_x.shape[-1]
        self.tot_len = len(self.data_x) - self.seq_len - self.pred_len + 1
    def __read_data__(self):
        self.scaler = StandardScaler()
        df_raw = pd.read_csv(os.path.join(self.root_path,
                                          self.data_path))
        '''
        df_raw.columns: ['date', ...(other features), target feature]
        '''
        cols = list(df_raw.columns)
        cols.remove(self.target)
        cols.remove('date')
        df_raw = df_raw[['date'] + cols + [self.target]]
        # print(cols)
        num_train = int(len(df_raw) * 0.7)
        num_test = int(len(df_raw) * 0.2)
        num_vali = len(df_raw) - num_train - num_test
        border1s = [0, num_train - self.seq_len, len(df_raw) - num_test - self.seq_len]
        border2s = [num_train, num_train + num_vali, len(df_raw)]
        border1 = border1s[self.set_type]
        border2 = border2s[self.set_type]
        if self.set_type == 0:
            border2 = (border2 - self.seq_len) * self.percent // 100 + self.seq_len
        if self.features == 'M' or self.features == 'MS':
            cols_data = df_raw.columns[1:]
            df_data = df_raw[cols_data]
        elif self.features == 'S':
            df_data = df_raw[[self.target]]
        if self.scale:
            train_data = df_data[border1s[0]:border2s[0]]
            self.scaler.fit(train_data.values)
            data = self.scaler.transform(df_data.values)
        else:
            data = df_data.values
        df_stamp = df_raw[['date']][border1:border2]
        df_stamp['date'] = pd.to_datetime(df_stamp.date)
        if self.timeenc == 0:
            df_stamp['month'] = df_stamp.date.apply(lambda row: row.month, 1)
            df_stamp['day'] = df_stamp.date.apply(lambda row: row.day, 1)
            df_stamp['weekday'] = df_stamp.date.apply(lambda row: row.weekday(), 1)
            df_stamp['hour'] = df_stamp.date.apply(lambda row: row.hour, 1)
            data_stamp = df_stamp.drop(['date'], 1).values
        elif self.timeenc == 1:
            data_stamp = time_features(pd.to_datetime(df_stamp['date'].values), freq=self.freq)
            data_stamp = data_stamp.transpose(1, 0)
        self.data_x = data[border1:border2]
        self.data_y = data[border1:border2]
        self.data_stamp = data_stamp
    def __getitem__(self, index):
        feat_id = index // self.tot_len
        s_begin = index % self.tot_len
        s_end = s_begin + self.seq_len
        r_begin = s_end - self.label_len
        r_end = r_begin + self.label_len + self.pred_len
        seq_x = self.data_x[s_begin:s_end, feat_id:feat_id+1]
        seq_y = self.data_y[r_begin:r_end, feat_id:feat_id+1]
        seq_x_mark = self.data_stamp[s_begin:s_end]
        seq_y_mark = self.data_stamp[r_begin:r_end]
        return seq_x, seq_y, seq_x_mark, seq_y_mark
    def __len__(self):
        return (len(self.data_x) - self.seq_len - self.pred_len + 1) * self.enc_in
    def inverse_transform(self, data):
        return self.scaler.inverse_transform(data)
 class Dataset_Pred(Dataset):
    def __init__(self, root_path, flag='pred', size=None,
                 features='S', data_path='ETTh1.csv',
                 target='OT', scale=True, inverse=False, timeenc=0, freq='15min', cols=None,
                 percent=None, train_all=False):
        # size [seq_len, label_len, pred_len]
        # info
        if size == None:
            self.seq_len = 24 * 4 * 4
            self.label_len = 24 * 4
            self.pred_len = 24 * 4
        else:
            self.seq_len = size[0]
            self.label_len = size[1]
            self.pred_len = size[2]
        # init
        assert flag in ['pred']
        self.features = features
        self.target = target
        self.scale = scale
        self.inverse = inverse
        self.timeenc = timeenc
        self.freq = freq
        self.cols = cols
        self.root_path = root_path
        self.data_path = data_path
        self.__read_data__()
    def __read_data__(self):
        self.scaler = StandardScaler()
        df_raw = pd.read_csv(os.path.join(self.root_path,
                                          self.data_path))
        '''
        df_raw.columns: ['date', ...(other features), target feature]
        '''
        if self.cols:
            cols = self.cols.copy()
            cols.remove(self.target)
        else:
            cols = list(df_raw.columns)
            cols.remove(self.target)
            cols.remove('date')
        df_raw = df_raw[['date'] + cols + [self.target]]
        border1 = len(df_raw) - self.seq_len
        border2 = len(df_raw)
        if self.features == 'M' or self.features == 'MS':
            cols_data = df_raw.columns[1:]
            df_data = df_raw[cols_data]
        elif self.features == 'S':
            df_data = df_raw[[self.target]]
        if self.scale:
            self.scaler.fit(df_data.values)
            data = self.scaler.transform(df_data.values)
        else:
            data = df_data.values
        tmp_stamp = df_raw[['date']][border1:border2]
        tmp_stamp['date'] = pd.to_datetime(tmp_stamp.date)
        pred_dates = pd.date_range(tmp_stamp.date.values[-1], periods=self.pred_len + 1, freq=self.freq)
        df_stamp = pd.DataFrame(columns=['date'])
        df_stamp.date = list(tmp_stamp.date.values) + list(pred_dates[1:])
        if self.timeenc == 0:
            df_stamp['month'] = df_stamp.date.apply(lambda row: row.month, 1)
            df_stamp['day'] = df_stamp.date.apply(lambda row: row.day, 1)
            df_stamp['weekday'] = df_stamp.date.apply(lambda row: row.weekday(), 1)
            df_stamp['hour'] = df_stamp.date.apply(lambda row: row.hour, 1)
            df_stamp['minute'] = df_stamp.date.apply(lambda row: row.minute, 1)
            df_stamp['minute'] = df_stamp.minute.map(lambda x: x // 15)
            data_stamp = df_stamp.drop(['date'], 1).values
        elif self.timeenc == 1:
            data_stamp = time_features(pd.to_datetime(df_stamp['date'].values), freq=self.freq)
            data_stamp = data_stamp.transpose(1, 0)
        self.data_x = data[border1:border2]
        if self.inverse:
            self.data_y = df_data.values[border1:border2]
        else:
            self.data_y = data[border1:border2]
        self.data_stamp = data_stamp
    def __getitem__(self, index):
        s_begin = index
        s_end = s_begin + self.seq_len
        r_begin = s_end - self.label_len
        r_end = r_begin + self.label_len + self.pred_len
        seq_x = self.data_x[s_begin:s_end]
        if self.inverse:
            seq_y = self.data_x[r_begin:r_begin + self.label_len]
        else:
            seq_y = self.data_y[r_begin:r_begin + self.label_len]
        seq_x_mark = self.data_stamp[s_begin:s_end]
        seq_y_mark = self.data_stamp[r_begin:r_end]
        return seq_x, seq_y, seq_x_mark, seq_y_mark
    def __len__(self):
        return len(self.data_x) - self.seq_len + 1
    def inverse_transform(self, data):
        return self.scaler.inverse_transform(data)
 class Dataset_TSF(Dataset):
    def __init__(self, root_path, flag='train', size=None,
                 features='S', data_path=None,
                 target='OT', scale=True, timeenc=0, freq='Daily',
                 percent=10, max_len=-1, train_all=False):
        self.train_all = train_all
        self.seq_len = size[0]
        self.pred_len = size[2]
        type_map = {'train': 0, 'val': 1, 'test': 2}
        self.set_type = type_map[flag]
        self.percent = percent
        self.max_len = max_len
        if self.max_len == -1:
            self.max_len = 1e8
        self.root_path = root_path
        self.data_path = data_path
        self.timeseries = self.__read_data__()
    def __read_data__(self):
        df, frequency, forecast_horizon, contain_missing_values, contain_equal_length = convert_tsf_to_dataframe(os.path.join(self.root_path,
                                                                                                                              self.data_path))
        self.freq = frequency
        def dropna(x):
            return x[~np.isnan(x)]
        timeseries = [dropna(ts).astype(np.float32) for ts in df.series_value]
        self.tot_len = 0
        self.len_seq = []
        self.seq_id = []
        for i in range(len(timeseries)):
            res_len = max(self.pred_len + self.seq_len - timeseries[i].shape[0], 0)
            pad_zeros = np.zeros(res_len)
            timeseries[i] = np.hstack([pad_zeros, timeseries[i]])
            _len = timeseries[i].shape[0]
            train_len = _len-self.pred_len
            if self.train_all:
                border1s = [0,          0,          train_len-self.seq_len]
                border2s = [train_len,  train_len,  _len]
            else:
                border1s = [0,                          train_len - self.seq_len - self.pred_len, train_len-self.seq_len]
                border2s = [train_len - self.pred_len,  train_len,                                _len]
            border2s[0] = (border2s[0] - self.seq_len) * self.percent // 100 + self.seq_len
            # print("_len = {}".format(_len))
            curr_len = border2s[self.set_type] - max(border1s[self.set_type], 0) - self.pred_len - self.seq_len + 1
            curr_len = max(0, curr_len)
            self.len_seq.append(np.zeros(curr_len) + self.tot_len)
            self.seq_id.append(np.zeros(curr_len) + i)
            self.tot_len += curr_len
        self.len_seq = np.hstack(self.len_seq)
        self.seq_id = np.hstack(self.seq_id)
        return timeseries
    def __getitem__(self, index):
        len_seq = self.len_seq[index]
        seq_id = int(self.seq_id[index])
        index = index - int(len_seq)
        _len = self.timeseries[seq_id].shape[0]
        train_len = _len - self.pred_len
        if self.train_all:
            border1s = [0,          0,          train_len-self.seq_len]
            border2s = [train_len,  train_len,  _len]
        else:
            border1s = [0,                          train_len - self.seq_len - self.pred_len, train_len-self.seq_len]
            border2s = [train_len - self.pred_len,  train_len,                                _len]
        border2s[0] = (border2s[0] - self.seq_len) * self.percent // 100 + self.seq_len
        s_begin = index + border1s[self.set_type]
        s_end = s_begin + self.seq_len
        r_begin = s_end
        r_end = r_begin + self.pred_len
        if self.set_type == 2:
            s_end = -self.pred_len
        data_x = self.timeseries[seq_id][s_begin:s_end]
        data_y = self.timeseries[seq_id][r_begin:r_end]
        data_x = np.expand_dims(data_x, axis=-1)
        data_y = np.expand_dims(data_y, axis=-1)
        # if self.set_type == 2:
        #     print("data_x.shape = {}, data_y.shape = {}".format(data_x.shape, data_y.shape))
        return data_x, data_y, data_x, data_y
    def __len__(self):
        if self.set_type == 0:
            # return self.tot_len
            return min(self.max_len, self.tot_len)
        else:
            return self.tot_len
--- a/data_provider/data_process.py
+++ b/data_provider/data_process.py
@ -0,0 +1,154 @@
 import os
 import numpy as np
 import pandas as pd
 from pydmd import DMD, MrDMD
 def load_data(file_path):
    """
    Loads the solar energy data from a CSV file.
    Args:
        file_path (str): Path to the CSV file containing the solar energy data.
    Returns:
        np.ndarray: Data array with shape (num_samples, num_nodes, 1).
    """
    df = pd.read_csv(file_path, index_col='time')
    data = df.values
    return np.expand_dims(np.asarray(data), axis=-1)
 def generate_offsets(seq_length_x, seq_length_y):
    """
    Generates the x and y offsets based on the given sequence lengths.
    Args:
        seq_length_x (int): Length of the input sequence.
        seq_length_y (int): Length of the output sequence.
    Returns:
        tuple: x_offsets, y_offsets arrays.
    """
    x_offsets = np.sort(np.concatenate((np.arange(-(seq_length_x - 1), 1, 1),)))
    y_offsets = np.sort(np.arange(1, seq_length_y + 1, 1))
    return x_offsets, y_offsets
 def fit_dmd_model(data, svd_rank=-1, max_level=2, max_cycles=3):
    """
    Fits a DMD model to the input data.
    Args:
        data (np.ndarray): Input data for DMD model fitting.
        svd_rank (int): Rank of the singular value decomposition. Default is -1 for auto-selection.
        max_level (int): Maximum level for MrDMD. Default is 2.
        max_cycles (int): Maximum number of cycles for MrDMD. Default is 3.
    Returns:
        np.ndarray: Reconstructed data after DMD fitting.
    """
    base_dmd = DMD(svd_rank=svd_rank)
    dmd = MrDMD(dmd=base_dmd, max_level=max_level, max_cycles=max_cycles)
    dmd.fit(data.T)
    reconstructed = dmd.reconstructed_data.T
    return reconstructed
 def prepare_data(data, x_offsets, y_offsets):
    """
    Prepares the input and output sequences from the given data.
    Args:
        data (np.ndarray): The input data array.
        x_offsets (np.ndarray): Offsets for the input sequence.
        y_offsets (np.ndarray): Offsets for the output sequence.
    Returns:
        tuple: x (input sequences), y (output sequences).
    """
    num_samples = data.shape[0]
    min_t = abs(min(x_offsets))
    max_t = abs(num_samples - abs(max(y_offsets)))  # Exclusive
    x, y = [], []
    for t in range(min_t, max_t):  # t is the index of the last observation.
        x.append(data[t + x_offsets, ...])
        y.append(data[t + y_offsets, ...])
    x = np.stack(x, axis=0, dtype='complex64')
    y = np.stack(y, axis=0, dtype='complex64')
    return x.transpose(0, 2, 1, 3), y.transpose(0, 2, 1, 3)
 def split_data(x, y, train_ratio=0.7, val_ratio=0.2):
    """
    Splits the data into training, validation, and test sets.
    Args:
        x (np.ndarray): Input sequences.
        y (np.ndarray): Output sequences.
        train_ratio (float): Ratio of data for training. Default is 0.7.
        val_ratio (float): Ratio of data for validation. Default is 0.2.
    Returns:
        tuple: x_train, y_train, x_val, y_val, x_test, y_test
    """
    num_samples = x.shape[0]
    num_train = round(num_samples * train_ratio)
    num_val = round(num_samples * val_ratio)
    num_test = num_samples - num_train - num_val
    x_train, y_train = x[:num_train], y[:num_train]
    x_val, y_val = x[num_train:num_train + num_val], y[num_train:num_train + num_val]
    x_test, y_test = x[-num_test:], y[-num_test:]
    return x_train, y_train, x_val, y_val, x_test, y_test
 def save_data(x, y, x_offsets, y_offsets, save_dir, dataset_type):
    """
    Saves the prepared data as compressed .npz files.
    Args:
        x (np.ndarray): Input sequences.
        y (np.ndarray): Output sequences.
        x_offsets (np.ndarray): x_offsets array.
        y_offsets (np.ndarray): y_offsets array.
        save_dir (str): Directory where the data will be saved.
        dataset_type (str): The type of dataset (train/val/test).
    """
    np.savez_compressed(
        os.path.join(save_dir, f"{dataset_type}.npz"),
        x=x,
        y=y,
        x_offsets=x_offsets.reshape(list(x_offsets.shape) + [1]),
        y_offsets=y_offsets.reshape(list(y_offsets.shape) + [1]),
    )
 def main():
    # Configuration
    data_file = './Solar-energy_data.csv'
    save_dir = './solar-energy'
    seq_length_x, seq_length_y = 24, 24
    # Data loading and preprocessing
    data = load_data(data_file)
    x_offsets, y_offsets = generate_offsets(seq_length_x, seq_length_y)
    # DMD model fitting
    reconstructed = fit_dmd_model(data)
    # Prepare the final data for training
    feature_list = [data, reconstructed, data - reconstructed]
    data = np.concatenate(feature_list, axis=-1)
    # Prepare sequences
    x, y = prepare_data(data, x_offsets, y_offsets)
    # Split the data into train, val, test sets
    x_train, y_train, x_val, y_val, x_test, y_test = split_data(x, y)
    # Save the datasets
    for dataset_type, _x, _y in zip(["train", "val", "test"], [x_train, x_val, x_test], [y_train, y_val, y_test]):
        save_data(_x, _y, x_offsets, y_offsets, save_dir, dataset_type)
    print("Data preparation and saving completed!")
 if __name__ == "__main__":
    main()
--- a/models/init.py
+++ b/models/init.py
--- a/models/normalizer.py
+++ b/models/normalizer.py
@ -0,0 +1,105 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 def gumbel_softmax(logits, tau=1, k=1000, hard=True):
    y_soft = F.gumbel_softmax(logits, tau, hard)
    if hard:
        # 生成硬掩码
        _, indices = y_soft.topk(k, dim=0)  # 选择Top-K
        y_hard = torch.zeros_like(logits)
        y_hard.scatter_(0, indices, 1)
        return torch.squeeze(y_hard, dim=-1)
    return torch.squeeze(y_soft, dim=-1)
 class Normalize(nn.Module):
    def __init__(self, num_features: int, eps=1e-5, affine=False, subtract_last=False, non_norm=False):
        """
        :param num_features: the number of features or channels
        :param eps: a value added for numerical stability
        :param affine: if True, RevIN has learnable affine parameters
        """
        super(Normalize, self).__init__()
        self.num_features = num_features
        self.eps = eps
        self.affine = affine
        self.subtract_last = subtract_last
        self.non_norm = non_norm
        if self.affine:
            self._init_params()
    def forward(self, x, mode: str):
        if mode == 'norm':
            self._get_statistics(x)
            x = self._normalize(x)
        elif mode == 'denorm':
            x = self._denormalize(x)
        else:
            raise NotImplementedError
        return x
    def _init_params(self):
        # initialize RevIN params: (C,)
        self.affine_weight = nn.Parameter(torch.ones(self.num_features))
        self.affine_bias = nn.Parameter(torch.zeros(self.num_features))
    def _get_statistics(self, x):
        dim2reduce = tuple(range(1, x.ndim - 1))
        if self.subtract_last:
            self.last = x[:, -1, :].unsqueeze(1)
        else:
            self.mean = torch.mean(x, dim=dim2reduce, keepdim=True).detach()
        self.stdev = torch.sqrt(torch.var(x, dim=dim2reduce, keepdim=True, unbiased=False) + self.eps).detach()
    def _normalize(self, x):
        if self.non_norm:
            return x
        if self.subtract_last:
            x = x - self.last
        else:
            x = x - self.mean
        x = x / self.stdev
        if self.affine:
            x = x * self.affine_weight
            x = x + self.affine_bias
        return x
    def _denormalize(self, x):
        if self.non_norm:
            return x
        if self.affine:
            x = x - self.affine_bias
            x = x / (self.affine_weight + self.eps * self.eps)
        x = x * self.stdev
        if self.subtract_last:
            x = x + self.last
        else:
            x = x + self.mean
        return x
 class MultiLayerPerceptron(nn.Module):
    """Multi-Layer Perceptron with residual links."""
    def __init__(self, input_dim, hidden_dim) -> None:
        super().__init__()
        self.fc1 = nn.Conv2d(
            in_channels=input_dim,  out_channels=hidden_dim, kernel_size=(1, 1), bias=True)
        self.fc2 = nn.Conv2d(
            in_channels=hidden_dim, out_channels=hidden_dim, kernel_size=(1, 1), bias=True)
        self.act = nn.ReLU()
        self.drop = nn.Dropout(p=0.15)
    def forward(self, input_data: torch.Tensor) -> torch.Tensor:
        """
            input_data (torch.Tensor): input data with shape [B, D, N]
        """
        hidden = self.fc2(self.drop(self.act(self.fc1(input_data))))      # MLP
        hidden = hidden + input_data                           # residual
        return hidden
--- a/models/reprogramming.py
+++ b/models/reprogramming.py
@ -0,0 +1,98 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 from torch import Tensor
 class ReplicationPad1d(nn.Module):
    def __init__(self, padding) -> None:
        super(ReplicationPad1d, self).__init__()
        self.padding = padding
    def forward(self, input: Tensor) -> Tensor:
        replicate_padding = input[:, :, :, -1].unsqueeze(-1).repeat(1, 1, 1, self.padding[-1])
        output = torch.cat([input, replicate_padding], dim=-1)
        return output
 class TokenEmbedding(nn.Module):
    def __init__(self, c_in, d_model):
        super(TokenEmbedding, self).__init__()
        padding = 1 
        self.tokenConv = nn.Conv1d(in_channels=c_in, out_channels=d_model,
                                   kernel_size=3, padding=padding, padding_mode='circular', bias=False)
        self.confusion_layer = nn.Linear(12, 1)
        # if air_quality
        # self.confusion_layer = nn.Linear(42, 1)
        for m in self.modules():
            if isinstance(m, nn.Conv1d):
                nn.init.kaiming_normal_(
                    m.weight, mode='fan_in', nonlinearity='leaky_relu')
    def forward(self, x):
        b, n, m, pn, pl = x.shape
        x = self.tokenConv(x.reshape(b*n, pl, m*pn))
        x = self.confusion_layer(x)
        return x.reshape(b, n, -1)
 class PatchEmbedding(nn.Module):
    def __init__(self, d_model, patch_len, stride, dropout):
        super(PatchEmbedding, self).__init__()
        # Patching
        self.patch_len = patch_len
        self.stride = stride
        self.padding_patch_layer = ReplicationPad1d((0, stride))
        self.value_embedding = TokenEmbedding(patch_len, d_model)
        self.dropout = nn.Dropout(dropout)
    def forward(self, x):
        n_vars = x.shape[2]
        x = self.padding_patch_layer(x)
        x = x.unfold(dimension=-1, size=self.patch_len, step=self.stride)
        x_value_embed = self.value_embedding(x)
        return self.dropout(x_value_embed), n_vars
 class ReprogrammingLayer(nn.Module):
    def __init__(self, d_model, n_heads, d_keys=None, d_llm=None, attention_dropout=0.1):
        super(ReprogrammingLayer, self).__init__()
        d_keys = d_keys or (d_model // n_heads)
        self.query_projection = nn.Linear(d_model, d_keys * n_heads)
        self.key_projection = nn.Linear(d_llm, d_keys * n_heads)
        self.value_projection = nn.Linear(d_llm, d_keys * n_heads)
        self.out_projection = nn.Linear(d_keys * n_heads, d_llm)
        self.n_heads = n_heads
        self.dropout = nn.Dropout(attention_dropout)
    def forward(self, target_embedding, source_embedding, value_embedding):
        B, L, _ = target_embedding.shape
        S, _ = source_embedding.shape
        H = self.n_heads
        target_embedding = self.query_projection(target_embedding).view(B, L, H, -1)
        source_embedding = self.key_projection(source_embedding).view(S, H, -1)
        value_embedding = self.value_projection(value_embedding).view(S, H, -1)
        out = self.reprogramming(target_embedding, source_embedding, value_embedding)
        out = out.reshape(B, L, -1)
        return self.out_projection(out)
    def reprogramming(self, target_embedding, source_embedding, value_embedding):
        B, L, H, E = target_embedding.shape
        scale = 1. / sqrt(E)
        scores = torch.einsum("blhe,she->bhls", target_embedding, source_embedding)
        A = self.dropout(torch.softmax(scale * scores, dim=-1))
        reprogramming_embedding = torch.einsum("bhls,she->blhe", A, value_embedding)
        return reprogramming_embedding
--- a/models/repst.py
+++ b/models/repst.py
@ -0,0 +1,102 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 from math import sqrt
 from transformers.models.gpt2.modeling_gpt2 import GPT2Model
 from transformers import GPT2Model, GPT2Config
 from einops import rearrange
 from reprogramming import *
 from normalizer import *
 class repst(nn.Module):
    def __init__(self, configs, device):
        super(repst, self).__init__()
        self.device = device
        self.pred_len = configs.pred_len
        self.seq_len = configs.seq_len
        self.patch_len = configs.patch_len
        self.stride = configs.stride
        self.dropout = configs.dropout
        self.gpt_layers = configs.gpt_layers
        self.d_ff = configs.d_ff     # output mapping dimention
        self.d_model = configs.d_model
        self.n_heads= configs.n_heads
        self.d_keys = None
        self.d_llm = 768
        self.patch_nums = int((self.seq_len - self.patch_len) / self.stride + 2)
        self.head_nf = self.d_ff * self.patch_nums
        self.patch_embedding = PatchEmbedding(self.d_model, self.patch_len, self.stride, self.dropout)
        self.gpts = GPT2Model.from_pretrained('./GPT-2', output_attentions=True, output_hidden_states=True)
        self.gpts.h = self.gpts.h[:self.gpt_layers]
        self.gpts.apply(self.reset_parameters)
        self.word_embeddings = self.gpts.get_input_embeddings().weight.to(self.device)
        self.vocab_size = self.word_embeddings.shape[0]
        self.num_tokens = 1000
        self.n_vars = 5
        self.normalize_layers = Normalize(num_features=1, affine=False)
        self.mapping_layer = nn.Linear(self.vocab_size, 1)
        self.reprogramming_layer = ReprogrammingLayer(self.d_model, self.n_heads, self.d_keys, self.d_llm)
        self.out_mlp = nn.Sequential(
            nn.Linear(self.d_llm, 128),
            nn.ReLU(),
            nn.Linear(128, self.pred_len)
        )
        for i, (name, param) in enumerate(self.gpts.named_parameters()):
                if 'wpe' in name:
                    param.requires_grad = True
                else:
                    param.requires_grad = False
    def reset_parameters(self, module):
        if hasattr(module, 'weight') and module.weight is not None:
            torch.nn.init.normal_(module.weight, mean=0.0, std=0.02)  
        if hasattr(module, 'bias') and module.bias is not None:
            torch.nn.init.zeros_(module.bias) 
    def forward(self, x):
        x_enc = self.normalize_layers(x, 'norm')
        x_enc = rearrange(x_enc, 'b n l m -> b n m l')
        enc_out, n_vars = self.patch_embedding(x_enc)
        embeddings = self.mapping_layer(self.word_embeddings.permute(1, 0)).permute(1, 0)
        masks = gumbel_softmax(self.mapping_layer.weight.data.permute(1,0))
        source_embeddings = self.word_embeddings[masks==1]
        enc_out = self.reprogramming_layer(enc_out, source_embeddings, source_embeddings)
        enc_out = self.gpts(inputs_embeds=enc_out).last_hidden_state
        dec_out = self.out_mlp(enc_out)
        outputs = dec_out.unsqueeze(dim=-1)      
        outputs = outputs.repeat(1, 1, 1, n_vars)
        dec_out = self.normalize_layers(outputs, 'denorm')
        return dec_out
--- a/run.py
+++ b/run.py
@ -0,0 +1,144 @@
 from data_provider.data_factory import  data_provider
 from utils.former_tools import vali, test, masked_mae, EarlyStopping
 from tqdm import tqdm
 from models.repst import repst
 import pickle
 import numpy as np
 import torch
 import torch.nn as nn
 from torch import optim
 import os
 import time
 import warnings
 import argparse
 import random
 import logging
 warnings.filterwarnings('ignore')
 fix_seed = 2023
 random.seed(fix_seed)
 torch.manual_seed(fix_seed)
 np.random.seed(fix_seed)
 parser = argparse.ArgumentParser(description='RePST')
 parser.add_argument('--device', type=str, default='cuda:0')
 parser.add_argument('--checkpoints', type=str, default='./checkpoints/')
 parser.add_argument('--root_path', type=str, default='path_to_data')
 parser.add_argument('--data_path', type=str, default='dataset_name')
 parser.add_argument('--pred_len', type=int, default=24)
 parser.add_argument('--seq_len', type=int, default=24)
 parser.add_argument('--decay_fac', type=float, default=0.75)
 parser.add_argument('--learning_rate', type=float, default=0.002)
 parser.add_argument('--batch_size', type=int, default=16)
 parser.add_argument('--num_workers', type=int, default=10)
 parser.add_argument('--train_epochs', type=int, default=100)
 parser.add_argument('--patience', type=int, default=20)
 parser.add_argument('--gpt_layers', type=int, default=9)
 parser.add_argument('--d_model', type=int, default=64)
 parser.add_argument('--n_heads', type=int, default=1)
 parser.add_argument('--d_ff', type=int, default=128)
 parser.add_argument('--dropout', type=float, default=0.2)
 parser.add_argument('--patch_len', type=int, default=6)
 parser.add_argument('--stride', type=int, default=7)
 parser.add_argument('--tmax', type=int, default=5)
 args = parser.parse_args()
 device = torch.device(args.device)
 logging.basicConfig(filename="./log/{}.log".format(args.data_path), level=logging.INFO)
 logging.info(args)
 rmses = []
 maes = []
 mapes = []
 train_loader, vali_loader, test_loader = data_provider(args)
 time_now = time.time()
 model = repst(args, device).to(device)
 early_stopping = EarlyStopping(patience=args.patience, verbose=True)
 params = model.parameters()
 model_optim = torch.optim.Adam(params, lr=args.learning_rate)
 # class SMAPE(nn.Module):
 #     def __init__(self):
 #         super(SMAPE, self).__init__()
 #     def forward(self, pred, true):
 #         return torch.mean(200 * torch.abs(pred - true) / (torch.abs(pred) + torch.abs(true) + 1e-8))
 # criterion = SMAPE()
 criterion = nn.MSELoss()
 scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(model_optim, T_max=args.tmax, eta_min=1e-8)
 path = "./checkpoints/{}_{}_{}".format(args.data_path, args.gpt_layers, args.learning_rate)
 if not os.path.exists(path):
    os.makedirs(path)
 for epoch in range(args.train_epochs):
    iter_count = 0
    train_loss = []
    epoch_time = time.time()
    train_loader.shuffle()
    model_optim.zero_grad()
    for i, (x, y) in enumerate(train_loader.get_iterator()):
        iter_count += 1  
        x = x.to(device)
        y = y.to(device)
        outputs = model(x)
        outputs = outputs[..., 0]
        y = y[..., 0]
        loss = criterion(outputs, y)
        train_loss.append(loss.item())
        if i  % 100 == 0:
            print("iters: {},  loss: {}, time_cost: {}".format(i + 1,  np.average(train_loss[-100:]), time.time() - epoch_time))
            logging.info("iters: {},  loss: {}, time_cost: {}".format(i + 1,  np.average(train_loss[-100:]), time.time() - epoch_time))
        loss.backward()
        model_optim.step()
        model_optim.zero_grad()
    logging.info("Epoch: {} cost time: {}".format(epoch , time.time() - epoch_time))
    print("Epoch: {} cost time: {}".format(epoch , time.time() - epoch_time))
    train_loss = np.average(train_loss)
    vali_loss = vali(model, vali_loader,  criterion, args, device)
    scheduler.step()
    early_stopping(vali_loss, model, path)
    if (epoch + 1) % 1 ==0:
        print("------------------------------------")
        logging.info("------------------------------------")
        mae, mape, rmse = test(model, test_loader, args, device)
        log = 'On average over all horizons, Test MAE: {:.4f}, Test MAPE: {:.4f}, Test RMSE: {:.4f}'
        logging.info(log.format(mae,mape,rmse))
        print(log.format(mae,mape,rmse))
--- a/utils/init.py
+++ b/utils/init.py
--- a/utils/former_tools.py
+++ b/utils/former_tools.py
@ -0,0 +1,255 @@
 import numpy as np
 import torch
 import torch.nn as nn
 import matplotlib.pyplot as plt
 from tqdm import tqdm
 from datetime import datetime
 from distutils.util import strtobool
 import pandas as pd
 from utils.metrics import metric
 plt.switch_backend('agg')
 def adjust_learning_rate(optimizer, epoch, args):
    # lr = args.learning_rate * (0.2 ** (epoch // 2))
    # if args.decay_fac is None:
    #     args.decay_fac = 0.5
    # if args.lradj == 'type1':
    #     lr_adjust = {epoch: args.learning_rate * (args.decay_fac ** ((epoch - 1) // 1))}
    # elif args.lradj == 'type2':
    #     lr_adjust = {
    #         2: 5e-5, 4: 1e-5, 6: 5e-6, 8: 1e-6,
    #         10: 5e-7, 15: 1e-7, 20: 5e-8
    #     }
    if args.lradj =='type1':
        lr_adjust = {epoch: args.learning_rate if epoch < 3 else args.learning_rate * (0.9 ** ((epoch - 3) // 1))}
    elif args.lradj =='type2':
        lr_adjust = {epoch: args.learning_rate * (args.decay_fac ** ((epoch - 1) // 1))}
    elif args.lradj =='type4':
        lr_adjust = {epoch: args.learning_rate * (args.decay_fac ** ((epoch) // 1))}
    else:
        args.learning_rate = 1e-4
        lr_adjust = {epoch: args.learning_rate if epoch < 3 else args.learning_rate * (0.9 ** ((epoch - 3) // 1))}
    print("lr_adjust = {}".format(lr_adjust))
    if epoch in lr_adjust.keys():
        lr = lr_adjust[epoch]
        for param_group in optimizer.param_groups:
            param_group['lr'] = lr
        print('Updating learning rate to {}'.format(lr))
 class EarlyStopping:
    def __init__(self, patience=7, verbose=False, delta=0):
        self.patience = patience
        self.verbose = verbose
        self.counter = 0
        self.best_score = None
        self.early_stop = False
        self.val_loss_min = np.Inf
        self.delta = delta
    def __call__(self, val_loss, model, path):
        score = -val_loss
        if self.best_score is None:
            self.best_score = score
            self.save_checkpoint(val_loss, model, path)
        elif score < self.best_score + self.delta:
            self.counter += 1
            print(f'EarlyStopping counter: {self.counter} out of {self.patience}')
            if self.counter >= self.patience:
                self.early_stop = True
        else:
            self.best_score = score
            self.save_checkpoint(val_loss, model, path)
            self.counter = 0
    def save_checkpoint(self, val_loss, model, path):
        if self.verbose:
            print(f'Validation loss decreased ({self.val_loss_min:.6f} --> {val_loss:.6f}).  Saving model ...')
        torch.save(model.state_dict(), path + '/' + 'checkpoint.pth')
        self.val_loss_min = val_loss
 class dotdict(dict):
    """dot.notation access to dictionary attributes"""
    __getattr__ = dict.get
    __setattr__ = dict.__setitem__
    __delattr__ = dict.__delitem__
 class StandardScaler():
    def __init__(self, mean, std):
        self.mean = mean
        self.std = std
    def transform(self, data):
        return (data - self.mean) / self.std
    def inverse_transform(self, data):
        return (data * self.std) + self.mean
 def vali(model, vali_loader,  criterion, args, device):
    total_loss = []
    model.eval()
    with torch.no_grad():
        for i, (batch_x, batch_y) in enumerate(vali_loader.get_iterator()):
            # batch_x = torch.squeeze(batch_x)
            # batch_y = torch.squeeze(batch_y)
            outputs = model(batch_x)
            # encoder - decoder
            outputs = outputs[..., 0]
            batch_y = batch_y[..., 0]
            # pred = outputs.detach().cpu()
            # true = batch_y.detach().cpu()
            pred = outputs
            true = batch_y
            # loss = criterion(pred, true)
            loss = masked_mae(pred, true, 0.0)
            total_loss.append(loss)
    # total_loss = np.average(total_loss)
    total_loss = torch.mean(torch.tensor(total_loss))
    model.train()
    return total_loss
 def MASE(x, freq, pred, true):
    masep = np.mean(np.abs(x[:, freq:] - x[:, :-freq]))
    return np.mean(np.abs(pred - true) / (masep + 1e-8))
 def test(model, test_loader, args, device):
    preds = []
    trues = []
    # mases = []
    model.eval()
    with torch.no_grad():
        for i, (batch_x, batch_y) in enumerate(test_loader.get_iterator()):
            outputs = model(batch_x)
            # encoder - decoder
            outputs = outputs[... , 0]
            batch_y = batch_y[... , 0]
            # pred = outputs.detach().cpu().numpy()
            # true = batch_y.detach().cpu().numpy()
            pred = outputs
            true = batch_y
            preds.append(pred)
            trues.append(true)
    # preds = torch.Tensor(preds)
    # trues = torch.Tensor(trues)
    preds = torch.stack(preds[:-1])
    trues = torch.stack(trues[:-1])
    amae = []
    amape = []
    armse = []
    for i in range(args.pred_len):
        pred = preds[..., i]
        real = trues[..., i]
        metric = metrics(pred,real)
        log = 'Evaluate best model on test data for horizon {:d}, Test MAE: {:.4f}, Test MAPE: {:.4f}, Test RMSE: {:.4f}'
        print(log.format(i+1, metric[0], metric[1], metric[2]))
        amae.append(metric[0])
        amape.append(metric[1])
        armse.append(metric[2])
    # return np.mean(amae),np.mean(amape),np.mean(armse)
    return torch.mean(torch.tensor(amae)), torch.mean(torch.tensor(amape)), torch.mean(torch.tensor(armse))
 def masked_mse(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels!=null_val)
    mask = mask.float()
    mask /= torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = (preds-labels)**2
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    loss = (preds-labels)**2
    return torch.mean(loss)
 def masked_rmse(preds, labels, null_val=np.nan):
    return torch.sqrt(masked_mse(preds=preds, labels=labels, null_val=null_val))
 def masked_mae(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels!=null_val)
    mask = mask.float()
    mask /=  torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = torch.abs(preds-labels)
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    loss = torch.abs(preds-labels)
    return torch.mean(loss)
 def masked_mape(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels!=null_val)
    mask = mask.float()
    mask /=  torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = torch.abs(preds-labels)/labels
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    loss = torch.abs(preds-labels)/labels
    return torch.mean(loss)
 def metrics(pred, real):
    mae = masked_mae(pred,real,0.0).item()
    mape = masked_mape(pred,real,0.0).item()
    rmse = masked_rmse(pred,real,0.0).item()
    return mae,mape,rmse
 # # import numpy as np
 # def cal_metrics(y_true, y_pred):
 #     mse = torch.square(y_pred - y_true)
 #     mse = torch.mean(mse)
 #     # rmse = torch.square(np.abs(y_pred - y_true))
 #     rmse = torch.sqrt(mse)
 #     mae = torch.abs(y_pred - y_true)
 #     mae = torch.mean(mae)
 #     return rmse, 0, mae 
--- a/utils/metrics.py
+++ b/utils/metrics.py
@ -0,0 +1,50 @@
 import numpy as np
 def RSE(pred, true):
    return np.sqrt(np.sum((true - pred) ** 2)) / np.sqrt(np.sum((true - true.mean()) ** 2))
 def CORR(pred, true):
    u = ((true - true.mean(0)) * (pred - pred.mean(0))).sum(0)
    d = np.sqrt(((true - true.mean(0)) ** 2 * (pred - pred.mean(0)) ** 2).sum(0))
    return (u / d).mean(-1)
 def MAE(pred, true):
    return np.mean(np.abs(pred - true))
 def MSE(pred, true):
    return np.mean((pred - true) ** 2)
 def RMSE(pred, true):
    return np.sqrt(MSE(pred, true))
 def MAPE(pred, true):
    return np.mean(np.abs(100 * (pred - true) / (true +1e-8)))
 def MSPE(pred, true):
    return np.mean(np.square((pred - true) / (true + 1e-8)))
 def SMAPE(pred, true):
    return np.mean(200 * np.abs(pred - true) / (np.abs(pred) + np.abs(true) + 1e-8))
    # return np.mean(200 * np.abs(pred - true) / (pred + true + 1e-8))
 def ND(pred, true):
    return np.mean(np.abs(true - pred)) / np.mean(np.abs(true))
 def metric(pred, true):
    mae = MAE(pred, true)
    mse = MSE(pred, true)
    rmse = RMSE(pred, true)
    mape = MAPE(pred, true)
    mspe = MSPE(pred, true)
    smape = SMAPE(pred, true)
    nd = ND(pred, true)
    return mae, mse, rmse, mape, mspe, smape, nd
--- a/utils/timefeatures.py
+++ b/utils/timefeatures.py
@ -0,0 +1,134 @@
 from typing import List
 import numpy as np
 import pandas as pd
 from pandas.tseries import offsets
 from pandas.tseries.frequencies import to_offset
 class TimeFeature:
    def __init__(self):
        pass
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        pass
    def __repr__(self):
        return self.__class__.__name__ + "()"
 class SecondOfMinute(TimeFeature):
    """Minute of hour encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return index.second / 59.0 - 0.5
 class MinuteOfHour(TimeFeature):
    """Minute of hour encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return index.minute / 59.0 - 0.5
 class HourOfDay(TimeFeature):
    """Hour of day encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return index.hour / 23.0 - 0.5
 class DayOfWeek(TimeFeature):
    """Hour of day encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return index.dayofweek / 6.0 - 0.5
 class DayOfMonth(TimeFeature):
    """Day of month encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return (index.day - 1) / 30.0 - 0.5
 class DayOfYear(TimeFeature):
    """Day of year encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return (index.dayofyear - 1) / 365.0 - 0.5
 class MonthOfYear(TimeFeature):
    """Month of year encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return (index.month - 1) / 11.0 - 0.5
 class WeekOfYear(TimeFeature):
    """Week of year encoded as value between [-0.5, 0.5]"""
    def __call__(self, index: pd.DatetimeIndex) -> np.ndarray:
        return (index.isocalendar().week - 1) / 52.0 - 0.5
 def time_features_from_frequency_str(freq_str: str) -> List[TimeFeature]:
    """
    Returns a list of time features that will be appropriate for the given frequency string.
    Parameters
    ----------
    freq_str
        Frequency string of the form [multiple][granularity] such as "12H", "5min", "1D" etc.
    """
    features_by_offsets = {
        offsets.YearEnd: [],
        offsets.QuarterEnd: [MonthOfYear],
        offsets.MonthEnd: [MonthOfYear],
        offsets.Week: [DayOfMonth, WeekOfYear],
        offsets.Day: [DayOfWeek, DayOfMonth, DayOfYear],
        offsets.BusinessDay: [DayOfWeek, DayOfMonth, DayOfYear],
        offsets.Hour: [HourOfDay, DayOfWeek, DayOfMonth, DayOfYear],
        offsets.Minute: [
            MinuteOfHour,
            HourOfDay,
            DayOfWeek,
            DayOfMonth,
            DayOfYear,
        ],
        offsets.Second: [
            SecondOfMinute,
            MinuteOfHour,
            HourOfDay,
            DayOfWeek,
            DayOfMonth,
            DayOfYear,
        ],
    }
    offset = to_offset(freq_str)
    for offset_type, feature_classes in features_by_offsets.items():
        if isinstance(offset, offset_type):
            return [cls() for cls in feature_classes]
    supported_freq_msg = f"""
    Unsupported frequency {freq_str}
    The following frequencies are supported:
        Y   - yearly
            alias: A
        M   - monthly
        W   - weekly
        D   - daily
        B   - business days
        H   - hourly
        T   - minutely
            alias: min
        S   - secondly
    """
    raise RuntimeError(supported_freq_msg)
 def time_features(dates, freq='h'):
    return np.vstack([feat(dates) for feat in time_features_from_frequency_str(freq)])
--- a/utils/tools.py
+++ b/utils/tools.py
@ -0,0 +1,379 @@
 import numpy as np
 import torch
 import torch.nn as nn
 import matplotlib.pyplot as plt
 from tqdm import tqdm
 from datetime import datetime
 from distutils.util import strtobool
 import pandas as pd
 from utils.metrics import metric
 plt.switch_backend('agg')
 def adjust_learning_rate(optimizer, epoch, args):
    # lr = args.learning_rate * (0.2 ** (epoch // 2))
    # if args.decay_fac is None:
    #     args.decay_fac = 0.5
    # if args.lradj == 'type1':
    #     lr_adjust = {epoch: args.learning_rate * (args.decay_fac ** ((epoch - 1) // 1))}
    # elif args.lradj == 'type2':
    #     lr_adjust = {
    #         2: 5e-5, 4: 1e-5, 6: 5e-6, 8: 1e-6,
    #         10: 5e-7, 15: 1e-7, 20: 5e-8
    #     }
    if args.lradj =='type1':
        lr_adjust = {epoch: args.learning_rate if epoch < 3 else args.learning_rate * (0.9 ** ((epoch - 3) // 1))}
    elif args.lradj =='type2':
        lr_adjust = {epoch: args.learning_rate * (args.decay_fac ** ((epoch - 1) // 1))}
    elif args.lradj =='type4':
        lr_adjust = {epoch: args.learning_rate * (args.decay_fac ** ((epoch) // 1))}
    else:
        args.learning_rate = 1e-4
        lr_adjust = {epoch: args.learning_rate if epoch < 3 else args.learning_rate * (0.9 ** ((epoch - 3) // 1))}
    print("lr_adjust = {}".format(lr_adjust))
    if epoch in lr_adjust.keys():
        lr = lr_adjust[epoch]
        for param_group in optimizer.param_groups:
            param_group['lr'] = lr
        print('Updating learning rate to {}'.format(lr))
 class EarlyStopping:
    def __init__(self, patience=7, verbose=False, delta=0):
        self.patience = patience
        self.verbose = verbose
        self.counter = 0
        self.best_score = None
        self.early_stop = False
        self.val_loss_min = np.Inf
        self.delta = delta
    def __call__(self, val_loss, model, path):
        score = -val_loss
        if self.best_score is None:
            self.best_score = score
            self.save_checkpoint(val_loss, model, path)
        elif score < self.best_score + self.delta:
            self.counter += 1
            print(f'EarlyStopping counter: {self.counter} out of {self.patience}')
            if self.counter >= self.patience:
                self.early_stop = True
        else:
            self.best_score = score
            self.save_checkpoint(val_loss, model, path)
            self.counter = 0
    def save_checkpoint(self, val_loss, model, path):
        if self.verbose:
            print(f'Validation loss decreased ({self.val_loss_min:.6f} --> {val_loss:.6f}).  Saving model ...')
        torch.save(model.state_dict(), path + '/' + 'checkpoint.pth')
        self.val_loss_min = val_loss
 class dotdict(dict):
    """dot.notation access to dictionary attributes"""
    __getattr__ = dict.get
    __setattr__ = dict.__setitem__
    __delattr__ = dict.__delitem__
 class StandardScaler():
    def __init__(self, mean, std):
        self.mean = mean
        self.std = std
    def transform(self, data):
        return (data - self.mean) / self.std
    def inverse_transform(self, data):
        return (data * self.std) + self.mean
 def visual(true, preds=None, name='./pic/test.pdf'):
    """
    Results visualization
    """
    plt.figure()
    plt.plot(true, label='GroundTruth', linewidth=2)
    if preds is not None:
        plt.plot(preds, label='Prediction', linewidth=2)
    plt.legend()
    plt.savefig(name, bbox_inches='tight')
 def convert_tsf_to_dataframe(
    full_file_path_and_name,
    replace_missing_vals_with="NaN",
    value_column_name="series_value",
 ):
    col_names = []
    col_types = []
    all_data = {}
    line_count = 0
    frequency = None
    forecast_horizon = None
    contain_missing_values = None
    contain_equal_length = None
    found_data_tag = False
    found_data_section = False
    started_reading_data_section = False
    with open(full_file_path_and_name, "r", encoding="cp1252") as file:
        for line in file:
            # Strip white space from start/end of line
            line = line.strip()
            if line:
                if line.startswith("@"):  # Read meta-data
                    if not line.startswith("@data"):
                        line_content = line.split(" ")
                        if line.startswith("@attribute"):
                            if (
                                len(line_content) != 3
                            ):  # Attributes have both name and type
                                raise Exception("Invalid meta-data specification.")
                            col_names.append(line_content[1])
                            col_types.append(line_content[2])
                        else:
                            if (
                                len(line_content) != 2
                            ):  # Other meta-data have only values
                                raise Exception("Invalid meta-data specification.")
                            if line.startswith("@frequency"):
                                frequency = line_content[1]
                            elif line.startswith("@horizon"):
                                forecast_horizon = int(line_content[1])
                            elif line.startswith("@missing"):
                                contain_missing_values = bool(
                                    strtobool(line_content[1])
                                )
                            elif line.startswith("@equallength"):
                                contain_equal_length = bool(strtobool(line_content[1]))
                    else:
                        if len(col_names) == 0:
                            raise Exception(
                                "Missing attribute section. Attribute section must come before data."
                            )
                        found_data_tag = True
                elif not line.startswith("#"):
                    if len(col_names) == 0:
                        raise Exception(
                            "Missing attribute section. Attribute section must come before data."
                        )
                    elif not found_data_tag:
                        raise Exception("Missing @data tag.")
                    else:
                        if not started_reading_data_section:
                            started_reading_data_section = True
                            found_data_section = True
                            all_series = []
                            for col in col_names:
                                all_data[col] = []
                        full_info = line.split(":")
                        if len(full_info) != (len(col_names) + 1):
                            raise Exception("Missing attributes/values in series.")
                        series = full_info[len(full_info) - 1]
                        series = series.split(",")
                        if len(series) == 0:
                            raise Exception(
                                "A given series should contains a set of comma separated numeric values. At least one numeric value should be there in a series. Missing values should be indicated with ? symbol"
                            )
                        numeric_series = []
                        for val in series:
                            if val == "?":
                                numeric_series.append(replace_missing_vals_with)
                            else:
                                numeric_series.append(float(val))
                        if numeric_series.count(replace_missing_vals_with) == len(
                            numeric_series
                        ):
                            raise Exception(
                                "All series values are missing. A given series should contains a set of comma separated numeric values. At least one numeric value should be there in a series."
                            )
                        all_series.append(pd.Series(numeric_series).array)
                        for i in range(len(col_names)):
                            att_val = None
                            if col_types[i] == "numeric":
                                att_val = int(full_info[i])
                            elif col_types[i] == "string":
                                att_val = str(full_info[i])
                            elif col_types[i] == "date":
                                att_val = datetime.strptime(
                                    full_info[i], "%Y-%m-%d %H-%M-%S"
                                )
                            else:
                                raise Exception(
                                    "Invalid attribute type."
                                )  # Currently, the code supports only numeric, string and date types. Extend this as required.
                            if att_val is None:
                                raise Exception("Invalid attribute value.")
                            else:
                                all_data[col_names[i]].append(att_val)
                line_count = line_count + 1
        if line_count == 0:
            raise Exception("Empty file.")
        if len(col_names) == 0:
            raise Exception("Missing attribute section.")
        if not found_data_section:
            raise Exception("Missing series information under data section.")
        all_data[value_column_name] = all_series
        loaded_data = pd.DataFrame(all_data)
        return (
            loaded_data,
            frequency,
            forecast_horizon,
            contain_missing_values,
            contain_equal_length,
        )
 def vali(model, vali_loader, criterion, args, device):
    total_loss = []
    model.in_layer.eval()
    model.out_layer.eval()
    with torch.no_grad():
        for i, (batch_x, batch_y) in enumerate(vali_loader.get_iterator()):
            batch_x = torch.Tensor(batch_x).to(device)
            batch_y = torch.Tensor(batch_y).to(device)
            outputs = model(batch_x)
            # encoder - decoder
            outputs = outputs[:, -args.pred_len:, :]
            batch_y = batch_y[:, -args.pred_len:, :].to(device)
            pred = outputs.detach().cpu()
            true = batch_y.detach().cpu()
            loss = criterion(pred, true)
            total_loss.append(loss)
    total_loss = np.average(total_loss)
    model.in_layer.train()
    model.out_layer.train()
    return total_loss
 def MASE(x, freq, pred, true):
    masep = np.mean(np.abs(x[:, freq:] - x[:, :-freq]))
    return np.mean(np.abs(pred - true) / (masep + 1e-8))
 def test(model, test_loader, args, device):
    preds = []
    trues = []
    # mases = []
    model.eval()
    with torch.no_grad():
        for i, (batch_x, batch_y) in enumerate(test_loader.get_iterator()):
            batch_x = torch.Tensor(batch_x).to(device)
            batch_y = torch.Tensor(batch_y)
            outputs = model(batch_x[:, -args.seq_len:, :])
            # encoder - decoder
            outputs = outputs[:, -args.pred_len:, :]
            batch_y = batch_y[:, -args.pred_len:, :].to(device)
            pred = outputs.detach().cpu().numpy()
            true = batch_y.detach().cpu().numpy()
            preds.append(pred)
            trues.append(true)
    preds = torch.Tensor(preds)
    trues = torch.Tensor(trues)
    amae = []
    amape = []
    armse = []
    for i in range(args.pred_len):
        pred = preds[:,:,i]
        real = trues[:,:,i]
        metric = metrics(pred,real)
        amae.append(metric[0])
        amape.append(metric[1])
        armse.append(metric[2])
    return np.mean(amae),np.mean(amape),np.mean(armse)
 def masked_mse(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels!=null_val)
    mask = mask.float()
    mask /= torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = (preds-labels)**2
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    return torch.mean(loss)
 def masked_rmse(preds, labels, null_val=np.nan):
    return torch.sqrt(masked_mse(preds=preds, labels=labels, null_val=null_val))
 def masked_mae(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels!=null_val)
    mask = mask.float()
    mask /=  torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = torch.abs(preds-labels)
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    return torch.mean(loss)
 def masked_mape(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels!=null_val)
    mask = mask.float()
    mask /=  torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = torch.abs(preds-labels)/labels
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    return torch.mean(loss)
 def metrics(pred, real):
    mae = masked_mae(pred,real,0.0).item()
    mape = masked_mape(pred,real,0.0).item()
    rmse = masked_rmse(pred,real,0.0).item()
    return mae,mape,rmse