Source code for scalr.model_training_pipeline

"""This file contains an implementation for the model training pipeline."""

from copy import deepcopy
import os
from os import path
from typing import Union

from anndata import AnnData
from anndata.experimental import AnnCollection
import torch

import scalr
from scalr.nn.callbacks import CallbackExecutor
from scalr.nn.dataloader import build_dataloader
from scalr.nn.loss import build_loss_fn
from scalr.nn.model import build_model
from scalr.utils import EventLogger
from scalr.utils import FlowLogger
from scalr.utils import load_train_val_data_from_config
from scalr.utils import read_data
from scalr.utils import set_seed
from scalr.utils import write_data



[docs]
class ModelTrainingPipeline:
    """Class for Model training pipeline."""

    def __init__(self,
                 model_config: dict,
                 train_config: dict,
                 dirpath: str = None,
                 device: str = 'cpu'):
        """Initialize required parameters for model training pipeline.

        Class to get trained model from given configs

        Args:
            dirpath (str): Path to store checkpoints and logs of the model.
            model_config (dict): Model config.
            train_config (dict): Model training config.
            device (str, optional): Device to run model on. Defaults to 'cpu'.
        """
        self.flow_logger = FlowLogger('ModelTraining')
        set_seed(42)

        self.train_config = train_config
        self.model_config = model_config
        self.device = device
        self.dirpath = dirpath


[docs]
    def load_data_and_targets_from_config(self, data_config: dict):
        """A function to load data and targets from data config.

        Args:
            data_config: Data config.
        """
        self.train_data, self.val_data = load_train_val_data_from_config(
            data_config)
        self.target = data_config.get('target')
        self.mappings = read_data(data_config['label_mappings'])



[docs]
    def set_data_and_targets(self, train_data: Union[AnnData, AnnCollection],
                             val_data: Union[AnnData, AnnCollection],
                             target: Union[str, list[str]], mappings: dict):
        """A function to set data when you don't use data directly from config,
        but rather by other sources like feature subsetting, etc.

        Args:
            train_data (Union[AnnData, AnnCollection]): Training data.
            val_data (Union[AnnData, AnnCollection]): Validation data.
            target (Union[str, list[str]]): Target columns name(s).
            mappings (dict): Mapping of a column value to ids
                            eg. mappings[column_name][label2id] = {A: 1, B:2, ...}.
        """
        self.train_data = train_data
        self.val_data = val_data
        self.target = target
        self.mappings = mappings



[docs]
    def build_model_training_artifacts(self):
        """This function configures the model, optimizer, and loss function required
        for model training.
        """
        self.flow_logger.info('Building model training artifacts')

        # Building model.
        self.model, self.model_config = build_model(self.model_config)
        self.model.to(self.device)

        # Building optimizer.
        opt_config = deepcopy(self.train_config.get('optimizer'))
        self.opt, opt_config = self.build_optimizer(
            self.train_config.get('optimizer'))
        self.train_config['optimizer'] = opt_config

        # Building Loss Function.
        self.loss_fn, loss_config = build_loss_fn(
            deepcopy(self.train_config.get('loss', dict())))
        self.train_config['loss'] = loss_config
        self.loss_fn.to(self.device)

        # Building Callbacks executor.
        self.callbacks = CallbackExecutor(
            self.dirpath, self.train_config.get('callbacks', list()))

        # Resuming from checkpoint using model weights.
        if self.train_config.get('resume_from_checkpoint'):
            self.flow_logger.info('Resuming model from checkpoint')
            self.flow_logger.info('Loading model weights...')
            self.model.load_weights(self.train_config['resume_from_checkpoint'])
            self.flow_logger.info('Loading optimizer state dict...')
            self.opt.load_state_dict(
                torch.load(self.train_config['resume_from_checkpoint'])
                ['optimizer_state_dict'])



[docs]
    def build_optimizer(self, opt_config: dict = None):
        """A function to build optimizer.

        Args:
            opt_config (dict): Optimizer config.        
        """
        if not opt_config:
            opt_config = dict()
        name = opt_config.get('name', 'Adam')
        opt_config['name'] = name
        params = opt_config.get('params', dict(lr=1e-3))
        opt_config['params'] = params

        opt = getattr(torch.optim, name)(self.model.parameters(), **params)
        return opt, opt_config



[docs]
    def train(self):
        """This function trains the model."""
        self.flow_logger.info('Training the model')
        # Building Trainer.
        trainer_name = self.train_config.get('trainer', 'SimpleModelTrainer')
        self.train_config['trainer'] = trainer_name

        Trainer = getattr(scalr.nn.trainer, trainer_name)
        trainer = Trainer(self.model, self.opt, self.loss_fn, self.callbacks,
                          self.device)

        # Building DataLoaders.
        dataloader_config = self.train_config.get('dataloader')
        train_dl, dataloader_config = build_dataloader(dataloader_config,
                                                       self.train_data,
                                                       self.target,
                                                       self.mappings)
        val_dl, dataloader_config = build_dataloader(dataloader_config,
                                                     self.val_data, self.target,
                                                     self.mappings)
        self.train_config['dataloader'] = dataloader_config

        epochs = self.train_config.get('epochs', 1)
        self.train_config['epochs'] = epochs

        # Train and store the best model.
        best_model = trainer.train(epochs, train_dl, val_dl)
        if self.dirpath:
            best_model_dir = path.join(self.dirpath, 'best_model')
            os.makedirs(best_model_dir, exist_ok=True)
            best_model.save_weights(path.join(best_model_dir, 'model.pt'))
            write_data(self.model_config,
                       path.join(best_model_dir, 'model_config.yaml'))
            write_data(self.mappings, path.join(best_model_dir,
                                                'mappings.json'))

        return best_model



[docs]
    def get_updated_config(self):
        """This function returns updated configs."""
        return self.model_config, self.train_config