Source code for deepmd.pd.train.wrapper

# SPDX-License-Identifier: LGPL-3.0-or-later
from __future__ import (
    annotations,
)

import logging
from collections import (
    OrderedDict,
)
from typing import (
    Any,
)

import paddle


[docs]
_StateDict = dict[str, paddle.Tensor] | OrderedDict[str, paddle.Tensor]




[docs]
log = logging.getLogger(__name__)




[docs]
class ModelWrapper(paddle.nn.Layer):
    def __init__(
        self,
        model: paddle.nn.Layer | dict,
        loss: paddle.nn.Layer | dict = None,
        model_params: dict[str, Any] | None = None,
        shared_links: dict[str, Any] | None = None,
    ) -> None:
        """Construct a DeePMD model wrapper.

        Args:
        - config: The Dict-like configuration with training options.
        """
        super().__init__()

[docs]
        self.model_params = model_params if model_params is not None else {}


[docs]
        self.train_infos = {
            "lr": 0,
            "step": 0,
        }


[docs]
        self.multi_task = False


[docs]
        self.model = paddle.nn.LayerDict()

        # Model
        if isinstance(model, paddle.nn.Layer):
            self.model["Default"] = model
        elif isinstance(model, dict):
            self.multi_task = True
            for task_key in model:
                assert isinstance(model[task_key], paddle.nn.Layer), (
                    f"{task_key} in model_dict is not a paddle.nn.Layer!"
                )
                self.model[task_key] = model[task_key]
        # Loss

[docs]
        self.loss = None

        if loss is not None:
            self.loss = paddle.nn.LayerDict()
            if isinstance(loss, paddle.nn.Layer):
                self.loss["Default"] = loss
            elif isinstance(loss, dict):
                for task_key in loss:
                    assert isinstance(loss[task_key], paddle.nn.Layer), (
                        f"{task_key} in loss_dict is not a paddle.nn.Layer!"
                    )
                    self.loss[task_key] = loss[task_key]

[docs]
        self.inference_only = self.loss is None



[docs]
    def share_params(self, shared_links: dict[str, Any], resume: bool = False) -> None:
        """
        Share the parameters of classes following rules defined in shared_links during multitask training.
        If not start from checkpoint (resume is False),
        some separated parameters (e.g. mean and stddev) will be re-calculated across different classes.
        """
        supported_types = ["descriptor", "fitting_net"]
        for shared_item in shared_links:
            class_name = shared_links[shared_item]["type"]
            shared_base = shared_links[shared_item]["links"][0]
            class_type_base = shared_base["shared_type"]
            model_key_base = shared_base["model_key"]
            shared_level_base = shared_base["shared_level"]
            if "descriptor" in class_type_base:
                if class_type_base == "descriptor":
                    base_class = self.model[model_key_base].get_descriptor()
                elif "hybrid" in class_type_base:
                    raise NotImplementedError(
                        "Hybrid descriptor is not implemented yet"
                    )
                else:
                    raise RuntimeError(f"Unknown class_type {class_type_base}!")
                for link_item in shared_links[shared_item]["links"][1:]:
                    class_type_link = link_item["shared_type"]
                    model_key_link = link_item["model_key"]
                    shared_level_link = int(link_item["shared_level"])
                    assert shared_level_link >= shared_level_base, (
                        "The shared_links must be sorted by shared_level!"
                    )
                    assert "descriptor" in class_type_link, (
                        f"Class type mismatched: {class_type_base} vs {class_type_link}!"
                    )
                    if class_type_link == "descriptor":
                        link_class = self.model[model_key_link].get_descriptor()
                    elif "hybrid" in class_type_link:
                        raise NotImplementedError(
                            "Hybrid descriptor is not implemented yet"
                        )
                    else:
                        raise RuntimeError(f"Unknown class_type {class_type_link}!")
                    link_class.share_params(
                        base_class, shared_level_link, resume=resume
                    )
                    log.warning(
                        f"Shared params of {model_key_base}.{class_type_base} and {model_key_link}.{class_type_link}!"
                    )
            else:
                if hasattr(self.model[model_key_base].atomic_model, class_type_base):
                    base_class = self.model[model_key_base].atomic_model.__getattr__(
                        class_type_base
                    )
                    for link_item in shared_links[shared_item]["links"][1:]:
                        class_type_link = link_item["shared_type"]
                        model_key_link = link_item["model_key"]
                        shared_level_link = int(link_item["shared_level"])
                        assert shared_level_link >= shared_level_base, (
                            "The shared_links must be sorted by shared_level!"
                        )
                        assert class_type_base == class_type_link, (
                            f"Class type mismatched: {class_type_base} vs {class_type_link}!"
                        )
                        link_class = self.model[
                            model_key_link
                        ].atomic_model.__getattr__(class_type_link)
                        link_class.share_params(
                            base_class, shared_level_link, resume=resume
                        )
                        log.warning(
                            f"Shared params of {model_key_base}.{class_type_base} and {model_key_link}.{class_type_link}!"
                        )



[docs]
    def forward(
        self,
        coord: paddle.Tensor,
        atype: paddle.Tensor,
        spin: paddle.Tensor | None = None,
        box: paddle.Tensor | None = None,
        cur_lr: paddle.Tensor | None = None,
        label: paddle.Tensor | None = None,
        task_key: paddle.Tensor | None = None,
        inference_only: bool = False,
        do_atomic_virial: bool = False,
        fparam: paddle.Tensor | None = None,
        aparam: paddle.Tensor | None = None,
    ) -> dict[str, paddle.Tensor]:
        if not self.multi_task:
            task_key = "Default"
        else:
            assert task_key is not None, (
                f"Multitask model must specify the inference task! Supported tasks are {list(self.model.keys())}."
            )
        input_dict = {
            "coord": coord,
            "atype": atype,
            "box": box,
            "do_atomic_virial": do_atomic_virial,
            "fparam": fparam,
            "aparam": aparam,
        }
        has_spin = getattr(self.model[task_key], "has_spin", False)
        if callable(has_spin):
            has_spin = has_spin()
        if has_spin:
            input_dict["spin"] = spin

        if self.inference_only or inference_only:
            model_pred = self.model[task_key](**input_dict)
            return model_pred, None, None
        else:
            natoms = atype.shape[-1]
            model_pred, loss, more_loss = self.loss[task_key](
                input_dict,
                self.model[task_key],
                label,
                natoms=natoms,
                learning_rate=cur_lr,
            )
            return model_pred, loss, more_loss



[docs]
    def load_state_dict(
        self,
        state_dict: _StateDict,
    ) -> tuple[list[str], list[str]]:
        self.set_extra_state(state_dict.pop("_extra_state"))
        return super().set_state_dict(state_dict)



[docs]
    def set_state_dict(
        self,
        state_dict: _StateDict,
    ) -> tuple[list[str], list[str]]:
        return self.load_state_dict(state_dict)



[docs]
    def state_dict(self) -> dict[str, Any]:
        state_dict = super().state_dict()
        extra_state = self.get_extra_state()
        state_dict.update({"_extra_state": extra_state})
        return state_dict



[docs]
    def set_extra_state(self, extra_state: dict[str, Any]) -> None:
        self.model_params = extra_state["model_params"]
        self.train_infos = extra_state["train_infos"]
        return None



[docs]
    def get_extra_state(self) -> dict:
        extra_state = {
            "model_params": self.model_params,
            "train_infos": self.train_infos,
        }
        return extra_state