基于能量的模型 (EBM) 通过将标量能量与变量的每个配置相关联来捕获变量之间的依赖关系。推理包括限制观察到的变量的值并找到使能量最小化的剩余变量的配置。学习包括找到一个能量函数,其中观察到的变量配置的能量低于未观察到的变量配置。EBM 方法为许多学习模型提供了一个通用的理论框架,包括传统的判别和生成方法,以及图变换器网络、条件随机场、最大边际马尔可夫网络和几种流形学习方法。 概率模型必须经过适当的归一化,有时需要对所有可能的变量配置空间求难以计算的积分。由于 EBM 不需要进行适当的归一化,因此这个问题自然而然地就被规避了。EBM 可以看作是一种非概率因子图,与概率方法相比,它们在架构和训练标准设计方面提供了更大的灵活性。