VAE, 变分自编码器

变分自编码器（Variational Autoencoder, VAE）是一种基于神经网络的生成模型，结合了自编码器（Autoencoder）和变分推断（Variational Inference）的思想，旨在学习样本数据的潜在分布。

背景知识

变分推断（Variational Inference, VI）是一种用于近似复杂概率分布的技术，其核心思想是将统计推断问题转化为优化问题。

定义

变分推断的目标是用一个简单的分布 $q(\theta)$ 近似一个难以直接计算的后验分布 $p(\theta \mid x)$. 通过最小化两者的 KL 散度来找到最优的 $q(\theta)$:
\[KL(q(\theta) \mid p(\theta \mid x)) = \int q(\theta) \log \frac{q(\theta)}{p(\theta \mid x)} d\theta\]
这种方法把推断问题转化为优化问题.

变分推断的优化目标通常基于 ELBO, 最大化 ELBO 等价于最小化 KL 散度.

定义
\[\mathcal{L}(q) = \mathbb{E}_{q(\theta)}[\log p(x, \theta)] - \mathbb{E}_{q(\theta)}[\log q(\theta)]\]

为了简化计算, 变分推断通常假设近似分布 $q(\theta)$ 是独立因子的乘积:

\[q(\theta) = \prod_i q_i(\theta_i)\]

这种假设虽然可能忽略变量之间的依赖关系，但显著降低了计算复杂度.

VAE 假设潜在变量遵循某种概率分布（通常是高斯分布），并通过变分推断来学习这种分布。具体来说，VAE 的目标是学习一个潜在空间的分布，使得从该分布中采样的数据能够生成与原始数据相似的新样本。

VAE 通常采用图像数据集进行训练, 数据中的每个样本都通过编码解码器进行处理.