| VGG 层 | 抓什么 | 论文怎么用 |
|---|---|---|
| relu1_2 | 颜色 / 边缘 | style |
| relu2_2 ★ | 细节纹理 | SR 内容损失 + style |
| relu3_3 ★ | 局部结构 | 风格迁移内容损失 + style |
| relu4_3 | 物体部件 | style |
| relu5_1 / 5_3 | 整体语义 | (过抽象, 未采用) |
| 训练集 | MS-COCO · 约 8 万张 · 256×256 |
| 优化器 | Adam |
| 学习率 | 1 × 10⁻³ |
| batch size | 4 |
| 迭代次数 | 40,000 (≈ 2 epoch) |
| 训练硬件 | 单张 GTX Titan X |
| 单风格训练时长 | ≈ 4 小时 |
| 关键约束 | 每个风格单独训一个网络 |
| Image Size | Gatys et al. [11] | Ours | Speedup vs | ||||
|---|---|---|---|---|---|---|---|
| 100 iter | 300 iter | 500 iter | 1 forward | 100 | 300 | 500 | |
| 256 × 256 | 3.17 s | 9.52 s | 15.86 s | 0.015 s | 212× | 636× | 1060× |
| 512 × 512 | 10.97 s | 32.91 s | 54.85 s | 0.05 s | 205× | 615× | 1026× |
| 1024 × 1024 | 42.89 s | 128.66 s | 214.44 s | 0.21 s | 208× | 625× | 1042× |
| 损失层 | VGG-16 relu2_2 特征重建 —— 用浅层特征,保边缘细节、少失真 |
| 训练数据 | MS-COCO 1 万张图,裁成 288×288 patch |
| 超分倍率 | ×4 / ×8(更大倍率需更多语义推理,故聚焦这两档) |
| 优化器 / 学习率 | Adam · lr 1 × 10⁻³ |
| batch / 迭代 | batch 4 · 200,000 iter |
| 正则化 | 无 weight decay · 无 dropout |
| 后处理 | 直方图匹配:输出 ↔ LR 输入,校正色彩/亮度漂移 |
| Method | Set5 | Set14 | BSD100 |
|---|---|---|---|
| Bicubic | 28.43 / 0.811 | 25.99 / 0.730 | 25.96 / 0.682 |
| Ours ℓ_pixel | 28.40 / 0.821 | 25.75 / 0.699 | 25.91 / 0.668 |
| SRCNN | 30.48 / 0.863 | 27.49 / 0.750 | 26.90 / 0.710 |
| Ours ℓ_feat ★ | 27.09 / 0.768 | 24.99 / 0.673 | 24.95 / 0.633 |
| Method | Set5 | Set14 | BSD100 |
|---|---|---|---|
| Bicubic | 23.80 / 0.646 | 22.37 / 0.552 | 22.11 / 0.532 |
| Ours ℓ_pixel | 24.77 / 0.686 | 23.02 / 0.579 | 22.54 / 0.553 |
| Ours ℓ_feat ★ | 23.26 / 0.706 | 21.64 / 0.584 | 21.35 / 0.547 |