7 Papers Radios 2019 ACM博士论文奖；巴斯大学南开几何风格迁移架构

2020-07-20本站

　　7 Papers Radios 2019 ACM博士论文奖；巴斯大学南开几何风格迁移架构。摘要：从无序集合中学习是一种基本的学习设置，最近这引起了越来越多的关注。这一领域的研究集中于用特征向量表示集合元素的案例，很少关注集合元素本身即遵循其自身对称性的常见情况。而后者与大量应用具备相关性，如图像去噪、多视图 3D 形状识别与重建等。

　　在本文中，来自英伟达研究院、斯坦福大学等机构的研究者提出了一种原则性方法来学习一般对称元素的集合。研究者首先描述了线性层的空间。线性层与元素重排序和元素的内在对称性具备等变性。本研究进一步表明，由被称为 Deep Sets for Symmetric elements layers (DSS) 的层构成的网络是不变函数和等变函数的通用逼近器。

　　此外，DSS 层很容易实现。最后，研究者用一系列使用图像、图以及点云的实验，证明该方法比现有的集合学习架构有所改进。

　　DSS 层与其他集合学习方法在信号分类（signal classification）任务上的比较推荐阅读：秩和检验，

　　摘要：在本文中，来自北理工和剑桥大学的研究者提出了一种免调参的 PnP 近端算法，支持自动设置内部参数，包括惩罚参数、去噪强度以及终止时间。该方法的核心部分是开发一个用于自动搜索参数的策略网络，该网络能够通过混合无模型和基于模型的深度强化学习来高效地学习参数。

　　研究人员通过数值和视觉实验表明，该方法学到的策略能够为不同的状态定制不同的参数，并且比现有的手动调参更加高效。此外，本研究还探讨了插入式去噪器，它和学得策略一起可达到 SOTA 结果，在线性和非线性的示例逆成像问题中皆是如此，尤其是在压缩感知 MRI 和相位恢复问题上都取得了不错的结果。

　　本研究中免调参即插即用（plug-and-play, PnP）框架总览。

　　加速因子 f 和噪声级别σ_n 不同的情况下，不同 CS-MRI 方法在 Medical7 和 MICCAI 两个数据集上的定量结果比较。

　　摘要：尽管效果显著，但神经机器翻译（neural machine translation）系统往往在输入数据不适当时失效，进而损害到这些系统的置信度。所以，弄清楚神经机器翻译系统在这种情况下如何以及什么时候失效对于系统维护来说至关重要。

　　在本文中，来自南大计算机软件新技术国家重点实验室和腾讯的研究者没有利用有限的手工误差特征来收集和分析失效的样例，而是通过一种基于强化学习的新范式来生成对抗样本，进而解决了上述问题。就效果而言，研究者提出的新范式可以揭露 BLEU 等给定性能度量的缺陷，并且适用于任何给定的神经机器翻译架构。

　　研究者在 RNN-search 和 Transformer 这两个主流神经机器翻译架构上进行对抗样本的实验，结果发现该方法可以生成具有保留意义对抗样本的稳定攻击。

　　在 Transformer-word、Transformer-BPE 和 RNN-search-BPE 三个神经机器翻译框架上，各种方法在 Zh→En MI 攻击任务上的各项度量结果比较。

　　推荐：值得关注的是，研究者还对这种稳定攻击的偏好模式进行了定性和定量分析，结果发现该攻击具备揭露缺陷的能力。

　　摘要：神经网络通常被表示为神经元相互连接的图。尽管神经网络被广泛使用，但目前对神经网络图结构及其预测性能之间关系的理解却不深。

　　在本文中，包括何恺明在内、来自斯坦福大学和 FAIR 的研究者系统地探讨了神经网络图结构对其预测性能的影响。具体而言，研究者开发了一种新的基于图的神经网络表示，他们称之为相关图（relational graph），其中神经网络计算的层能够沿图结构进行多次信息交互。

　　将 4 节点关系图转换为 4 层 65 维多层感知器（ Multilayer Perceptron）的示例。

　　推荐：本研究通过相关图来表示并理解神经网络，这是深度学习网络架构的一种新视角。

　　摘要：图神经网络（graph neural network, GNN）已经在少样本学习任务等众多挑战性应用中显示出了优越性能。尽管 GNN 从少样本中学习和泛化的能力很强，但常常遇到过拟合和过平滑的问题，从而限制了模型的可扩展性。

　　在本文中，来自新加坡南洋理工大学和高性能计算研究所的研究者提出了一种新颖的注意力 GNN，它通过结合三重注意力机制（triple-attention mechanism），即节点自注意力、邻域注意力和层记忆注意力，解决了上述问题。

　　具体而言，研究者通过理论分析和实例说明了提出的注意力模块为何能够提升少样本学习 GNN。实验表明，通过归纳和转换设置，这种注意力 GNN 在 mini-ImageNet 和 Tiered-ImageNet 数据集上均在少样本学习方面优于当前基于 GNN 的 SOTA 方法。

　　各种方法在 mini-ImageNet 和 Tiered-ImageNet 数据集上的少样本平均分类准确率结果比较。

　　控制变量研究：mini-ImageNet 数据集上分类准确率与层数量的变化曲线图。

　　推荐：研究者计划在未来的研究工作中将注意力 GNN 应用于更多挑战性的应用中。

　　摘要：这篇论文的主要贡献是设置了测试布尔函数单调性的复杂度，并在解决 UGC（Unique Games Conjecture）方面取得了重大进展。UGC 是近似算法和复杂性理论中的最核心问题之一。

　　在这篇论文的第一部分中，Minzer 提出一个能够检查布尔函数单调性的最优测试器，解决了该领域中的一个著名难题。在该论文的第二部分，Minzer 进行了确立该猜想的另一半路程，在此过程中他证明了用于驳斥 UGC 的最有力证据无效。即使 UGC 不能很快得到解决，Minzer 的论文在解决之前无法解决的问题方面也取得了重大进展。

　　本文作者 Dor Minzer 现为普林斯顿高等研究院（Institute for Advanced Study, IAS）博士后研究员。

　　摘要：在本文中，来自英国巴斯大学和南开大学的研究者引入一种支持几何样式迁移的神经架构。不同于该领域最近的研究主题，本研究不受语义内容的限制，因而在通用性方面独树一帜。

　　具体而言，这种新架构在负责迁移纹理风格的网络之前运行，所以可以将纹理迁移至扭曲图像。这种神经架构还有另一个创新之处，即研究者可以借此扩展神经风格迁移（neural style transfer, NST）输入范式。

　　用户可以如常地输入内容 / 风格对，也可以选择输入内容 / 纹理风格 / 几何风格三元组。这三种图像输入范式可以将分割分为两部分，并因而保证输入表现出更大的通用性。

　　由左至右分别为：原始内容图像、风格图像、使用 Gatys 等研究者提出方法的纹理迁移效果图、以及使用本研究提出方法的几何和纹理迁移效果图。

　　推荐：研究者承认该算法依然存在着一些局限性。该算法是全局性的，但很多风格是却是局部性的。例如，立体派（cubism）等图像风格就超出了该算法的适用范围。

　　机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation，在 7 Papers 的基础上，精选本周更多重要论文，包括NLP、CV、ML领域各10篇精选，并提供音频形式的论文摘要简介，详情如下：

博士论文

上一篇：硕士毕业论文答辩PPT制作细节分析

下一篇：小学生做出硕博水平的科研成果被质疑造假父母系中科院研究所博士

留言与评论（共有 0 条评论）

7 Papers Radios 2019 ACM博士论文奖；巴斯大学南开几何风格迁移架构

搜索

关注我

图文推荐

标签云