三维不规则数据常常出现在许多L域的研究中,比如社会科学中的社会网络、大脑成像中的功能网络,又或者在摩登7接下来要提到的研究三维形状的计算机图形学中,这样的不规则数据在现实生活中几乎是无处不在的。
近年来,基于这种三维不规则数据的深度学习发展迅速,而图卷积神经网络应对三维不规则数据的表现尤为突出[2]。
在计算机图形学中,为了虚拟化真实世界的物体(如人或者动物等),三维形状通常需要离散化为网格(mesh),用于真实感渲染。但是,因为设备的差异或采集方式的不同,很难针对单个三维形状得到的相同的离散化方式(固定的分辨率和连接关系)。这种同一个形状具有不同的离散化方式是计算机图形学有别于其他学科的一个重要特点,而现有的图神经网络无法有效统一不同离散化下的特征,这J大地限制了图神经网络在图形学L域的发展。
那么,如何解决这一问题呢?
自动化所团队提出了一种新颖的多尺度图卷积神经网络,重点解决了传统图卷积神经网络中图节点学习到的特征对图分辨率和连接关系敏感的问题。该方法可以实现在低分辨率的三维形状上学习特征,在G低分辨率形状之上进行测试,并且保持不同分辨率特征的一致性。
01 研究背景
传统的图卷积神经网络通常聚集1-邻域(GCN),k-环邻域(ChebyGCN)或k-近邻邻域(DGCNN)的信息,所以其感受野与分辨率或者图连接关系是相关的。也就是说,在三维形状的不同离散化下,卷积的感受野对应的形状语义范围产生了较大的变化。如何解决这种卷积方式未考虑到针对不同离散化情况所产生的问题,存在较大的挑战。
02 方法简述
为解决现有图卷积神经网络的问题,团队设计了一种多尺度图卷积神经网络(multiscale graph convolutional network,MGCN)。如图1所示,摩登7发现,针对不同分辨率和连接关系的离散化,三维图谱小波函数表现出J佳的鲁棒性,并且不需要计算测地距离。因此,摩登7设计将多尺度的小波函数嵌入到图卷积神经网络的学习当中。

2020年5月底OpenAI发布了有史以来强的NLP预训练模型GPT-3,大的GPT-3模型参数达到了1750亿个参数
达摩院金榕教授介绍了语音、自然语言处理、计算机视觉三大核心AI技术的关键进展,并就AI技术在在实际应用中的关键挑战,以及达摩院应对挑战的创新实践进行了解读
新一代移动端深度学习推理框架TNN,通过底层技术优化实现在多个不同平台的轻量部署落地,性能优异、简单易用。腾讯方面称,基于TNN,开发者能够轻松将深度学习算法移植到手机端G效的执行,开发出人工智能 App,真正将 AI 带到指尖
新加坡国立大学NExT中心的王翔博士分析了知识图谱在个性化推荐L域的应用背景,并详细介绍了课题组在个性化推荐中的相关研究技术和进展,包括基于路径、基于表征学习、基于图神经网络等知识图谱在推荐系统中的融合技术
根据各种指法的具体特点,对时频网格图、时域网格图、频域网格图划分出若干个不同的计算区域,并以每个计算区域的均值与标准差作为指法自动识别的特征使用,用于基于机器学习方法的指法自动识别
Tube Feature Aggregation Network(TFAN)新方法,即利用时序信息来辅助当前帧的遮挡行人检测,目前该方法已在 Caltech 和 NightOwls 两个数据集取得了业界L先的准确率
姚霆指出,当前的多模态技术还是属于狭隘的单任务学习,整个训练和测试的过程都是在封闭和静态的环境下进行,这就和真实世界中开放动态的应用场景存在一定的差异性
优酷智能档突破“传统自适应码率算法”的局限,解决视频观看体验中G清和流畅的矛盾
通过使用仿真和量化指标,使基准测试能够通用于许多操作L域,但又足够具体,能够提供系统的有关信息
基于内容图谱结构化特征与索引更新平台,在结构化方面打破传统的数仓建模方式,以知识化、业务化、服务化为视角进行数据平台化建设,来沉淀内容、行为、关系图谱,目前在优酷搜索、票票、大麦等场景开始进行应用
NVIDIA解决方案架构师王闪闪讲解了BERT模型原理及其成就,NVIDIA开发的Megatron-BERT
自然语言处理技术的应用和研究L域发生了许多有意义的标志性事件,技术进展方面主要体现在预训练语言模型、跨语言 NLP/无监督机器翻译、知识图谱发展 + 对话技术融合、智能人机交互、平台厂商整合AI产品线