这篇文章回顾了几个最新的基于TCN的解决方案。
我们首先介绍运动检测的案例研究,并简要回顾一下TCN架构及其相对于传统方法(如卷积神经网络(CNN)和递归神经网络(RNN))的优势。然后介绍了TCN的几个新颖应用,包括改善交通预测,声音事件定位和检测以及概率预测。
TCN简要回顾
Lea等人的开创性工作。(2016)首先提出了基于视频的动作分割的时间卷积网络(TCN)。此常规过程的两个步骤包括:首先,使用(通常)对时空信息进行编码的CNN来计算低级特征,其次,将这些低级特征输入到使用(通常是)捕获高级时域信息的分类器中)RNN。这种方法的主要缺点是需要两个单独的模型。 TCN提供了一种统一的方法来分层捕获所有两个级别的信息。
编码器-解码器框架如图1所示,其中有关体系结构的更多信息可以在前两个参考文献中找到(在文章末尾)。提供了最关键的问题,如下所示:TCN可以采用一系列任意长度并将其输出为相同长度。在使用一维完全卷积网络体系结构的情况下,使用因果卷积。一个关键特征是,时间t的输出 仅与t之前发生的元素卷积 。
随着Yan等人最近发表的研究成果,围绕TCN的话题甚至传到了《自然》杂志上。(2020)在TCN上进行天气预报任务。在他们的工作中,使用TCN和LSTM进行了对比实验。他们的结果之一是,除其他方法外,TCN在使用时序数据的预测任务中表现出色。
下一部分提供了此经典TCN的实现和扩展。
改善流量预测
拼车和在线导航服务可以改善交通预测效果并改变人们的出行方式。通过更好的交通预测可以实现更少的交通拥堵,更少的污染,安全和快速的驾驶等。由于这是实时数据驱动的问题,因此有必要利用即将到来的流量的累积数据。基于此,Dai等人最近(2020)提出了一种混合时空图卷积网络(H-STGCN)。总体思路是利用分段衬里流量密度关系的优势,并将即将来临的交通量转换为等效的行进时间。他们在这项工作中使用的最有趣的方法之一是图卷积以捕获空间依赖性。复合邻接矩阵捕获流量近似的固有特征(更多信息,请参见Li,2017)。在以下架构中,提出了四个模块来描述整个预测过程。
声音事件定位和检测
声音事件定位和检测(SELD)的领域在不断增长。对环境的了解在自主导航中起着至关重要的作用。Guirguis等最近(2020)提出了一种声音事件SELD-TCN的新颖架构。他们声称,他们的框架在现场培训方面比当前最先进的技术领先。在他们的SELDnet(以下结构)中,以44.1 kHz采样的多声道音频记录通过应用短时傅立叶变换提取频谱的相位和幅度,并将其堆叠为单独的输入特征。然后,连接卷积块和循环块(双向GRU),然后连接完全连接的块。SELDnet的输出是声音事件检测(SED)和到达方向(DOA)。
为了超越它,他们提出了SELD-TCN:
由于扩张的卷积使网络能够处理各种输入,因此可能需要更深入的网络(在反向传播期间,网络会受到不稳定梯度的影响)。他们通过适应WaveNet(Dario et al。,2017)架构克服了这一挑战。他们表明SELD任务不需要循环层,并成功检测到活动声音事件的开始和结束时间。
概率预测
由Chen等人设计的新颖框架(2020)可用于估计概率密度。时间序列预测改善了许多业务决策方案(例如,资源管理)。概率预测可以从历史数据中提取信息,并最大限度地减少未来事件的不确定性。当预测任务是预测数以百万计的相关数据系列时(如在零售业务中),它需要大量的劳动力和计算资源来进行参数估计。为了解决这些困难,他们提出了基于CNN的密度估计和预测框架。他们的框架可以学习系列之间的潜在关联。他们的工作中的新颖之处在于他们提出的深层TCN,如其体系结构所示:
编码器-解码器模块解决方案可能有助于实际的大规模应用设计。