TME 论文简介
夏日画 LV1

论文:Tree-guided Multi-task Embedding Learning for Semantic Annotation of Venues Using Check-ins

背景介绍

许多兴趣点(POI)缺乏语义标注,无法补充兴趣点的表示,这对于用户探索新的场所以及基于语义的推荐服务、城市计算等产生了巨大的阻碍。
给定用户签到轨迹以及类别标签的层次结构,我们的目标是将兴趣点以及类别标签映射到向量空间中,然后基于兴趣点向量和类别向量为无类别标签的兴趣点预测类别。

现有方法要么未能对签到序列中的上下文信息(包括兴趣点上下文和类别上下文)进行完整建模,要么没有考虑相关类别之间的语义相关性(即层次结构)。

image

方法

image

我们提出了一种基于树形层次结构的多任务表征学习模型(TME),用于兴趣点语义标注。模型由两个组件组成:

  • 序列及类别嵌入组件

    • 该组件的主要目标是学习兴趣点序列和相应的类别序列来表示兴趣点和类别。我们通过对兴趣点上下文和类别上下文进行建模,分别构建了兴趣点-兴趣点共现和兴趣点-类别两种共现模式,并对它们进行矩阵分解来学习兴趣点表征和类别表征。在本部分中,包含在这两种上下文中的序列模式和特征可以帮助我们更好地表达兴趣点和类别。
  • 基于层次结构的多任务学习组件

    • 这一部分旨在通过建模已知的兴趣点类别和预定义的类别层次结构来丰富和增强这些表征。由于类别具有树状结构,类别作为场馆的标签信息不是独立的,而是层次相关的。我们把一个兴趣点类别标注看作一个任务,与父类和子类相关的地点标注任务之间存在一定的相关性。因此,提出了一种基于类别的层次结构的多任务学习模块来捕捉任务间的相关性(即,由已知的类别层次结构确定相互关联类别之间的相似性),通过group lasso(2,1范式)约束,使语义相似性较大的类别组之间的分类任务高度相关,具有更强的任务共享特征,学习到更具辨析性的兴趣点和类别表征。

这两个组件通过一个统一的框架完成学习,兴趣点语义也得到了相应的规范。最后通过模型框架将兴趣点和类别投射在同一个嵌入空间中。

实验结果

所有的实验在东京与纽约两个数据集上进行,实验结果如图3,图4所示。

image image
由 Hexo 驱动 & 主题 Keep
本站由 提供部署服务