FMTL
Flexible Multi-Task Learning for Recommendation
Title:弹性多任务学习模型
概述
目标
- 目前解决负样本迁移现象的多任务学习模型(MMOE、PLE),只探索了每一个任务的一种特征表征抽取或者仅仅采用了简单的门控机制去生成特征表征,这导致这些MTL模型不能够很好的处理现实世界中多模式、强稀疏性、强长尾效应的数据。
- FMTL模型目的是为了更好的解决多模式、强稀疏性、强长尾效应的现实数据。
解决方案
特征提取策略
(以PLE为基础)
- 多任务学习中,每一个任务学习多个表征,每个表征输出一个logit(一个任务由多个子任务输出融合)
- 在一个任务内部,task-specific experts由多个子任务共享,每个子任务对应一个cgc输出,具体涉及:
- 在特征抽取阶段,由 shared experts+task-specific experts 抽取融合表征时gating机制,引入温度参数;
- 在最后一层输出的时候,每个任务对应的子任务融合机制;
特征融合策略
- P-MRG(首先通过门控策略将我们上一步特征提取的针对每一个任务的Q个表征向量进行融合,然后再经过MLP网络得到最后的逻辑输出);
- P-MRL(首先将我们上一步特征提取的针对每一个任务的Q个表征向量分别输入到k个MLP网络中,然后最后通过门控机制进行融合);
- P-MRC(首先将我们上一步特征提取的针对每一个任务的Q个表征向量进行concat,然后再经过MLP网络得到最后的逻辑输出);
方案
特征提取策略
(特征提取的过程是十分重要的,因为不同任务之间的冲突不被处理就会导致效果的下降)
针对每一个任务
其中
表示第
其中
特征融合策略
- P-MRG(首先通过门控策略将我们上一步特征提取的针对每一个任务的Q个表征向量进行融合,然后再经过MLP网络得到最后的逻辑输出); - P-MRL(首先将我们上一步特征提取的针对每一个任务的Q个表征向量分别输入到k个MLP网络中,然后最后通过门控机制进行融合); - P-MRC(首先将我们上一步特征提取的针对每一个任务的Q个表征向量进行concat,然后再经过MLP网络得到最后的逻辑输出);