【智能案例】电商智能商品运营应用 - 严选召回

博主： PanDonglin
发布时间：2019 年 12 月 10 日
3536 次浏览
暂无评论
3622字数
分类：案例人工智能

背景

网易严选是一家品牌电商，连接着供应商和用户，改善供应链的同时给用户提供高品质、高质量、无大牌溢价的商品。营销侧业务场景是在线电商的重中之重，面临的场景挑战包括：

如何优化流量分配？
如何增加 GMV？
如何提升用户购物体验？

互联网人口红利消失殆尽，在存量争夺用户时间的战场上，必须高效充分利用每份流量。使用个性化算法是各家必用技术，在电商的营销场景提升效果明显，点击率预估提升一小步，流水增益一大步。网易严选目前主要采用深度模型应用在搜索、推荐、广告等场景，具体算法方向有 DeepCTR、Embedding、NLP 等。我们选用 TensorFlow 作为模型训练和推断的解决方案，拥抱深度学习和 TensorFlow 带来的好处：

提升模型迭代效率，可以从两点理解：

大部分特征组合工作交给深度模型，让 Machine Learning Engineer 更关注在模型本身，享受学术届新模型落地在工业界的技术红利。
TensorFlow 提供很多预训练好模型和模型基础结构。

训练和推断无缝结合（TF Serving 的出现是当初选择 TensorFlow 的最大参考因素，目前我们也在尝试 TFX 中）。
充足的社区资源（踩坑也可以爬得出来）。

在转向深度学习的这两年，网易严选个性化场景的用户体验、指标数据都有较大提升（产品形式、系统能力、算法效果都在持续优化中）。个性化场景最重要的两个阶段是召回和排序，接下来会从这两方面切入分享网易严选实践经验和思路总结。

能力统一召回体系

这里的召回更准确定义是召回 + 粗排。召回的目的是快速缩小范围，减轻精排的压力。网易严选系统当下的挑战不在数据规模和系统压力，我们设计系统最看重的是复用性、维护性和扩展性。因此考虑对召回能力做大统一，涉及搜索、推荐、广告、客服多个业务场景。

召回抽象

对召回来说，输入输出都是信息，只是信息的类别可能不同，同时必须定义信息间关系度量：$ score = f (InputData,OutputData) $。召回阶段对时延比较敏感，不能选用太过复杂关系度量算法。对于多个场景，信息可以抽象为：

搜索（输入查询词，输出商品列表、专题内容列表）
推荐（输入用户，输出商品列表）
广告（输入用户，输出素材列表）
客服（输入问题，输出答案列表、相似问题列表）

信息载体包括文本和向量，两端信息载体相同的情况下才能计算关系度量值。显而易见查询词、商品、问题 / 答案、专题内容天然包含文本信息，而使用向量必须依靠模型做目标的向量化表征。

类似 Airbnb[1] Sequence Embedding 思路，我们基于 TensorFlow 实现商品向量化表征，同时引入 Batch 内 pairwise loss 和 side info 进一步提升模型的性能和效果。基于商品向量可以关联表征用户、查询词、专题。

向量关联表征.png

问题 / 答案的向量化参考 sentence embedding 技术，由专门的 NLP 同学负责。

召回能力

如果信息是文本或向量，召回能力需要支持：

文字相关性：依靠 ElasticSearch 索引，BM25 算法度量相关性。
语义相似性：Pre-train 和 fine-tuning 的 BERT 模型推断相关性。
向量最近邻：近似最近邻搜索（Approximate Nearest Neighbor），余弦距离计算相关性。

作为通用召回体系必须保证低延时、高可用，具体做系统架构时我们将三种能力都用索引来支撑。文字相关性本来就是索引提供的能力；向量最近邻基于 LSH（Locality-sensitive hashing）投影后再建索引，获取索引正排数据（原始向量）计算匹配得分，实现向量的在线查询能力。非 GPU 环境下 BERT 模型比较耗时，可将热门查询词和高频问题（二八定律）做离线推断，结果得分 T+1 同步到索引。

能力统一.png

至此三种能力都整合在索引体系下，召回场景可以并行使用。举个例子：

搜索场景：输入查询词同时使用文字相关性，语义相似性（Query 和 ItemTitle 形成 setence pair），向量最近邻召回商品（QueryVector 到 ItemVector）。网易严选商品总量偏小，扩展召回能力希望用户能看到更多关联商品。
推荐场景：输入推荐模块商品池条件和用户向量，使用文字相关性（多路召回的商品过滤条件，是通用的索引条件查询），向量最近邻 (UserVector 到 ItemVector) 召回商品。

各显神通精排服务

精排场景没有考虑对能力做抽象统一，每个模块核心诉求点会不同（有些战略导向的场景可能只考虑曝光点击量）。核心指标上综合考量曝光转化率（CTR*CVR）、UV 价值、总体 GMV，这些都是算法需要全局优化的目标，同时综合业务方的人工策略，呈现给用户最终的商品浏览效果。小伙伴可以充分发挥聪明才智，自由选择特征和模型结构，以线上 AB Test 数据评估价值。我们的精排模型探索往大的说分为两方面：追求精度效果的复杂深度模型和实时感知用户偏好的在线模型，下文做详细介绍。

复杂模型

使用深度模型做 DeepCTR 预估，主体思路是 Embedding&MLP，对模型做网易严选场景的适配调整。我们首个深度模型是 WDL[2]，依靠 TensorFlow 提供基础的 WDL 模块可以方便的编码实现。Wide Part 依靠先验知识构建特征，挑选高覆盖、高价值属性两两交叉构建特征。Deep Part 依靠深度网络实现特征组合，对商品 Id、类目 Id、属性 Id Embedding，但不直接对用户 Id Embedding，而是基于用户和商品的行为序列表征用户，引入注意力模块[3] 计算用户向量。

后续在定制 WDL 之上加入 CTR、CVR 的多任务学习[4]，共享 Embedding 层权重，构建 CTCVR LOSS，实现曝光阶段的 CVR 预估。

复杂 T+1 模型.png

在线模型

业界已经形成共识数据新鲜度能进一步提升模型效果。为实时感知用户偏好，一般使用实时特征传入深度模型，但存在两个问题：

实时特征在线计算用于推断，数据清理用于训练；特征调整的维护成本和计算量比较大。
实时特征线上计算有不可靠性，扰动模型效果。

我们选择实现成本较低的方案：T+1 复杂模型的基础上挑选 TopK 应用实时重排序，在风险可控的前提下尝试激进实时算法。基于用户和商品交互数据计算用户多类目的实时兴趣向量（用户向量表征参考上文召回说明），在不同的场景按需使用。如在搜索推荐，使用当前上下文信息激活多维度用户实时向量，计算向量距离重排序商品列表达到类似实时模型的效果。系统工程上收益一个是用户和商品交互数据是基础统计，没有额外特征维护成本，另一个使用向量有更好泛化性和数据容错性。网易严选场景验证效果有明显的提升。

实时向量表征.png

结语

近几年深度学习领域的技术革新非常快，新模型新思路层出不穷，不由感叹 “终身学习” 的知行合一颇为不易。网易严选营销端个性化有丰富的深度学习应用场景，从点击率预估、语义匹配、向量化到素材合成、文案生成、人群画像，我们一直在扩充算法的能力边界。借助 TensorFlow 高效实现 & 验证学术界 SOTA 模型，关注应用微创新和算法适配落地，能大幅提升算法团队工作效率。

来源：https://mp.weixin.qq.com/s?__biz=MzU1OTMyNDcxMQ==&mid=2247487192&idx=1&sn=20aabe74a2998795e245cc343b463521

最后修改：2020 年 01 月 02 日

文章有用，请随意赞赏

发表评论取消回复

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

【智能案例】电商智能商品运营应用 - 严选召回

PanDonglin • 2019 年 12 月 10 日

<h1>背景</h1><p>网易严选是一家品牌电商，连接着供应商和用户，改善供应链的同时给用户提供高品质、高质量、无大牌溢价的商品。营销侧业务场景是在线电商的重中之重，面临的场景挑战包括：</p><ul><li>如何优化流量分配？</li><li>如何增加 GMV？</li><li>如何提升用户购物体验？</li></ul><p>互联网人口红利消失殆尽，在存量争夺用户时间的战场上，必须高效充分利用每份流量。使用个性化算法是各家必用技术，在电商的营销场景提升效果明显，点击率预估提升一小步，流水增益一大步。网易严选目前主要采用深度模型应用在搜索、推荐、广告等场景，具体算法方向有 DeepCTR、Embedding、NLP 等。我们选用 TensorFlow 作为模型训练和推断的解决方案，拥抱深度学习和 TensorFlow 带来的好处：</p><ul><li>提升模型迭代效率，可以从两点理解：</li></ul><ol><li>大部分特征组合工作交给深度模型，让 Machine Learning Engineer 更关注在模型本身，享受学术届新模型落地在工业界的技术红利。</li><li>TensorFlow 提供很多预训练好模型和模型基础结构。</li></ol><ul><li>训练和推断无缝结合（TF Serving 的出现是当初选择 TensorFlow 的最大参考因素，目前我们也在尝试 TFX 中）。</li><li>充足的社区资源（踩坑也可以爬得出来）。</li></ul><p>在转向深度学习的这两年，网易严选个性化场景的用户体验、指标数据都有较大提升（产品形式、系统能力、算法效果都在持续优化中）。个性化场景最重要的两个阶段是召回和排序，接下来会从这两方面切入分享网易严选实践经验和思路总结。</p><h1>能力统一召回体系</h1><p>这里的召回更准确定义是 召回 + 粗排。召回的目的是快速缩小范围，减轻精排的压力。网易严选系统当下的挑战不在数据规模和系统压力，我们设计系统最看重的是复用性、维护性和扩展性。因此考虑对召回能力做大统一，涉及搜索、推荐、广告、客服多个业务场景。</p><h2>召回抽象</h2><p>对召回来说，输入输出都是信息，只是信息的类别可能不同，同时必须定义信息间关系度量：$ score = f (InputData,OutputData) $。召回阶段对时延比较敏感，不能选用太过复杂关系度量算法。对于多个场景，信息可以抽象为：</p><ul><li>搜索（输入查询词，输出商品列表、专题内容列表）</li><li>推荐（输入用户，输出商品列表）</li><li>广告（输入用户，输出素材列表）</li><li>客服（输入问题，输出答案列表、相似问题列表）</li></ul><p>信息载体包括文本和向量，两端信息载体相同的情况下才能计算关系度量值。 显而易见 查询词、商品、问题 / 答案、专题内容 天然包含文本信息，而使用向量必须依靠模型做目标的向量化表征。 </p><p>类似 Airbnb[1] Sequence Embedding 思路，我们基于 TensorFlow 实现商品向量化表征，同时引入 Batch 内 pairwise loss 和 side info 进一步提升模型的性能和效果。基于商品向量可以关联表征用户、查询词、专题。</p><p><img src="https://www.16084a.com/usr/uploads/2020/01/4143181761.png" alt="向量关联表征.png" title="向量关联表征.png"style=""></p><p>问题 / 答案的向量化参考 sentence embedding 技术，由专门的 NLP 同学负责。</p><h2>召回能力</h2><p>如果信息是文本或向量，召回能力需要支持：</p><ul><li>文字相关性：依靠 ElasticSearch 索引，BM25 算法度量相关性。</li><li>语义相似性：Pre-train 和 fine-tuning 的 BERT 模型推断相关性。</li><li>向量最近邻：近似最近邻搜索（Approximate Nearest Neighbor），余弦距离计算相关性。</li></ul><p>作为通用召回体系必须保证低延时、高可用，具体做系统架构时我们将三种能力都用索引来支撑。文字相关性本来就是索引提供的能力；向量最近邻基于 LSH（Locality-sensitive hashing）投影后再建索引，获取索引正排数据（原始向量）计算匹配得分，实现向量的在线查询能力。非 GPU 环境下 BERT 模型比较耗时，可将热门查询词和高频问题（二八定律）做离线推断，结果得分 T+1 同步到索引。</p><p><img src="https://www.16084a.com/usr/uploads/2020/01/940594173.png" alt="能力统一.png" title="能力统一.png"style=""></p><p>至此三种能力都整合在索引体系下，召回场景可以并行使用。举个例子：</p><ul><li>搜索场景：输入查询词同时使用文字相关性，语义相似性（Query 和 ItemTitle 形成 setence pair），向量最近邻召回商品（QueryVector 到 ItemVector）。网易严选商品总量偏小，扩展召回能力希望用户能看到更多关联商品。</li><li>推荐场景：输入推荐模块商品池条件和用户向量，使用文字相关性（多路召回的商品过滤条件，是通用的索引条件查询），向量最近邻 (UserVector 到 ItemVector) 召回商品。</li></ul><h1>各显神通精排服务</h1><p>精排场景没有考虑对能力做抽象统一，每个模块核心诉求点会不同（有些战略导向的场景可能只考虑曝光点击量）。核心指标上综合考量曝光转化率（CTR*CVR）、UV 价值、总体 GMV，这些都是算法需要全局优化的目标，同时综合业务方的人工策略，呈现给用户最终的商品浏览效果。小伙伴可以充分发挥聪明才智，自由选择特征和模型结构，以线上 AB Test 数据评估价值。我们的精排模型探索往大的说分为两方面：追求精度效果的复杂深度模型和实时感知用户偏好的在线模型，下文做详细介绍。</p><h2>复杂模型</h2><p>使用深度模型做 DeepCTR 预估，主体思路是 Embedding&MLP，对模型做网易严选场景的适配调整。我们首个深度模型是 WDL[2]，依靠 TensorFlow 提供基础的 WDL 模块可以方便的编码实现。Wide Part 依靠先验知识构建特征，挑选高覆盖、高价值属性两两交叉构建特征。Deep Part 依靠深度网络实现特征组合，对商品 Id、类目 Id、属性 Id Embedding，但不直接对用户 Id Embedding，而是基于用户和商品的行为序列表征用户，引入注意力模块[3] 计算用户向量。 </p><p>后续在定制 WDL 之上加入 CTR、CVR 的多任务学习[4]，共享 Embedding 层权重，构建 CTCVR LOSS，实现曝光阶段的 CVR 预估。</p><p><img src="https://www.16084a.com/usr/uploads/2020/01/1094381146.png" alt="复杂 T+1 模型.png" title="复杂 T+1 模型.png"style=""></p><h2>在线模型</h2><p>业界已经形成共识数据新鲜度能进一步提升模型效果。为实时感知用户偏好，一般使用实时特征传入深度模型，但存在两个问题：</p><ul><li>实时特征在线计算用于推断，数据清理用于训练；特征调整的维护成本和计算量比较大。</li><li>实时特征线上计算有不可靠性，扰动模型效果。</li></ul><p>我们选择实现成本较低的方案：T+1 复杂模型的基础上挑选 TopK 应用实时重排序，在风险可控的前提下尝试激进实时算法。基于用户和商品交互数据计算用户多类目的实时兴趣向量（用户向量表征参考上文召回说明），在不同的场景按需使用。如在搜索推荐，使用当前上下文信息激活多维度用户实时向量，计算向量距离重排序商品列表达到类似实时模型的效果。系统工程上收益一个是用户和商品交互数据是基础统计，没有额外特征维护成本，另一个使用向量有更好泛化性和数据容错性。网易严选场景验证效果有明显的提升。</p><p><img src="https://www.16084a.com/usr/uploads/2020/01/4102950872.png" alt="实时向量表征.png" title="实时向量表征.png"style=""></p><h1>结语</h1><p>近几年深度学习领域的技术革新非常快，新模型新思路层出不穷，不由感叹 “终身学习” 的知行合一颇为不易。网易严选营销端个性化有丰富的深度学习应用场景，从点击率预估、语义匹配、向量化到素材合成、文案生成、人群画像，我们一直在扩充算法的能力边界。借助 TensorFlow 高效实现 & 验证学术界 SOTA 模型，关注应用微创新和算法适配落地，能大幅提升算法团队工作效率。</p><p>来源：<span class="external-link"><a class="no-external-link" href="https://mp.weixin.qq.com/s?__biz=MzU1OTMyNDcxMQ==&mid=2247487192&idx=1&sn=20aabe74a2998795e245cc343b463521" target="_blank"><i data-feather="external-link"></i>https://mp.weixin.qq.com/s?__biz=MzU1OTMyNDcxMQ==&mid=2247487192&idx=1&sn=20aabe74a2998795e245cc343b463521</a></span></p>

【智能案例】电商智能商品运营应用 - 严选召回

背景

能力统一召回体系

召回抽象

召回能力

各显神通精排服务

复杂模型

在线模型

结语

发表评论取消回复

【项目实战】利用 GAN (生成对抗网络) 技术模拟生成大衣款式

【学习笔记】商城体系之B2B2C思维

【项目实战】利用 GAN (生成对抗网络) 技术模拟生成花型图案

16084A原型框架

【数据集】DeepFashion 服装数据集记录

企业价值创造治理成熟度（EVCGM）概述

【智能案例】工业界提高效率智能应用 - 通用贝克休斯

【知识图谱】AI相关概念与发展简史

【数据集】RP2K 零售商品数据集

【数据集】常见服装10种类图片数据集 - Fashion MNIST

【智能案例】电商智能商品运营应用 - 严选召回

背景

能力统一召回体系

召回抽象

召回能力

各显神通精排服务

复杂模型

在线模型

结语

发表评论 取消回复

【智能案例】电商智能商品运营应用 - 严选召回

发表评论取消回复