搜索联想词数据指标体系怎么设计
本文主要介绍了搜索引擎中的搜索联想词(SUG)的相关概念、重要性和评价指标,旨在帮助读者理解如何有效地设计和优化SUG以提升用户体验和转化效果。
在搜索产品中,有一个场景特别容易被忽视,但它是保障用户的搜索体验、以及引导用户转化非常重要的一个环节,就是搜索联想词。
京东搜索联想词搜索
联想词,我们一般称之为SUG(以下同),SUGGESTION的缩写,从字面的意思就能看出这个场景的定位就是“为用户的搜索提供引导和建议”。
所以对于SUG来说,它核心的目标在于给到用户搜索建议,以便快速找到目标商品,提升搜索使用效率。
举一个典型的例子:比如一个感冒的用户想要找“999感冒灵颗粒”,用户至少需要敲打15次键盘才能输入完整、准确的词。
但是如果搜索有SUG,且联想的足够准确的话,那么最多敲打3次键盘,也就是输入“999”即可找到目标关键词,效率提升了至少4~5倍。如下图:
因此,在搜索产品中,一个好的SUG很关键。前几天读者群有个朋友问“如何衡量一个SUG效果”,今天专门写一篇文章来讲讲。
一、关于SUG
在讲具体如何衡量一个SUG效果之前,大家要先了解SUG是怎么做的,然后才好去看怎么衡量它做的效果。
SUG和搜索的流程非常类似。搜索的大概流程:
- 用户输入关键词
- 关键词分析,明确搜索意图
- 根据意图召回满足条件的搜索结果
- 对这些结果进行排序
- 展示给用户
SUG的流程类似:
- 用户输入关键词
- 根据用户当前输入关键词召回符合条件的其他关键词
- 对这些联想词进行排序
- 展示给用户
所以从这个角度来讲的话,很多用于衡量搜索效果的指标,其实可以变通的复用到SUG。
基本上对策略产品效果衡量的话,大致包括算法维度和业务维度的评估。
二、算法维度
从算法维度来看,核心指标基本上就是召回和准确。具体来讲,SUG在算法维度这块的指标包括联想词数量,联想词准确率,联想词多样性。
1. 联想词数量
联想词数量是指当用户输入关键词之后,能够联想出来其他关键词的数量,这个一般用于对SUG联想词召回模型的离线评估,衡量联想词召回能力。
一般来说,模型能够生成的联想词越多越好,相当于提供了更多的候选集。但是也不绝对。
从产品、用户端来说,在设计SUG展示策略的时候,基本会限制露出联想词的个数(10~15)个,因此,产品端对于这个指标通常可以不用关注,基本都可以满足需求。
2. 联想词准确率
很明显,联想词除了要保证足够的召回数量,更重要的是准确。只有准确才能命中用户真正想要搜索的关键词,他们才会去使用。
联想词准确率是指基于用户搜索的关键词,衡量联想出其他关键词是否准确的一个指标。
这里的准确需要定义一个标准,通常跟平台业务挂钩。比如电商平台,用户输入“牛”,联想出“牛奶”是准确的,但是在诸如短视频、文章社区等内容平台,则可能联想出“牛年大吉”是准确的。
3. 联想词多样性
联想词多样性是指用户输入关键词之后,能够联想出来其他关键词的类型。
比如输入牛奶,可能联想出来蒙牛牛奶,牛奶永辉、低脂牛奶,牛奶100ml,袋装牛奶,牛奶黄桃味,这些其实都是联想词的类型,或者是联想词组成策略。
蒙牛牛奶:品牌+关键词
低脂牛奶:属性(口味、规格等等)+关键词
牛奶永辉:门店+关键词
所以丰富的联想词类型能够命中用户多个需求,也是提升用户输入效率的关键。
以上三个指标的好坏通常与联想词生成和排序相关的模型有关,因此我把他归为算法指标,一般需要在上线之前进行离线的评估。
三、业务维度
从业务,或者是产品维度来讲,衡量一个SUG做的好坏通常可以从以下几个维度来衡量:使用、效率和转化。
1. 使用
SUG使用率:SUG点击次数/搜索次数
SUG点击率:SUG点击次数/SUG曝光次数
SUG无结果率:SUG引导无结果次数/SUG曝光次数
2. 效率
SUG平均点击位置:SUG位置*各位置点击次数 /SUG点击次数
SUGTopN使用率:SUG TopN点击量/SUG曝光次数
3. 转化
SUG引导CTR:由SUG引导进入搜索结果页点击次数/SUG点击次数
SUG引导UCVR:由SUG引导进入搜索结果页的下单人数/SUG点击人数
SUG引导ARPU值:由SUG引导进入搜索结果页的GMV/SUG点击人数
以上指标一般通过埋点来采集相关数据,并且进行对应指标的计算。
本文由人人都是产品经理作者【夏唬人】,微信公众号:【策略产品夏师傅】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
想问问,SUG曝光次数的定义,不是很明白是什么事件呢