微博搜索策略分析

微博搜索在不同场景下的不足，依据用户场景和展现结果满足情况两个方面进行问题的拆解，程序智能给出个性化的解决方案，满足用户高效获取信息的需求。本文是针对微博搜索策略分析，enjoy~

一、调研目标

研究新浪微博在不同需求场景下的搜索效果，提出优化方案，以满足用户高效获取信息的需求。

二、调研分析

参照网页搜索策略的思考方式，将从需求明确度、query特点以及对结果的要求对微博搜索存在的不足进行分析：

图1 调研分析

1. 需求明确

参照网页搜索策略的思考方式，将从需求明确度、query特点以及对结果的要求对微博搜索存在的不足进行分析：

（1）query结构简单清晰

场景一：搜索“电影龙猫”

搜索词：电影龙猫

期待结果：关于新上映的电影龙猫的讨论

实际结果展示：

搜索结果分析：

搜索结果满足了用户的基本需求，第一条为电影《龙猫》的介绍，从第二条到第四条都是知名博主的点评，但是再往下的信息只是含有“龙猫”字眼，比如明星和博主的吐槽以及日常陈述、博主的影视推荐，没有《龙猫》的其它有效信息。

从query可看出，微博对搜索词做了切词处理（有的不含“电影”字眼），但没有进行相应的的语义分析。在前面4条的信息中，热度和相关性较高，可以满足大部分用户的需求，但在后面的信息中，只要query切词中有相关的关键词与最新消息区配，系统将依据热度进行信息排行，这就导致相关性降低，推送结果与用户预期不符的情况。

场景二：搜索“演员宋仲基”

搜索词：演员宋仲基

期待结果：关于宋仲基的最新动向

实际结果展示：

搜索结果分析：搜索结果基本满足了用户需求，第一条为官微热门，是宋仲基的最新消息，满足需求。再往下看，大部分信息仍是满足需求的，但是同样存在切词的问题，如：博主的日常陈述中是含有“宋仲基”字眼，但没有其它有效信息，这同样是query切词匹配的问题，这是问题一。

除此之外，每个专题下有大量重复信息没有得到系统的筛选，加大了用户获取差异化信息的成本，如：宋仲基主演的电影《波哥大》暂停拍摄这条消息被不同的博主连续频繁推送，这是问题二。

（2）query口语化

场景三：搜索“感冒吃什么药好的快”

搜索词：感冒吃什么药好的快

期待结果：推荐治疗感冒药的相关信息

实际结果展示：

搜索结果分析：搜索结果基本满足。

第一条是推荐的是热门文章，与“query”非常吻合；第二条热门问答视频，标题与“query”非常吻合；第三条是行业官微直接提供了与“query”吻合的解决方案，可以说前三条是非常满足需求的；

到了第四条、第五条，直到第二条，大量的博主日常生活的记录了，记录中有感冒、吃药这样的字眼，这说明系统也只是做了简单的关键词的匹配，并没有理解用户真正的需求是找到治疗感冒的药，这是问题一。

更甚者，十条以后，居然出现“鸡感冒了怎么治疗，鸡感冒了吃什么药最好？”的信息，说明系统没有进行语义上的推理，即——用户在搜索时前面没有加“人”此类的主语，应该默认为人感冒了，如果是动物肯定会在搜索时加猫、狗这样的习惯，没有进行语义上分析，这是问题二。

另外，从query角度来讲，切词为“感冒+吃+药+什么+好+的+快”，query匹配度是非常高的，切词也无明显丢掉、重组的现象，但是系统并没有对query背后的搜索需求做深度的挖掘，“感冒”是症状，“药”是方法，其前面加了“什么”，显然是在找解决方案啊，当然，也属语义分析的问题。

场景四：搜索“矫正牙齿得多少钱”

搜索词：矫正牙齿得多少钱

期待结果：推荐矫正牙齿的价格信息

实际结果展示：

搜索结果分析：

搜索“矫正牙齿得多少钱”，微博中只推送了三条信息：

第一条是广告，而且是与“query”完全无关的广告，不满足需求，且用户需要往下翻页继续找相关信息，增加了寻找信息答案的成本，这是问题一；
第二条是一篇与“query”吻合度极高的文章，但是文章内容限制在深圳罗湖，不够全面；
第三条是博主的求助信息了，同样没有得到答案，也不能满足信息。

由此可见，微博中对于“矫正牙齿价格”的信息资源是非常少的，或者是系统设计的相关度太低以至于没有推荐出来。

（3）query表达方式复杂

场景五：搜索“新一对小兰表白是在哪一集”

搜索词：新一对小兰表白是在哪一集

期待结果：想知道“新一对小兰表白”是在哪一集

实际结果展示：

搜索结果分析：基本能满足需求，但存在两个问题：

前两要推送的依然是博主的日常包含有与query相同的关键词的相关信息，网友给出答案，但是用户不能通过摘要立即看到结果，需要再点击继续从上往下寻找答案，这个过程虽然满足了需求，但是仍然增加了获取有效信息的成本；
后面一条又是广告，用户仍需要往下翻页继续找相关信息，增加了寻找优质答案的成本。

场景六：搜索“我真是大笨蛋，除了喜欢你，我什么都做不好”是哪个电影里的台词

搜索词：我真是大笨蛋，除了喜欢你，我什么都做不好是哪个电影里的台词

期待结果：想知道这句台词的来源

实际结果展示：

搜索结果分析：前两条能满足需求，但是基本是对问题的间接回答，第三、第四甚至到第十条都是博主的心语，只是对query进行了简单的匹配，而且从结果中我们可以看出，query被切词为“我真笨蛋，我除了喜欢你，我什么都做不好”+“是”+“哪个”+“电影”+“里”+“的”+“台词”，显然，出现了明显的丢掉现象。

2. 需求明确，对结果有特殊要求

场景七：搜索“北京最新房价”

搜索词：北京最新房价

期待结果：想知道北京的最新房价

实际结果展示：

搜索结果分析：

满足需求情况较好，即北京、最新、房价，推送的结果不仅与北京房价相关，也满足“最新”这一特殊需求。笔者认为，这跟query是热点问题有关，也跟系统中也有官微的信息资源有关。

场景八：搜索“北京最新房价”

搜索词：华为最新款手机

期待结果：想知道华为最新款手机的相关信息

实际结果展示：

搜索结果分析：

满足需求情况不好，第一条推送的是关于华为的热点新闻，跟用户需求——最新款手机不匹配，这说明系统的推荐对热点的依赖太高，这是问题一；第二条推送是华为最新款手机的功能、价格，满足需求；第三条，推送的是一条语义理解意义的资讯，query切词为“华为+最新+款+手机”，显然切词后出现了重组现象，但是结果基本满足需求；第四条推送的一条无相关广告；第五条推送的是与query吻合度极高的热门文章，满足需求，但是需要点击进去后才能得到答案。

总得来说，搜索结果依赖于热度和更新时间。

3. 需求不明确

场景九：搜索“秋冥”

搜索词：秋冥

期待结果：了解何有英《秋冥》这幅画的相关信息

实际结果展示：

搜索结果分析：

基本不满足需求。系统不知道《秋冥》是什么？最好的结果也就是找到了与“秋冥”这个关键词匹配的信息，却不是笔者期待的结果。

场景十：搜索“三体”

搜索词：三体

期待结果：了解《三体》这本书的相关信息

实际结果展示

搜索结果分析：基本不满足需求。前面三条推送的都是只含“三体”这个词，与《三体》这本书的内容信息无关；第四条更是推送了与《三体》无关的广告；第五条，终于是与《三体》这本书及其作者的信息了；但是，第六条，又与期待结果不匹配。因此，如果要获取精准信息，需要对搜索词进行扩展。

从以上10个场景的调研分析可知，微博搜索的不足集中在以下几个方面：

推荐顺序：微博的热度和最新时间权值过高，忽略query的匹配度。
信息重复：重复信息过多，用户在有限时间内获取差异化信息的成本加大。
语义理解：主要依赖query与信息资源的文字信息的匹配度，不能理解query背后的真实需求。
广告置顶：微博对广告的过度推广分散用户高效获取信息的精力。
热门query和冷门query的处理方式单一：基本是基于热度、最新以及query有匹配的原则推送，导致推送结果有大量无效信息。
语义转换：query口语化与书面推送结果差异很大，如：“矫正牙齿得多少钱”和“矫正牙齿价格”。
展现形式：答案有的不够一目了然，有的热门文章中、问答专题中包括query搜索答案，但搜索结果中因只有标题，没有摘要，答案不能一下子就能找到，用户必须得点击进去再继续挑选才行，再加上相关的关键词没有标识，如漂红。

三、优化方案

根据上述调研结果，总结微博搜索在不同场景下的不足，依据用户场景和展现结果满足情况两个方面进行问题的拆解，程序智能给出个性化的解决方案，满足用户高效获取信息的需求。

作者：Alian

来源：Alian

扫一扫微信咨询

商务合作联系我们

本文经授权由青瓜传媒发布，转载联系作者并注明出处：//www.f-o-p.com/187150.html

《免责声明》如对文章、图片、字体等版权有疑问，请联系我们。广告投放找客户找服务蘑菇跨境

运营大纲

微博搜索策略分析

一、调研目标

二、调研分析

1. 需求明确

2. 需求明确，对结果有特殊要求

3. 需求不明确

三、优化方案

相关推荐