logo

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

2017-01-27 18:02:48来源:知乎精选

话题: ,,,,
载入中...

【何明科的回答(375票)】:

这个问题我太喜欢了。作为一个数据控,面对Google在2006年推出的Google Trends,心情是兴奋得崩溃,不亚于目睹AlphaGo击败李世石。那个时候我还是BCG的一名咨询顾问,就深深觉得市场调研这个行业要被颠覆。所以后来写这一系列文章(做投行、行研、咨询等金融岗位,有没有什么好用的找数据技巧呢? - 何明科的回答),几乎是在那个时候买下了种子。

随后在同年,百度推出了百度指数。本来是更喜欢用Google Trends的,但是由于众所周知的原因,最后还是只能使用百度指数。后来转行做投资,就开始更加频繁地使用百度指数来发现崛起的网站和各种生活现象。当然除了百度指数,后来开始使用爬虫(你是通过什么渠道获取一般人不知道的知识和信息的? - 何明科的回答)。

那个年代,百度还比较开放,所有的指数都可以下载CSV格式的源数据,而且怎么使用也不会弹出登录框。于是经常下载百度指数的源数据,做出各类漂亮表格,向老板们建议最近流行的各类网站和应用。

(顺便广告一下,可提供百度指数源数据的抓取服务。)

在2007-2008年,给创业者说,我发现你们最近很火是因为观察到百度指数的变化。大家都惊为天人,现在听起来很傻很天真,但在当时却是实情。而且不仅是使用,还会使用各种小技巧来屏蔽各种噪音。比如:想知道58同城的搜索量,不能只用“58同城”或者“58”,而要使用“58同城 + 58”,否则会漏掉一大块儿搜索量,从下图来看,"58"的搜索量为“58同城”的30%左右。有一次看到某投资人写文章复盘58和赶集之战,提到赶集在2011年大量使用电视广告后,百度指数超过了58同城,然而只用了“58同城”这一个词来比较。这是常见错误,数据爱好者注意避免!

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

影响百度指数的因素

百度指数是以用户搜索量和媒体检索量等作为基础数据,同时通过防作弊等方式的过滤和加权,形成最后的指数。介于算法没有公开过,唯一清晰的是:百度指数与搜索人数及次数高度相关。而关于媒体检索量,大概是和相关文章的发布量有关。但是基于目前的知识,相关系数及重要因子不明。

到目前为止,百度指数仍是观察各网站/App/互联网服务乃至线下各类产品及趋势最好的手段之一,即使准确性堪忧,但实时性仍是最好的。同时被越来越多的专业人士使用,包括:最早使用百度指数的IT人士及投资人士、咨询顾问、营销人士等等。

题主提到的百度指数的波动,只要有如下的原因引起。

季节性比如上图中58同城的百度指数,每年在接近除夕前的最后一周至正月初六跌入谷底,因为其主力用户群都回家过年,找车找房找工作的需求也大幅降低;而从正月初七到整个正月结束前,搜索指数基本拉出这一年的最高峰,也是因为其主力人群回归到工作城市,开始新一年的找房找车找工作的节奏。

而下图是关于爱奇艺的百度指数,基本是每周六拉出一个高峰,因为周六是互联网人群看视频的聚集时间。但是这个规律在春节期间被彻底打破。

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

广告。品牌广告,特别是电视广告和户外广告,对百度指数的影响非常大。因为互联网广告,会将用户直接带到目标网站或者App;而电视广告和户外广告在成功洗脑或者恶心用户之后,会引起用户的好奇心或犯贱感,去百度搜索关键词然后查看服务或产品:因此电视广告或户外广告往往更容易拉动百度指数的上涨。

下图反映的是2015年轰轰烈烈的二手车大战(二手车敢问路在何方? - 数据冰山 - 知乎专栏),优信、瓜子和人人车在百度指数上的高峰,基本都是在其投放电视及户外广告之后立即出现。另外有几点值得特别注意:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

作弊。创业公司也知道投资人越来越依赖于百度指数来做投资决策,于是有人就开始刷百度指数,下图是美丽说的一次乌龙,华尔街的术语叫做Fat Finger。不知道是不是程序员多输入了一个零,于是百度指数暴涨接近10倍,当时所有人的表情一定是这样的:飞起来了……

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

现象级事件。网络时代,爆红的现象越来越频繁,每年至少有个几遭:有叶良辰这样的草根英雄,也有各种正规军的IP内容。下图是乐视网的百度指数,虽然保持了周六的高峰,但是在2015年12月-2016年1月,随着《太子妃升职记》的热播,乐视网的百度指数走出新高,完全打破了周末效应的影响。这就是现象级的IP引起了群众围观造成的。从乐视网和太子妃升职记的百度指数对比来看,趋势还是很一致的。

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

当然,现象有好就有坏。网秦在2011年3月走出异常高峰,就是拜315晚会制造的现象所赐。不知道今年的315晚会又是谁中招,走出异常的“百度指数高峰”,果敢预测是人人喊打的运营商劫持,我的预测理由在这里:如何看待小米等联合声明:呼吁运营商严格打击流量劫持? - 何明科的回答

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

_________________________________

更多精彩文章请看:数据冰山 - 知乎专栏

【王珏的回答(162票)】:

最近研究了一段时间的百度指数,这里分享一些我自己的观点。

先回答第一个问题:靠谱,但一般只用来做大致的对比,并没有严格意义上的数据价值。

百度指数是以搜索量和媒体检索量为基础进行了过滤和加权。大概意思就是越多人搜,百度指数越高。但其中两者应该也不是特别明显的线性关系。(知乎上有很多将百度指数与实际搜索量挂钩的经验公式个人觉得不是特别靠谱)比如说一个品牌的百度指数是另一个品牌的2倍,也不能说明其搜索量就是2倍。中间没有明确的线性关系。其次,媒体检索量意味着媒体关注度,多发几篇稿子,媒体关注度就多一点,百度指数就高一些。但就目前市场上的PR来说,绝大部分稿子对品牌百度指数提升的影响都微乎其微。

百度指数更多的是用来做对比。比如:

1) 两个同行的百度指数比较;(如拍拍贷和人人贷)

2) 同一品牌在不同时间段的百度指数的差异(比如“波司登”在夏天和冬天的百度指数能差10倍)

3) 同一品牌在活动推广之前和活动推广之后的指数差异;(比如“唱吧”在今年初上了“天天向上”之后,百度指数一下子从前一天6000冲到次日的45000)

同时,百度指数里面的“地区分布”里可以看到目标搜索词排名全国前10的城市。同行之间还可以对比。

回答第二个问题:不确定。但不排除作假的可能性。

一般来说,网站的百度指数在短时间内(尤其是几天内)波动,一般会有以下几个原因:

1) 出现媒体或大众感兴趣的新闻;(如巨额融资,创始团队爆出重大新闻等)

2) 大面积铺线下广告;(如口袋购物之前在北京地铁大肆广告,很多人看到了回公司就会在百度上搜)

但根据笔者观察,目前第一条对百度指数的影响已经很小了,除非出现及其巨大的爆料,会持续几天,但很快百度指数还是会回到爆料之前的值。第二条也一样,广告一停,除非有极好的用户口碑,否则基本上也会降到铺广告之前的数值。

其中,如果出现持续性的波动,那么就有理由怀疑作假的可能性了。如下图

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

这是几个短租网站的百度指数,从中可以看到,蚂蚁短租和游天下的百度指数相对平稳,而小猪短租的百度指数则经常性的剧烈波动,相邻的两天波动幅度在1000以上。考察剧烈波动的时间点,并没有相关的重磅新闻出炉,同时也没看到小猪短租大面积的线下广告,那这个波动如何理解呢?

我们再看下面这张图:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

这是小猪在过去12个月里面按百度指数高低排名的全国前10大城市。再比较一下蚂蚁短租和游天下在过去12个月里面的百度指数全国前10名城市。大家有看出哪里不一样了么?

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

对了,游天下和蚂蚁短租排名前10的城市基本上都是一二线大城市,全国范围内平均分布;而小猪短租则有7个城市来自于一个省,而且有5个城市可以说连三四线城市都算不上。。。难道这几个城市的用户对小猪特别青睐,经常搜索?但是在小猪网站上连梅州,惠州这样的城市都没有。。。对了,游天下和蚂蚁短租排名前10的城市基本上都是一二线大城市,全国范围内平均分布;而小猪短租则有7个城市来自于一个省,而且有5个城市可以说连三四线城市都算不上。。。难道这几个城市的用户对小猪特别青睐,经常搜索?但是在小猪网站上连梅州,惠州这样的城市都没有。。。

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

至于为什么只有广东的城市?拿一些不是特别重点的城市刷百度指数,以逃避百度的跟踪,是一些网站/代理商经常的做法。本帖作为一个纯技术探讨贴,不对其动机最深入探究。但笔者只是想问,能不紧着一只羊身上薅羊毛么?

【luziyeFantasy的回答(15票)】:

百度指数相对靠谱,通过分析能有一些实际的参考意义。

先看一下百度指数能干什么。

百度指数能够告诉用户:某个关键词在百度的搜索规模有多大,一段时间内的涨跌态势以及相关的新闻舆论变化,关注这些词的网民是什么样的,分布在哪里,同时还搜了哪些相关的词,帮助用户优化数字营销活动方案。

作用说明:反映用户在互联网上对特定关键词的关注程度及持续变化情况。

算法说明:以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和。根据数据来源的不同,搜索指数分为PC搜索指数和移动搜索指数。

为什么要看百度指数?因为在某一特定时间内,的确能看得出来用户对某一个关键词的关注程度,来看看这个关键词、产品、网站是不是有一定的(传播)效果。

举个本周最近很多人讨论的余佳文和周鸿祎的视频例子~

如何看待余佳文与周鸿祎的公开对话? - 互联网行业

看一看“余佳文”这个关键词:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

8.12号之前,数据一直平平,但是在8.12这一天开始持续的上涨,为什么?8.12号之前,数据一直平平,但是在8.12这一天开始持续的上涨,为什么?

因为CCTV1开讲啦在12号那天在自己的微信平台上出了一个剪切的视频,这个视频充满了槽点,火了,于是在接下来的几天里,肯定有很多人在百度上搜索“余佳文”以及和其相关的关键词,

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

媒体关于余佳文的报道不在少数,关于“余佳文”的媒体指数,

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

毋庸置疑,“超级课程表”也肯定出现了一个峰值,

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

这种热点现象会带来短时间内的指数波动,但是好像似乎“然并卵”。

再来看另一组前段时间火的“神州专车”。

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

可以看出:搜索指数在6.26这天出现一个峰值,而媒体指数在6.26和8.2两天出现了峰值!为什么!可以看出:搜索指数在6.26这天出现一个峰值,而媒体指数在6.26和8.2两天出现了峰值!为什么!

为什么会出现搜索指数和媒体指数不同步的现象呢~

因为在6.25日那天,神州专车出了一系列撕逼Uber的海报,当天足够成了一个热点话题,用户会自己去搜索这一关键词,并自发形成话题,

你以为神州撕错了B?其实你才错了。

所以,神州专车的曝光传播营销目的都达到了^_^

那为什么,8.2这天,媒体指数出现了峰值,而搜索指数依然平平呢。因为在8,2之前,神州专车宣布8月推出免费接送机业务,并且活动未开始,负责人就被政府约“茶”,媒体对这一事件进行了大肆报道,

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

而时间点就是在8.2这天,而用户才不管这些约茶不约茶呢~而时间点就是在8.2这天,而用户才不管这些约茶不约茶呢~

(所以?用户不太在乎你一天发多少新闻稿写多少软文,他们在乎的是你有没有槽点有没有形成一个话题,让我自己主动的在一个特定时间内去搜索相应的关键词?)

那百度指数有什么用呢?

可以作为两个同类行业的竞品比较,比如携程和去哪儿~

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

看一副来自易观的数据图就能看出对市场的影响,看一副来自易观的数据图就能看出对市场的影响,

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

市场格局方面——2015年第2季度,在线旅游市场两极多强格局进一步巩固。携程、去哪儿交易份额共占68.66%,交易规模分别为410.3亿元人民币和318.7亿元人民币。
但是,携程的搜索指数是两倍领先于去哪儿,但是交易额只多了29%,这足以说明,搜索指数量也和市场份额(用户量)不是一个正相关的倍数关系,及携程搜索量是去哪儿的两倍,那么市场交易额或者产品用户量就是就是去哪儿的两倍。

淘宝提供代刷百度指数,但是刷百度指数似乎毛用都没有,这又不是微博粉丝,做给老板看阿?~

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

那如何提高百度指数?

核心:让品牌得到足够多的曝光。

品牌内容覆盖的地方足够多足够广,更多的人知道想要了解。

而百度指数又是一个滞后的数据,智能对已经发生的事情做总结分析,又不能预测~

更难过的是,还能找到第二个具有参考意义的指数嘛,除了百度。。。/(ㄒoㄒ)/~~

【寒鸦的回答(1票)】:

比较准。曾经做过百度下拉刷词,钱花了大几万,怎么统计效果呢,经过同学们的热烈讨论,我们给出了以下几个维度:

订单,关键词搜索量,关键词UV数据,这样对于seo来说基本满足。但是你刷词还要考虑竞价投放的效果吧。这个时候百度指数发挥了重要的作用。鼠标定位上去你会看到具体的值,这个就是展示数据了。

这样我们的roi,ctr等各个维度的数据也出来了,seo和sem的数据和历史数据大致相同。

所以还是比较准的。

【兰夕的回答(44票)】:

百度指数靠谱吗?

真是个好问题。

在影视界,百度指数常常用来作为评估艺人或者影视项目的参考。我们来看看两个男明星的百度指数数据。

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

看看这缠缠绵绵的曲线!

看那高峰峰值,看那断崖式一起下跌——这是双人跳水现场?(有个水花压得不够哦)

而这两位百度指数如此相似的艺人……是双胞胎吗?并不。。他俩八杆子打不着,一位是以摸头杀闻名的电视剧大神,一位是韩范歌手,路子基完全不搭架,连同框的事都没干过。

(一定要问是谁的话,不怕挑明了说,一位是霍建华老干部,一位是表情包大神黄子韬,或者说wuli韬韬这个名字大家更熟悉?)

老干部目前凭《女医》在两台拿着峰顶视收,wuli韬韬近来并无活动,只是在美国录音,但是近30天的百度指数却能几乎完美地重合在一起,几处峰值更是诡异地同步出现,再同时双双殉情,不,断崖式双人跳水,为什么他们的百度指数曲线会如此惊人地相似?呵呵,你猜。

如果你说艺人的数据都差不多的话……

老干部与某位马上要办喜事的小花同为《女医》的主演,近期这部剧同样热播,但是近30天他们俩的百度指数曲线是这样的……

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

好吧,难怪你们剧中都成不了一对……原来是天注定……

至于大名鼎鼎的北海道CP就更是……看图说话吧:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

这能叫CP?完全看不出来比翼双飞的趋势吧……

至于第一张指数图出现的诡异断崖式下跌,我不禁脑洞大开一记:会不会是某操作员偷懒忘了续费?看起来,高峰跌落的数值,才是真正的数值哦。请注意,这完全是不负责任猜想。

其实百度艺人指数有人为操作现象早不是新闻,因为无论是作为厂商代言的择选,还是影视选角,以及艺人个人的知名度,百度指数都是很重要的“大数据”资料。

偏偏百度艺人指数并不是简单的搜索量相加,而是经过“加权过滤算法处理”,所以,你懂的,这其中就会留下很多的操作空间。

业界就有人曾爆出,某位曾和公司闹解约的小生和老干部用的是同一间数据公司。而且,在某位艺人的某段时间搜索数量统计上,曾经爆出了延边小城的搜索量等于北京上海搜索量总和的笑话,故此有了“延边一哥”的美誉。

在影视界,电影票房也好、电视剧收视率的样板污染也好,早就不是什么新闻了,现如今连新媒体数据照样可以玩。至于是什么造成了老干部和wuli滔滔的指数如此相似,咳,倒是也别疑心是艺人,说不定就有一些疯狂的黑客粉丝愿意应援呢?

当然,最应该问一问的,就是百度自己了。

现在回到问题:百度指数靠谱吗?你说呢?

----------------------------------------------------------------------

低调地安利一枚公众号:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

娱乐次元:准专业化娱乐圈资讯集散地,带你拨开迷雾看圈内!

包括不限于星闻、影评剧评、业界资讯,最新鲜的话题推送,给从业者最冷静的侧面参考:)

【梁昌霖的回答(24票)】:

1. 指数基本上能够反应搜索量的多少,但是也不像有些人说得那样直接相等,甚至不是线性的比值关系,感觉超过一定的搜索量以后,搜索量/指数 的比值在增加。有图有真相:

下图是“妈妈帮”一词,在4月-9月间的真实搜索量:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

下图是相同期间对应百度指数变化情况。

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

4月份,每天搜索次数30000的时候,对应百度指数大概为10000。现在每天搜索次数约4.8万,对应指数大约是1.2万。4月份,每天搜索次数30000的时候,对应百度指数大概为10000。现在每天搜索次数约4.8万,对应指数大约是1.2万。

2. 城市分布基本靠谱,但是人群属性等分析,太不靠谱了。再以妈妈帮举例,95%的用户是女性,20-29和30-39的人群占比相当。但是百度指数的分析结果:

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

【筑牙的回答(3票)】:

运营相关,我主要用百度指数研究市场给产品准备新闻稿

个人总结:

1、对于一些非品牌、人名等专用词汇,搜索指数和媒体指数通常不一致。

很好理解,两个场景,某个品牌最近在新闻端做广告,于是用户会在百度搜索,此时搜索和媒体数是有相关性的,因为用户行为模式是:被媒体勾起了好奇心,然后去满足好奇心

而我搜索的是防伪、正品、溯源等这类非专属词汇,绝大部分的搜索,用户的行为模式:我在生活中遇到问题,要找解决的方法。

举我研究的例子:(注:时期为2015.1.1——2016.1.28)

百度指数靠谱么?有些网站的百度指数频繁剧烈波动意味着什么?

1.1 从搜索和媒体高峰月份来看,几乎是不重合的。1.1 从搜索和媒体高峰月份来看,几乎是不重合的。

1.2 从来源相关词和新闻主要内容来看,也是很少重合的。

也就是说,用户想要解决的问题,媒体没有关注,因为媒体是传播新闻,而不是传播知识。

2、定性分析有时比定量分析重要,分析数据背后的实质比分析数据要重要。

同样沿用上面的例子,根据这几个词的详细分析:

2.1总体分析:5个关键词中用户的搜索热度依次为:防伪、正品、假货、溯源、渠道管理

分析方法:

(注:百度指数还可以看人物画像,因为这5个词的人物画像相差不多,因此没有另外单列。这些关键词搜索的年龄层均为30-39岁,主要集中在广东、浙江、北京,男性搜索量比女性多。)

2.2具体分析:

  1. 用户搜索高峰月份与媒体报道高峰月份不一致,搜索内容也不一致。

  2. 用户搜索主要目的为防伪查询,媒体主要报道特殊商品的防伪技术,比如人民币、大闸蟹。

  3. 说明用户防伪查询意愿一直比较强烈,百度查询的第一二页大部分为官方机构或者品牌的防伪查询网站。

  4. 部分需求较大但防伪方法较少人了解的商品搜索人数也较多,比如小米手机、苹果手机,长尾关键词为燕麦(药品,实际为血钻野燕麦,类似伟哥)。

  1. 用户搜索高峰月份与媒体报道高峰月份不一致,搜索内容也不一致。

  2. 用户主要目的为查询所购买商品是否为正品,因此关键词与电商有关,商品方面关注名牌服装、阿迪达斯、手表和小米苹果手机等高消费品。

  3. 与关键词防伪类似,当用户想要判断商品的真伪时,首先想到的是搜XX 正品or防伪查询,因为只要知道正品是什么样子就知道自己买到的是不是正品,而搜假货的话则会n多种可能。

  1. 用户对此关键词的认知较少,因此搜索需求较少,新闻媒体的报道也较少使用这个词。

  1. 用户搜索高峰月份与媒体报道高峰月份一致。

  2. 说明当新闻爆出某电商平台有丑闻时,用户才会自主搜索假货,了解这个电商是否值得信任。

  1. 用户搜索目的主要为了解渠道管理方法以及查找相关系统。

以上,有想法再更新,欢迎讨论。

【又是独自存在时的回答(1票)】:

因为性别原因,女性在社交网站一般注册为男性(微博例外),所以你不管搜什么,都是男性高。。。(毕竟国情)

至于一些大姨妈,丝袜之类的搜索,不用我说你也知道了,肯定是男性多。。。

百度包养的小妾的搜索一般高于业界标准。。比如爱奇艺。。。

不过因为很少有人挂vpn上百度,所以ip所指向的物理位置绝对靠谱

综上所述,趋势数据相对靠谱,性别分析不靠谱,地域分析最靠谱

原文地址:知乎

您可能还会对这些文章感兴趣!

最新评论文章

热门标签