[魔镜工作原理]竞品宝贝/店铺的引流关键词报表是如何生成的?

 

 

这篇文章主要针对淘宝平台,但同样适用于其他的平台,比如1688.com, 速卖通,京东,等等。

 

第一步,我们准备一个包含几十万淘宝搜索词的大词库。

 

第二步,我们使用其中的每一个词来模拟买家在淘宝平台上进行搜索,然后记录搜索结果中每一个宝贝的排名位置。比如下图中,我们用“风衣”这个词来搜索。在搜索结果中会有大约40个自然搜索宝贝和大约10几个直通车广告宝贝,我们会把这些宝贝都记录下来。然后我们会自动翻页,获取前面若干页的所有宝贝和排名。

 

关键词 宝贝 排名位置
风衣 宝贝1 1
风衣 宝贝2 2
风衣女 宝贝A 1
风衣女 宝贝B 2
风衣女 宝贝1 10
风衣女 宝贝2 12

 

keyword-1

 

这个列表会有多长呢?会有至少1亿行。(关键词库词数 * 每个关键词下记录宝贝数量)

 

第三步,我们会把这1亿行数据载入到我们独有的大规模数据集群里面(你可以想象成一个装满计算机的大机房),然后对数据进行清洗和处理。变成这样的形式:

 

宝贝 关键词 排名
宝贝1 风衣 1
风衣女 10
宝贝2 风衣 2
风衣女 12

 

在这一步之后,我们已经可以了解到某一个商品的引流词是哪些,他们分别在什么排名下引流(这会决定从这个关键词引流量的大小)。

 

第四步,我们进一步把宝贝聚合到店铺一级,帮助用户了解店铺整体的引流关键词如何分布,引流效果如何。

 

换句话说,整个流程其实每个用户也可以尝试人工去进行。您可以对您关注的那些关键词,逐个在淘宝上进行搜素,然后找到搜索结果中您关注的竞品的排名,记录下来,最后再整理成宝贝下关键词的形式。唯一的问题就是工作量,搜索一个词还行,搜索100个词已经是一件枯燥乏味的事情,搜索1万个词?您可以想象吗?这只能由机器来帮助人类完成了。

 

这样生成的数据是准确的吗?

 

对于自然搜索而言,这一套方法获取到的关键词引流情报基本是准确的(影响准确度的因素包括上下架时间导致排名波动和翻页页数),因为本质上是机器模拟人去淘宝页面上进行搜索。如果竞品在关键词下排名页数非常靠后,魔镜是不做收录的。因为在那样的排名下面产生的引流效果页非常差,不是用户需要关注的重点。

 

而对于直通车而言,可能不会完全跟竞争对手的直通车后台一模一样。因为直通车是一个广告系统,它会根据“精确匹配/广泛匹配“等模式把相近的关键词也纳入到广告展现,在这种情况下,魔镜收录的关键词会偏多,用户可能会觉得奇怪,为什么直通车后台没有配置的关键词也会在魔镜里面。

 

直通车关键词的收录同样也会受到翻页页数的影响。如果一个竞品宝贝在某个关键词下排名非常靠后,魔镜也不会做收录。而在这种情况下,魔镜收录到的词可能会偏少。

 

总的来说,魔镜所提供的竞品关键词报表不可能完全跟卖家/直通车后台一模一样,而魔镜也从来不希望跟直通车后台一模一样。魔镜要做的就是模拟真实买家,在淘宝网站上进行真实的搜索,收录真实的搜索结果。这才是对于卖家来说最重要的情报。从这个意义上来说,魔镜提供的关键词报告可能会比直通车后台更真实。

 

值得指出的是,魔镜在数据爬取和处理的覆盖度和质量上都有很高的标准。即便是在一些山寨产品通过使用小词库和低翻页数量来减少数据处理量从而跟魔镜进行恶性竞争的情况下,我们仍然不考虑在成本和价格上进行妥协。我们不希望我们开创的数据情报生态系统变成劣币驱逐良币的柠檬市场,因为我们相信,优质的数据可以带来成功,而劣质的数据只能加速失败。