如何快速挖掘新兴领域需求

核心提示挖掘需求的重要性不必多说,有需求才会有市场。创业者在进入一个新兴领域时会思考这个问题:如何挖掘出用户需求,并做出用户愿意付费的产品。本文提供一种挖掘新兴领域需求的思路:长尾搜索词。搜索引擎的搜索框作为用户主动搜索的入口,用户的每个输入都可能

挖掘需求的重要性不必多说,有需求才会有市场。创业者在进入一个新兴领域时会思考这个问题:如何挖掘出用户需求,并做出用户愿意付费的产品。

本文提供一种挖掘新兴领域需求的思路:长尾搜索词。

搜索引擎的搜索框作为用户主动搜索的入口,用户的每个输入都可能是痛点,这些痛点更大概率能转化为需求和产品。所以我们可以通过收集用户的这些长尾搜索词,并结合一些关键指标,找出需求点。接下来,我们通过挖掘区块链领域相关需求的例子来讲讲如何操作。

最近比特币等各种虚拟货币大涨,相信大伙或多或少听说过。

那么问题来了,区块链经过这些年的发展,作为一个还算新兴的领域,它到底衍生出了哪些产业,创业者进入这个行业能提供哪些服务。步骤一:确定领域词首先我们需要确定领域词,领域词的选择至关重要。需要有足够的特征和代表性,不然在后续的扩展挖掘中会越偏越远。

比如区块链行业相关的领域词 「比特币」「Defi」 「以太坊」。获取行业的领域词,可以有如下办法:

  1. 寻找别人整理好的
  2. 向相关行业人员请教
  3. 自己写程序抓取挖掘
1 和 2 不在本文的讨论中,新兴领域的词层出不穷,整理好的词库有它的滞后性,特别是区块链相关的,项目更新日新月异。

还不如自己动手丰衣足食,构建自己的领域词库。

首先找到该领域比较权威的网站或者导航站,比如区块链相关的新闻站有「巴比特」「区块律动」,导航站有

http://

qkl123.com

,我们将导航站收录的项目以及相关的描述都抓取下来。然后需要从文件中将领域词分离出来,方法就是 分词 + 计算词频 + 抽出 topN 的关键词我们先尝试使用结巴分词对内容进行分词,一般情况下结巴分词能够比较好的处理中文分词,但是却不适用于我们这种场景。原因是结巴分词靠的是词典,对于新兴领域词典有滞后性,比如我们测试 区块链是一个伟大的革新,很明显区块链 没有很好的被识别出来。

步骤二:拓展长尾词关键词确定后,我们可以围绕关键词扩展出更长尾的词。比如围绕挖矿,可能的需求有 怎么挖矿挖矿多长时间能回本 挖矿真的能赚钱吗。那么如何快速拓展出这些长尾词呢,可以思考下,如果我们有类似的问题,会怎么获取信息。答案是主动搜索 - 问百度,问知乎,问各种搜索引擎。

主动搜索真切的表达了自己当时的需求。比如我们在百度搜索 挖矿,百度会有一系列的下拉联想词出来,绝大部分是人主动搜索形成的,而这些词背后恰恰体现人们最迫切的需求。通过上图我们可以看到 挖矿 每个月搜索量很高。说明在区块链领域中 ,挖矿需求真实存在。

很多人可能会执着于挖掘搜索量很高但竞争小的词,会进入一些误区。不是所有满足条件的关键词就一定能转化成需求,并最终完成变现,它可能是蓝海,也可能不满足需求本身。反过来,如果你的资源足够,哪怕竞争再激烈,进入一个需求量足够大的市场,也能够分一杯羹。采用上文同样的方法,我们可循环遍历抓取百度规划师的那部分数据。

有一些现成的拓词工具能直接使用,附带搜索量结果。至此,我们完成了长尾词的挖掘,接下来就是怎么分析这些数据了。步骤四: 聚类长尾词我们总共跑出了 30w 区块链相关的长尾词,这些词需要做个归类,人工整理耗时耗力,可以写程序帮我们处理大部分工作。

这里介绍一种简单的聚类算法 K-means ,属于无监督算法(Unsupervied learning),即我们手上没有明确的类别,通过算法把相似的东西分到一个组,来寻找其中的规律。网上有一些很好用的 Python 库,如 scikit-learn 能直接实现 K-means 算法聚类简单分析下数据,区块链行业目前搜索的长尾词用户画像大概分几类 (以下仅供娱乐)

  • 青铜级别 (刚刚知道区块链这个行业,还在将信将疑中)
  • 黄金级别 (现货不够刺激,直接上期货)
  • 王者级别 (不愿只做韭菜,直接当镰刀)
在分析的过程中,我们也发现程序处理流程的几个问题
  • 长尾词覆盖不全由于区块链行业的特殊,很多关键词没法在规划师中获取到搜索量,故需要另外分析。同时我们确定领域词的时候,可以扩大抓取的数量和范围。

  • 条目跟行业无关比如 defi 是区块链金融,那么会拓展到金融相关的长尾词,挖矿也会扩展到挖煤矿的长尾词。这个问题可以通过一些思路避免,本文先不赘述,下期再讲。
回顾
  • 有些做技术的同学可能纠结算法的准确率。这里面我的观点是,技术用来给工作提效,但不能纯依赖技术。

    如果一个算法准确率在 70% 左右,已经能提升一半以上的效率,但再优化这个算法耗费的精力指数级上升,那么可先不优化。

  • 「信息熵+互信息」 算法是我之前的反作弊团队在识别恶意品牌营销上用到的。换个思路,发现它在挖掘需求上面也是把利器。

    再拓展下,此算法可以挖掘出各行业的品牌词,也能给结巴分词自定义行业词库,细做下去应该也挺有趣。

  • 通过关键词挖掘需求,只是作为一个维度去判断市场,不是万金油。
 
友情链接
鄂ICP备19019357号-22