基本过程:数据(无价值)-> 挖掘(重点、核心) -> 有效数据(有价值)-> 找到既有业务 -> 变现 基本思想: 1.对于未知的需求,挖掘本身是没有方向的,需要有一套框架体系作为指引 2.对于确定的需求,应该有一套确定的挖掘手段 3.先找到卖什么,能不能卖、怎么卖是另外考虑的问题。 4.必须从人性角度、用户实际需求出发思考 5.凡是有引流和投广告的地方,都可能存在商机 6.返现一个可能的商机,就要尽可能的了解整个流程,看别人是怎么做的 框架体系 作用: 1.作为前进的指引 2.数据池是鱼塘,有价值的数据就是鱼,框架体系就是编织渔网的方法和渔网本身,这样才能抓到鱼 原理: 1.“特殊”词汇反映着特定人群的特定需求、特定行为、特定意图 2.提问就是产生需求的最直观的体现 3.动词代表行为,行为体现动机,动机反映需求 过程:信息挖掘(收集) -> 信息筛选(清洗)-> 分析(需要耐心人工完成) -> 使用(创造价值) 前提:数据分析的前提是需要有比较充足的数据,这样分析出来的结果才是有效的 构建逻辑: 基本逻辑: 1.从用户的角度思考,遇到需求、问题或者痛点时会用什么词汇搜索 2.从服务的提供者角度思考,我能提供服务的那些需求一般会涉及什么词汇 符合下列其中之一即为特殊词汇: 1.什么词汇能够体现用户的需求、问题或者痛点 2.什么词汇在用户的描述中必然出现 3.什么词汇能够紧跟时代的发展,能够反映或关联当前的新事物 4.提供服务的那些需求一般会涉及什么词汇 挖掘方法: 1.搜索引擎高级搜索指令搜索 作用:在指定的范围内搜索指定内容 intitle:格式:‘intitle:"待搜索的关键词"’ inurl: 格式:‘待搜索的关键词 inurl:待搜索范围的网站’ 2.下拉词(下拉框里的词): 作用:通过该入口自己能够主动去获取新鲜事物 特点: 1.时效性(近期)、热度(高频),在近期内某些长尾词有了较高频次的搜索就会出现在下拉框里 2.具有联想功能,能用a-Z、0-9、拼音等字符来带出其他词汇 使用:目标主词+ a-Z/0-9/拼音等字符 适用范围:任何带搜索框的地方,例如:搜索引擎、抖音等 具体应用: 信息发掘:新增需求、功能变动、突发事件 舆情监控 3.基词+高频词根拓展 过程:拓词+清洗(去重、去长、去短、去无效词,去非目标词) 拓词步骤: 1.以某一个词为起点(基词),通过工具网站,找到一批相关的长尾词 2.对长尾词做分词,然后统计词频,找到词频最高的一批词根 3.用基词+高频词根,通过工具网站,再找到一批相关的长尾词 4.重复上述步骤,直到第一次的高频词根使用完 拓词原则:遵循28定律,把能覆盖80%词量的20%词根都拿去拓展,基本就能收集到有代表性的词库了 工具网站:5118、百度的关键词规划师、艾奇关键词工具、爱站、站长工具等工具 注意: 1.分词时要重视词频文档建立 2.分词时要忽略无效词根 筛选方法: 无效词库:存放通用的、与目标必定无关的词,经过比对后进行排除 去重:需要把一模一样的词去除 去长去短:一个正常的关键词的长度是在一定范围内的,太短没有参考意义,太长一般是有重复词根 去无效词:乱码、字符串、纯数字等等 去非目标词:某些词根一看就不是我们想要研究的,比如一些违法乱纪的,那就把包含该词根的全部去掉,这一步骤并非必须,仅根据个人分析目的。 分析方法: 词向量文本分类 作用:一种计算文本相似度的方法,针对大量数据进行聚合减少数据量,把相似文本聚合在一起成为一个主题 注意:计算词汇相似度时,不要把通用词、无关词等也纳入计算范围,以增加准确性 缺点:没有特殊结构,只能一个个主题的看 适用范围:任何 关键词根提取法: 作用:按照特定的结构,以一个基词为中心来聚合文本,便于按照层级结构分析和查看 方法: 1.提取一份词库里词频最高的topN 2.按照上一条的思路在包含上一级词根的前提下陆续提取下一层级的topN词频 3.最后一个节点的子节点输出对应长尾词 4.利用Python的”xmind“模块把词频作为节点输出 5.节点中增加数值显示(涵盖总词量/在词库里所占比例),可以知道这个板块在词库中占的比重 适用范围:单一领域,即以一个基词为中心进行构建 模版分析: 主词 + 疑问词 + 动词 主词的作用限制了领域、疑问词保证了需求、动词则确定了方向 适合用来挖掘一些服务类、工具类的业务 使用方法: 把词汇放入搜索引擎搜索,看看别人通过它们在做什么(核心) 词汇体系: 疑问词:什么、如何、怎样、能不能、是不是、可不可以、需不需要、如何、怎么、怎样、怎么样、能不能、是不是、有没有、有什么、可不可以、哪有、哪些、哪种、哪里、哪个 人性懒惰:技巧、方法、诀窍、秘诀、套路、快速、一键、批量、自动、自动化、数字化、数智化 求资源:资源描述 + 打包/网盘/云盘/百度云/整部/整套/全本/合集、技巧、全集、套路、百度云、高清、超清、整份、在线、全部、下载、上传 情感词:太慢 产品词:包罗了互联网主流平台名称,比如:微信、抖音、微博、闲鱼、探探等大众小众平台 行业词:seo、sem、爬虫、区块链等等,这些都是一个领 后缀词:文件后缀,txt、rmvb、avi、png、jpg、mobi 资源词:课件、视频、素材、笔记、电视剧、电影、照片、游戏、歌曲、文档、文件、教程、影片、小说、图片、原图、书籍 意图词:表达强烈的意图,跪求 私域流量:微信、QQ、群、公众号、个人网站、关注公众号、加微、"加威"、"+薇"、加微、加威、加薇、加胃、加魏、+V、vx、加微、联系、进、找我及其相关变种 说明: 1.明确信息标题:直接从标题就能看到业务信息 2.非明确信息标题:标题里仅由通用词组成,无法再获取其它信息 3.搜索引擎:不单指传统的搜索引擎,只要任何一个平台、一个应用、一个APP、一个网站,有搜索框就算搜索引擎 问题: 1.有那些特殊词汇?怎么收集?怎么使用 2.词向量文本分类 无法理解: 1. 商业模式不一定都是具体的交易 参考: 互联网常见的_特殊词汇_,往往被忽略的商机.html https://zhuanlan.zhihu.com/p/182462542 之前承诺的关键词数据来啦!.html https://mp.weixin.qq.com/s/ceYXS-E-6UByhhIeyZVLPA 一个自动发现新鲜需求的小助手.html https://mp.weixin.qq.com/s/akcXPXLzD87A3m20UKhFBg 如何在百万级的数据里找到别人正在赚钱的项目.html https://zhuanlan.zhihu.com/p/157846204 如何轻松找到抖音里不起眼的赚钱项目.html https://zhuanlan.zhihu.com/p/159151941 学会这几点,就可以在百万数据里找到能赚钱的项目.html https://zhuanlan.zhihu.com/p/179046666 利用【筛选模板】轻松提取出小红书热门业务.html https://mp.weixin.qq.com/s/xsRddRCLsxbtO1fUdKlCTQ 如何自动收集大批量现成的互联网业务.html 绝大部分需求痛点都可以按照这套词库框架挖掘出来.html 技能篇:想要挖掘商机,先学会这个能力.html 几个现学现用的方式:提取用户较为“迫切”的需求!.html 从网页的“小广告”中提取出最热门的业务!.html 从付费行为里给自己找一个兼职当作副业.html 百度搜索移动端流量词热度统计方法.html 百度竞价广告:穷尽蓝海流量-收集篇.html 百度竞价广告:穷尽蓝海流量-查词篇.html 百度竞价:大量挖掘有商业价值的词汇,截流另一片长尾流量!.html seo清洗百万长尾词数据的策略.html SEO采集海量文章,用倒排索引找出_类似的标题.html 学会利用“情感分析”从用户评论里挖掘槽点.html https://mp.weixin.qq.com/s/vKlEpJiCe8GLfBgYOj_iMA 搜一搜SEO选词实操步骤,附提词工具!.html