抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容

Դ未知

ߣ老铁SEO

16

2019-07-13 19:42:27

理论

今日头条在2012年创立之后,一路高歌猛进,积累了大量的用户,曾一度号称日均活跃用户高达2.5亿,可见其用户体量是何等的巨大,这也成了作为我们重要的引流阵地。期间,也有很多前辈写了一些关于今日头条技术攻略文章,总体可以归纳为以下几个量化的指标:

1) 点击率

2) 阅读时间

3) 评论

4) 点赞

5) 收藏

6) 转发

虽然这些因素都很重要,但是这些都不是我要讨论的点,我要讨论的重点是内容的构造。有些大佬也分享过,内容归结起来有两点:一是追热点,二是寻找热搜关键词,然后根据关键词去做内容。热点或热搜关键词可以通过以下几种渠道去寻找:

1) 新浪热搜(http://s.weibo.com/top/summary?cate=realtimehot)

2) 百度搜索风云榜(http://top.baidu.com/)

3) 关键词规划师(http://www2.baidu.com/)

4) 5118(http://www.5118.com/)

5) 词库网(http://www.ciku5.com/)

6) 爱站词库(https://ci.aizhan.com/)

的确,这些都是行之有效的方法,但是我还想是从使用场景出发,来探讨一下内容构造。

场景举例

小纯是一个喜欢体育资讯的人,打开今日头条的时候,他会看一些体育资讯,当然看到热点新闻或者美女图片的时候,他也会点开了看一下,那么今日头条也会根据小纯的兴趣爱好和浏览轨迹,生成大数据标签,可能给他贴上的标签是:90后、喜欢美女、猥琐男、体育,然后根据这些标签去给我推荐内容。

这个就是一般用户的使用场景,通过场景能够推导出内容首先需要满足两个条件:一是符合用户标签,二是标题具有吸引力的,根据标题跟标签去创造内容。那么什么样的内容才会具有两个条件?其实可以参看阅读量在10w+,100w+的爆文。

实操

工具

python

python geckodriver

python PhantomJS

python第三方库:selenium、jieba(结巴)

第一步,打开今日头条娱乐版块(https://www.toutiao.com/ch/news_entertainment/):

由于是信息流样式,所以只有不断的鼠标往下拉,才能得到之前的文章,那么我们小调用火狐浏览器,具体代码参考如下,它可以实现浏览器自动滑动,显示信息流的内容

然后excel整理得出的结果是,可以得出文章的url跟标题。

第二步,筛选高评论的文章,一般情况下,评论数跟阅读量是成正比的,然后抓取高评论文章的标签,代码参考如下:

然后excel整理得出的结果是,可以得出文章对应的标签。

最后通过excel数据透视表得出结果:

第三步,进行爆文标题分词,分析爆文出爆文常用词,代码参考如下:

经过Excel数据透视表整理得出结果,分析占比最大的常用词,

总结

1、 越多爆文都使用的标签,说明其受众是巨大的,才有可能成为爆文的可能;我们创作内容使用这些标签,或者针对这些标签创作内容,在一定程度上让我们内容具备了爆文的特质。

2、 除了内容本身之外,标题占了很重要的一部分,那么抓取标题常用词,在一定程度上就能够吸引到用户去点击我们所创作的内容。

作者:肖小纯

补漏洞但依然可越狱 苹果iOS 6 1 2更新

来电科技CEO袁炳松发内部信回应 ldquo 盗窃 rdquo 属不实消息 此前曾被陈欧

教师节的歌曲 有关教师节的歌曲推荐

富士康推富金机网 打造工业品跨境电商

你还在纠结什么 专业VOV空气净化器值得选购

熊掌号运营学习的心得体会

第一财经商业数据中心 2019中国跨境电商出口趋势与机遇白皮书

贴吧个人主页发帖软件

百度竞价推广技巧 如何做好关键词排名和出价

SEO网站优化 百度SEO排名 SEO推广技术 上海SEO服务公司

SEO网站优化 百度SEO排名 SEO推广技术 上海SEO服务公司

360如何升级win10正式版 360免费升级系统教程

好的文章标题如何写

SEO优化排名精灵站长工具 v6 0 6 下载

吐血破解百度seo排名点击器 实现seo快速排名

佭ϴý Ѷ Media8ý

在线客服

外链咨询

扫码加我微信

微信:juxia_com

返回顶部