火车采集器官方博客
数据驱动社群运营,怎样科学找到你的群聊kol
post by:dong 2018-9-10 9:49

前些天看知乎,看到有人讨论kol,如下图:

 

小采想就kol跟大家来聊一聊,为什么你手机里曾经加入过的好多群聊,最后都无声无息的死掉了?

总结了一下群聊死掉的原因,我得出两个结论:

1、群里没有KOL,也就是没有人制造话题,活跃群氛围;

2、群聊定位不明确,运营者不知道大家喜欢聊什么。

我就以公司最近拉的“火车头YY培训交流群”为例子吧:

这个群是我们最近新拉的一个直播培训交流群,目的是方便直播培训活动的进行and为大家提供一个交流场所。

我把群里的聊天记录以txt文本形式都导了出来做了一个简单的分析,如图:

 

看上去很杂乱,这样的数据显然是不能直接用的,所以把数据导入excel表格。

但是直接导入excel表格的话你只会得到一堆无序的数据,这不是我们想要的。

因为如果你把它直接导入进Excel,会出现很多串行的情况,群消息的文本会有换行的内容。

所以这肯定是要处理的,并且会有两个比较严重的问题:

1. 换行后是时间的保留下,其他类型的换行全部去掉,要不然导入Excel会出现串行的情况;

2. TXT中字段之间的间距不一致,需要间距一样或者用相同的字符分开才能导入进Excel里。

TXT不支持通配符,所以需要放到Word中处理。复制进Word后,把所有的“^p2018”(通配符^p代表回车或者换行符)都替换成“####”保存下来,然后把其他剩余的“^p”全部删掉。然后再把####替换回“^p2018”。这样第一步完成。

这时你就得到了这样的数据,如图所示:

 

把这些数据导入excel表格,像这样:

 

再进行分列操作,具体如图:

分列操作
/
四步骤

经过一系列的操作,最后你能得到这样一张结构化的表:

 

前面有些地方会有替换处理不干净的,使用筛选功能,把串行的调整一下这样就完成了。

做下词云就能得到:

  

通过上面的操作,我们对这个群有了更深刻的了解,前面提到的两个问题,也有了解决办法。

对小采来说,还有一个收获:

我通过分析积极参与群聊的人,找到我群里的KOL,维护好他们就相当于维护好了我的社群。

词云图就无需过多解释了,高频词就是群成员关注的话题。

有一个地方提一下,群聊消息里面,有“@XXXX”这种内容,XXX是群成员的昵称。

如果你的词云图里某个成员的昵称出现了,那你要把这个人好好供起来了,他很大概率是群里最受欢迎的对象。

emmm,以上就是小采所采集的数据得到的结果,你也可以去操作一下,去找到独属于你群聊的kol!

 

评论:
发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容