我和关注我的前1000个粉丝“合影”啦,收集前1000个粉丝进行了一系列数据分析,收获满满

我们都知道在CSDN平台上博主与粉丝的互动是非常少的,不像B站抖音这些平台,CSDN粉丝数点赞数等数据相对非常低,这些现象产生的主要原因必然是因为平台的性质不同,面向对象不同。B站抖音偏娱乐休闲,大家自然更原因花多的时间在这上面,而CSDN作为一个学习平台,在数据量上很自然是比不过他们的(讲道理,有多少人喜欢学习胜过休闲娱乐呢)。

而我个人认为不仅仅是因为CSDN是一个学习平台,博主与粉丝相互之间缺少了解也占了很大一部分原因,这一点很难否认,因为相比于陌生人,大家都更愿意给有相识基础的人点赞。而同样的只有更了解受众的情况,博主才能更好地同粉丝进行互动。

所以如何才能更好地增加与粉丝的互动呢?从平台性质来看,我自然无能为力,同样我也不能指望着粉丝主动来了解我。所以目前我能做的,就只有试着去了解粉丝咯,了解关注我的人,究竟是什么人才!

注:以下分析使用的方法并不复杂,大家可以当作是我自己的一次小实验。

目录

  • 数据介绍
  • 从1到1000,我花了多长时间
  • 第1个和第1000个关注我的粉丝
  • 粉丝数与日期之间的关系
  • 粉丝的码龄分布情况
  • 粉丝的被访问量分布情况
  • 粉丝的被访问量分布情况
  • 粉丝的粉丝数量分布情况
  • 粉丝的被点赞评论收藏数分布情况
  • 献给脱粉的朋友
  • 我与粉丝的“合影”
  • 总结
  • 数据介绍

    虽然现在关注我的人早已经超过1000了,但我觉得1000算是一个比较有意义的数字,所以我特意收集了关注我的前1000名朋友的信息,主要有以下两个部分:

    1. ID、关注日期
    2. ID、码龄、被访问量、原创文章、粉丝数量、点赞数、评论数、收藏数

    之所以拆分成两部分呢,主要是因为这两部分收集的来源不同。

    第一部分来源于:

    收集到的数据如下所示:

    第二部分来源于:

    收集到的数据如下所示:

    诶,如果我从粉丝页面收集了前1000个人的信息,那我从关注页面收集前1000个人的信息会是一样的吗??

    答案是:NO!

    因为有人脱粉了!!!(过分!)

    这里可以先跟大家讲的是,我收集到的1081个关注信息中,有1000个粉丝关注着我,也就是说在这期间有81个粉丝“弃我而去”(文末我会“隆重介绍”他们)。

    介绍完数据后,接下来我们就正式对这些数据进行分析啦!

    从1到1000,我花了多长时间

    具体计算方法如下:=MAX(B2:B1082)-MIN(B2:B1082))


    如图,从第一个关注我的人,到第1000个粉丝,我用了586天的时间。其中最早有粉丝关注是在2019/12/22,第1000个粉丝的关注日期则是在2021/7/30。

    第1个和第1000个关注我的粉丝

    因为获取的时候是按关注顺序来收集的,所以得到结果比较简单。

    在这里先要感谢一下我的第一个粉丝Kingforwise,万事开头难,有了第一个才会有第二个,所以我非常感谢Kingforwise这位朋友,感谢你的支持!

    那么同时也要感谢l66yyy,非常刚好是我的第1000个粉丝,幸运!

    粉丝数与日期之间的关系



    从上图可以看到,我的粉丝增长主要是在今年才猛增的(毕竟今年更的比较多博客哈哈)

    粉丝的码龄分布情况

    说明:码龄不足1年的这里统一用0.5代替。


    从在这里可以看到,关注我的朋友大多是码龄1-4年的,其中码龄最高的为21年。

    粉丝的被访问量分布情况


    由上图可以看到绝大多数粉丝的被访问量都为0。

    我筛选出访问量小于200的数据做一个直方图,如下所示:

    粉丝的被访问量分布情况



    由上述图也不难发现,绝大多数朋友也不发博客。

    粉丝的粉丝数量分布情况



    从上图我们同样可以发现,绝大多数粉丝也是没有粉丝的,而其中只有两个粉丝的粉丝量破千,其中最高为1975。

    粉丝的被点赞评论收藏数分布情况





    其实从上述图片中我们同样不难发现,绝大多数朋友(93%以上)的数据都是0,而从点赞数和收藏数的平均值和分布情况来看,很明显的是大家都是经常被人白嫖的,这个结论似乎一点都不让人感到意外。

    献给脱粉的朋友

    谨以此图,献给脱粉的朋友,感谢曾经“相识”,我们有缘江湖再见。

    以下是实现的Python源码。

    # -*- coding: utf-8 -*-
    import datetime
    
    import pandas as pd
    from wordcloud import WordCloud
    
    today = datetime.datetime.today()
    
    subscribe = pd.read_csv('./subscribe.csv',encoding='gb18030', header=0)
    fans = list(pd.read_csv('./fansInfo.csv',encoding='gb18030', header=0)['ID'])
    
    love_friend = []
    # 距今超过300天的ID只添加一次,100-300的添加两次,其余添加3次。
    for i in range(len(subscribe['ID'])):
        date = datetime.datetime.strptime(subscribe['关注日期'][i], "%Y/%m/%d")
        diff = (today - date).days
        if subscribe['ID'][i] not in fans:
            love_friend.append(subscribe['ID'][i])
            if diff < 300 and (today - date).days > 100:
                love_friend.append(subscribe['ID'][i])
            if diff <= 100:
                love_friend.append(subscribe['ID'][i])
                love_friend.append(subscribe['ID'][i])
    
    res = ' '.join(love_friend)
    # 生成词云
    wc = WordCloud(
        font_path='simkai.ttf',
        background_color='white',
        width=600,
        height=600,
        max_font_size=50
    )
    wc.generate(res)
    wc.to_file('res.png')  # 图片保存
    

    我与粉丝的“合影”

    哈哈哈,虽然想说越早关注的人字越大,但好像已经没有什么关系了,都看不到。

    总结

  • 从粉丝们关注我的时间来看,确实我是在今年,尤其是今年暑期开始,迎来了粉丝迅速增长的时期,这里主要原因是因为我在暑假期间开始疯狂写作,目前我五十多篇博客中有大概三分之二的博客就是诞生于这个期间;而在这个期间前,大概是在去年11月份,主要是因为我写了有关智能优化算法的文章,才慢慢的有了最初的粉丝基础。
  • 从关注我的这1000个粉丝中不难看出,几乎80%的朋友是不发博客的,从点赞评论和收藏数量来看也有93%以上的人数据基本为0;而从码龄这个数据来看,关注我的群体主要集中在1-4年,从CSDN用户的角度(第一次使用CSDN的人多数是大一时期)可以大致推测,我的粉丝群体多数是在校的大学生,有少数工作多年的粉丝,但确实是少。
  • 上述结果似乎带给我的信息不多,但好歹也算是我更进一步了解到了关注我的人大概是怎样的,这就已经很不错了!

    从收集数据到进行数据分析,感受挺多的。虽然数据量少,分析方法简单,但终究分析还是有所收获。因为这次算是一次跟自己生活最贴近的数据分析了,以前分析的项目都是一些远在天边的东西,总和自己搭不了边。即使这次的结果不用去专门收集数据进行分析也能大致猜出来,但并不意味着我的分析就毫无意义。

    无论结果,过程更有意义!

    CSDN@报告,今天也有好好学习

    来源:报告,今天也有好好学习

    物联沃分享整理
    物联沃-IOTWORD物联网 » 我和关注我的前1000个粉丝“合影”啦,收集前1000个粉丝进行了一系列数据分析,收获满满

    发表评论