生个女孩吧 关注:677,108贴子:38,098,440

口袋48直播历史数据整理

只看楼主收藏回复

子杰吃饺图,镇楼保平安。一样的饺子,不一样的吃法。


1楼2018-03-25 14:25回复
    如题,整理了到2018年3月21日中午所有口袋48依然保存的录播的弹幕,贡献榜和播放数。
    导致局限性的因素:
    1. 很忙的大top们不怎么直播。
    2. 一些退团成员直播已经完全消失。
    3. 口袋48被删直播没有,大概有10%到20%的直播已被删除。
    4. 最早只能找到2016年9月21日的直播。
    5. 即使成员不主动删直播,似乎每个成员能保存的直播数量有256的上限。估计和编码方式有关。
    6. 即使没有主动删除没有达到上限,袋王的土豆硬盘依然有概率丢失录播。
    7. 爆肝一夜搞完才想起来没区分视频直播和电台,懒得弄了。
    8. 就算有直播也不一定有弹幕,16年11月前弹幕全部或者大量丢失
    9. 极个别弹幕时间轴故障,故直播时长最大设为100小时
    10. 别删掉或别封号的弹幕(应该)不会有
    11. 最大的问题:弹幕昵称可以自己改。。。后面会做相关修正
    12. 直播播放数算法改变过多次,过去大概出来进去一次数量+4,现在看录播不增加观看数。不知道如何修正。
    13. 贡献榜数据不会有重复名称,但是每次贡献榜最大数量是20
    14. 不理解贡献值算法,由于改动和活动鸡腿价格并不稳定,总选期间直播投票可能极大影响当时的贡献值。不知道如何修正。
    15. 没怎么调试,如果出错提前道歉
    16. 移籍和组阁是大问题,目前整理所有移籍后数据都归为新队,刘炅然依然算HII,熊心瑶依然算NIII。再晚两天Ft开了直播就更乱了。
    感谢xsaiting并推荐他的网站https://xsaiting.com/pocket48/


    2楼2018-03-25 14:27
    收起回复
      广告
      立即查看
      全团直播简报
      从2016年9月21日中午到2018年3月21日中午
      保存下来的直播数量:16,194(其中686弹幕文件丢失或者没有弹幕)
      弹幕超过一条(囧直播时长靠弹幕算的)直播总时长:21033小时21分57秒
      纸面总播放量:99,099,967
      上榜总贡献:242,148,772
      平均弹幕速率:16.32/min
      平均观看增长速率:78.53/min (算出来想起来这里忘了排除无弹幕回放,懒得改了)
      平均上榜贡献速率:191.88/min (问题同上)


      3楼2018-03-25 14:28
      收起回复
        前排留名,超绝可爱黄彤扬


        来自Android客户端4楼2018-03-25 14:28
        回复
          全团聚聚简报
          弹幕登场昵称总数:148,046
          去掉只发过一个弹幕的(其中一群发了弹幕才发现自己的皮是手机号的)还有:127,358
          如果排除两个账户前后换成一个昵称的情况,这是这段时间参与直播的账号数量最大可能值
          贡献榜上登场聚聚总数:27,345
          去掉一共5贡献的还有:24,619
          这是这段时间参与直播的账号数量最小可能值


          5楼2018-03-25 14:28
          收起回复
            前排


            来自手机贴吧6楼2018-03-25 14:30
            回复
              全团聚聚弹幕数和贡献值分布
              去掉所有只发过一个弹幕的昵称,每个昵称弹幕数量平均值是161.5,中位数是22,分布直方图如下
              注意y轴为对数坐标,距离差dy实际为差10^dy倍

              可见大部分昵称都都不活跃,弹幕数少于100的昵称数为96,523。但是活跃的昵称超级活跃,4,386个昵称水了超过一千,60个昵称水了上万条弹幕,这些朋友以一当十当百,把每个昵称平均弹幕数拉到了100以上。
              去掉只有5贡献值的账号,上榜账号平均值为9835.3,中位数为255,相比弹幕分布显示了更大的两极分化差距,大批壕的存在使得分布的尾巴很长。但是开头提到,四选直播投票影响了贡献值分布。

              右上角是完整直方图,不太清楚,横坐标最右是六百万


              7楼2018-03-25 14:32
              回复
                全团聚聚动态分析
                动态分析以周为单位,每一周的周一中午12点到下一周的周一中午12点为一个周期,大体符合一般公演活动规律和各种节奏事件的规律。
                弹幕昵称动态分析
                开头提到,弹幕昵称可以重命名,所以并不能直接用来计算用户变化情况。但是考虑以下推理:
                每个周新出现(之前弹幕从未出现)的弹幕昵称数 =每个周新出现(之前弹幕从未出现)的用户数-这个周改昵称发弹幕的用户数
                每个周消失(之后直到现在弹幕再未出现)的弹幕昵称数 =每个周出坑(之后直到现在弹幕再未出现)的用户数-这个周改昵称发弹幕的用户数
                上下相减,所以每个周改昵称的情况可以大体上消去,估得弹幕用户净增加值。不准确的地方是:1.注意只在一个周发过弹幕的会被消去2.改了昵称隔了几个周再发弹幕,会使得当前周估计的净增加值少一而之后再发弹幕的时候净增加值多一,总体上抵消但是在动态上还是不准确的,可以当作暂时出坑。计算累计净增加值,可以相对减小2因素的影响。
                因为首次通过和末次通过概念,开头和结尾一段时间的数据是不准确的。所以图上画出从17年第一个周到组阁前一个周的情况


                8楼2018-03-25 14:34
                收起回复
                  广告
                  立即查看
                  看不到,哪个*大来解释一下,我看直播都不发弹幕怎么办?因为我没钱买棒子,不好意思说话


                  来自Android客户端10楼2018-03-25 14:35
                  收起回复
                    补图


                    11楼2018-03-25 14:35
                    回复
                      贡献榜聚聚动态分析。
                      包括了5贡献就上榜的账号。虽然不会有重复名称,每次贡献榜只有20位。同样,可以把第一个累计上榜账号净增作为17年初的初始绝对数量,则此图为贡献榜聚聚总量变化。



                      12楼2018-03-25 14:37
                      收起回复
                        现在我基本不看公演和直播啊


                        来自Android客户端13楼2018-03-25 14:37
                        收起回复
                          。。


                          IP属地:安徽来自iPhone客户端14楼2018-03-25 14:37
                          回复
                            总选期间应该单独算


                            IP属地:山东来自Android客户端15楼2018-03-25 14:38
                            收起回复
                              广告
                              立即查看


                              IP属地:江苏16楼2018-03-25 14:38
                              回复