编程 Python

Python脚本如何在bilibili中查找弹幕发送者

Posted in Python onJune 04, 2020

总所周知bilibili是没有办法直接查看弹幕的发送者的，这使得当我们看到一些nt弹幕的时候虽然生气，却无可奈何，但是B站是可以屏蔽某个用户发送的弹幕的，这说明数据接口里肯定有用户信息，由于最近在学爬虫，所以我想先找找弹幕接口，分析下里面的数据。

找接口

找接口当然是随便打开一个视频然后F12啦，可是当我找了两圈后我傻眼了，没找到啊。。得，不能把时间浪费在这种事情上，果断打开百度，不出所料，找到了如下的两个接口，都是XML格式网页

https://comment.bilibili.com/+cid
https://api.bilibili.com/x/v1/dm/list.so?oid=+cid

这里面的cid是一种每个视频独有的数字，也就是每一P都有一个cid，查找cid可以打开网页然后F12，再ctrl+f搜索cid，一般八九位数的就是cid了。

这里我找到了一个接口，可以通过aid找到cid

https://www.bilibili.com/widget/getPageList?aid=+aid

分析数据

弹幕数据是获取到了，那么我们就要从这一堆数据中分析他们的用途了

Python脚本如何在bilibili中查找弹幕发送者

这里大概能得到两个信息，其中第6个数据为时间戳，第8个数据为用户uid的某种加密方式。经查询得到这是用户uid经过crc32校验得到的结果转为16进制数，所以只能通过uid得到对于的校验码，无法反推。。似乎只能通过彩虹表的方式查找数据了？那么这串8位16进制的数字在数据库中要用什么方式保存呢？
选择似乎有varchar和bigint，由于B站有差不多6亿个用户，在6亿个数据中查找想要的字符串那速度必然很慢（但有人经测试得到varchar型数据和bigint型数据查找速度其实差的不多？）
就在我决定用bigint储存数据时，我突然想到，8位16进制那就是2的32次方，int型的储存上限时2的31次方，如果用无符号的方式保存正好是2的32次方，也就是能储存到0xffffffff这么大的数据，正好满足要求。于是果断换成无符号int，与之对应的id也为无符号int，并将crc32b编码过后的数据作为主键，制成彩虹表存入我的服务器内。
（粗略的算了一下，6亿数据就是需要27G左右的空间…而我的服务器一共才40G的大小…）

做成网页供大家使用

接下来的操作似乎就水到渠成了，写了个python脚本，该python脚本接受2个参数，视频cid和想要搜索的弹幕关键字，返回用户发送的弹幕，用户的crc32b编码，时间戳。然后用php的exec函数执行python代码，并通过搜索数据库找出用户的uid，通过php返回json格式数据给前端。

python代码(写的很烂)

import requests
from bs4 import BeautifulSoup
import re
import io

import sys

sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')
req = requests.get('https://comment.bilibili.com/'+sys.argv[1]+'.xml')
req.encoding = req.apparent_encoding
soup = BeautifulSoup(req.text, 'html.parser').find_all(name='d')
result = ""
for i in soup:
 s = re.sub('<(.*?)>', '', str(i))
 index = 0
 if(len(sys.argv[2])>0):
  index = s.find(str(sys.argv[2]))
 if(index!=-1):
  result+=str(i).split(",")[6]+","+s+","+str(i).split(",")[4]+","
print(result)

效果展示

前端代码就是随便写的~至少功能实现了嘛

Python脚本如何在bilibili中查找弹幕发送者

这里说一下为什么是NULL，因为我的服务器还在可怜巴巴的往数据库内写入彩虹表数据。。预计需要4天~
今天加了个暴力破解的功能，避免了查询结果为NULL，但是相对的查询速度会非常慢。

最后！附上该工具的链接：点我

总结

到此这篇关于Python脚本如何在bilibili中查找弹幕发送者的文章就介绍到这了,更多相关bilibili弹幕发送者内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Python脚本如何在bilibili中查找弹幕发送者

- Author -

dlpu_fan

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

c++生成dll使用python调用dll的方法

Jan 20 Python

Python之os操作方法(详解)

Jun 15 Python

python中的文件打开与关闭操作命令介绍

Apr 26 Python

django 使用 request 获取浏览器发送的参数示例代码

Jun 11 Python

numpy下的flatten()函数用法详解

May 27 Python

pandas数据处理进阶详解

Oct 11 Python

tensorflow实现在函数中用tf.Print输出中间值

Jan 21 Python

简单了解django处理跨域请求最佳解决方案

Mar 25 Python

Python数据相关系数矩阵和热力图轻松实现教程

Jun 16 Python

django rest framework 自定义返回方式

Jul 12 Python

Python+Selenium实现抖音、快手、B站、小红书、微视、百度好看视频、西瓜视频、微信视频号、搜狐视频、一点号、大风号、趣头条等短视频自动发布

Apr 13 Python

Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解

Aug 14 Python

Python爬虫谷歌Chrome F12抓包过程原理解析

Jun 04 #Python

python实现按键精灵找色点击功能教程,使用pywin32和Pillow库

Jun 04 #Python

解决python图像处理图像赋值后变为白色的问题

Jun 04 #Python

Python爬虫JSON及JSONPath运行原理详解

Jun 04 #Python

python 实现图像快速替换某种颜色

Jun 04 #Python

python下对hsv颜色空间进行量化操作

Jun 04 #Python

Python-opencv实现红绿两色识别操作

Jun 04 #Python

You might like

php print EOF实现方法

2009/05/21 PHP

PHP 类型转换函数intval

2009/06/20 PHP

php递归删除指定文件夹的方法小结

2015/04/20 PHP

PHP基于cookie与session统计网站访问量并输出显示的方法

2016/01/15 PHP

[原创]smarty简单模板变量输出方法

2016/07/09 PHP

PHP程序员学习使用Swoole的理由

2018/06/24 PHP

PHP实现十进制数字与二十六进制字母串相互转换操作示例

2018/08/10 PHP

PHP5.5新特性之yield理解与用法实例分析

2019/01/11 PHP

Javascript 汉字字节判断

2009/08/01 Javascript

HTML5附件拖拽上传drop & google.gears实现代码

2011/04/28 Javascript

jQuery 文本框得失焦点的简单实例

2014/02/19 Javascript

javascript几个易错点记录

2014/11/26 Javascript

13 款最热门的 jQuery 图像 360 度旋转插件推荐

2014/12/09 Javascript

Bootstrap3学习笔记(二)之排版

2016/05/20 Javascript

详解前后端分离之VueJS前端

2017/05/24 Javascript

JavaScript实现数值自动增加动画

2017/12/28 Javascript

JavaScript中Dom操作实例详解

2019/07/08 Javascript

jQuery实现移动端图片上传预览组件的方法分析

2020/05/01 jQuery

python3制作捧腹网段子页爬虫

2017/02/12 Python

python根据时间获取周数代码实例

2019/09/30 Python

python不相等的两个字符串的 if 条件判断为True详解

2020/03/12 Python

Pytorch数据拼接与拆分操作实现图解

2020/04/30 Python

使用python创建Excel工作簿及工作表过程图解

2020/05/27 Python

通过HTML5 Canvas API绘制弧线和圆形的教程

2016/03/14 HTML / CSS

特步官方商城：Xtep

2017/03/21 全球购物

马来西亚综合购物网站：Lazada马来西亚

2018/06/05 全球购物

美国值得信赖的婚恋交友网站：eHarmony

2018/10/04 全球购物

ORLY官网：美国专业美甲一线品牌

2019/12/11 全球购物

linux面试题参考答案（1）

2016/01/22 面试题

董事长秘书岗位职责

2013/11/29 职场文书

高中美术教学反思

2014/01/19 职场文书

婚礼秀策划方案

2014/05/19 职场文书

党员公开承诺书2016

2016/03/24 职场文书

JavaScript实现班级抽签小程序

2021/05/19 Javascript

B站评分公认最好看的动漫,你的名字评分9.9,第六备受喜欢

2022/03/18 日漫

Spring boot admin 服务监控利器详解

2022/08/05 Java/Android