[Python] 抖音字体反爬,爬虫字体反爬策略——每周一个爬虫小教程系列
作者:CC下载站 日期:2020-06-17 00:00:00 浏览:50 分类:编程开发
在B站上看到一个关于抖音字体反爬的视频,看完之后,精神抖擞,不禁感觉,我又行了,于是在模拟器上下载了一个抖音,打开了我尘封已久的抖音号。
可以看见显示的数字是正常的,但是查看源码就是错误的。
既然是字体反爬,那就得去找下字体,双击下载
然后用在线字体编辑器打开看一下。
我们看到这个数字1的Unicode是$E602,是不是和源代码中的差不多呢。
在教程里面说到对于字体反爬,需要用模块将字体转为xml,相当于字典,然后就这样替换吧。
将字体文件转换为xml文件需要用到的模块是fonttoole,这里需要自行安装一下。
fromfontTools.ttLibimportTTFont font=TTFont('iconfont_9eb9a50.woff') font.saveXML('DouYinFont.xml')
转换完成之后的XML文件。
我们来搜索一下我们之前的数字1,他的Unicode就是E602,然后可以发现这里和之前在线字体网站上的结果是一样的
然后我们来将XML文件提取出来,并输出一下(XML提取我目前也不会,所以是跟着教程写的,后期再去了解一下吧)
a=font['cmap'].getBestCmap() print(a)
这个时候发现似乎这些都变成了数字,而不是之前的$E602这样子的,是因为进制转换了,由原始的16进制,转成了10进制。
然后我们需要将这个字典中的十进制数字转成这种16进制,然后还得把0x替换为&#x
然后用代码实现就是酱紫的,大概就是提取出cmap这个节点的信息,然后遍历这个字典,然后重新转换成16进制然后变成字符串,在替换一下。
a=font['cmap'].getBestCmap() b={} forkey,valueina.items(): b[str(hex(key)).replace('0x','&#x')]=value print(b)
然后就是用代码将num_这些转换为数字,参照这张字体在线编辑器的即可
c={ 'num_':'1', 'num_1':'0', 'num_2':'3', 'num_3':'2', 'num_4':'4', 'num_5':'5', 'num_6':'6', 'num_7':'9', 'num_8':'7', 'num_9':'8', }
然后改进一下之前的代码:
forkey,valueina.items(): b[str(hex(key)).replace('0x','&#x')]=c[value] print(b)
然后为了和网页源码里面一样()所以还需要做一些修改,在后面加一个分号和空格。
forkey,valueina.items(): b[str(hex(key)).replace('0x','&#x')+';']=c[value] print(b)
然后就是请求源码,然后替换了。
headers={ 'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/83.0.4103.97Safari/537.36', } url='https://www.iesdouyin.com/share/user/91723415754' res=requests.get(url=url,headers=headers).text forkey,valueinb.items(): ifkeyinres: res=res.replace(key,value+'') print(res)
猜你还喜欢
- 03-29 [编程相关] Winform窗体圆角以及描边完美解决方案
- 03-29 [前端问题] has been blocked by CORS policy跨域问题解决
- 03-29 [编程相关] GitHub Actions 入门教程
- 03-29 [编程探讨] CSS Grid 网格布局教程
- 10-12 [编程相关] python实现文件夹所有文件编码从GBK转为UTF8
- 10-11 [编程算法] opencv之霍夫变换:圆
- 10-11 [编程算法] OpenCV Camshift算法+目标跟踪源码
- 10-11 [Python] python 创建 Telnet 客户端
- 10-11 [编程相关] Python 基于 Yolov8 + CPU 实现物体检测
- 03-15 [脚本工具] 使用go语言开发自动化脚本 - 一键定场、抢购、预约、捡漏
- 01-08 [编程技术] 秒杀面试官系列 - Redis zset底层是怎么实现的
- 01-05 [编程技术] 《Redis设计与实现》pdf
取消回复欢迎 你 发表评论:
- 精品推荐!
-
- 最新文章
- 热门文章
- 热评文章
[话剧] 《开心麻花 话剧小品合集》有声音频 wma
[好站推荐] 300+语音风格任你选,这可能是我用过最好用的配音工具
[资料] 精选200+套手抄报模板
[素材] 图标素材合集
[书籍] 祝由科.秘诀奇书.乾元亨利贞版无水印 [PDF]
[电影] 2024年美国科幻动作片《月球叛军2:烙印之人》BD中英双字
[电影] 2006年日本经典科幻灾难片《日本沉没》蓝光日语中字
[电影] 2024年美国科幻喜剧片《超能敢死队:冰封之城》HD西语中英双字
[电影] 2023年国产动画片《舒克贝塔·五角飞碟》HD国语中字
[教程] 风光摄影后期调色与渲染系列教程
[资料] [大学期末救急课] 猴博士+高斯课堂+斐多课堂,全集视频合集
[云资源] 价值2万元的老男孩Python教程
[书库] 史上最全摄影书推荐(附700本PDF版打包下载)
[云资源] 花了一千多元买的私人健身教程
[下载工具] Internet Download Manager 6.42.7 (IDM)
[影视] 灌篮高手 WEB-DL版下载/Slam Dunk/スラムダンク/灌篮高手:THE FIRST/灌篮高手电影版 2022 The First Slam Dunk 61.35G
[即时通讯] 腾讯QQ PC版9.7.22.29315去广告绿色纯净版
[开发环境] PhpStorm2023中文激活版v2023.3.3 正式版
[资料] 3000 套电影电视剧 LOGO 宣传片常用音效合集包
[安卓软件] 酷我音乐APP_v10.7.6.4 去广告破解豪华VIP版
[云资源] 价值2万元的老男孩Python教程
[影视] 灌篮高手 WEB-DL版下载/Slam Dunk/スラムダンク/灌篮高手:THE FIRST/灌篮高手电影版 2022 The First Slam Dunk 61.35G
[云资源] 花了一千多元买的私人健身教程
[书库] 史上最全摄影书推荐(附700本PDF版打包下载)
[动画] 北斗神拳(1984) [两季合集] [MKV]
[资料] 抗战阵亡将士资料+续编
[电视剧] 三体 (2024) 全8集 网飞版本 中文字幕 合集
[影视] 三大队 WEB-DL版下载/Endless Journey/请转告局长,三大队任务完成了 2023 三大队 6.7G
[纪录片] 河西走廊【10集 国语 中文字幕 1080P 10.8G MP4】
[安卓软件] OfficeSuite中文版APP v14.2.50872.0破解版
- 最新评论
-
好东西阿zfy123123 评论于:04-18 谢谢楼主xiaoqi 评论于:04-12 勿在线解压,勿手机解压,请在电脑上用最新款压缩软件解压!推荐360压缩或者好压CC下载站 评论于:04-10 无法解压啊,客服能不能给个解压教程ravengrey 评论于:04-10 谢谢支持!!CC下载站 评论于:03-26 很棒的资源,感谢分享云体风身 评论于:03-26 感谢分享,好东西云体风身 评论于:03-26 谢谢支持!CC下载站 评论于:03-14 央视精品,感谢付出提供。qwer9009 评论于:03-14 谢谢支持!!!CC下载站 评论于:03-13
- 热门tag