写在最前面的话:
第一次发帖呢,如果格式什么有不规范的地方,管理组的大佬们及时提醒我呢。
某只可爱的孩纸问我能不能批量下载华文慕课上的视频,分析了一下网页,还是有可以get到的方法的。
未按要求输入一定导致程序出错,所以请仔细阅读说明
本工具仅供学习交流使用,禁止以任何形式将不仅限于本软件/软件生成的数据用于商业用途。
呐、这东西咋用咧?(使用说明)
需要你输入的信息有一下几样:
1.你的Cookies,能力和精力有限,加上安全考虑,没有也不打算通过软件登录,所以就需要你的cookies
华文慕课的Cookies很多,但你只需要输入pku_auth部分,字母+大小写格式,没有任何符号
Q:怎么获取Cookies啊?
A:你不会百度啊??!(误
只需要复制pku_auth之后的等号后的内容直到分号前的内容就可以了(不包含分号啊)
2.课程ID,你需要打开任何一个这个课程的可以播放视频的页面【大佬们,是播放页的ID
正确打开方式得到的链接有下面几种
http://www.chinesemooc.org/live/733677
http://www.chinesemooc.org/course.php?ac=course_view&id=733766&eid=29840&key=0
老司机们一看就懂了,对吧,前面那个链接的ID就是那串数字,后面这个连接的ID是id=之后的数字
输入了以后:
程序会尝试获取课程的名称,因为分析样本数量不多,也许匹配到的不是完整正确的课程名称或者是奇奇怪怪的东西,但如果前面输入正确的话,你可以坚持继续
按回车就好了,然后耐心等待一下下
再之后:
再之后还需要我说吗、、、好吧,我已经能想到如果这里不说明会有很多人说LZ怎么会这样这样啊的情形了
如果你用记事本,notepad++这类软件,直接打开就可以了
如果你想用Excel查看,那么你需要把文本编码从UTF-8转为ANSI,这里简述,不清楚的孩纸们自行百度
用记事本打开data.csv,另存为,在编码一栏里选择ANSI,覆盖源文件保存即可。
运行截图:
程序界面↑
如果你的程序运行的时候是这样,那么大概稳了↑
编码格式手动更改(可选)↑
Excel下查看到的内容↑
很多地方适用的小技巧(大佬们回避):
很多人在用控制台或者类实模式的时候输入发现Ctrl+V的粘贴功能完全用不了啊,甚至有的右键粘贴都找不到,那么,试试在标题栏的程序logo上右键吧,也许能有不一样的收获哦
最后想说的是:
这个软件对你有用或者帮到你了,又或者你喜欢这样的软件,来来来,评分走一波,在这里谢过各位看官们了。
下载:
土豪通道:
免CB:
链接: https://pan.baidu.com/s/1mi1bRVM 密码: w5vz
更新说明:
2017-08-08 -0.2
1.增加了简单的错误检查,避免部分页面错误导致程序终止
2.临时解决部分视频章节变化产生的错误,如有提示出现错误,忽略即可(之后版本已处理)
2017-08-08 -0.3
1.设定超时时间为15秒,避免部分视频无法解析导致的长时间停滞
2.优化错误提示
3.对获取视频下载地址增加可选的延时
4.使用IE10的User-agent进行访问
5.工具分享改为分享文件夹,避免帖内文件及内容频繁更新
启用了延时之后运行截图↑
错误提示优化↑
附带的一些东西:
2017-08-09 新增批量重命名工具
使用说明:
1.将下载好的视频和data.csv以及重命名工具放在同一个目录下,运行重命名工具即可
相关截图:
运行前↑
运行截图↑
重命名后↑
The End.
碎碎念:
基于Python3.6写的程序
不过听说有人喜欢看这些东西,随手分析一下也无妨
哈勃病毒分析 https://habo.qq.com/file/showdetail?pk=ADAGZF1vB2cIO1s7
virscan.org分析报告 http://r.virscan.org/report/39167f8ce63229b6c136da9caa18ab71