12.16修复失效 写真爬取v2.3 ...

5次阅读
没有评论

2023年最后一个月了,又没了一年,时间真快。

软件失效一段时间了,很久之前就说更新,但是一直拖到现在才更新。先解释一下。

刚开始是上月月底准备更新,然后编译的时候,突然发现界面背景用了很久了,想换一个,于是出现了—抛砖引玉,引出美“玉”—这一个帖子,结果是没找到如意的。

于是在本月初花了一周多的时间,找了差不多一千多张图片,结果是每张图都是感觉差点意思。

没办法,再之后就是修图,对—抛砖引玉,引出美“玉”—中某张图进行修改。原以为瑕疵比较明显,没想到由于软件界面小,瑕疵在软件上不是很明显,意外之喜。

这样按理说,上周末新版软件就可以更新出来,但是,注意这里出现了一个但是,重点来了

突然想到,软件访问过程中提交的User-Agent数据都是一样的,这太假了,于是周末就花时间写了个随机生成User-Agent的功能,随带优化一下整体运行代码。

简单说,就是先装了数十个不同版本浏览器获取UA数据(时间主要是花在这儿),找到相同点后,保留固定的数据,随机模拟生成动态的数据,再随机拼接获取随机UA数据。

这样时间一晃,就到了今天。好了,就解释到这儿。

还是一样的说明一下,如有违规,请关帖,再就是,软件是用易语言编写的,部分杀毒软件会报毒是正常的现象。

楼主目前只知道只有火绒不会报毒,其他的都会,担心的朋友可以至虚拟机运行或自行删除软件。

先来一个查毒截图,我们的老伙计——腾讯哈勃,其他的没用过。代码除了模块调用,可以说全是个人一行一行敲出来的,看了查毒之后再继续看下面的内容。

软件的使用同前,都到2.3版本了,不会的可以先看软件的“帮助”后再使用。

软件所牵涉到的所有网站,初始地址均来源于本论坛,所有网站内容也是公开可查询的,如有侵权,私聊或者回复一下楼主(最好是私聊)。

此次主要更新内容:

网站按内容更新快慢重新排序!!!

随机生成User-Agent数据!!!

修复不显示网站内容问题

修复部分网站不能下载保存问题

优化部分代码提升运行流畅性

修复目前已知若干小bug

放张软件测试图,软件是可以正常运行的.....(特别指出,所有网站截止到发帖为止,在楼主电脑上均可正常获取)

土豪通道(蓝奏的哈):

百度网盘下载地址:https://pan.baidu.com/s/1RGL3HtmswfsPDmblv-PM6w?pwd=b4mj 提取码:b4mj
阿里云下载地址:https://www.alipan.com/s/SGJS3arXXrV 提取码:oy33

注意:
目前楼主有时间可添加网站进软件,丰富其内容。前提是公开的网站,变相收费(比如会员、月费等)的网站,没时间以及能力(主要是没能力)去获取网站内容,所以不要提供,提供了也没用。

图片保存在软件运行目录。

软件下载的图片都是网站提供的原始图,网站是啥样,图片质量就是啥样。

另外就是——原蓝奏网盘链接失效,今后更新修复后的版本,将存放在新的蓝奏网盘中。原蓝奏网盘中的历史版本暂时关闭下载

2023-12-12 23:05
打脸了,才发出来几分钟,第一个网址就访问不了了,不知道啥原因,具体的明天晚上再看去了。

2023-12-13 13:58
刚刚访问第一个网站网址,浏览器可以正常访问了,软件应该也可以正常获取了。具体等回去再测试。

2023-12-14 19:59
秀人及以下是获取不了了,由原来的jpg、png等常规图片格式改成.webp格式,易语言的组件不能直接显示这一个格式,晚点我转换一下代码,然后重新上传新版本,见鬼了,这一次才更新,就这么多的问题。

2023-12-15 19:40
测试了一下,秀人及以下只是预览有问题,可以正常下载到本地(有可能图片被压缩了,具体有没有被压缩,我要周末测试才知道),所以先将就一下,周末修改代码、更新软件。

2023-12-16 17:20
这一次更新,遇到的问题太多了,不过还好,已经再次更新修复,一般来说,刚更新半月到一月内,出现问题,会及你最大可能第一时间去修复,超过这个时间,就得等较为充裕的时候再修复。

修复后软件查毒

修复秀人及以下网站显示问题
爱女某网站每次获取都是163页,修复获取内容bug

土豪通道(蓝奏的哈):

百度网盘下载地址:https://pan.baidu.com/s/1GtkBDSKHtBJMHhA8bST_Aw?pwd=fbks 提取码:fbks
阿里云下载地址:https://www.alipan.com/s/wgkEfCaWfaz 提取码:c6p3

因为加了个模块,所以软件大了0.4M左右,后面会找时间缩减模块中的无用代码,尽量缩小软件体积。

至于说的批量下载功能,只有小批量下载功能,这一点从最开始的版本就说过,不会写大批量下载功能的,怕有人配合脚本,无限制的下载内容,可能对原网站没影响,但是以防万一。所以一直没写。

正文完
 0
116博客
版权声明:本篇文章由 116博客 于2024-11-29发表,共计1945字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码