搜索文本2.4(从word、wps、excel、pdf和txt文件中查找文本的工具)

1次阅读
没有评论

旧版本及介绍请移步至

从word、wps、excel、pdf和txt文件中查找文本的工具。因工作中要经常从大量word文档中查找固定的文本,所以自己就做了本工具。
可以批量从doc、docx、wps、xls、xlsx、pdf(需要开源pdfium.dll支持,已放在包里)和txt文件中查找关键文本,文本文件可自定义多个扩展名(如:.html,.ini,.pas)。
wps文件采用OLE方式读取,所以系统中需要安装wps软件。
可以一次查找多个关键字(关键字之间是或者的关系),用逗号分隔,支持正则表达式,也可以在已有列表中查找。
找到的列表支持导入导出
本工具使用delphi12编译,因使用FMX,文件较大(12M多),所以用UPX压缩到3M多,需要带上2个Dll。
本人使用的系统环境为:win10,office2016、wps2019,没有多余的环境可测试,若发现问题,可在本贴反馈,我找时间修改完善(但功能上已不想再作大的修改)

2024年2月4日更新2.4版,2.3.1b版本问题较多,不要继续使用。

解决问题:
1.预览内容卡住的bug、缓存读入错误的bug。
2.更换excel文件解析组件,速度更快兼容性更好,excel处理错误率大幅降低接近0,缺点是exe文件变大了。
3.在缓存文件类型中会重复加入相同扩展名的问题。
4.右键菜单中文化。
加入功能:
1.对搜索的文件名作提前判断,默认在文件名开头和末尾加上*号,如果不要自动加*号,则在开头和末尾处加入"/"符号。
2.更换“要搜索文本”框的右键菜单。
3.其他界面上的小更新。
后续计划:
1.考虑更换word文件处理方式,提升准确率
2.考虑更换文本预览组件,显示更直观

正文完
 0
116博客
版权声明:本篇文章由 116博客 于2024-11-28发表,共计705字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码