温馨提示:该页面为Windows软件,不支持手机用户安装使用
在当前市场中,虽然充斥着各种收费的网页采集器,但一款完全免费的网页采集器却相当罕见。这款名为“翠绿色网页采集器”的软件,功能强大且完全免费,绝对是您采集网页信息的理想选择。该系统基于先进的互联网技术,能够高效地采集网页信息。其主要特色功能包括:
动态信息采集:能够采集网页中JavaScript执行后的动态信息,确保您获取到最完整的网页内容。
正则表达式设置:允许您自定义采集的正则表达式,以满足不同网页的采集需求。
另外该软件自带多种采集方案,分别适用于静态数据网页和动态性网页。官方网站的照片和百度搜索引擎的信息都是通过这款软件采集,并进行数据库索引的。
输入您想要采集的网址,正常访问网页。
在抵达采集目标后,点击工具栏上的“查询JS后源代码”按钮,以获取执行JavaScript后的网页内容。
如果没有立即看到相关内容,请稍等片刻再次点击,以确保JavaScript代码执行完毕。
通过查看详细的网页源代码,确定使用方案1或方案2。如果可以通过改变网址的页数来导航到下一页,则使用方案1;如果是通过脚本动态更新网页内容,则使用方案2。
点击工具栏上的“运行采集方案”按钮,根据步骤1选择方案1或方案2。
如果已经存在方案1和方案2转换成的downloadtotal.txt文档,可以选择方案3。
填写必要的信息或关系式,点击“开始采集”按钮,系统将自动开始采集。
如果需要取消采集任务,可以点击提示框的“取消”按钮,系统将停止采集并关闭提示框。
点击工具栏上的“终止采集方案”按钮,系统将停止当前的采集任务。
为了避免您的网页内容被采集,您可以采用以下方式:
在短文的首尾添加任意不稳定的内容。通常情况下网页采集器会指定一个起始位置和一个结束位置,提取中间的内容。例如如果您的正文内容是:
1234567890
您可以在其前后添加不固定的内容,如:
1234567890
这样采集器将无法提取到完整的内容。
希望以上信息能够帮助您更好地了解和使用翠绿色网页采集器。
安装快捷方式
修改或删除您的SD卡中的内容
拥有完全的网络访问权限
控制振动
查看网络连接
开机启动
防止手机休眠
在其他应用之上显示内容
录音
更改您的音频设置
拍摄照片和视频
连接WLAN网络和断开连接
查看WLAN连接
关闭其他应用
卸载快捷方式
让应用始终运行
修改系统设置
检索正在运行的应用
读取您的通讯录
与蓝牙设备配对
访问蓝牙设置
发送持久广播
写入/删除您的通讯录
使用指纹硬件
更改网络连接性
展开/收拢状态栏
查找设备上的帐号
写入/删除您的通讯录
读取同步设置
启用和停用同步
停用屏幕锁定
允许接收WLAN多播
添加或修改日历活动,并在所有者不知情的情况下向邀请对象发送电子邮件
读取日历活动和机密信息
关闭其他应用
请求安装文件包
连接WLAN网络和断开连接
拥有完全的网络访问权限
查看WLAN连接
查看网络连接
访问确切位置信息(以 GPS 和网络为依据)
访问大致位置信息(以网络为依据)
拍摄照片和视频
防止手机休眠
安装快捷方式
开机启动
发送持久广播
控制近距离通信
对正在运行的应用重新排序
读取您的SD卡中的内容