• <center id="ecgew"><sup id="ecgew"></sup></center><tr id="ecgew"></tr>
  • <legend id="ecgew"></legend>
  • <legend id="ecgew"></legend>

    列表提取器获取特殊链接网址(如在onclick属性)

    简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

    但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

    解决方案:

    一、url字段配置

    先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;



    二、获取onclick属性内容

    选择 “高级配置” 选项卡 ==》把 “只获取网址” 勾去不选择 ==》提取值类型选择 “节点属性” ==》属性名填写 onclick ==》保存



    三、正则提取链接网址

    选择 “日期等正则提取” 选项卡 ==》正则捕获组处填写  openW\('(.*)'\)  ==》测试 ==》没问题,保存。


    如果是另一种 javascript:location.href 的常见方式,正则捕获组处填写href='(.+?)'


    亚洲精品无码不卡在线播he <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>