切换风格

默认Lavender Sky Flowers Wizard Snow Beige California City Dragon Black London Sunset glow Pink Cloud

21

主题

241

积分

0

精华

用户组 

易积分
3212
热心
0
好评
0
怎么取一个网站的多个网页的源码呀[复制链接]
发表于 2022-6-23 12:56:53 | 显示全部楼层 |阅读模式
本帖最后由 cxz11 于 2022-6-23 14:39 编辑

怎么取一个网站的多个网页的源码呀

比如  先取 主页  再取  列表页   再取内容页

把主页的网址取出来 进入 列表页  再从列表页进入内容页  一直循环完

就像火车头采集器哪个  采集网址 和 内容


  1.        
  2.         事件 按钮1.被单击()
  3.         高级列表框1.清空项目()
  4.         多线程1.开始取网页源码(编辑框1.内容,"utf-8")
  5.         显示进度对话框("加载中...")       
  6.                 变量 网址 为 文本型
  7.                 变量 数据 为 文本型
  8.         网址="http://ftp6532695.host127.sanfengyun.cn"
  9.         数据="zhujiwusysdomain=ftp6532695.host127.sanfengyun.cn"
  10.         置cookies("zhujiwusysdomain=ftp6532695.host127.sanfengyun.cn")
  11.     置附加协议头("User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36")
  12.         编辑框1.内容=发送网络数据(网址,"","utf-8",5000)
  13. 结束 事件
  14. 事件 多线程1.取网页源码完毕(主页网址 为 文本型)
  15.          变量 主页正则 为 文本型 = "<a href="(.*?)" style="text-decoration:none;">"
  16.         创建表达式(主页正则,真,假)
  17.         开始匹配(主页网址)
  18.         判断循环首 匹配下一个()=真
  19.         调试输出(取子匹配文本(1))
  20.         调试输出("=======================================================================================")
  21. 多线程2.开始取网页源码(编辑框1.内容 & 取子匹配文本(1),"utf-8")
  22.                 判断循环尾
  23.         关闭进度对话框()       
  24. 结束 事件
  25. 事件 多线程2.取网页源码完毕(源码 为 文本型)
  26.         调试输出("==========================================这里是  多线程2   =============================================")
  27.         变量 列表文本 为 文本型 = "4944506D9F5BB899E3D91658BE447A77DD0A80FF6FA4568E7166B7F61952A47532CFAA03C5068D1A92B910DD517996BFBFF02617F457710BC076D3E3074E71CDFFED2980DA9AD489CE4C9607ACD43ADC01C5F0BD170DC312619F73C4124E14666897288B474E0B72F688CD0C18FDBFDD753742188A2FF4E93C8062CF5713632FD65FB10F7E0EB149E9A9BAB1A3308A76216A7F18CDB34337929045719F4CF2A5083480628712765E5FF39C61A5ED1CEF61CEC97E9AF4349659174DAB36573CB64C5EE99846C1D814FBE7FEE70B8D80B7CCA158B3969EA371CD59ACCB0A97C19EECB7F4ECE52F17376A5534226C5B035C6975F58D026523FC6B8DEC8AA0F31EFB1CB8F8AD1FC6E83F82072CA0DA01DBC0691BB2CB92A43B956E502E038E385A3C22CF7340E1E7E976B088C8F02859E2FF76F234D767BF087F7611AF1C3B0A8FDC92ACBFD2FFFB22B237F5B408F5F66A5C44636FF94FE533E03BB0C8447B34"
  28.         创建表达式(RC4解密(列表文本,"66816381"),真,假)
  29.         开始匹配(源码)
  30. 调试输出("==========================================多线程2.取网页源码完毕   =============================================")
  31.         判断循环首 匹配下一个()=真
  32.                
  33.         调试输出("==========================================这里是  多线程2   =============================================")
  34.         调试输出("标题"%取子匹配文本(2))
  35.         判断循环尾
  36. 结束 事件
复制代码


多线程1的源码能取出来   就差个 多线程2 取的源码了  谁帮我看看   帮我改改呀?
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

36

主题

816

积分

0

精华

用户组 

易积分
872
热心
0
好评
0
QQ

活跃会员

发表于 2022-6-23 23:22:41 | 显示全部楼层
钱+问题=解决
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

37

主题

519

积分

0

精华

用户组 

易积分
679
热心
0
好评
2
发表于 2022-6-24 18:36:45 | 显示全部楼层
建议使用ok取网页源码
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

9

主题

317

积分

0

精华

用户组 

易积分
1295
热心
0
好评
0

活跃会员

发表于 2022-6-25 14:28:41 | 显示全部楼层
很容易的,自己想想就会,简单问题。这种小问题建议别浪费钱!!!
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

0

主题

0

积分

0

精华

用户组 

易积分
7
热心
0
好评
0
发表于 2022-6-25 17:28:04 | 显示全部楼层

解决的方法很好很直接

点评

尽想白嫖,白嫖不说,嫖完了谢谢都不会说。搞鸡仔。  详情 回复 发表于 2022-6-26 13:26
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

36

主题

816

积分

0

精华

用户组 

易积分
872
热心
0
好评
0
QQ

活跃会员

发表于 2022-6-26 13:25:27 | 显示全部楼层
本帖最后由 617390720 于 2022-6-26 13:26 编辑

--------------------------------
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

36

主题

816

积分

0

精华

用户组 

易积分
872
热心
0
好评
0
QQ

活跃会员

发表于 2022-6-26 13:26:11 | 显示全部楼层
吾甚吊丶耐何 发表于 2022-6-25 17:28
解决的方法很好很直接

尽想白嫖,白嫖不说,嫖完了谢谢都不会说。搞鸡仔。
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

0

主题

42

积分

0

精华

用户组 

易积分
295
热心
0
好评
0
发表于 2022-6-29 07:07:22 | 显示全部楼层
法国梵蒂冈的规定
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

1

主题

145

积分

0

精华

用户组 

易积分
34
热心
0
好评
0
发表于 2022-6-29 08:13:44 来自手机 | 显示全部楼层
多线程采取
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

3

主题

45

积分

0

精华

用户组 

易积分
334
热心
0
好评
0
QQ
发表于 2022-7-3 10:35:38 | 显示全部楼层
嵌套不就行了
易如意中文编程学习交流论坛有你更精彩~
回复

使用道具 举报

QQ|sitemap|免责声明|RGB颜色对照表|手机版|小黑屋| 易如意 - E4A中文编程学习交流论坛

GMT+8, 2024-5-3 13:52 , Processed in 0.062096 second(s), 34 queries .

Powered by Discuz! X3.4

© 2001-2018 eruyi.cn

返回顶部