求获取下一页源码
一个网站的网址从第一页到最后一页都相同,但是只能获取到第一页源码,下一页源码要怎么获取到,希望那个大神有具体例子说明下,帮忙解决问题。还有,你在这个链接的手机版网页源码里只接可以采集到所有集数地址,不用下一页,也不用API
把你的网址发出来啊
我这给你举个例子:
第一步:
分页 = 1
多线程1.开始取网页源码2("http://*****.com/ & 分页 & ".html","utf-8")
后面就是多线程的源码内容********
第二步:比如你用的高级列表框
事件 高级列表框1.表项被滚动(首个可见项目索引 为 整数型,可见项目总数 为 整数型,所有项目总数 为 整数型)
如果首个可见项目索引 + 可见项目总数 >= 所有项目总数 则
分页 = 分页 + 1
多线程1.开始取网页源码2("http://*****.com/" & 分页 & ".html","utf-8")
结束 如果
结束 事件
看不懂的话,@我,我再来给你注释行代码,积分给我,谢谢 爱奇艺的综艺节目https://www.iqiyi.com/a_19rrh2ybxx.html
网址都一样怎么会后面有分页地址呢,你看看 roller 发表于 2019-5-20 02:47
把你的网址发出来啊
我这给你举个例子:
第一步:
爱奇艺的综艺节目https://www.iqiyi.com/a_19rrh2ybxx.html
网址都一样怎么会后面有分页地址呢,你看看 本帖最后由 roller 于 2019-5-20 10:55 编辑
chenjiajin22 发表于 2019-5-20 04:23
爱奇艺的综艺节目https://www.iqiyi.com/a_19rrh2ybxx.html
网址都一样怎么会后面有分页地址呢,你看看 ...
特意去帮你抓了个包,不用分页的,拼接他的API地址获取所有列表,可以得到所有集数
API地址是:https://pcw-api.iqiyi.com/album/source/svlistinfo?cid=6&sourceid=233071001&timelist=2019
你只要在源码里获取参数:CID SOURCEID TIMELIST这三个参数就行了
然后拼接起来
变量 CID 为 文本型
变量 SOURCEID 为 文本型
变量 TIMELIST 为 文本型'上面的变量 值 可以在源码里得到
多线程1.开始取网页源码2("https://pcw-api.iqiyi.com/album/source/svlistinfo?cid=" & CID& "&sourceid=" & SOURCEID &"&timelist=" & TIMELIST,"utf-8")
对了,TIMELIST源码里没有,这个是年份,你应该懂的吧,你一在获取的是2019年的所有列表,直接写2019就行了,无需设置变量,不过看情况而定,
我自己还没写这个东西,所以不是很全面比如TIMELIST的参数设置为201904就是获取4月份的所有列表,201903就是获取3月份的所有列表,2019是全年的所有列表
roller 发表于 2019-5-20 10:51
特意去帮你抓了个包,不用分页的,拼接他的API地址获取所有列表,可以得到所有集数
API地址是:https://pcw-a ...
我也学习 了呵呵 roller 发表于 2019-5-20 10:51
特意去帮你抓了个包,不用分页的,拼接他的API地址获取所有列表,可以得到所有集数
API地址是:https://pcw-a ...
高手啊留下Q方便请教 roller 发表于 2019-5-20 02:36
还有,你在这个链接的手机版网页源码里只接可以采集到所有集数地址,不用下一页,也不用API
...
手机版是用手机看源码吗,还是电脑上选择手机版看,这个不懂 chenjiajin22 发表于 2019-5-20 13:37
手机版是用手机看源码吗,还是电脑上选择手机版看,这个不懂
是的,手机版的页面源码
页:
[1]
2