2 个回答
-
| 2017-10-09 07:31:57 广告
推荐如下的java开源爬虫或抓取框架
1.webmagic
【猪猪-后端】WebMagic框架搭建的爬虫,根据自定义规则,直接抓取,使用灵活,Demo部署即可查看。
官站:WebMagic
2.jsoup
java网络爬虫jsoup和commons-httpclient使用入门教程实例源码
搜索"jsoup"的分享列表
官站:jsoup Java HTML Parser, with best of DOM, CSS, and jquery
3.apache httpclient
java爬虫实现之httpClient4.2.1 连接池管理客户端请求 抓取页面简单示例
搜索"httpclient"的分享列表
HttpClient - HttpClient Home
4.如果觉得框架用起来复杂,其实完全可以通过java.net.HttpURLConnection来实现。
java通过java.net.HttpURLConnection类抓取网页源码工具类分享
搜索"HttpURLConnection"的分享列表
参考下爬虫相关的源码demo吧:
搜索"爬虫"的分享列表
搜索"抓取"的分享列表本问答由Night Silent提供
-
| 2017-10-09 07:24:45 广告
爬不爬的都无所谓了,你需要的只是一个好用的html解析库而已。个人推荐jsoup。本问答由Night Silent提供
更多
- 汇付天下电签pos机客服电话是多少?
- 20
- 3
- 嘉联立刷pos机客服电话是多少?
- 38
- 3
- 瑞银信pos机客服电话是多少?
- 53
- 3
- 考拉畅付pos机24小时客服热线是多少?
- 23
- 3
- 闪电宝pos机24小时在线客服是什么?
- 58
- 3
- 嘉联立刷pos机客服电话是多少?
- 51
- 3
- 刷宝pos机400客户服务电话是什么?
- 29
- 3
- 快钱pos机售后客服电话是多少?
- 36
- 3
- 考拉云商pos机售后热线是什么?
- 5
- 3
- 乐刷pos机售后客服电话是多少?
- 71
- 3