LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1201|回复: 0

大家有没用curl做过爬虫程序?

[复制链接]
发表于 2009-1-6 12:42:51 | 显示全部楼层 |阅读模式
直接用curl爬指定网站,指定目录层数(depth)

需要考虑哪些不同的页面连接结构因素

暂不考虑以下因素:
论坛的话,得考虑cookie登录验证;
https页面,也得考虑登录验证;

如果是Ajax的页面的话,又有什么比较好的方法呢(可以直接在shell下后台运行)?

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表