地址簿抓取器






1.53/5 (7投票s)
地址簿抓取器
我找到了两种从任何网站抓取地址簿的方法……
1. 使用 WebClient 类的 DownloadData 和 UploadValues 方法
基本算法是:
- 创建
WebClient
类对象,以获取用于发送和接收来自由 URL 标识的资源的的方法。 - 在标头中设置用户代理信息,并设置代理设置。
- 下载登录页面。
- 通过正则表达式提取需要与登录信息一起发送的所需名称值集合,例如用户名、密码等,以获取地址簿。
- 再次,设置标头信息,例如用户代理等。
- 上传页面并获取 cookie 信息。
- 下载地址簿页面。
- 创建名称值集合。
- 设置标头信息,例如 cookie 信息、用户代理等。
- 使用名称值集合上传页面 - 它将以字节数组格式返回地址簿。
请参考附件代码文件:Contact_Importer_.aspx.cs.zip。
2. 使用 .NET Framework 的 HTTPWebRequest 和 HTTPWebResponse HTTP 类
基本算法是:
- 获取网页的第一步是实例化一个
HttpWebRequest
对象。这发生在调用WebRequest
类的static Create()
方法时。 - 设置请求标头字段和用户凭据。
- 从服务器获取响应到
stream
对象,并向其中添加用户凭据信息。 - 通过在请求中发送 cookie 来发送进一步的请求。
- 再次使用
create()
方法打开地址簿页面。 - 通过发送 cookie 信息与请求来获取响应,它将以字节数组格式返回地址簿页面。
请参考附件代码文件:Contact_Page_Importer.cs.zip。
历史
- 2008 年 2 月 27 日:初始版本