65.9K
CodeProject 正在变化。 阅读更多。
Home

地址簿抓取器

starIcon
emptyStarIcon
starIcon
emptyStarIconemptyStarIconemptyStarIcon

1.53/5 (7投票s)

2008 年 2 月 27 日

CPOL

1分钟阅读

viewsIcon

62340

downloadIcon

1663

地址簿抓取器

我找到了两种从任何网站抓取地址簿的方法……

1. 使用 WebClient 类的 DownloadData 和 UploadValues 方法

基本算法是:

  1. 创建 WebClient 类对象,以获取用于发送和接收来自由 URL 标识的资源的的方法。
  2. 在标头中设置用户代理信息,并设置代理设置。
  3. 下载登录页面。
  4. 通过正则表达式提取需要与登录信息一起发送的所需名称值集合,例如用户名、密码等,以获取地址簿。
  5. 再次,设置标头信息,例如用户代理等。
  6. 上传页面并获取 cookie 信息。
  7. 下载地址簿页面。
  8. 创建名称值集合。
  9. 设置标头信息,例如 cookie 信息、用户代理等。
  10. 使用名称值集合上传页面 - 它将以字节数组格式返回地址簿。

请参考附件代码文件:Contact_Importer_.aspx.cs.zip

2. 使用 .NET Framework 的 HTTPWebRequest 和 HTTPWebResponse HTTP 类

基本算法是:

  1. 获取网页的第一步是实例化一个 HttpWebRequest 对象。这发生在调用 WebRequest 类的 static Create() 方法时。
  2. 设置请求标头字段和用户凭据。
  3. 从服务器获取响应到 stream 对象,并向其中添加用户凭据信息。
  4. 通过在请求中发送 cookie 来发送进一步的请求。
  5. 再次使用 create() 方法打开地址簿页面。
  6. 通过发送 cookie 信息与请求来获取响应,它将以字节数组格式返回地址簿页面。

请参考附件代码文件:Contact_Page_Importer.cs.zip

历史

  • 2008 年 2 月 27 日:初始版本
© . All rights reserved.