使用Index Server动态创建HTML页面并搜索纯文本和HTML元标记






3.73/5 (7投票s)
2003年8月2日
4分钟阅读

100460

929
本文主要探讨在招聘门户网站中遇到的问题,即如何为雇主/招聘人员提供机制,根据给定模板搜索求职者上传和创建的简历,反之亦然,求职者可以根据指定条件搜索工作。
引言
本文主要探讨在招聘门户网站中遇到的问题,即如何为雇主/招聘人员提供机制,根据给定模板搜索求职者上传和创建的简历,反之亦然,求职者可以根据指定条件搜索工作。
问题
有两种解决方案可以解决此问题。
- 解决方案一:
所有关于求职者的相关信息应存储在数据库中,包括他们的简历。当雇主根据指定条件获取简历时,匹配特定条件的记录将通过普通的 SQL 查询语言从数据库中获取。但是,当雇主指定纯文本搜索条件时(纯文本搜索意味着指定与结果匹配的关键词,如 Visual Basic 开发人员、SQL Server 专家等),记录将通过纯文本搜索机制从数据库中获取。SQL Server 会单独处理需要纯文本搜索的字段,使用单独的页面,这在一定程度上提高了性能,但并非总是最佳选择。
该解决方案的主要缺点是,在招聘门户网站中,我们有数百万的求职者(例如,在 monster.com 等网站上)的个人资料,并且这个数字每天都在增加。因此,使用 SQL Server 的纯文本搜索从数百万条记录中获取简历会极大地降低查询执行时间的性能。我们插入了简历(通常至少是 2 页的 MS Word 文档),因此获取这些字段也是 SQL Server 令人头疼的查询执行计划。
- 解决方案二:
第二种也是最高效的方法是将简历以 HTML 文件格式保存,并指定元标记(Meta tags 用于唯一标识 HTML 文档),然后使用 Index Server(它是 Windows 2000/Windows XP/Windows Server 2003 的一部分)搜索这些简历。
A 部分)动态 HTML 创建
我在这里使用的技术是创建 HTML 模板,定义相关的字段和元标记名称,通过它们我可以在第二部分搜索简历。(HTML 模板文件随源代码提供)。
当求职者创建个人资料并输入所有相关信息时,我可以使用 `System.IO` 命名空间中的 `StreamReader` 类将模板 HTML 页面的所有内容检索到内存中,然后逐个将用户提供的凭据替换到模板 HTML 页面中,并根据用户提供的信息设置元标记名称的内容值,然后将简历保存为 HTML 页面,文件名如 *profileId.html*(*Profile ID* 在任何情况下都是唯一的)。
B 部分)使用 Index Server 通过 HTML 页面的纯文本和元标记进行搜索
Index Server 是 Windows 2000/Windows XP/Windows Server 2003 的一部分,因此使用 Index Server 没有额外的成本。
要配置 Index Server,请按照以下步骤操作
- 定位 Index Server
开始 --> 设置 --> 控制面板 --> 管理工具 --> 服务和应用程序 --> Index Service
- 创建新的目录
右键单击 Index Server --> 新建 --> 目录,提供目录名称和 Index Server 管理目录的文件夹。
- 映射搜索文件夹
右键单击目录名称下的 *目录*,然后选择新建 --> 目录 --> 定位映射的目录并为其指定别名(UNC),例如 Profiles。
- 设置目录的属性
右键单击目录 --> 属性 -->(跟踪 --> WWW 服务器 --> 选择默认网站 --> 确定)
- 重启 Index Server
重启 Index Server。
- 完全重新扫描映射的文件夹
右键单击映射的文件夹 --> 所有任务 --> 重新扫描(完整)
- 刷新映射文件夹的元标记属性
右键单击属性 --> 所有任务 --> 刷新列表
- 缓存元标记属性
选择目录 --> 属性 --> 逐个选择元标记属性。
双击(元标记属性)--> 勾选缓存选项并为字符串属性选择 **"VT_LPWSTR"** 选项。
现在,从开发环境开始,我使用 ASP.NET for Visual Basic .NET 中的 Index Server 数据访问 **"ixssco control" 类型库**,但我们也可以使用 ASP 3.0、Visual Basic 6.0、ASP.NET for C#.NET 等。首先,我收集了员工想要查看简历的所有信息,然后根据这些信息构建动态查询,在定义了元标记的列之后将其发送到 Index Server 对象,最后将结果显示在数据网格中。
结论
此应用程序不仅可用于招聘门户网站,还可以使用 Index Server 从 HTML 页面中搜索特定数据。为了创建动态 HTML 页面,我们不仅可以生成 HTML,还可以生成 MS Word、文本格式、RTF 格式的文档。