第1期0引言
随着招聘信息需求的大量增长,出现了诸如智联招聘、中
华英才网和51job 这样的专业人才招聘网站。它可以按照用户的自主设置精确地查询招聘信息。但是,这类网站只包含了交费企业或会员单位的招聘信息,所以有相当一部分公司的招聘信息不能被检索到。同时,传统的基于关键词字符匹配的信息检索中,参与匹配的只有外在的表现形式,而非它们所表达的全部概念,所以用户很难简单地用关键词或关键词串来真实地表达需要检索的内容,检全率较低。
针对这些问题,本文在研究有效招聘信息检索时,把信息检索从关键词匹配的层面提高到语义层面,特别是抓住招聘信息中某些词条特有的语义特点来构造合理的语义网络,有效地规避检索范围,实现快速、有效、准确地招聘信息检索。
1
语义网络
1.1
语义网络的基本概念
按照数学的观点,语义网络是一种带有标记的有向图。在
语义网络中通过概念节点与关系弧的连接来表示概念之间的联系。节点用于表示实体、概念和情况等,弧线用于表示节点间的关系。语义网络表示由下列4个相关部分组成:①词法部分:决定表示词汇表中允许有哪些符号,它涉及各个节点和弧线;
②结构部分:叙述符号排列的约束条件,指定各弧线连接的节
点对;③过程部分:说明访问过程,这些过程能用来建立和修正描述,以及回答相关问题;④语义部分:确定与描述相关的(联想)意义的方法,即确定有关节点的排列及其占有物和对应弧线。
1.2语义网络的表示
语义网络表示法是人类知识体系网络化的表现,它能够使
联想式推理得到很好地发挥,为进行复杂推理打下坚实的基础。语义网络各个概念之间的关系,主要由IS —A (表示“具体-抽象”关系),PART-OF (表示“整体一构件”关系),IS (表示一个节点是另一个节点的属性),HAVE (表示“占有、具有”关系),
BEFORE /AFTER /AT (表示事物间的次序关系),LOCATED —ON (表示事物间的位置关系)等谓词表示。在实际应用时,可根
据具体情况定义新的关系标签。二元语义网络的表示:要表示京巴是狗的一种品种,用语义网络表示为:京巴是狗。多元语义网络的表示:要表示A 和B 两足球队在A 所在地进行的第2场比赛的比分是3比1,用语义网络表示如图1所示。
2招聘信息的语义分析及语义网络的构造
通过观察众多企事业单位发布的招聘信息,可以了解到,
用人单位对于人才的需求以及设定的限制条件基本相同,而且招聘信息的格式也大同小异。以通信领域一家中型规模的公司发布的招聘信息为例,它有研发类、销售类、财经类3种人才需求,对岗位的描述分为这样几个部分:职位名称、职位要求、职位说明。我们可以通过表格的形式来总结出它们的共性,如表
图1
多元关系的语义网络表示
比赛
第二场
3-1
B
A
客队
比分
主队
作者简介:王盛润(1973-),女,四川达州人,四川省仁寿县卫生学校助理工程师,研究方向为网络管理、计算机维护;吴继强(1975-),男,四川眉山
人,四川省仁寿县人民医院助理工程师,研究方向为网络管理、计算机维护。
安徽录取结果查询时间基于语义网络的有效招聘信息检索研究
王盛润1,吴继强2
(1.四川省仁寿县卫生学校,四川仁寿620500;2.四川省仁寿县人民医院,四川仁寿620500)
要:在运用语义检索技术相关原理的基础上,分析了招聘信息的语义特点,构建了针对招聘信息查询的语义网
络,提出了适合招聘信息查询的专用检索系统的设计思路。关键词:语义检索;招聘信息;潜在语义;本体;语义网络中图分类号:TP311.52
文献标识码:A
文章编号:1672-7800(2009)01-0027-02
第8卷第1期2009年1月
Vol.8No.1Jan.2009
软件导刊
Software Guide
软件导刊2009年
1所示。
从表1看出,用人单位提供的职位基本就可以概括为名称、要求、说明3个大的属性,下面可再包含学历、专业、外语水平、工作地点等具体属性。当然,有些工作岗位还设定了月薪、工作类型(全职或兼职)、工作年限(工作经验)以及招聘人数等要求,这些也可以作为具体属性加入进来。而表格的“其它”这一类栏目,大多是阐述性文字,信息量比较分散,应聘者的第一关注度并不高,在构造语义网络时可以忽略。
对于应聘人员来讲,他们还关注应聘单位的企业类型、企业规模、企业电话和传真等细节信息,可是这些信息却不一定都出现在公布的招聘信息里,所以在构造招聘信息领域的语义网络时都应该尽可能地考虑将其作为网络元素。那么,在对招聘信息进行相应的语义分析之后,可以构建出这样的一个语义网络,如图2所示。图2中,“招聘信息”与“招贤纳士”、“加入我们”、“工作机会”等字段是同义关系。之所以提炼出这些同义概念,是因为在互联网搜索中,许多企业或单位的主页上的招聘信息链接大都是这类文字。除此之外,语义网络中其它的分支结构基本上属于上下位的包含关系。对于“企业名称”、“职位名称”和“工作经验”等字段,由于各个企业自身情况的不同,体现出来的信息有较大差别,就没有按范围或类别一一列举出来,但这对于检索没有太大的影响。河北教育网登录
语义网络的建立可以不要求有相关领域的专业知识,因此比较容易建立。而Ontology的建立必须要有专家的参与,相对而言更加严格和困难。所以,随着招聘信息新的语义特征出现,还可以对上面的语义网络进行完善和更新。
构建好语义网络之后,在进行基于语义网络的有效招聘信息检索时,可以考虑建设专用的检索系统。特别是在就业竞争激烈的情况下,有条件的高校还可以尝试建立高校就业信息资源搜索引擎,而分词词典是比较重要的一个环节。要对中文语句进行基于词的处理,必须先要进行词的切分处理,以正确地识别出每一个词。在进行分词时,应注意到中文分词存在的歧义现象,这种歧义包括交叉歧义和组合歧义。在应用比较成熟的分词技术的基础上,还可以考虑到招聘信息的特点,过滤掉那些检索意义不大的词语。
3结束语
语义网络是为了解决自然语言理解问题而发展起来的一种知识表示理论和方法。为了构建适合互联网上招聘信息搜索的知识库,本文对语义网络的特点和表示方法进行了介绍,并根据对企业公布的招聘信息的语义分析,构建了针对招聘信息检索的语义网络。最后还提出建立一种专用检索系统,并对该系统进行了整体设计,规划出了系统框架,对系统功能及关键技术作了论述。对基于语义网络的有效招聘信息的检索研究还只是一个初步的尝试。一方面,语义网络还存在许多改进和完善的地方,另一
方面,在语义网络中,各节点的语义相关度计算问题还有待进一步研究。当然对于语义网络的研究还只是一个理论层面,将来的工作是将它应用到通用性平台当中,以满足用户更广泛的要求。
参考文献:
[1]李洁,丁颖.语义网、语义网格和语义网络[J].计算机与现代化,2007(7).
[2]吴健,陈珂,董金祥.基于语义网的产品配置知识表达及检索[J].计算机辅助设计与图形学学报,2005(1).
(责任编辑:杜能钢)
表1某公司招聘信息汇总职能
类别研发类
销售类财经类
职位名称
软件研发
销售工程师
帐务会计
学历
硕士或本科
硕士学历
本科以上
专业
计算机、通信相关专业
通信、电子、计算机
会计或财务管理
外语水平
熟练阅读和理解英语资料
英语口语流利
英语六级426分以上
其它
熟悉C/C++编程语言
良好的语言表达能力、外向
认真敬业、责任心强
工作地点
深圳、成都、西安、上海
全国
北京、上海、深圳
其它
负责通信系统软件模块的
设计、调试
负责市场项目的挖掘、运作
熟悉集团统一会计政策
职位要求职位说明
图2招聘信息的语义网络
企业
名称
注册资金企业
规划
加入
我们
招贤
纳士
2023年公务员考试时间省考
招聘
信息
工作
机会
外资企业
性质企业
信息
发布
日期
职位
信息云南公务员考试招录网
职位
名称
合资
国企民营职位
4级英语词汇说明
职位
要求
工作
地点
外语
水平
工作
经验
专业
学历
工作
待遇
工作
类型
招聘
人数实习
兼职
全职
口语
CET-4
2021年河南省省考公告博士
硕士
本科
专科
CET-6
28 --