由于大数据的爆炸式增长,社会正在迅速地经历数字化转型,进入快速变化的新世界。这些新趋势影响到社会和未来的工作,进而影响到人才培养和教育,数据科学是数字化转型的核心。数据科学是包括数据规划、数据获取、数据管理、数据分析以及数据推断的科学。理论基础主要来自统计学、计算机科学、数学等学科。2022湖南省考成绩公布
数据科学从一系列学科中汲取技能和概念,使其成为一个真正的跨学科领域。许多领域的学生都需要学习数据收集、存储、整合、分析、推理、交流和伦理的知识。关键能力包括计算和统计思维、数学基础、模型建立和评估、算法和软件基础、数据策展、知识转移及沟通和责任。
面对众多快速出现的数字挑战,图书情报学在数据科学教育中面临着机遇和挑战。情报学为大数据提供了基础研究方法,促进了多源数据融合,拓宽了大数据的应用领域;大数据为情报学研究提供了更多的可能性、丰富了研究方法,提升了研究效率、扩大了研究范围。情报学取向的大数据与数据科学专业人才的培养,既有其必要性,又有其不可替代性。图书情报学科应该赋予学生“信息计算”学科的能力,在应用领域使用工具解决问题并创造价值、信息和知识的能力。我们需要发展区分与计算机科学或商学院的数据科学教育,构建图书情报领域的数据科学教育框架,采用基于用户、基于工具和基于应用程序的方法来执行。
基于数据科学教育和实践的现状,识别数据
图书情报领域数据人才需求及职能分析
——
—基于ALA JobLIST的分析
苏芳荔(郑州航空工业管理学院信息管理学院)
自治区招生网
摘要:文章以美国图书馆协会2006-2018年发布的数据相关的招聘广告为数据来源,共收集了职位名称中包
含“Data”的321个招聘广告,对具体的职位名称、知识和技能要求以及职能职责进行分析,评估其中所描述
的需求与职能,以期为数据科学的课程设计和人才培养提供帮助。
关键词:数据人才;图书情报学科;人才培养;美国
中图分类号:G259.712;G250-4文献标志码:A文章编号:1005—8214(2021)01—0073—06 Analysis of Job Requirement and Function of Data Professionals in Library and Infor-mation Field——
—Based on the ALA JobLIST Analysis
Su Fang-li
Abstract:Taking the data of job advertisements published by American Library Association from2006to2018as the data source,the paper collects321job advertisements with“data”in job titles,analyzes the specific job titles,knowledge and skills requirements and duties and responsibilities,and evaluates the needs and functions described in them,so as to provide help for
the curriculum design and personnel training of data science.
Keywords:Data Professionals;Library and Information Science Subject;Personnel Training;American
[基金项目]本文系2020年河南省高等学校青年骨干教师培养计划“图书馆数字人文服务模式研究”(项目编号:2020GGJS173)的研究成果。
073
相关工作所需的具体能力,如知识、技能,是设计数据科学专业人员教育和专业框架的一个重要基础。本研究试图通过评估图书情报领域数字科学相关招聘广告中所描述的知识技能要求,确定数据科学相关从业者所需的能力,为促进图书馆学信息科学更好地融入数据科学领域,以及数据科学的课程设计和人才培养提供帮助。1文献综述1.1
数据科学人才培养及课程体系构建研究
自北卡罗莱纳州立大学2007年首次设立
“数据分析”硕士专业以来,美国已经有多所高校陆续开设“数据分析”或“数据科学”等相关专业,不仅涉及到传统的计算机、数学和统计学等院系,而且还涉及到图书情报等人文社科类院系。截至2019年3月,ischool 联盟有29所信息学院开设了数据科学相关专业[1]。我国的数据科学教育开展相对较晚,最早是北京航空航天大学于2013年开设了“数据科学”硕士专业。2016年,教育部首次批准北京大学、对外经济贸易大学、中南大学三所高校增设“数据科学与大数据技术”本科专业。截至2019年底,
国内一共有482所高校本科获批设立该专业[2]。
英语四六级近年来,学界对图书情报领域的大数据人才培养多有探讨。巴志超等人认为,情报学要深入推进各门类学科与情报学之间多方式、大跨度的广泛交叉,从而建设多元开放、互动协同发展的学科生态[3]。苏日娜等选取开设数据科学研究生项目的15所iSchools 高校作为调研对象,从专业学科优势、学科体系划分、课程目标、核心课程设置、课程制度等方面研究数据科学课程体系及人才培养等问题
[4]
。陶俊等调查并分析
了国外5所典型图书情报背景的iSchool 院校在数据科学专业上的培养目标、学分学制和课程结构
[5]
。陈沫等对国内外大数据相关专业的培养
目标和课程设置模式进行调研,并结合国内的教学资源情况设计情报学取向的大数据专业人才培养计划[6]。1.2
基于招聘广告的内容分析
对招聘广告内容进行分析非常常见,王东
波等收集了智联招聘、51job 等招聘网站上有关数据科学的工作岗位数据,通过对数据科学招聘信息中出现的人才技能素养实体的抽取,探究指导情报学学科紧跟时代发展潮流的课程设计内容[7]。
通过对图书馆相关招聘广告的分析可以促进图书馆学信息科学的教育。通过了解不同类型图书馆员的需求,图书馆学信息科学课程开发人员可以更好地实施课程开发和教学方法设计,为图书馆的新职位培养成功的候选者。如,Jeonghyun Kim 等对数字策展领域的招聘广告进行了分析[8],R.Khan 等对美国高校图书馆数据馆员招聘广告进行了内容分析,挖掘数据馆员所需要的任职资格和能力[9]。2数据来源与研究方法2.1
数据来源
本文旨在选择和分析一个针对图书情报学毕业生的数据科学招聘广告样本,以在培养数据人才和设计课程方面提供建议,帮助图书情报学发展。美国图书馆协会(American Library Association,ALA )JobLIST (/)是“图书馆与信息科学与技术工作”的招聘网站,也是美国图书馆协会、大学与研究图书馆协会的服务网站。在此网站发布的招聘信息主要针对图书馆学、信息科学的毕业生。
从2006年8月到2018年4月(数据获取于2019年4月,而美国图书馆协会不提供一年内的招聘广告信息),ALA JobLIST 发布的所有招聘广告信息共24,058个,其中一些广告被重新发布,直到招到合适的人才,本研究对此首先进行了数据去重处理。ALA JobLIST 的数据节点包括职位名称、工作ID、发布时间、国家、、公司名称、工作类型、工作描述、工作要求、最低学历、最低工作经验、工资(高/低/类型)、截止日期和工作职能。设定职位名称中包含“Data”,共收集到321个相关的招聘广告。笔者获取样本的招聘广告列表是以图书馆为中心,最终收集的样本主要分布于学术/研究机构(学院/大学)。
074
2.2研究方法
为了确定数据相关工作需求的特征和模式,笔者分析了321个相关工作数据集,重点关注招聘广告发布的年份、职位名称、知识和技能需求、职能和职责。
人工审核了所有系统给出的职位描述和职位要求,手工提取出具体的知识技能要求和职责。然后,将数据导入到Vosviewer,得到知识技能和工作职责中关键词出现的频次和共现网络,进而识别数据相关工作需要的核心技能和工作职责。
2020年河南省公务员考试面试名单
另外,本研究使用Pajek提供的方法来进行知识技能要求和工作职责的社区划分,然后将共现网络图和社区划分从Pajek导出到VOSviewer,以进行网络社区的可视化。
通过对ALA JobLIST里12年间数据相关工作招聘广告的分析,了解数据相关工作的资格要求与工作职能,为数据科学教育提供建议。
3结果分析
3.1数据人才需求的逐年分布
如表1所示,样本中第一个数据人才工作职位需求发布于2006年,招聘社会科学数据馆员,主要从事社会科学数据的统计工作。从2007年到2011年,ALA JobLIST上每年有大约10人的数据人才工作需求。2011年到2012年、2015年到2016年,工作需求的数量显著增长。2018年的工作岗位数量有所下降,这是由于2018年的数据不完整造成的。从ALA JobLIST中数据人才需求数量的逐年分析可以看出,图书情报领域对数据科学人才的需求逐年增加,也可以看出图书馆越来越多地参与数据科学工作。
3.2职位名称分析
对于求职者来说,职位名称是衡量一个职位是否合适的初步标识,也是一个工作需求最核心的概括和
凝练。数据人才需求范围非常广泛,数据人才需求相关职位名称分布非常分散,共有186种不同的与数据科学相关的职位名称。图1显示了数据人才工作需求中至少出现三次以上的的职位名称,共18种。
图1数据相关工作职位名称
“数据服务馆员”的职位最多,样本中共出现
了24次,其次是“社会科学数据馆员”和“数据
馆员”,分别出现了18次和16次。其他职位名称
还包括“研究数据馆员”“商业数据馆员”“研究
数据管理馆员”“数据管理专家”“数据策展员”等。所有的职位名称中都包含“数据”,所需从业
者负责及完成与数据相关的工作职能和职责。
临沂人才网最新招聘为了更好地挖掘职位名称中包含的内容和范围,本研究分析了职位名称中包含的关键词,最
常见的工作类型是图书馆馆员,其次是专家和协
调员,其他工作类型还包括主任、管理员、顾问、
研究员、负责人等。相关的学科包括社会科学、
商业、科学、地理等。主要工作包括服务、研究、
管理、技术、协调、策展、分析等。
3.3知识和技能要求
在所有数据人才工作需求中,有262个样本
可以从职位描述和系统给出的职位要求中提取特
定的知识和技能要求。数据相关工作所要求的知
年份(年)需求工作数百分比
200610.31%
200712  3.74%
200816  4.98%
20095  1.56%
201010  3.12%
201113  4.05%
2012288.72%
2013288.72%
20143611.21%
2015329.97%
20165115.89%
20176720.87%
201822  6.85%
总计321100.00%
表1数据人才逐年工作需求
075粉笔公务员网课资源
识和技能主要有:管理、软件、元数据、团队管理、统计软件(SPSS、SAS、STATA )、教学与培训、数据库、数据策展、交流能力、数据保存、分析技能、数据可视化等(见表2)。
基于知识和技能需求的关键词共现情况,构建了共现网络,通过pajek 中的Louvain 方法,将数据人才的技能需求划分为3个簇,也就是把需求分为三个大的类别,如图2所示。
表2数据相关工作知识技能要求
数据人才知识和技能要求包括以下三个方面。(1)数据管理、数据保存技术及交流和协作能力。主要包括:熟悉数据管理计划和数据保存工具;理解研究过程和数据生命周期;具有数据管理知识(元数据、数据检索和研究数据使用、格式迁移、保存),熟悉XML、SQL、MySQL、Unix 文件系统等数据管理技术;了解地理空间元数据和数据管理标准和实践;了解数据管理、策展和保存的原则和实践;具备DSpace 和Fedora 等存储库系统和内容管理系统的知识;优秀的沟通、协作和解决问题的能力;能够在团队环境中有效地与教师、学生和员工一起工作;优秀的口头、书面、人际沟通、组织和
分析能力。
(2)程序和脚本语言、元数据标准。主要包括:熟悉主要元数据标准(如DC、DDI、OAI-PMH、MODS、METS、PREMIS 或MARC )和脚本语言(如PHP、PERL、Python、Javascript );有语义技术和数据检索经验;掌握用于数据密集型研究的脚本语言;有使用网络书目数据库搜索的知识;了解开放获取的趋势和问题;优秀的技术和分析能力;熟悉数据可视化工具;有使用关系数据库的经验。
(3)社会科学数据分析方法和信息素养培训经验。有使用统计软件包(如Stata、R、D3、MATLAB、SAS 或SPSS )的经验;熟悉适用于社
会科学的数据发现分析技术和统计方法;熟悉业务数据库和资源;丰富的商业和财务知识;有研究机
构的公共服务经验;熟悉学术交流过程的知识(出版、版权、资料库);在学术机构有教学经验和信息素养教学经历;教学和开发以用户为导向的培训和信息资源。3.4
工作职能/职责分析
数据人才相关的321个招聘广告
中,有269个具有一个或多个系统给定的工作职能(见图3)。
数据相关工作最重要的职能是研
究(64),其次是信息技术/系统
关键词频次关键词频次
Management (管理)83Training (培训)19Resource (资源)60Public Service (公共服务)18Software (软件)59Scholarship (学术)18Language (语言)40DSpace 17Social Science (社会科学)40Excel 17Metadata Standard (元数据标准)37PERL 17Team (团队)36Presentation (保存)17SPSS 35Research Data Management (研究数据管理)17SAS 32Statistical Software (统计软件)17STATA 32Workflow (工作流)17Python 29Organizational Ski
ll (组织技能)16Teaching (教学)27Advanced Degree (高等学位)15Instruction (培训)26Fedora 15Work Experience (工作经验)26Tableau 15Business (商业)25Analytical Skill (分析技能)14Database (数据库)25Data Visualization Tool (数据可视化工具)14Research Data (研究数据)25Javascript 13Record (记录)24Higher Education (高等教育)12XML 24Multiple Project (多任务)12Access (获取)23Oral Communication Skill (口语交际能力)12Data Curation (数据策展)23Programming Language (编程语言)12Metadata (元数据)23Publication (出版物)12Preservation (保存)23Strong Service Orientation (服务导向)12Excellent Communication (交流)22Data Management Plan (数据管理计划)10Proficiency (效率)22New Technology (新技术)10Organization (组织)20Relational Database (关系数据库)10
图2数据人才知识和技能要求
076
(49)和数字项目(48)。参考文献(42)、区域研究/学科专家(38)和行政/管理(31)在工作职能表中出现均超过30次,是数据类工作的主要职能。
根据工作职能的共现情况,识别出三个大类的工作(见图4),分别为:①数字项目、数字保存、特
殊馆藏和档案、知识管理类工作;②研究和参考咨询、馆藏开发、信息素养和培训类;
③信息技术和系统、多媒体和网络服务、培训技术及开放获取类。
图4工作职能共现网络
在321个数据人才相关工作样本中,有294个样本可以从职位描述中提取特定的职责。数据类工作职责主要包括数据服务、开放获取、顾问、培训、保存、可视化等。基于工作职责包含的关键词的共现情况,构建共现网络,将工作职责划分为2个大类(见图5)。
(1)教学、培训、课程建设、顾问、数据服务、外联等工作,主要职责包括:促进和整合跨学科的数据服务和数据素养到图书馆教学中;推进开放数据,为从事数据密集型研究项目的教师提供服务;为学术界提供广泛的数据服务;为图书馆数据扫盲提供培训和支持;开展关于可视化工具和技术的研讨会或相关培训;与各图书馆的人员就研究、教学和数据相关项目进行合作;指导学生查数据集,并教导学生如何清理和操作数据,以用于分析和统计应用。
(2)图书馆的研究数据、元数据、数据集合、数据馆藏的管理、保存、策展及获取等工作,主要职责包括:社会科学统计数据收集,方便获取更多的数据资源;选择、获取、管理和交付数字数据集合,建立数值和空间数据收集,方便跨学科访问其他数据资源;参与数据收集的选择、组织、交付和
管理;开发并提供广泛的研究数据管理;参与数据文档计划元数据项目;制定长期元数据战略规划;分析来自数据和内容所有者的元数据,以确保质量和完整性;选择适当的元数据标准和模式,并就创建和清理元数据的工具和工作流提供建议;为可用的数据集创建元数据;监测和研究可能适用于数据服务的新数据管理方法和技术;在当前和未来的数据保存基础设施中实现数据管理系统;设计有助于数据可视化、数据和信息访问、数据发现、数据挖掘、数据发布、数据管理和保存的流程;确定、评估和推荐定性和定量(文本分析)数据集;获取、存储和维护数据集。
4启示与建议
针对ALA的招聘广告内容分析提供了快速演变的数据科学领域专业人员的需求和职责的详细画像。招聘方正在寻合格的候选人来从事数据
相关的工作。分析结果部分显示了数据人才所需
图3数据人才工作职能
图5工作职责共现网络
077