过刊目录

  • 2021年, 第44卷, 第10期
    刊出日期:2021-10-30
      

    论文
  • 全选
    |
    论文
  • 论文
    范涛1,2,王昊1,2,张宝隆1,2
    2021, 44(10): 1.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]对非物质文化遗产(以下简称非遗)文本展开属性抽取研究,有利于非遗的知识图谱建设和非遗文化传播。[方法/过程]首先,基于非遗属性表,借助远程监督方法,构建大规模非遗文本属性标注语料。其次,基于深度学习方法构建CNNBiLSTMAttCRF模型,对标注的非遗属性语料库中的属性值进行抽取,并同相关基线模型进行比较。[结果/结论]通过对标注语料库进行抽样检测,发现基于远程监督的非遗属性抽取标注语料库质量较高;本文提出的模型在多个非遗属性中属性抽取表现最优,同时平均的非遗属性抽取性能最佳。
  • 论文
    赵梓博1,2,王昊1,2,邓三鸿1,2,张海潮1,2
    2021, 44(10): 8.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]深度学习模型已经成为命名实体识别的主要方法,但当前多数模型的预处理忽略文本中词上下文的语义信息。因此,探明文本的语义化表示对于实体识别的影响具有重要意义。[方法/过程]文章以中华美食本体库构建为例,通过构建CRFs、BiLSTMCRFs、Char2vecBiLSTMCRFs和BERTBiLSTMCRFs这4类模型,对比分析文本语义化表示对其识别效果的影响;联合比较了基于BERTBiLSTMCRFs模型的术语单独抽取和集合抽取的结果,并将该模型应用于美食本体库的构建。[结果/结论]实验表明,使用BERTBiLSTMCRFs模型的实体识别准确率要高于其他模型,整体F1值提升87%;并且实体单独识别抽取比集合抽取效果更好。[局限]研究的实验数据规模有限,后续研究将在更大数据集上进行。
  • 论文
    张军亮1,2,方雪梅1,雒曼3,孙晶晶1
    2021, 44(10): 18.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。
  • 论文
    彭知辉
    2021, 44(10): 27.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]研究情报产品规范的概念、来源及构成,有助于构建完整的情报产品规范框架,提高情报产品质量。[方法/过程]基于“何谓→为何→何为”的逻辑思路,依次阐述情报产品规范如何理解、从何而来、怎样构建。[结果/结论]情报表达和情报交流是情报编写的两个本质属性,由这些本质可推导出情报产品的基本原则,再根据这些原则确立情报产品的一系列规则,以及对这些规则加以描述的具体要求,并且针对某些具有强制性的规则制定出情报产品标准。根据情报产品规范的逻辑关系,即“本质→原则→规则→要求→标准”,可以构建出情报产品规范的基本框架。
  • 论文
    高凡1,孙超2,吴振新3,4
    2021, 44(10): 35.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]参考成熟度模型以及长期保存能力成熟度模型的相关应用,设计基于成熟度模型的数字资源长期保存能力评价框架,为国内长期保存服务机构的建设和发展提供参考。[方法/过程]通过详细分析成熟度模型的概念、原理和应用,参考相关长期保存能力成熟度模型的方法和过程,将成熟度模型与相关保存标准相结合,设计完成用于长期保存服务评价的能力成熟度评价框架。[结果/结论]初步完成符合我国实践需求的长期保存服务能力成熟度模型及评价框架的设计,为国内长期保存服务机构的建设和发展提供参考。
  • 论文
    孙蒙鸽1,2,韩涛1
    2021, 44(10): 41.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]立足于科技情报服务视角,研判未来科研过程的发展趋势——智能化,同时明确当前知识服务智能化升级机遇,以此为国家的科技发展把握先机并提供更强有力保障。[方法/过程]文章借助培根归纳法分析框架,通过梳理生物学界“Alpha Fold”、化学界“A Mobilie Chemist”等“智能科学家”系统的实现原理和系统架构,发现未来科研智能化范式的典型特征是将AI算法和机器人技术与科学研究相融合,实现科研假说的自主提出甚至是假说合理性的自主验证。[结果/结论]当科研过程走向智能化,科技知识服务平台也需走向数据化和计算化,相应的服务角色、服务目标、服务方式和能力基础也将发生重大转变。
  • 论文
    高颖1,杜娟2
    2021, 44(10): 50.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]数据匿名化是产生于数据流通环节、隐匿个人数据特征的技术规则,在将个人数据转化为数据资产的过程中面临着数据收集合法性缺失以及数据再次被识别的现实风险,此类风险可以通过对立法的完善来加以规避。[方法/过程]通过对域外数据匿名化的立法经验与司法实践进行探究,分析我国数据匿名化发展现状与现实困境,提出规制数据匿名化风险的可行性建议。[结果/结论]建议我国在专门数据保护立法中以利益平衡为基础构建数据匿名化最低法律标准,在具体场景立法中以最低法律标准为指导作出数据匿名化的具体规定,并提供数据匿名化的事后法律救济以应对个人数据被再次识别所产生的法律风险。
  • 论文
    袁晓文1,俞立平2
    2021, 44(10): 57.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在学术评价中,由于评价体系指标日益增多会导致专家赋权困难,以及评价指标标准化后平均值不相等会扭曲实际权重,产生自然权重问题,从而使得评价结果根本不能体现专家权重。文章在进行理论分析的基础上,提出一种新的完全信息多重主成分分析方法来解决这个问题,并以JCR2017数学期刊为例进行了实证。研究结果表明:学术评价中专家辅助赋权与自然权重问题必须高度重视,完全信息多重主成分分析可以较好地解决这个问题,该方法的评价结果具有较好的统计学性质,需要注意的是当主成分指标分类效果较差时需要专家进行进一步讨论。
  • 论文
    张燕,赵婉忻,董凯
    2021, 44(10): 65.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]对学者影响力评价指标p指数进行综合改进得到pnew指数,以提高人才影响力评价的公平性。[方法/过程]将学者署名顺序和是否为通信作者作为学者贡献度的考量指标,剔除自引频次,考虑高、低他引论文的不同贡献,以Scopus数据库为数据源,将60名青年学者整个学术生涯的论文产出作为研究对象,通过实证分析和相关性分析验证pnew指数的合理性。[结果/结论]pnew指数能够更加客观地体现学者的被引数量与其对文章的贡献,同时更加有效地筛选出高他引作者。
  • 论文
    于梦月,申静
    2021, 44(10): 72.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]党政智库是中国特色新型智库建设的中坚支撑力量,探究其知识服务能力评价有助于明确党政智库知识服务的功能定位,改进服务质量,提高服务水平。[方法/过程]从利益相关者视角,通过深度剖析党政智库的内外部利益相关者和知识服务能力,建立党政智库的知识服务能力框架,基于该框架构建党政智库知识服务能力评价指标体系,并对其进行实证分析。[结果/结论]研究表明该评价指标体系能综合、客观和有效地评价党政智库知识服务能力水平,可以作为评价党政智库知识服务能力的标准和尺度,其评价结果可以为我国党政智库知识服务能力提升提供对策建议。
  • 论文
    崔婷
    2021, 44(10): 79.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    通过对国内外危机防控的研究,探讨数字化时代我国高校图书馆面临服务变革、信息安全、舆情、经费和资源,以及人才等众多危机。指出图书馆危机治理的现状具有危机治理意识薄弱、法治观念不强、体制机制不健全等特点。提出了应健全基于全生命周期理论、全要素、全方位和全过程危机治理的4A危机治理体系,发挥好各方面的协同作用,保障图书馆健康稳定发展。
  • 论文
    曾忠禄,李珂
    2021, 44(10): 83.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]世界大部分信息都是定性数据,难以用传统的统计分析方法进行分析,而一般的人工分析又由于人的有限理性而容易导致分析偏差,内容分析方法是最好的解决方案之一。现有文献对于该方法的运用研究较少,而运用该方法的文献对其运作流程大都缺乏具体说明。文章希望通过细致讨论两种不同的内容分析方法,并提供一个实战案例进行具体演示说明,以弥补现有的不足。[方法/过程]内容分析方法可以基于归纳法,也可以基于演绎法。文章先总结两种不同方法的运作,然后采用归纳法做一个案例分析,特别展示内容分析过程中需要关注的各种问题。[结果/结论]基于归纳法的内容分析方法是分析分散信息,发现模式、主题的重要情报分析方法。电脑的算法分析不能完全代替分析人员的判断。
  • 论文
    孙玉伟1,2,戚景琳2,刘超2,巩礼男2,田梅2
    2021, 44(10): 90.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]探究社会科学科研人员的数据复用行为的影响因素,对图情机构进行科学数据管理和数据服务提供策略参考。[方法/过程]基于MOA理论框架构建数据复用行为影响因素模型,对社会科学领域二手数据使用较为普遍的科研人员进行问卷调查获得样本数据,利用结构方程模型分析验证科研人员数据复用行为的影响因素及其作用路径,并对模型进行了修正。[结果/结论]社会科学领域科研人员的数据复用动机对社会科学科研人员数据复用行为影响最大,其次是机会,再次是能力。动机因素中,科研人员本身的数据需求与感知利益正向影响数据复用行为;机会因素中,二手数据的质量、数据背景信息完备性、数据的可获得性均正向影响数据复用行为;数据素养能力对科研人员数据复用行为也有显著的正向影响。其中,机会因素中的学科风气对数据复用行为的影响不显著。
  • 论文
    杨波,杨美芳
    2021, 44(10): 100.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]世界贸易摩擦加剧与全球新型冠状病毒肺炎疫情流行的大环境下,企业处于创新发展与经济转型升级的关键时期,各类风险事件频发,提高风险事件快速响应效率成为亟待解决的问题。针对多源异构的企业风险信息泛滥、知识组织与处理能力不足以及风险管理智能化程度较低等现状,文章构建了风险事件驱动的企业知识服务模型。[方法/过程]文章从知识服务的视角探讨风险事件快速响应中企业知识服务模型构建与应用过程,明确风险管理领域知识服务模型各要素,以风险数据为基、风险决策为标,以风险事件为驱动,以知识图谱分析方法为力,将风险领域知识服务过程分解为事前预警、事中响应与事后总结三个阶段,结合风险事件处理的经验知识,构建风险领域知识获取—组织—应用三级知识服务模型。[结果/结论]模型引入知识图谱方法对风险事件不同阶段的知识需求进行相应的知识表达、组织与融合,为企业管理者提供风险管理知识服务方案,为面向跨学科的知识服务理论创新提供新增长点。
  • 论文
    刘畅,杨子傲,王馨悦
    2021, 44(10): 110.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]作为学习知识的巩固与学习效果的评估,本科生课业是本科生学习的重要环节,这个环节中学生经常需要自主搜集信息、组织信息并创造信息。了解学生在课业过程中的信息行为和体验,有助于设计相应的信息搜索和辅助学生学习的系统。[方法/过程]文章通过长期在线观察结合问卷和日志分析对18名在校本科生课业过程中的信息行为进行分析,探究了学生课业信息行为在不同阶段的特征及完成体验。[结果/结论]研究发现,在4个不同时间区间学生课业投入的精力与课业完成的比例具有明显的差异。按照课业时间分配类型,可将学生分为“前期型”“平稳型”“后期型”与“前少后多型”4类,不同类别的学生在信息搜寻行为与体验上有不同表现。由此提出在分析学生课业信息行为时,应将信息搜寻过程模型与日常信息查询行为模型中的时间情境结合展开分析。
  • 论文
    李金泽1,2,夏一雪1,张鹏1,何巍1,兰月新1
    2021, 44(10): 119.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]随着信息技术的高速发展,网络舆情已经成为公共决策的重要参考,正确分析和引导突发舆情事件,重点在于舆情的情报感知,为突发舆情事件的应急管理提供情报支持。[方法/过程]文章剖析突发舆情事件的发展态势,从突发事件舆情中提取情报,分类为诉求型情报和支援型情报,建立全新的突发舆情事件情报语料库,基于朴素贝叶斯、支持向量机、K近邻三种算法,构建突发舆情事件情报感知模型,搜集大量“新型冠状病毒肺炎疫情”的文本数据进行实证分析。[结果/结论]突发舆情事件情报感知模型中三类分类算法的准确率、召回率、F1值较高,结果验证了突发舆情事件情报语料库的科学性,以及突发舆情事件情报感知模型的合理性,其中运用支持向量机算法感知结果为:诉求型情报的F1值为0873,支援型情报的F1值为0894,相比其他算法的感知评价指数,支持向量机算法的感知结果更加准确。
  • 论文
    杨湘浩,阚顺玉,叶旭,贺新年
    2021, 44(10): 129.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]突发事件网络谣言传播是一个极其复杂的社会现象,引入超网络刻画其传播过程,对提升我国突发事件网络谣言治理能力具有积极意义。[方法/过程]在对突发事件网络谣言传播过程分析的基础上,构建了突发事件网络谣言传播的超网络模型,并定义了超网络的各层子网及主要度量指标。最后,应用具体案例对该模型进行验证分析。[结果/结论]研究结果表明,通过建立超网络模型,能更有效识别突发事件网络谣言传播中的关键节点和关键路径,从而能对突发事件网络谣言传播进行针对性治理。
  • 论文
    吴布林1,薛冬1,杨克2
    2021, 44(10): 137.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]重大突发公共事件发生时,社交媒体信息的可信度最为关键,严重影响社交媒体用户行为。而用户行为直接决定公共事件信息传播效果。当前大多数的社交媒体用户信息行为分析方法是量化、跟踪单个用户的网络行为,但是无法总体衡量媒体用户行为变化趋势。为此,文章以“新型冠状病毒肺炎”(COVID19)疫情事件为例,对该重大突发公共事件中社交媒体用户的相关信息行为进行研究。[方法/过程]选取某市某高校学生作为研究对象,以Likert五级量表作为测量工具,依据调查问卷调查者对测量项目的认同程度,设计调查问卷变量测量量表。建立结构方程模型,并检验整体模型适配度,通过临界比率方法检验所建立模型的显著性,深入探究重大突发公共事件中社交媒体用户的信息行为。[结果/结论]研究结果表明,事件相关信息过量推送与分享易造成用户的心理抗拒情绪;事件信息质量决定了用户的信息行为;用户的危机信息采纳行为与风险感知存在负向影响;积极性信息的用户转发概率更高。
  • 论文
    冯兰萍1,2,钱春琳1,2,庞庆华1,程铁军3
    2021, 44(10): 142.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]探究突发事件网络舆情政府干预时机和应对措施,以期为该类研究提供新思路,为政府及相关部门有效应对突发事件提供借鉴。[方法/过程]详细阐述了研究问题和研究假设,引入政府干预延迟参数a,构建“政府—网民—关键节点”三方博弈演化模型,并分析该类舆情演化过程中三方博弈的过程和结果。通过仿真实验分析不同政府延迟干预程度下各主体策略的演化过程和结果。[结果/结论]结果显示,当a增加时,政府趋向于选择“干预”策略;面对网民和关键节点的不同策略组合,不同的政府延迟干预程度对政府干预意愿产生不同影响。最后,对政府干预突发事件网络舆情的时机和应对措施提供建议。
  • 论文
    郭培燕,李艳
    2021, 44(10): 151.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]上市公司投资者在线问答社区是重要的企业开源情报平台,对在线问答社区中披露的信息进行充分的挖掘利用能够成为大数据环境下提升企业情报竞争力的有效举措。[方法/过程]文章基于活动理论,就“上证e互动”平台上的问答文本,从文本内容特征和问答结构特征出发,构建了提问、回复、问答关联3个要素层的11个具体评价指标,并以21所上市公司的实际数据为例,挖掘其与公司绩效的相关性,探究将其作为上市公司竞争情报来源的可行性。[结果/结论]可将“上证e互动”这样的上市公司在线问答社区信息披露质量作为判断公司绩效的依据,为企业竞争情报研究提供新的情报来源。
  • 论文
    朱镇远,黄微,张晓君
    2021, 44(10): 158.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]探究不同大学生群体网络信息交互行为轨迹的相似性,构建网络交互行为轨迹相似度,从而更加有效地对网络环境下的大学生群体信息交互行为进行甄别、分类与预测。[方法/过程]结合经典信息行为理论与地理测绘当中的时空轨迹预测方法,以微博环境当中的大学生群体作为研究样本,通过问卷调查、轨迹相似度计算、本底线法、灰色模型等方法进行实证分析。[结果/结论]研究结果表明利用轨迹结构相似度进行预测的方法的结果优于其余两种方法,大学生群体网络交互行为轨迹相似度可作为对大学生群体网络交互行为分类及预测的依据。
  • 论文
    陈诗1,2,王东波2,3,黄水清2,3
    2021, 44(10): 165.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]指代消解是古文信息挖掘的重要组成部分,是古文数字人文研究的技术支撑研究之一。文章使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,旨于为古文数字人文研究的发展做出推进。[方法/过程]选取《史记》为语料来源,通过阅读大量文献的同时结合语料特征制定标注规范,人工构建实验所需的语料库;另外,使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,并将文本划分为无词性字单位语料、无词性词单位语料、有词性词单位语料三种,探索不同分割单位与词性特征引入对指代消解效果的影响。[结果/结论]实验结果表明,在BiLSTMCRF模型实验中引入词性特征,消解效果(F均值)达8401%,而在未引入词性特征的情况下,BERT模型指代消解效果优于BiLSTMCRF,F均值达8243%。基于BiLSTMCRF模型的无词性字单位文本实验与无词性词单位文本实验中F均值分别为7413%、7757%。所利用的深度学习方法能够有效解决古文句内人称代词指代消解问题,同时词性特征的引入能够有效提升模型的指代消解性能。[局限]仅针对句内、有且只有一条指代链的情况进行人称代词指代消解研究,同时文本量较小,实验具有一定局限性。
  • 论文
    曾刚1,赵雪芹2
    2021, 44(10): 173.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]基于知识元研究视角探索知识抽取与组织方法,提高万里茶道数字资源开发利用效率。[方法/过程]构建知识元语义描述模型,基于该模型实现万里茶道知识抽取,并利用深度学习实现对知识语义层面的细粒度组织。[结果/结论]实现对细粒度、多维关联知识的揭示与展示,推动万里茶道历史人文资源的活化和保护。
  • 论文
    吴晓燕1,胡雅敏1,2,陈方1,2
    2021, 44(10): 179.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文章基于专利共类信息,从整体和局部视角构建技术融合的分析框架。整体层面分析技术领域融合分布和年度变化,利用领域共现分析领域间融合程度。局部层面利用计量学指标(共现频次、中介中心性和突发指数)识别重要领域的热点技术、关键技术和新兴技术。以合成生物学专利为例进行实证研究,结果显示,该分析框架有助于把握技术融合的整体发展态势,能够有效识别研发热点和关键技术,分析演化轨迹并预测发展趋势。
  • 论文
    范昊,郑小川
    2021, 44(10): 185.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]对国内外开源情报研究进行分析,归纳总结学术界关于开源情报的理论和应用成果,分析研究中存在的缺漏和不足之处,为后续的研究提供支持。[方法/过程]使用定量的方法对文献进行总体发文量分析和关键词共现分析后,进一步运用内容分析法梳理开源情报的概念,结合DIKW模型提出当前学术界关于开源情报的研究结构,归纳总结其内容。[结果/结论]目前国内外对开源情报主题进行了广泛的探索,特别是在开源情报的概念发展、开源情报搜集、融合、质量评估、模型构建等研究内容上有了新的认识。但总体研究仍处于起步阶段,其中理论模型和方法的研究相对较少。此外,开源情报的应用场景和内容仍有扩展的空间。
  • 论文
    梦非1,朱庆华2
    2021, 44(10): 193.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近年来,社交网络越来越成为一种信息传播的重要媒介,并对网络意见的形成与扩散影响巨大。伴随2016年美国大选、2019年新型冠状病毒肺炎等一系列“黑天鹅事件”的出现,网络意见偏差引起了学术界、政界的广泛重视。文章首先对意见偏差的内涵进行梳理,认为意见偏差是个体或群体的意见看法无法反映事物真实的状况。在此基础上,重点从虚假信息、局部极化、偏见倾向、传播控制4个角度对意见偏差的研究进展进行综述,总结了主要流派及其观点。结合发展趋势与当前研究不足,文章从人工智能渗透、低可信内容管控、偏差的标准认定,以及意见操控反制4个方面对未来研究进行了展望。
  • 论文
    柯健1,2,李欣2,许鑫1
    2021, 44(10): 202.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    [目的/意义]旨在从宏观视角梳理国外竞争情报实践进展,为我国构建良好的竞争情报生态、推进企业竞争情报工作提供启示。[方法/过程]采用文献与网络调查法,概述美国、法国、加拿大、南非、巴西、以色列几国的竞争情报探索历程与实践进展。[结果/结论]各国竞争情报实践源自不同的推动力量,参与主体、工作内容及发展现状也有所差异。对我国的启示:发挥政府主导作用,优化竞争情报服务环境;协同多方力量,共建竞争情报服务生态系统;适应信息技术变革,构建竞争情报综合处理方案;树立竞争情报意识,加强竞争情报文化建设;加强竞争情报规划,提升竞争情报战略嵌入性。
  • 论文
    2021, 44(10): 211.
    摘要 ( ) PDF全文 ( )   可视化   收藏