[目的/意义]探索人工智能内容生成技术对开源情报工作的影响与改变。[方法/过程]以ChatGPT的形成与AIGC技术演进为研究起点,分析ChatGPT现有技术特征与技术演进趋势,从开源情报全周期视角解析该现象级应用对开源情报工作的潜在影响。[结果/结论] ChatGPT对开源情报的信息搜索、信息获取、信息处理环节具有一定提升作用。但现有技术缺陷使ChatGPT在开源情报全流程介入中仍面临数据可靠性、情报隐秘性、意识形态风险等问题与挑战。建议情报机构采取AIGC技术融合理论探索、AI生成式内容可靠性评估、智能技术体系建设等积极策略来应对本轮技术变革,更好实现开源情报价值。[局限]受限于AIGC技术领域专业化知识与ChatGPT应用下的开源情报实践不足,研究结论仅是ChatGPT对开源情报工作影响的思考与探索。
[目的/意义]作为大型语言模型的杰作,ChatGPT智能机器人的出现暗示着强人工智能时代即将来临。由于ChatGPT功能多样和强智能性等特征使其备受关注,但同时也潜藏应用风险,故而有必要探索治理路径。[方法/过程]文章分析ChatGPT的技术逻辑和特征,论证ChatGPT智能机器人应用的风险类型,并在此基础上构建协同治理的体系。[结果/结论]ChatGPT智能机器人应用的风险主要包括:社会信任机制面临危机、版权规则遭受冲击、个人数据的泄露风险骤升以及真实信息被篡改或滥用。未来法律层面应当完善数据分类分级、数据获取以及数据利用制度;ChatGPT开发者和平台层面应当分别强化审查义务和数据清洗义务;ChatGPT用户层面应当承担声明义务和注意义务,同时提高甄别能力;行业组织层面需要发布技术指南,推进企业事前合规建设。
[目的/意义]诗词创作是数字人文领域自然语言生成研究的重要方向,对古诗词遣词造句的版本争议判断、自动诗词问答等具有一定意义,然而当前尚未出现能够自动生成繁体中文古诗词的预训练模型,已有研究着眼于根据使用者需求创作不同风格的简体古诗词。[方法/过程]文章基于CLM使用繁体《四库全书》无标点语料、繁体中文古诗词语料在gpt2-chinese-cluecorpussmall上进行继续预训练构建SikuGPT2、SikuGPT2-poem模型。采用困惑度、BLEU、专家打分、图灵测试等验证模型性能。[结果/结论]实验显示SikuGPT2-poem模型困惑度较低,生成的诗歌BLUE评分较基准模型低0.053左右,在人工打分中较基准模型平均高1.93分。总体而言,文章提出的模型表现优异且通过图灵测试,提出的古汉语生成式系列模型的预训练语料集尚小。模型在古诗生成方面表现较好,但尚不能满足赋、曲等体裁的需要。
[目的/意义]协同发展是提高科研创新效率的有效途径,对科研大数据生态系统协同程度进行测算能够梳理科研大数据发展脉络,为实现科研大数据协同发展提供参考。[方法/过程]在解析科研大数据生态协同内涵的基础上,引入复合系统协同度测度模型,基于2011—2020年《中国统计年鉴》《中国科技统计年鉴》等面板数据,测算科研大数据生态协同度。根据测度结果提出科研大数据发展现存问题的改善策略。[结果/结论]科研大数据协同治理虽然已经初具成效,子系统的有序度呈逐年增长态势,但整体协同度仍处于较低水平,从规制、技术、管理3个维度提出改善策略,为更好地实现科研大数据协同发展提供参考。
[目的/意义]以知识扩散为视角,探讨知识单元的学术价值形成机制,衡量知识单元粒度上的知识价值增量,为破除“以刊评文”的科研评价弊端提供方向。[方法/过程]首先,利用知识描述规则抽取学术文献中的知识单元;其次,在梳理现有研究的基础上,提出知识主体的知识结构描述方法,以及知识存量与流量的量化方法;然后,从知识主体的知识结构、知识存量、知识流量等客观可测维度,构建知识扩散视域下知识单元的学术价值形成机制;最后,将知识单元在知识扩散网络中的相互影响关系融入其学术价值计算过程中,并结合知识单元在知识扩散网络中的具体位置对其学术价值加以调整。[结果/结论]文中方法实现了知识单元粒度上的知识价值定量研究,其测得的知识价值能够较好地体现知识单元在领域知识扩散中的实际作用,使知识单元作为基本单位直接参与到学术价值评价。
[目的/意义]加强机构知识库和智库的数据共享和信息融合,探索异构数据互联,推动机构知识库与智库的共建共享。[方法/过程]梳理国内外机构知识库与智库数据交换相关实践以及我国机构知识库现存问题,分析数据交管共享所涉及的各个机构需求,挖掘二者共建共享的服务需求以及服务机制,实践研究数据共享的智库型机构知识库。[结果/结论]在山东理工大学机构知识库的基础上,融合智库功能,初步构建了山东理工大学智库型机构知识库,提出了智库型机构知识库在数据汇聚、数据挖掘以及知识服务3个方面的实践策略。
[目的/意义]情报是研究重大突发公共危机预警问题的重要支撑,而信息空间论是近年来新兴的理论范式,旨在分析社会中信息和知识的生产交换问题,与重大公共危机预警问题研究高度契合。因此,探讨公共危机预警情报服务模型,有助于增强情报工作服务应急预警的能力和水平,更为研究公共危机治理提供新的思路。[方法/过程]首先,界定了公共危机预警情报的内涵,指出在危机预警工作中,情报是基础,研判是关键,方法是工具。其次,基于公共危机事件演变过程,运用情报生产链,构建了公共危机预警情报模型,并着重对危机情报源、筛选原则、危机信号发现/挖掘、预警情报等级划分进行概述。最后,通过三鹿集团毒奶粉事件验证和阐述所构建的公共危机预警情报模型。[结果/结论]模型从技术、管理和组织三个层面分析了安全情报感知、智库协同和匹配化情报应用的动态协作过程,进而为建立常态化危机应急预警机制与公共危机治理体系提供了多层次的动态危机预警情报服务。
[目的/意义]识别颠覆性技术有助于在制定研发和市场战略布局中获得首发优势,如何在大数据背景下综合提高颠覆性技术识别的精准率、召回率和识别效率至关重要。[方法/过程]结合机器学习与专家知识,首先,构建SimCSE-LDA语义相似度表征模型,以深入挖掘专利摘要中隐含的关键技术主题,实现更深层次的显著特征主题识别,并通过聚类效果评价指标检验其识别效果,进一步结合专家知识判定关键技术主题名称,对主题间内在联系判定,最终识别出关键技术。其次,运用突变性表征颠覆性技术内在特质,基于CBLOF算法对关键技术主题进行异常检测,将计算得到的技术主题异常分数作为判断技术突变程度的依据,从而识别出颠覆性技术。最后,结合领域专家知识和《中国制造2025》验证颠覆性技术识别效果。[结果/结论]以农业机器人为例,以德温特专利数据库的DWPI英文改写专利摘要文本为数据源,进行实证分析,验证了该颠覆性技术识别方法的可行性与有效性。
[目的/意义]面对波谲云诡的国际形势以及复杂敏感的产业竞争态势,产业协同应急处置能力受到考验,亟须智慧化的应急情报服务,探索建立以产业协同应急实际需求为导向的,及时、准确且高效的突发事件应急处置方式,以实现精准认知、智慧预警、智能反馈、循证高效和协同联动的产业协同应急智慧服务,提升产业应对突发事件能力,保障产业的稳定发展。[方法/过程]依据协同理论和循证理论,以产业竞争情报和应急情报为多源情报数据基础,构建“多源数据驱动—突发事件监测—区块链与数据湖技术底座—循证理论支撑—多主体协同响应”的产业协同应急智慧服务模式,以实现多源数据共融驱动和多元主体协同共治下的产业突发事件准确研判、快速反应和及时处置,并以芯片产业应急场景为例,阐释产业协同应急智慧服务模式在产业应急场景中的价值和作用。[结果/结论]案例证明该模式可实现智慧、高效和及时的应急响应和处置,提升产业全局反应速度、联动处置能力和应急处突水平,为复杂国际竞争环境中我国产业发展提供稳定可靠的应急情报智慧服务保障。
[目的/意义]科学数据与期刊论文的互联有助于科学数据的共享和重用,利用关联数据技术实现中文领域科学数据与期刊论文的互联,以促进科学数据和期刊论文的双向知识发现。[方法/过程]首先,分析科学数据和期刊论文中的关联属性和国家科学数据元数据标准,抽取相关元数据,通过命名实体丰富元数据中的隐含信息;其次,在复用本体的基础上形成描述科学数据与期刊论文互联的语义模型,并利用ORCID等属性关联外部数据集,丰富科学数据实体属性;最后,通过Web前端页面的方式直观地展现科学数据和期刊论文的关联,以促进知识发现。[结果/结论]以国家农业科学数据中心的科学数据集和中国知网农业工程领域的期刊论文为实例数据,通过关联数据的语义描述实现科学数据和期刊论文的多维度、深层次互联,帮助用户更加便捷地发现潜在相关资源和检索目标数据。