内容简介
本书为数字信息资源与服务创新研究丛书之一,是一本译著。其目的在于为学术影响力评价的主题、技术和方法提供一份手册。本书共分为四个部分:网络工具和分析、科学系统、统计方法与基于文本的方法、可视化。所有章节均由本领域的国际一流科学家提供,每一章均提供了对所述主题的介绍,并阐述了如何将该主题技术和方法应用于信息计量学研究。具有一定的学术价值。
作者简介
窦永香,教授,博士生导师/硕士生导师,主要从事信息分析、智能信息系统与检索、知识管理与知识系统工程方面的研究。曾主持国家自然科学基金项目“基于社区的P2P信息资源的语义检索策略与模型研究”、陕西省自然科学基金“网络信息资源的信息体系结构和组织方法研究”各1项。曾在《情报学报》《图书情报工作》《情报杂志》等核心刊物上发表论文30余篇。
目录
第一部分 网络工具及分析
1 利用Map Equation Framwork实现网络的社区发现及可视化
1.1 引言
1.2 方法综述
1.3 Map Equation Framework
1.3.1 Map Equation
1.3.2 Infomap
1.4 Map Equation软件包的操作步骤说明
1.4.1 Map EquationWeb应用
1.4.2 Infomap命令行软件
1.4.3 网络输入和输出格式
2 链接预测
2.1 引言
2.2 链接预测过程及其应用
2.3 数据
2.4 链接预测工具
2.4.1 安装
2.4.2 基本用途
2.5 链接预测实践
2.5.1 前处理
2.5.2 预测器选择
2.5.3 预测
2.5.4 评价和解释
2.5.5 配置文件
附录:用作Python模型
3 网络分析与指标
3.1 引言
3.2 网络与文献计量学
3.3 基本网络特性
3.4 网络数据
3.5 利用网络科学计量
3.6 合作网络
3.7 引文网络
4 分析引文网络的PageRank相关方法
4.1 引言
4.2 PageRank
4.2.1 PageRank定义
4.2.2 PageRank计算
4.2.3 阻尼因子参数
4.2.4 以随机冲浪方式解释PageRank
4.3 文献综述
4.3.1 PageRank的前身
4.3.2 分析文献引文网络的PageRank方法
4.3.3 分析作者引文网络的PageRank方法
4.3.4 分析出版物引文网络的PageRank方法
4.4 使用说明
4.4.1 从Web of Science数据库下载书目数据
4.4.2 用Sci2工具建立一个文献引文网络
4.4.3 使用MATIAB进行PageRank计算
第二部分 科学系统
5 系统生命周期及其与三股螺旋的关系
5.1 简介
5.2 相关研究
5.3 实验假设
5.4 技术生命周期中的可度量状态
5.5 使用工具生成结果的步骤
5.6 关于技术准备水平里程碑5的扩展/进化
5.7 TRL逻辑到改进模型的应用
5.8 讨论
6 空间科学计量学与学术影响:近期研究、工具及方法综述
6.1 引言
6.2 综述论文选取
6.2.1 综述范围
6.2.2 检索过程
6.3 综述
6.3.1 出版物和引文影响力的空间分布
6.3.2 引文影响地理图
6.3.3 工具和方法
7 科研人员发表模式及其在作者消歧中的应用
7.1 引言
7.2 文献所属作者判别研究综述
7.3 方法
7.4 科研人员文献发表模式中的规律
附录1:期刊学科列表
附录2:院系学科列表
8 知识整合与扩散:多样性和连贯性的度量和可视化
8.1 引言
8.2 概念框架:知识整合和扩散作为认知多样性与连贯性的变化
8.3 数据选择和操作方法
8.3.1 分析单元
8.3.2 将元素划分类别
8.3.3 获取关系
8.3.4 可视化
8.4 如何计算和可视化知识整合
8.4.1 多样性测量介绍说明
8.4.2 计算一组论文多样性的R脚本
第三部分 统计与基于文本的方法
9 信息计量研究中的受限因变量模型和概率预测
9.1 引言
9.2 数据:在信息计量学中哪些文献被引用
9.3 二分类变量回归
9.4 有序变量回归模型
9.5 计数资料模型
9.6 Stata中的受限因变量模型
10 利用Stanford CoreNLP软件进行文本挖掘
10.1 引言
10.2 文献计量学研究中的文本挖掘
10.3 文本挖掘系统的结构
10.4 Stanford CoreNLP分析器
10.5 举例说明文本挖掘在文献计量学分析中的应用
10.6 结果
11 主题模型:使用主题滤镜评价学术影响力
11.1 引言
11.2 主题模型
11.2.1 语言模型(LM)
11.2.2 Probabilistic Latent Semantic Indexing模型(pLSI)
11.2.3 Latent Dirichlet Allocation模型(LDA)
11.2.4 Author-Tropic模型
11.2.5 Author-Conference-Topic模型
11.2.6 Hierarchical Latent Dirichlet Allocation模型(Hierarchical LDA)一
11.2.7 Citation LDA模型
11.2.8 Entity LDA模型
11.3 主题模型方法在学术交流中的应用
11.4 主题模型工具:案例研究
12 机构间引文影响力差别的本质与实际意义:运用效应量与可信区间分析百分位数的指南
12.1 引言
12.2 百分位数排名
12.3 数据与统计软件
12.4 效应量及相关概念
12.5 Cohen's d(对于个体机构)
12.6 机构间的平均值差值
12.7 比例(既用于单个机构也用于机构间的比较)
附录:用于分析的Stata代码
第四部分 可视化
13 文献计量网络的可视化
13.1 引言
13.2 文献综述
13.2.1 文献计量网络的类型
13.2.2 可视化方法
13.3 软件工具
13.3.1 通用的网络分析工具
13.3.2 文献计量网络分析和可视化工具
13.3.3 文献引文网络的分析和可视化工具
13.4 技术
13.4.1 VOSviewer
13.4.2 CitNetExplorer
13.5 指导手册
13.5.1 数据采集
13.5.2 VOSviewer
13.5.3 CitNetExplorer
附录:VOSviewer使用的标准化、可视化与聚类技术
14 可复制的科学学研究
14.1 用于科学学研究的开放工具
14.2 科学学(Sci2)工具
14.2.1 工作流程设计及复制
14.2.2 数据读取器
14.2.3 时间分析(何时)
14.2.4 地理空间分析(何地)
14.2.5 主题分析
14.2.6 网络分析
14.3 职业轨迹
14.3.1 数据准备分析
14.3.2 数据可视化及解释
14.4 讨论与展望
参考文献
精彩书摘
《学术影响力的测评:方法与实践》:
在最近的研究中,Jonkers和Cruz—Castro(2013)用有国外工作经验的阿根廷研究者做样本探讨这一效应。当这些研究者回国时,与其他国家的研究者相比,他们更倾向于与以前东道国的研究者共同发表论文。比起其他不流动的同龄人,这些研究人员更偏爱在高影响力的期刊发表论文,甚至当流动的科学家不与外国研究者共同发表时。重要的是,把研究者的早期出版记录作为返回阿根廷后高影响出版物的一个解释变量,是自我选择(比较好的科学家都是流动的)的原因。
Tripp1(2013)的另外一项研究调查了国际流动的明星科学家对区域知识转移的影响。问题是区域是否获利于引进国外著名科学家。他们发现流动的明星科学家在区域知识转移活动中并未与非流动明星科学家有不同。然而,流动的科学家们与公司有更多跨区域的联系,这些公司强调流动科学家对于弥补区域内外联系的重要性。
……
前言/序言
学术影响力的测评:方法与实践 内容梗概: 本书深入探讨了“学术影响力”这一复杂而重要的概念,旨在为研究者、学术机构、政策制定者以及期刊出版商提供一套全面、系统且可操作的理论框架和实践指南。我们将超越传统、狭隘的论文引用计数,从多维度、多层次剖析学术界如何衡量和评估研究成果的价值、传播度和实际贡献。本书并非堆砌冰冷的数字,而是力求展现学术影响力背后的人文关怀、知识传承和社会进步的逻辑。 第一部分:学术影响力的多维透视 本部分将颠覆对学术影响力的单一认知,将其置于一个更广阔的视野下进行考察。 引言:超越“引用迷信”,重塑学术评价 回顾学术评价的演变历程,指出传统评价体系的局限性,如过度依赖定量指标、忽视研究质量和创新性、容易导致“垃圾论文”泛滥等。 阐述学术影响力为何是一个动态、多维度且具有情境性的概念,强调其与知识发现、技术创新、社会发展以及人类福祉的内在联系。 提出本书的核心观点:学术影响力的衡量需要综合考量研究本身的内在价值、在学术共同体内的传播广度与深度、对学科发展的推动作用、以及其对现实世界产生的实际改变。 勾勒本书的整体结构和核心目标,激发读者对学术影响力评价新方法的兴趣。 第一章:学术影响力的定义与内涵 传统影响力的追溯与反思: 详细梳理经典的学术影响力指标,如期刊影响因子(Impact Factor)、h-index、g-index等。 深入分析这些指标的计算方式、优势与局限,例如: 期刊影响因子: 易受学科专业性、发表周期、自我引用等因素影响,无法反映单篇论文的实际影响力。 h-index: 衡量研究者的产出数量和引用数量的综合,但可能忽视高引用但低产出的杰出贡献,也可能受到“引用网”效应的影响。 g-index: 旨在纠正h-index对高引用论文的侧重不足,但同样存在计算复杂、易受极端值影响的问题。 探讨这些指标在不同学科领域可能存在的适用性差异,以及跨学科评价的挑战。 分析“引用迷信”对学术研究生态的负面影响,如“被引用导向”的研究行为、忽视非引用性贡献等。 学术影响力的维度拓展: 内在价值: 聚焦研究的创新性、原创性、科学严谨性、方法论的先进性、理论的突破性等。这部分将深入探讨如何从研究内容本身去评估其潜在的影响力,而非仅仅依赖于外部的量化指标。 学术传播与互动: 显性传播: 除了传统引用,还包括论文的下载量、阅读量、被翻译的次数、在学术会议上的报告与讨论、被他人研究引用的频率与深度。 隐性传播: 指研究成果通过非正式渠道(如学术交流、课程教学、项目合作)进行传播,以及对学术思想和范式的潜在影响。 学术对话与批评: 被同行审议、被积极评论、被纳入学术辩论,这些都是重要的影响力体现。 学科贡献与范式演进: 研究是否开辟了新的研究方向、建立了新的理论框架、提出了新的研究方法,从而推动了学科的整体进步。 是否解决了学科内的长期难题,或者为学科发展开辟了新的可能性。 社会经济与文化影响: 技术转化与产业应用: 研究成果是否转化为实际技术、产品、服务,推动了产业发展和经济增长。 政策制定与公共服务: 研究是否为政府决策、公共政策的制定提供了科学依据,改善了社会福祉。 教育与人才培养: 研究成果是否被纳入教学内容,为培养下一代人才提供了支撑。 公众认知与文化启蒙: 研究成果是否引发了公众的关注和讨论,提升了科学素养,对社会文化产生了积极影响。 学术影响力与研究质量、研究价值的关系: 区分三者,但强调它们之间的相互关联性。研究质量是影响力的基础,研究价值是影响力的体现,而学术影响力则是研究价值在不同层面的放大和延伸。 第二章:新兴指标与评估工具 替代计量学(Altmetrics)的崛起: 详细介绍Altmetrics的定义、来源(社交媒体、新闻报道、博客、维基百科、政策文档等)和价值。 分析常见的Altmetrics指标,如提及次数(Mentions)、分享次数(Shares)、下载次数(Downloads)、政策引用(Policy Mentions)等,并探讨其解读方式。 讨论Altmetrics在捕捉早期影响力、跨学科传播以及社会影响力方面的优势。 警示Altmetrics的局限性,如噪音、操纵可能性、以及其是否能真正反映学术深度和质量。 网络可视化与知识图谱: 介绍如何利用引文网络、合作网络、概念网络等进行学术影响力的可视化分析。 阐述知识图谱如何揭示研究主题的演变、研究热点、学科交叉以及关键研究者或机构。 展示可视化工具在识别潜在合作者、发现新领域、以及评估机构整体研究布局方面的应用。 定性评估方法的再思考: 同行评审的深化: 探讨如何改进同行评审流程,使其更能识别创新性、潜在影响力和研究质量。 专家委员会的评估: 介绍如何组建具备跨学科背景的专家委员会,对研究成果进行更为全面和深入的评估。 案例研究与故事叙述: 强调通过详细的案例研究,讲述研究成果如何产生影响,这比冷冰冰的数据更能打动人心。 第二部分:学术影响力的测量实践 本部分将从个体、机构、学科、期刊等不同层级,提供具体的评估方法和案例。 第三章:个体研究者的学术影响力评估 简历与研究档案的构建: 如何全面展示研究成果,包括论文、专著、专利、软件、数据集、参与的重大项目、获得的奖励、受邀的讲座等。 引用分析的深度解读: 不仅仅看引用次数,更要分析引用来源(顶尖期刊、权威著作)、引用语境(支持性引用、批评性引用、扩展性引用)、引用频率的趋势。 如何识别和排除“低质量”引用,例如教科书中的引用、纯粹的背景引用等。 非引用性贡献的量化与描述: 教育与指导: 培养博士生、博士后,其后续发展也是影响力的体现。 学术服务: 担任期刊编辑、会议组织者、评审专家等。 开放科学实践: 数据共享、代码公开、预注册研究等,这些行为有助于提升研究的可信度和可重复性,间接产生影响力。 公众科普与沟通: 通过讲座、媒体采访、科普书籍等形式,向公众传播科学知识。 学科特点与评估的匹配: 不同学科的研究产出和传播方式存在差异,评估方法需要因地制宜。例如,数学和理论物理学可能更侧重于理论创新和高难度证明,而生物医学可能更看重实验发现和临床应用。 第四章:学术机构的研究影响力评估 机构层面的定量指标: 科研产出总量与质量: 机构发表论文的数量、质量(如高被引论文比例)、专利数量、技术转移收入等。 学科优势与特色: 分析机构在优势学科领域的研究产出和影响力,识别新兴的研究方向。 机构引文影响力(Normalized Citation Impact): 考虑研究发表年份、研究领域以及文献类型等因素,对引用进行标准化处理,以提高可比性。 定性评估与战略规划: 学科评估报告: 引入外部专家对机构的优势学科和重点研究领域进行评估,识别其在国内外学科排名中的位置和潜在增长点。 研究项目与平台的支撑: 评估机构在建设国家级/省级研究中心、实验室、大科学装置等方面的投入和成效。 人才引进与培养: 评估机构吸引和留住顶尖人才的能力,以及培养优秀研究生的比例和去向。 社会服务与贡献: 评估机构在服务地方经济、推动科技进步、参与重大社会项目等方面的贡献。 案例分析: 选取国内外知名大学和研究机构,分析其在学术影响力建设方面的成功经验和失败教训。 第五章:期刊与出版商的角色与影响力评估 期刊的学术声誉与影响力: 超越影响因子: 探讨其他评价期刊质量和影响力的指标,如文章下载量、社交媒体提及量、同行评价、编辑声誉、出版周期、开放获取情况等。 期刊内容质量与稀缺性: 评估期刊发表的论文是否具有原创性、前沿性,以及是否填补了学术研究的空白。 期刊的生命周期与学科代表性: 某些期刊可能在特定时期成为某一学科的“发声筒”,其影响力需要结合学科发展历程来理解。 出版商的责任与价值: 推动学术交流: 出版商如何通过提供高质量的出版平台、支持开放获取、开展学术推广活动来促进研究成果的传播。 质量控制与学术诚信: 出版商在确保学术出版物的严谨性和防范学术不端行为中的作用。 数据分析与服务: 出版商如何利用自身数据资源,为研究者和机构提供更精准的影响力分析服务。 第六章:学科与领域的影响力评估 跨学科研究的影响力: 评估跨学科研究在推动学科融合、解决复杂问题方面的独特价值。 如何衡量跨学科研究的传播和影响,例如是否能够同时在不同学科的期刊上获得认可。 新兴学科与交叉领域的影响力: 如何在研究尚不成熟、数据积累有限的情况下,评估新兴学科的影响力。 关注其研究的创新性、潜在颠覆性以及对未来发展方向的引领作用。 政策研究与决策影响力: 如何评估智库、研究机构在政策制定和公共议题讨论中扮演的角色和产生的实际影响。 关注政策研究的严谨性、客观性以及其对相关政策文本和实践的指导作用。 第三部分:学术影响力的未来展望与伦理考量 本部分将聚焦学术影响力评价的未来发展趋势,以及在实践中需要注意的伦理问题。 第七章:学术影响力评价的挑战与机遇 数据的可获得性与质量: 如何获取全面、准确、可信的研究数据,尤其是在涉及隐性影响力和社会影响力的评估时。 算法偏见与公平性: 警惕自动化评估工具可能存在的算法偏见,确保评估过程的公平公正。 主观性与客观性的平衡: 如何在量化指标的基础上,融入合理的定性评估,避免过度追求量化而忽略研究的实际价值。 全球化视角下的影响力评估: 如何克服语言、文化、经济发展水平等差异,进行具有国际可比性的学术影响力评估。 人工智能在影响力评估中的应用与反思: 探讨AI在数据分析、模式识别、预测性评估等方面的潜力,同时强调人类智慧和伦理判断的重要性。 第八章:学术影响力的伦理准则与实践 避免过度量化与“指标主义”: 强调学术影响力评估应以促进学术发展和知识创新为根本目的,而非服务于指标的攀比。 透明度与可解释性: 评估方法的选择和应用过程应尽可能透明,使被评估者能够理解评估依据。 公正与避免歧视: 确保评估过程不因研究者背景、研究领域、机构类型等因素而产生不公平对待。 负责任的研究行为: 鼓励研究者发表高质量、可信的研究成果,避免抄袭、伪造、数据篡改等学术不端行为,这些都是学术影响力的根基。 长远视角与可持续发展: 评估影响力不应只看短期效应,更要关注研究成果的长期价值和对未来发展的贡献。 结论:构建更健康、更包容的学术生态 重申学术影响力评价的最终目标是服务于知识的创造、传播与应用,促进人类社会的进步。 呼吁学术界、政策制定者、教育机构、出版商等各方携手合作,共同探索和完善学术影响力评价体系。 展望未来,一个更加多元、公平、有活力的学术评价体系将有助于激励更多的原创性研究,推动科学技术的持续繁荣,并最终惠及全人类。 本书的每一章节都将通过翔实的理论阐述、丰富的案例分析、以及对前沿研究的梳理,为读者呈现一幅关于学术影响力评价的完整图景。我们力求做到内容权威、论证严谨、逻辑清晰、语言生动,让本书成为所有关心学术发展和研究评价的读者的宝贵参考。