人文社会科学文献网络知识模型与应用

更多详情

内容简介:
本书重点关注用于发现有价值的跨界知识的数据、模型、估计和评价等统计学习方法及其应用。全书由7章构成,第1章是导论,第2章是跨界知识模型的基本概念,第3~5章是基础计算模型,第6章和第7章是跨界知识模型的应用。
本书可作为档案管理、图书馆学、情报学、统计学、复杂系统、数据挖掘等专业高年级本科生及研究生研讨课的讨论参考书,也可作为科研管理、高等教育研究的方法参考书。




目录:

第1章导论

1.1知识模型理论的演进

1.2人文社会科学评价理论回顾

1.3国内人文社会科学研究成果评价的主要观点

参考文献

第2章跨界知识模型和估计过程

2.1跨学科研究进展

2.2跨界知识模型的含义

2.3人文社会科学跨界知识模型的估计过程

2.4跨界知识模型的框架和数据

参考文献

第3章社会网络分析

3.1社会网络的概念与发展

3.2社会网络的基本特征

3.3网络抽样

3.4社群挖掘算法

3.5社群网络模型的评价

参考文献

第4章重叠社群提取算法

4.1重叠社群概述

4.2无背景信息社群提取算法

4.3带背景信息社群挖掘算法

4.4带背景信息的重叠社群提取OCE算法

4.5OCE算法的性质

4.6几种社群挖掘算法的比较

参考文献

第5章自然语言模型

5.1向量空间模型概述

5.2统计语言模型

5.3LDA模型

5.4LDA模型在语言腐败识别中的应用

5.5基于网络调整的主题模型(NetPLSA)

5.6中文分词方法和分词工具

参考文献

第6章学术热点发现的理论与实践

6.1学术热点概念的变迁

6.2基于学者选读文献的学术热点定义和数据基础

6.3随机区块模型和计算

6.4实证研究

6.5本章小结

参考文献

第7章人文社会科学学术跨界影响力模型

7.1文献的跨界影响关系估计数据

7.2无重叠社群的实证研究

7.3重叠社群的跨机构合作主题模型研究

7.4总结与未来研究展望

参考文献

索引

后记

前言:
谈到科学文献,大多数学者往往把评价的视角集中于它的被引次数、作者实力、发表期刊、半衰期等数量指标上。论及人文社会科学文献,又将着眼点放在思辨性、规范性、科学性和创新性等类级指标上,所有的聚焦点都集中在作品的外在“特征”方面,并认为这些方面的综合体就是人文社会科学作品的精髓所在。而从文献作为知识载体对知识的传播与交流作用来看,不仅仅是引起同行的注意就够了。
随着知识大爆炸网络时代的出现,一方面,学术成果生机繁荣,影响深度和广度不断扩展,形成了一个素材丰富、信息量巨大的跨界学术生态圈; 另一方面,借助学术文献对知识的撷取、加工、转移、传播等活动频繁,蕴藏在这纷繁的大数据轨迹之中的宝贵的交叉学术观点和新鲜的学术气息成为新思想、新理论以及跨界合作的新证据。于是,人们对文献和文献的选择要求越来越高,不再满足于仅仅靠阅读经典来收获选题思路,也不满足于跻身于某学术流派下做细枝末节的注记,甚至对于科技小品也能有想法。从大量文献中建立用于连接不同领域的稳定的知识跨界桥梁已成为一个重要课题。
尤其是在人文社会科学领域,本土语料体系被国际化、形式化、碎片化,本土的人文社会科学正面临着被肢解的困境,一方面学术成果不得不受制于禀赋之外量化评价的驱赶,另一方面是现代科学高度分化形成坚固的学科壁垒、部门壁垒、学派壁垒和地域壁垒,跨领域的研究在众多庞杂而又迅速更新的学术资源面前,常常显得无所适从,甚至有的学科发展封闭被迫依附于学术之外以求生存所导致传统特色萎缩而引发对其科学独立性的质疑,这更加大了这些学科知识被忽略甚至被丢弃的可能性。
人文社会科学根植于生活世界,对人的思维世界和生命更新起着滋养的作用,尤其是在“人、机、物”共生的大数据时代,许多知识的价值密度被掩埋,需要用新的工具和新的表现形式打通交流的阻隔,帮助学者在跨领域的学习和研究中更有效地找到和更便捷地获取所需要的信息资源。网络知识模型是一类用于理解跨界知识转移及变化规律的工具,其主要作用在于发掘学科之间的关联支撑结构,发现中西方学术传统沟通与圆融的肌理,寻求自然科学与社会科学融通的主题空间,重构人文知识的生长土壤。人文社会科学的网络知识模型既是情报学、统计学、计算机科学、管理学交叉领域的学术前沿,也是知识发现和大数据分析的热点问题,更是科学认识人文社会科学作品评价体系中不可或缺的重要组成部分。
本书重点关注用于发现有价值的跨界知识的数据、模型、估计和评价等统计学习方法及其应用。全书由7章构成: 第1章是导论部分,主要对文献计量经典理论和观点进行梳理; 第2章是跨界知识的基本概念; 第3~5章是基础计算模型,重点关注社会网络模型和自然语言模型; 第6章和第7章是跨界知识模型的综合应用,内容包括学术热点发现的理论与实践、人文社会科学学术跨界影响力模型。这些模型强调读者对文献的需求视角,试图通过学术文献的内容结构实现跨界知识模型的估计过程,重视模型对智能搜索和知识图结构信息的解读能力。
这是一个全新的视角,所列实践活动刚刚起步,希望得到更广泛的关注和评论,为发展出适用于人文学科学术成果影响广度的评价工具奠定理论基础; 这些模型所产生的用于提取人文学科科学探索中的跨界规律、合作规律和协同规律等经验数据可为科研管理、学科建设和学术评审提供决策参考; 这些研究也可视作统计学习对文献类型数据内容探索分析的新尝试,其结果就是今天的学术网络资源日益产生新价值、呈现新气息、成为创新的素源,为不同领域学者的研究提供更大和更有效的跨界知识思维导图。
非常感谢中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目《人文社会科学学术成果评价指标体系》(项目编号: 10XNI014)和2013—2015年同类项目《人文学科跨界关系网络跟踪评价研究》(项目编号: 13XNI011)的经费支持; 感谢中国人民大学“985工程”的支持; 感谢清华大学出版社的大力支持; 感谢中国人民大学袁卫教授的鼓励和宝贵帮助; 感谢有幸参与国务院学位办组织的《统计学一级学科简介》和《统计学博士、硕士学位基本要求》两份文件的编写工作,使我获得宝贵机会向新的一级学科代表学习学科发展问题,增强了对跨学科要义和学术责任的深刻理解。5年来,许多同学曾阶段性地参与到这项跨学科的研究过程中,他们中间有: 李荣明、龚君泰、张波、杨晓芳、陈文、颜娅婷、王晓航、赵碧君、马璇、郑轶、刘圣、李沐雨、贺诗源、张慧和王爱玲等; 中国人民大学图书馆的郑惠玲、张云和孟坛魁同事协助获取有价值的实验数据; 感谢中国人民大学应用统计科学研究中心、统计学院、合作单位研究生院和网络中心的支持,感谢刘大椿教授和北京师范大学管理学院系统科学系的樊瑛教授参与讨论并提出诸多宝贵意见,正是他们的激情参与赋予了我们坚定的信念,使我们终于在文献和文献内容之间觅到一个恰当的视角——网络知识模型,并通过这台可调节的显微镜去探寻人类文明的跨界研究规律。

王星
中国人民大学应用统计科学研究中心
&中国人民大学统计学院
2014年5月