计算社会科学:发展现状与前景展望

核心提示随着人类社会的进步和科技的发展,科学研究的方法也在不断演进,从早期以亚里士多德的天动学说为代表的自然哲学研究手法,逐步演变到以牛顿为代表的对自然哲学的数学原理的探索,进一步发展到如今基于数值计算和模拟仿真的计算科学时代。而进入21世纪,人工

随着人类社会的进步和科技的发展,科学研究的方法也在不断发展,从早期以亚里士多德的天体运行论为代表的自然哲学的研究方法,到以牛顿为代表的自然哲学的数学原理的探索,进一步发展到现在以数值计算和模拟为基础的计算科学时代。21世纪,人工智能技术的发展拉开了数据密集型科学发展的序幕,被称为第四代科学。

《中国人工智能发展报告2018》已经显示,中国是目前人工智能论文和人工智能专利产出最多的国家。这部分是由于当今人工智能算法的进化,这些算法很大程度上基于大数据,而中国庞大的人口是世界上最好的天然大数据试验场。可以预见,人工智能中的大数据和大数据技术在社会科学研究领域的应用将会越来越普遍,成为社会科学研究领域的重要趋势。也将成为推动新时代中国特色哲学社会科学发展的重要动能。

核心观点

人工智能在社会科学中的应用研究现状如何?

人工智能在社会科学领域的应用还处于比较基础的阶段。

在社会科学领域,中国在人工智能的应用上与发达国家还有一定差距。截至2018年,中国社会科学领域人工智能相关文献数量不到美国的四分之一。

人工智能和社会科学研究范式的多样性是如何体现的?

社会科学的研究范式:1。定性分析;2.定量分析;3.计算实验的模拟研究;4.基于人工智能的数据密集型研究。

未来社会科学研究的范式必然向多元化发展;

1.在提出研究问题方面,大数据的研究范式可以驱动研究者提出新的研究问题和关注点;

2.无论是数据采集、整合、分析,人工智能的应用都会大大提高效率。大数据分析可以让研究者更顺畅地观察和捕捉研究对象之间的逻辑关系;

3.充分利用人工智能的先进算法,可以大大降低理论建模的假设,大大提高模型的复杂程度,使仿真程度更高更好;

4.人工智能带来的多维度大数据,一般可以解决变量缺失的问题,降低样本选择性偏差的概率。

未来可计算社会科学的研究将如何发展?

大数据技术:大数据有四个主要特点,即数据量大、生成速度快、类型多样、价值密度低。大数据的应用和传统的数据处理方式将会发生巨大的变化。

计算+数据校准分析算法和数据辅助:人工智能的算法可以大大提高社科研究的分析效率。研究者在构建理论模型时,不需要因传统的计算能力问题而对模型做各种假设,使得模型更好地模拟现实世界。

微观分析与宏观分析相结合:人工智能带来的大数据,从更微观的层面使社会科学研究成为必然。同时,人工智能还可以带来新的计算机算法,可以让社会科学的宏观分析和微观分析更加统一。

可计算社会科学的研究将面临怎样的挑战?

可计算社会科学研究中的误区:1。过于注重相关性,忽视研究对象之间的因果关系;2.陷入“统计学废话”现象;3.过度依赖算法导致偏差扩大。

社会科学研究者运用人工智能进行深入研究的必备能力:随着人工智能对社会科学研究的逐步渗透,社会科学研究者除了社会科学领域的传统学科训练外,还需要具备一定的数据工程师、软件工程师的能力。

随着人类社会的进步和科技的发展,科学研究的方法也在不断发展,从早期以亚里士多德的天体运行论为代表的自然哲学的研究方法,到以牛顿为代表的自然哲学的数学原理的探索,进一步发展到现在以数值计算和模拟为基础的计算科学时代。

传统的科学研究方法主要是基于研究者通过观察和实验提出的假设,然后通过反复试错验证来实现理论探索,也就是先提出理论再验证理论的过程。而人工智能背景下的研究特点,则体现在利用相对有限的小规模观测数据,然后通过不同的场景和模拟技术获取更多的数据——也就是深度学习,最终完成新理论的发现。可以称之为仿真驱动的科学研究,是从数据中发现规律的过程。

01

人工智能在社会科学中的研究现状

与自然科学相比,人工智能在社会科学中的应用还处于比较基础的阶段。根据美国科学信息研究所编制的Web of Science引文数据库,罗辰和沈浩选取了以人工智能为主题的社会科学领域的公开发表的论文和会议论文,发现涉及人工智能的社会科学研究最早可以追溯到1975年。但前10年,人工智能相关的社会科学论文数量每年都在个位数徘徊。直到最近10年,这个数字迅速增加,每年都有100多篇相关论文,其中2017年和2018年分别超过200篇。

虽然中国在工程和自然科学领域的人工智能研究领先于世界其他国家,但在社会科学领域的人工智能应用方面,中国与发达国家仍有一定差距。截至2018年,中国社会科学领域人工智能相关文献数量不到美国的四分之一。社会科学是研究人类社会各种现象的全部或任何一门学科,包括商业与经济学、政治学、法学、伦理学、历史学、社会学、心理学、教育与教育研究、运筹学、管理学等。人工智能涉及社会不同子科学的研究深度和广度是不一样的。

截至2018年,我国人工智能在社会科学中的应用多在商科和经济方向,相关论文515篇;说到人工智能的应用广度,即一个社会科学子学科与人工智能研究领域其他学科的相关性,心理学的程度中心性最高。其他涉及人工智能的社会科学分支学科分别是运筹学与管理学、教育与教育研究、其他社会科学分支学科。表1显示了使用人工智能最多的五个社会科学子学科,以及它们对应的广度指标。从表1可以看出,人工智能在社会科学领域涉及的这些子学科,也是近年来数量化趋势明显的社会科学子学科。人工智能的跨学科特征在社会科学研究中非常明显,毫无疑问,未来将是文理融合的时代。

02

人工智能与社会科学研究范式的多样化

前言中提到,人工智能在社会科学研究中的引入,使得社会科学的研究方法更加多元化。根据米卡宁的研究,社会科学的研究范式可以分为四种类型。

首先是定性分析,即通过类比和推理来概括研究对象之间的关系,而现代社会科学的定性分析是通过理论建模来解释研究对象之间复杂的逻辑关系,这与自然哲学的研究方法相对应。

二是定量分析,通过“假设检验”,利用人工收集的数据,论证研究对象之间的关系。社会科学中因果关系的确认是研究者非常关心的问题。然而,长期以来,由于数据的有限性和社会科学研究对象成分的复杂性,社会科学研究中的大量定量分析往往存在样本选取导致的偏差问题,这与探索数学原理的方法相对应。

三是计算实验的模拟研究,最具代表性的是经济学领域使用的可计算一般均衡分析。在通过复杂的数学推导进行定性分析的基础上,利用有限的真实数据对模型进行标定。当复杂模型被证明在一定程度上有效时,是通过模拟现实中不存在的模拟数据,对研究对象进行反事实分析而完成的。近10年来,计算实验的模拟研究方法越来越受到社会科学研究领域有影响力的专业学术期刊的关注。原因是这些研究方法能更好地克服定性分析和定量分析的局限性。

第四,基于人工智能的数据密集型研究。现在几乎所有的大数据研究,从数据采集、建模到分析预测,都可以用计算机来完成。其在数据上的优势毋庸置疑,研究的效率也远胜于其他研究方法。但是,这种研究方法的重点应该锁定在理论建模和分析上。如果忽视甚至放弃理论建模,可能无法准确判断研究对象与其他复杂逻辑之间的因果关系,研究结果也难以给出合理解释。所以必须反复强调,一旦大数据的样本有偏差,或者算法有偏差,研究结果也会有很大的误差。

人工智能的发展给社会科学的研究带来了难以想象的大数据、新算法和超强计算能力,所以未来社会科学研究的范式必然会向多元化发展。

首先,在提出研究问题方面,大数据的研究范式可以驱动研究者提出新的研究问题和关注点。到目前为止,人工智能提供的大数据大多是被动收集的,受研究热点或传统研究方向的影响较小。因此,这些大数据可以在深度和广度上启发研究者新的研究问题,可以帮助研究者跳出基于文献综述的传统框架,扩展重要学科问题研究的空空间。

其次,无论是数据采集、整合、分析,人工智能的应用都会大大提高效率。大数据分析可以让研究人员更顺畅地观察和捕捉研究对象之间的逻辑关系。

再次,由于“因果关系是人类理性行为和活动的基本基础,人类理性本身不能否认因果关系”。社会科学中传统的理论建模定性分析可以得出研究对象之间的理论因果关系。在此基础上,如果能够充分利用人工智能的先进算法,毫无疑问可以大大降低理论建模的假设条件,大大提高模型的复杂度,模拟的程度也会越来越高,越来越好。

最后,根据理论模型的定性分析,研究人员可以利用人工智能进一步收集和整合大数据,从而实现理论研究结果的准实验定量分析。在社会科学领域的实证分析中,变量的内生性问题、缺失变量和样本选择性偏差是困扰研究者做出准确因果判断的关键原因。人工智能带来的多维度大数据,一般可以解决变量缺失的问题,降低样本选择性偏差的概率。同时,如果采用大数据收集和挖掘前的准实验设计来解决变量的内生性问题,社会科学中定量研究的解释力会更强。

如前所述,研究范式多元化的目标和趋势是既要克服传统研究范式的数据劣势,又要克服完全交给数据科学的大数据研究范式的理论解释不足。

03

计算社会科学的研究进展

人工智能的应用对社会科学的研究技术和方法产生了巨大的影响,促进了被称为可计算社会科学的研究领域的发展。主要体现在大数据技术的突破,数据瓶颈的突破,分析效率的提升,实现微观支撑宏观研究。

大数据技术。大数据的应用和传统的数据处理方式将会发生巨大的变化。

首先是数据的实时可用性。传统的数据通常是手工收集的,是为了社会科学研究中某种“假设检验”的目的而收集的,通常具有严重的滞后性。

第二是数据量巨大。一方面,海量数据带来的多维数据不仅为研究者提供了更多的信息,也使研究者对数据整合和分析的统计工具的使用发生了质的变化。

第三是数据的结构多样性。传统的数据结构一般要么是数值,要么是文本,而大数据的数据源更加多样,可能是传统的数值,也可能是文本、图片、音频甚至视频。

第四,数据挖掘、存储和分析技术的更新速度将大大提高。随着数据规模越来越大,数据库、并行计算、云计算、机器学习等技术都将成为社会科学研究的中间步骤。

模型+数据校准分析的算法和数据辅助。人工智能的算法可以大大提高社会科学研究的分析效率。研究者在构建理论模型时,不需要由于传统的计算能力而受到各种假设的限制,使得模型更好地模拟现实世界。

微观分析与宏观分析相结合。人工智能给社会科学研究带来大数据,从更微观的层面让社会科学研究成为必然。同时,人工智能还可以带来新的计算机算法,可以使宏观复杂化和微观研究成果的总和化,使社会科学的宏观分析和微观分析有更好的统一性。这样,不仅可以实现对微观个体行为的深入研究,还可以突破每个微观个体的网络结构,从而进一步得到每个微观个体对不同宏观因素的作用。

04

计算社会科学研究所面临的挑战

虽然人工智能技术的应用拉开了可计算社会科学研究和发展的序幕,但要真正创造出实用的研究成果,一些基础条件仍需完善。

可计算社会科学研究中的误区。第一个错误是过于注重相关性,忽略了研究对象之间的因果关系。第二个错误是陷入“统计学废话”现象。第三个错误是过度依赖算法,导致偏差扩大。目前的人工智能算法只能处理一个特定的任务,也就是狭义的人工智能。由于狭义的人工智能算法是针对特定目标实施的,其算法在有偏的基础数据样本上会带来较大的偏差。

需要强调的是,在社会科学研究过程中,人工智能可能会导致样本和算法有偏差的两种误解,会产生相互叠加的放大效应。至少,我们的研究结果可信度降低,最坏的情况,我们的研究结果可能是伪命题。与理论的定性分析和传统数据的定量分析相比,涉及人工智能的社会科学研究的研究方法更加复杂,增加了其他研究者区分研究结果的难度。

社会科学研究者利用人工智能进行深入研究的能力。随着人工智能对社会科学研究的逐步渗透,社会科学研究者除了社会科学领域的传统学科训练外,还需要具备一定的数据工程师和软件工程师的能力。同时,社会科学研究者也需要了解现在社会科学领域的因果分析方法和大数据的相关性分析方法的优缺点,在研究不同问题时选择合适的研究方法。

政策建议。新技术的应用将进一步推动可计算社会科学研究的发展。总的来说,大数据的相关性分析方法更适合规范研究,提高预测的准确性,为政府和企业提供政策建议和支持;大数据辅助的因果分析是实证研究的未来发展方向。人工智能在真正进入计算机算法的自我迭代更新和进步之前,仍然是高科技的劳动密集型。然而,随着进一步发展和文理融合时代的到来,社会科学研究者、数据工程师和软件工程师之间的跨学科合作也是社会科学研究的必然趋势。这门跨学科的基础学科,无疑就是统计学和数据处理相关的计算机语言。日本等一些发达国家从小学就开始普及统计学的教育,在本科文科专业开设了“数据科学”的专业课,同时大力推进计算社会科学相关的开发软件的学习,如R语言、java语言、人工智能核心语言Python等。我们可以借鉴其做法,尽快开设相关的跨学科课程,提供网络使用相关知识的普及等公共产品,为第四科学时代的到来打好基础,做好准备。

来源:学术前沿2019年10月《中国计算社会科学研究现状与未来》

作者:袁堂军,复旦大学经济学院教授

原编辑:赵新阳

新媒体编辑:尹泽轩

愿景:刘洁

 
友情链接
鄂ICP备19019357号-22