随着不断文学史研究的广度和深度,重写中国文学史

2022-08-04 10:19 来源：读者提供作者：网友发布浏览：0

核心提示网络文艺始于数字，风行数字，可以说是数字让文艺在互联网世界中穿越飞扬、一路驰骋，创造出具有中国特色的文化类型。同样也是数字让网络文艺成为一种文化工业。由于数字的复制性强，也方便存储，使得网络文艺的数字化开一代之风——数字阅读。我们在看到数字

网络文艺始于数字，数字大行其道。可以说，数字让文学艺术在互联网世界里飞来飞去，一路疾驰，创造了中国特色的文化类型。也是数字化让网络文艺成为了文化产业。因为数字的可复制性强、存储方便，网络文艺的数字化开始了新一代——数字阅读。我们在看到数字化具有上一代无可比拟的优越性的同时，也容易忽略另一面——网络文艺的数据容易形成数字的叠加和交叉。特别是由于信息来源广泛，不同的管理单位无法统一管理数据，容易形成数据的“压力汇”。如果不重视网络文艺的数据管理，很容易导致“重数据”的丢失，造成不可挽回的损失。因此，重视网络文艺的“数据”管理，不仅体现了数字时代文艺研究的转型，也是尊重媒介文化特点和客观规律的科学和实证手段之一。

“数据”收集和存储的原则

在互联网上收集和保存文学艺术的“数据”，不仅可以获得第一手的原始数据，而且可以有效地防止冗余和复杂的数据被误导。因此，注意“数据”的保存尤为重要。“数据”保存应遵循以下原则:

—就是区分有限权利和无限权利。网络文艺数据除了各大平台内部系统外，还有外部公共空室。虽然平台内部系统受版权规范，但评论区有一些“子文”，大众评论散落在互联网的缝隙中。研究人员可以把这些零散的数据汇总起来，整理出来，用特殊的方式存储起来。并截图或复制相关IP地址以备后期查询校对。引用时必须标注相关IP地址作为参考或评论，否则会形成一定的侵权。

第二是能够识别数据。由于网民知识产权意识薄弱，评论区有很多抄袭或摘抄他人信息的评论。如果没有筛选，科研人员会直接引用，容易产生混淆，导致因误用信息而导致的非自愿侵权。很多抄袭、洗稿往往就是靠这种所谓的借鉴他人的手段进行的。所以这也是保护原创作者知识产权的重要保障。

三是排除碎片化信息的干扰。在相对自由空的互联网中，信息和知识的界限有时并不太细，大量信息以口水或碎片的形式存在。一方面，研究人员需要识别来源，同时形成信息渠道的可追溯性。最重要的是能够分辨出信息在什么语境下。其次，要能够比较相似的信息，独立思考，从而综合评价其价值。这样才能去伪存真，寻求有价值的文献资源。

第四，及时纠错，动态管理。互联网上的文艺“数据”由于来源众多，具有很强的可复制性。“数据”的真实性和原创性很难保证，因为同一个来源被不同层次的用户反复移动过。所以要及时和出处对比，和原作者核对。比如作者在研究网络历史小说时，认为《明》创作于网络上的2004年，而作者提供的确凿证据证明2004年是错误的，实际时间创作于2003年。所以互联网信息的误差真的很大，如果联系不上作者或者当事人，有些信息的准确性几乎无法保证，这是互联网信息的一个弊端。

第五，多方比较，扩大征集范围。因为网上的“数据”是复杂无序的，有时候只是一个帖子，连作者都无从得知。要充分利用互联网搜索引擎的作用，与传统出版物和其他数据库进行比对，确保信息的一致性和准确性，从而明确“数据”的真实性和来源渠道的合法性。

只有收集到的真实有效的数据才算是有价值的信息，应该开始对“数据”的真实性进行管理。保证数据的纯粹性，保护原作者的知识产权。

“数据”存储和使用方法

网络文艺研究中的“数据”起着重要的支撑作用。因为互联网作为一门实践科学，遵循的是科学实证主义的哲学原则。所以“数据”可以起到客观的印证作用。当然，有人会质疑“数据”的真实性。因此，“数据”的来源和保存尤为重要。

一种是通过截频来保留信息。由于互联网信息承载量大，大量信息的叠加增加了信息层次化的频率，信息的检索成本高；其次，互联网系统的不稳定会让“数据”丢失，每一次系统更新都可能让信息丢失。特别是对于人文社科的“数据”，很容易与一般信息混淆，其重要性可能得不到必要的重视。互联网“数据”再次受到外界的极大干扰。数据和一般信息在监管过程中受到相同的物理和技术环境，客观上会被“格式化”为一般信息。所以，有价值的“数据”一定要提前备份或者断频。

其次，定期收集和比较中国知网、万芳数据、超星、维普等数据库的内容，综合利用。这些知名的知识型数据库，一开始都是经过编辑筛选的，后来都被使用过，正在使用中。有具体下载，也考验市场使用频率。笔者在使用CNKI数据时发现，由于存在重名，且部分期刊报纸未录入CNKI系统，无法访问互联网知识系统进行检索。所以要扩大搜索半径，同时联合门户网站的搜索引擎，如，360，搜狗等进行综合对比和应用，确保数据的全面性和完整性。

第三，是同一渠道的数据库，检索需要年限。比如一份大报，如果搜索最近两年的报纸，网上也能看到，但是两年以上的内容就搜索不到了。因此，科研人员需要有意识地定期下载相关内容，个人要做好备份并及时保存。

第四是充分利用“数据”资源，因为利用本身就是保存。只有通过不断的使用，才能提高“数据”的曝光度，让“数据”参与体验世界的构建，在构建的过程中检验“数据”的有效性和准确性。同时也可以不断修正可能出现的错误，降低错误率，否则就会互相引用，从一个故事传到另一个故事。在使用过程中，尽量使用第一信息，万不得已使用“数据”二手信息，注明来源和出处，并提供准确的IP地址。当作者用“数据”来写一篇研究论文的初稿时，可以在网上收集相关信息。第二稿修改时，已经找不到第一稿IP地址的信息了。这时候只能忍痛放弃自己热爱的东西，删除初稿的相关内容。毫无疑问，这一过程实际上对互联网原始“数据”的真实性提出了挑战，互联网的原始历史遗址遭到了严重破坏。

网上的“数据”有很强的选择性，复制删除都很方便。这个特点带来了互联网“数据”的脆弱性和不安全性。互联网“数据”需要加强和“加密”。在充分利用数据库和搜索引擎的同时，可以辅以私密的数据收集手段。