随着不断文学史研究的广度和深度,重写中国文学史

核心提示网络文艺始于数字,风行数字,可以说是数字让文艺在互联网世界中穿越飞扬、一路驰骋,创造出具有中国特色的文化类型。同样也是数字让网络文艺成为一种文化工业。由于数字的复制性强,也方便存储,使得网络文艺的数字化开一代之风——数字阅读。我们在看到数字

网络文艺始于数字,数字大行其道。可以说,数字让文学艺术在互联网世界里飞来飞去,一路疾驰,创造了中国特色的文化类型。也是数字化让网络文艺成为了文化产业。因为数字的可复制性强、存储方便,网络文艺的数字化开始了新一代——数字阅读。我们在看到数字化具有上一代无可比拟的优越性的同时,也容易忽略另一面——网络文艺的数据容易形成数字的叠加和交叉。特别是由于信息来源广泛,不同的管理单位无法统一管理数据,容易形成数据的“压力汇”。如果不重视网络文艺的数据管理,很容易导致“重数据”的丢失,造成不可挽回的损失。因此,重视网络文艺的“数据”管理,不仅体现了数字时代文艺研究的转型,也是尊重媒介文化特点和客观规律的科学和实证手段之一。

“数据”收集和存储的原则

在互联网上收集和保存文学艺术的“数据”,不仅可以获得第一手的原始数据,而且可以有效地防止冗余和复杂的数据被误导。因此,注意“数据”的保存尤为重要。“数据”保存应遵循以下原则:

—就是区分有限权利和无限权利。网络文艺数据除了各大平台内部系统外,还有外部公共空室。虽然平台内部系统受版权规范,但评论区有一些“子文”,大众评论散落在互联网的缝隙中。研究人员可以把这些零散的数据汇总起来,整理出来,用特殊的方式存储起来。并截图或复制相关IP地址以备后期查询校对。引用时必须标注相关IP地址作为参考或评论,否则会形成一定的侵权。

第二是能够识别数据。由于网民知识产权意识薄弱,评论区有很多抄袭或摘抄他人信息的评论。如果没有筛选,科研人员会直接引用,容易产生混淆,导致因误用信息而导致的非自愿侵权。很多抄袭、洗稿往往就是靠这种所谓的借鉴他人的手段进行的。所以这也是保护原创作者知识产权的重要保障。

三是排除碎片化信息的干扰。在相对自由空的互联网中,信息和知识的界限有时并不太细,大量信息以口水或碎片的形式存在。一方面,研究人员需要识别来源,同时形成信息渠道的可追溯性。最重要的是能够分辨出信息在什么语境下。其次,要能够比较相似的信息,独立思考,从而综合评价其价值。这样才能去伪存真,寻求有价值的文献资源。

第四,及时纠错,动态管理。互联网上的文艺“数据”由于来源众多,具有很强的可复制性。“数据”的真实性和原创性很难保证,因为同一个来源被不同层次的用户反复移动过。所以要及时和出处对比,和原作者核对。比如作者在研究网络历史小说时,认为《明》创作于网络上的2004年,而作者提供的确凿证据证明2004年是错误的,实际时间创作于2003年。所以互联网信息的误差真的很大,如果联系不上作者或者当事人,有些信息的准确性几乎无法保证,这是互联网信息的一个弊端。

第五,多方比较,扩大征集范围。因为网上的“数据”是复杂无序的,有时候只是一个帖子,连作者都无从得知。要充分利用互联网搜索引擎的作用,与传统出版物和其他数据库进行比对,确保信息的一致性和准确性,从而明确“数据”的真实性和来源渠道的合法性。

只有收集到的真实有效的数据才算是有价值的信息,应该开始对“数据”的真实性进行管理。保证数据的纯粹性,保护原作者的知识产权。

“数据”存储和使用方法

网络文艺研究中的“数据”起着重要的支撑作用。因为互联网作为一门实践科学,遵循的是科学实证主义的哲学原则。所以“数据”可以起到客观的印证作用。当然,有人会质疑“数据”的真实性。因此,“数据”的来源和保存尤为重要。

一种是通过截频来保留信息。由于互联网信息承载量大,大量信息的叠加增加了信息层次化的频率,信息的检索成本高;其次,互联网系统的不稳定会让“数据”丢失,每一次系统更新都可能让信息丢失。特别是对于人文社科的“数据”,很容易与一般信息混淆,其重要性可能得不到必要的重视。互联网“数据”再次受到外界的极大干扰。数据和一般信息在监管过程中受到相同的物理和技术环境,客观上会被“格式化”为一般信息。所以,有价值的“数据”一定要提前备份或者断频。

其次,定期收集和比较中国知网、万芳数据、超星、维普等数据库的内容,综合利用。这些知名的知识型数据库,一开始都是经过编辑筛选的,后来都被使用过,正在使用中。有具体下载,也考验市场使用频率。笔者在使用CNKI数据时发现,由于存在重名,且部分期刊报纸未录入CNKI系统,无法访问互联网知识系统进行检索。所以要扩大搜索半径,同时联合门户网站的搜索引擎,如,360,搜狗等进行综合对比和应用,确保数据的全面性和完整性。

第三,是同一渠道的数据库,检索需要年限。比如一份大报,如果搜索最近两年的报纸,网上也能看到,但是两年以上的内容就搜索不到了。因此,科研人员需要有意识地定期下载相关内容,个人要做好备份并及时保存。

第四是充分利用“数据”资源,因为利用本身就是保存。只有通过不断的使用,才能提高“数据”的曝光度,让“数据”参与体验世界的构建,在构建的过程中检验“数据”的有效性和准确性。同时也可以不断修正可能出现的错误,降低错误率,否则就会互相引用,从一个故事传到另一个故事。在使用过程中,尽量使用第一信息,万不得已使用“数据”二手信息,注明来源和出处,并提供准确的IP地址。当作者用“数据”来写一篇研究论文的初稿时,可以在网上收集相关信息。第二稿修改时,已经找不到第一稿IP地址的信息了。这时候只能忍痛放弃自己热爱的东西,删除初稿的相关内容。毫无疑问,这一过程实际上对互联网原始“数据”的真实性提出了挑战,互联网的原始历史遗址遭到了严重破坏。

网上的“数据”有很强的选择性,复制删除都很方便。这个特点带来了互联网“数据”的脆弱性和不安全性。互联网“数据”需要加强和“加密”。在充分利用数据库和搜索引擎的同时,可以辅以私密的数据收集手段。

 
友情链接
鄂ICP备19019357号-22