手机浏览器扫描二维码访问
视频内容继续:
【接下来的一段时间里,我将分若干集,从各个角度出发,来论证《红楼梦》后四十回并不是曹雪芹手笔。
而本集视频,我们先从文本特征差异研究开始。我将运用统计学方法,并结合R语言技术,对我的观点进行阐述!】
弹幕上,网友们又蒙圈了。
“R语言技术?统计学?跟《红楼梦》有什么关系?”
“什么是R语言?”
“这不是文学方面的事情么?怎么涉及到数学和计算机技术了呢?”
“对啊,文学就是文学,怎么能和其他学科混为一谈呢,一看就不靠谱!”
“继续围观,看这个诗人能扯出什么花样来。”
……
【在大量事件的前提下,无论是在语言表述,还是在写作中,每个人在特定情况下用字或是用词都存在着某种规律。
这种规律便是个人在说话与写作中所形成的语言表达习惯,即是个人在其特定习惯中所形成特有的文体特征。
所以,不同的作者在用词频率与用词风格上存在一定的差异性。
我将运用R语言对《红楼梦》著作进行文本分词和词频统计,从高频词汇和虚字两个研究角度,来分析《红楼梦》前八十回与后四十回在文本特征上的差异性。
首先,我们率先研究高频词汇。
在《红楼梦》的高频词汇中,我首先将人名、地名、称谓等剔除掉,以及对“一个”“一面”等表数量的没有实际意义的词汇进行剔除。
于是,我们得到了65个高频词汇进行文本研究,现制作统计表格。
如下图!】
短视频中,贴出一张统计表。
【高频词汇研究对象表】
【1,什么;2,我们;3,那里;4,姑娘;5,你们……63,家里;64这话;65到底。】
短视频解读继续:
【……我的研究分组方案如下,一至三十回第一组,十六至四十五回第二组,三十一至六十回第三组……,以此类推,一共将《红楼梦》分成7组。
运用R语言,对各组进行分词,对高频词汇研究对象进行词频统计。绘制高频词汇频数变化折线图。
如下图所示!】
话音落,短视频里,贴出了运用R语言绘制出的高频词汇频数变化折线图——一个带有X、Y坐标的七条折线的统计表。
而此时,网友们全看傻了。
“懵逼了,这些都啥意思啊?”
“这能代表啥啊,根本看不懂啊!”
“诗人你到底啥意思,请你明说行么?”
“我感觉看了你的视频,受到了侮辱!”
“你高估我们了!”
……
短视频开始对这一折线图进行讲解:
【我们可以发现折线图有明显的锯齿形,那么就表明高频词汇在各分组有明显的波动……诸如16(没有)、21(听见)、26(回来)、34(心里)、51(那些)、65(到底)等词汇,当第六组和第七组出现波峰的时候,其他组却出现了波谷;
而在42(不过)、61(姊妹)等词汇,当第六组和第七组出现波谷的时候,其他组却出现了波峰;这就说明第六组和第七组的折线图与其他组的折线图有明显的相反的走势……】
弹幕疯狂抗议:
“求你了别说了,听不懂啊,能直接告诉我结论么?”
“你让数学常年不及格的我,如何理解你的高深莫测?”
“直接说结论吧,真听不懂!”
走出动物世界 楚医生的作精娇妻是玄门大佬 天价片酬,我反手捧红路人 我有一卷降妖谱 重生港综:抓诡日记 星际大盗:她又A又飒 最狠氪金主播 快穿之宿主她又软又茶 薪火游戏 穿梭万界:从要听神明的话开始 系统让我当大明星之乘风破浪 三国之暴君典韦 二次元里的魔道修士 大秦:开局奉命侍绝美太后 我,神话鲲鹏,转世成女帝伴生兽 我在末世卖肠粉 开局黑科技神豪,打造最强人族 万劫人皇 啃老失败,从主持人开始出道 天下第一暴君
2012年为什么平安无事?2012年冬至日冬至时出生的人为何被人称为神?2012年后的政府为什么要向大企业额外征收能源税以及星际探索税?当人们津津乐道着地界末日时,或恐慌,或兴奋,却不知天人开始五衰,诸天开始崩塌!一条条通往地界通道打通,大能纷降,人类历史上从未有像2012后时代那么精彩!一切都由一乡村小子发誓到海州,赚百亿,娶娇娘而拉开序幕!最贴近当下的后2012时代!最恢弘瑰丽的天地!最小强最奇遇的升级!最浪漫的都市爱情!最玄幻最悲壮的天地大灾!一切尽在天地杀!...
母亲重病,巨额医药费将张超逼上了绝路。因为善心救人,却得到了一双鉴宝神眼。从此以后,纯净清透的帝王绿翡翠,富贵逼人的极品玛瑙,温润洁白的和田玉,古拙厚重的青铜器,精美绝伦的青花瓷,云缭烟绕的山水画一个珠光宝气的世界向他敞开大门,鉴宝捡漏,赌石改命,张超的人生步步青云,直上云霄!...
被丈夫折磨了三十年的柳瑶珍死后重生了。回到了和渣男结婚的当天,她一脚把渣男踹下炕。她要离婚,要把上辈子所有的遗憾都弥补回来。蓉蓉的第七本书炮灰攻略上马了,大家关注啊!...
他是万里海疆上的战神,回归都市,只为给她们一个家!...
为了逃脱寡妇周丽的算计,受尽欺辱的乡村穷小子王昊,机缘巧合逆袭成了一个医术超群的神医,他救死扶伤,带领村民勤劳致富,引得校花找上门...
家族破灭他受尽羞辱消失无踪三年后,带着一纸婚约,重回都市。曾经欺我辱我的人,你们的末日到了!...