55小说网

手机浏览器扫描二维码访问

第424章 幻当程序员小白用自然语言编程时会怎样(第1页)

=数据卡尺=

如何用统计学的知识,来应用在数据上呢?

-第一步-

要弄明白统计学和数据之间的共性和非共性。

统计学:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而统计学本身就有意和无意的忽略了各个数值的先后排列。

数据:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而数据本身很注重各个数值的先后排列。

比如:ABRACADABRA

用统计学来表示,就是A出现了5次,B出现了2次,C出现了1次,D出现了1次,R出现了2次。

用数据来表示,就是ABRACADABRA。

那么如何把数据快速的解压缩出来呢?可以使用分段压缩方式,比如把一个大文件,分割成一个个片段,例如:

ABRACADABRATHEFOXJUMP.张三和李四一起去喝酒。

那么,就可以根据前面的数据,本身就是采用英文的方式,也就是最多是52进制(区分大小写),而后面的中文可就麻烦了,毕竟中文本身进制相当大,那么就需要进行大进制处理。

用统计学的方法,就是把数据平均分,然后分割成可以互相对齐的数据个体,然后统计这些数据个体各出现了多少次。

然后进行统计,把统计数据记录下去。

也就是说,把大英百科全书的纯文本内容用统计学的方式记录下来,就能对应到大小写英文字母+符号+空格+换行+换页……

那么就能够统计出各英文字母出现过多少次,这导致的就是数据能够很好把所有元素给还原出来,只是这些元素之间的排列组合,就随着数据长度的变大而趋向更高运算量。

最简单的方法,就是用三种统计方法:

如字母矩阵:

ACAEFHIOPQRTTYT

ASDKFJASLKFDJLA

SKJFDASDFSADFAS

DFASFASDFASFDAS

FDJHLKJHLKJHLKJH

凤临天下之毒女仁医  穿书后我又成了人间富贵花  怪物收集册  副本里的二三事  人在漫威,开局激活六福星!  大秦扶苏  快穿攻略黑化男主收集计划  都市无双战神  叶锋苏凝霜  大明之锦衣为王  最强金田一  太初符神  桃源乡村  吃货萌妻有毒  重生之神级投资林风沈萌萌  超能萌宝:腹黑爹地不要碰我妈咪  丹魂剑魄  龙游天下叶锋小说免费  女总裁的超级神婿  养鬼为祸(劫天运)  

热门小说推荐
宅在韩国的农夫

宅在韩国的农夫

狗血的重生了,你说我一个药剂师居然学的是农垦专业!什么,有金手指,还是神农空间!老天啊,你是要我把农民这个行业进行到底啊!...

念念不忘

念念不忘

被男友跟继母弄晕,打算贩卖,却无意间听到他们打算吞掉公司的财产,她奋力逃出去,被赫赫有名的景行止救了,他帮了她,却也提出条件让她做他的妻子继母跟男友继续陷害,她不得答应了做他的妻子,却不料在他的温柔里越陷越深直到他的正牌女友归来,她才发现,那不过是一场预谋一场自作多情,景行止,早知如此,何必让我爱上你?...

神厨宝妈种田忙

神厨宝妈种田忙

一朝穿越,借尸还魂,开局就是糟心的一家,还有一个没爹的娃。所幸林锦绣有主角光环,系统加身,人生开挂,狂赚小钱钱。来恶人,打!有弱小,帮!诶,这位大兄弟,怎么长的如此像我放大版的儿子,等等,留下姓名来。暴富带大家过好日子给儿子找个爹,齐活咯!...

寒门赘婿

寒门赘婿

某总裁为女儿钦定了婚事,然后出乎意外的事情发生了,出身寒门的女婿忍受不了豪门婚姻的痛苦当他露出他的真实身份时,总裁一家震惊了...

首席娇妻:翻滚吧前夫

首席娇妻:翻滚吧前夫

我从未想过有一天席慕深会带着怀孕的方彤,逼我离婚,我惨败在方彤张狂的笑声中,从此,我走上了复仇之路...

每日热搜小说推荐