手机浏览器扫描二维码访问
“教授,你不是做语言翻译的,语言是规则的游戏,概率这太不靠谱了。”
保罗·加尔文还想再挣扎一下。
当然他确实也不信翻译和统计学能扯上什么关系。
词语之间一一对应。
英文单词和俄语单词一一对应,直接直译,扩充语料库。
在当时的思维里,这才是正道。
也就是所谓穷举法。
把所有的词语做好一一对应之后,自动翻译也就实现了。
统计学,概率游戏,不谈如果林燃是对的,他们的无能会暴露无遗,光是林燃提到的改进原理从直觉上来说就是错误的。
简单来说,反直觉。
就像在GPT大模型出来之前,大家都觉得算法最重要。
GPT出来之后,大家开始都一窝蜂力大飞砖。
等到deepseek的时候,好像算法有点用。
哪怕是顶级的研究人员,也会有盲从的问题,会有迷茫、找不到方向、走不出来的情况。
在这个计算机的混沌年代,会这样再正常不过了。
“精确?精确意味着出错,现在的计算机远远达不到精确这一点。
你们难道不清楚,你们在54年之所以演示出了良好的效果,是因为那些俄语句子是你们精挑细选出来的。
实际自然语言的复杂性要远超你们预期。
你们只做了语料库的扩展,规则覆盖都没有做,上下文依赖处理也没有。
你们能比我更懂机器翻译?”
林燃怒吼道:“你们做了九年都没有进展,现在立刻马上按照我说的去做!”
林燃的地位、实力和权力摆在这,他们根本没有拒绝的选择。
沃森会信林燃就不说了,毕竟深蓝项目才结束,国防部的麦克纳马拉那更是林燃说什么就是什么。
你们这帮搞计算机的能比数学大师更懂计算机?
林燃在博弈论和统计学上展现出来的风采,麦克纳马拉还没忘呢。
IBM的CEO支持林燃,国防部部长支持林燃,乔治敦大学的研究团队只能被按在地上摩擦。
“我们要做的一共五点,优化算法和规则设计,扩充语料和词汇,改进数据处理的效率,引入统计方法和硬件最大化利用。
其中改进数据处理效率和硬件最大化利用由IBM方面负责。
另外三点则由乔治敦大学的成员们负责。
我们先来谈优化算法和规则设计。
你们一直的问题在于,你们对于规则集的扩张没有引入更加细化的句法规则。
因为存储有限,你们觉得扩充对照词汇库就够了。
实际上句法规则显得更加重要。
你们需要做到,引进常见的高频句型。
对上下文进行依赖处理。
使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。
比如свет同时有光和世界的意思。
这个完全可以根据前词判断是光还是世界。”
沃森弱弱提醒道:“教授,你还会俄语啊?”
重燃青葱时代 反贼之路:开局抢了和亲公主! 农门悍媳有空间,嫁猎户被宠不停 女儿喜欢后爸,我成全他们一家三口 亡国公主娇又软,糙汉可汗夜夜宠 出宫第四年,清冷摄政王夜夜求复合 请天下赴死 娶了棺中女帝,我在都市修仙 怪猎:这条火龙有特性 三年婚姻守空房,我独美你发疯 重生的我只想追小姨子 第四天灾:人在高武,游戏成神 奥特曼:开门啊,是我,老人迦! 换亲后!带火婆家! 怪她太乖 蓄谋已久,强扭的白月光他又酸又涩 四合院:开局何大清要跑路 团宠小福星,扛着粮仓去逃荒 平步亲芸 海贼:从捡到红发断臂开始
首先这并非是讲述如何在末日求生!而是怎么创造末世,将世界玩弄于鼓掌之中。掀起丧尸狂潮!带领恶魔入侵!引导虫族降临!在这末日游戏之中,一切都由我一手缔造!其次我要感谢一直以来陪伴我的眷属们。带来无尽寒冬与死亡的巫妖王,阿尔萨丝米奈希尔。由吞噬一切的病毒创造的生命,亚历克斯墨瑟将时间掌控于手中的极恶精灵,时崎狂三。被符文枷锁所禁锢的远古巫灵,泽拉斯。诸君一起来创造一次末日的狂欢盛宴吧!...
没有人知道他到底赚了多少钱,他也不知道自己到底有多少钱,但自1905年起,到二战结束,他的寡头财团已经控制了全世界大部分石油矿产航道,并垄断了几乎所有高端产业,成为金融工业的主宰,牢牢掌控着世界经济命脉。他是江渝,一个开了外挂的穿越者,在民国时代呼风唤雨的超级大军阀。民国X届总统如果你的脑袋不比子弹还硬的话,最好不要得罪那个家伙,前面几届的脑袋已经开花了。江渝很好,苏州有个大园林给你养老。倭国天皇从今天起本皇每天只吃一顿饭,节省下来的钱都将用于加强对中华民国的军事支出。江渝一群穷鬼,咱民国粮食产量已经足够所有百姓敞开肚子吃了。红色毛熊尽管远东邪恶国家目前无比猖獗,但他们一定会被淹没在人民战争的汪洋大海中。江渝看我把大海抽干!书群284379558...
据说她是被李氏买来给儿子冲喜的,却在新婚之夜克死丈夫!丈夫死后,还莫名其妙的有了身孕!啧啧,名声不好,却有一张祸水脸,引来不少男人的觊觎!没关系,咱上辈子是杀手,咱不怕!...
被逼入绝路的江风,意外从家传古玉中,获得鉴宝神通!从此,风云化龙!双眸断万古,一定乾坤。我要鉴定的,不单单是古董宝藏,还有这天地万物的规律!...
...
...