手机浏览器扫描二维码访问
由于内存空间有限,我们暂时只存储高频词对,像出现次数前1000的词对,忽略低频情况。
当翻译某个词的时候出现多个选择,就参考概率表选择最可能的翻译。
另外就是统计相邻词的共现频率。
мы经常与говорим一起出现,对应Wespeak,机器在翻译的时候则优先选择这个组合。
通过规则优先处理和统计方法处理模糊情况的方式,来弥补规则的不足!”
林燃从统计学的角度给他们好好上了一课。
不过这只是一个开始。
在座的研究团队们知道了林燃优化策略的轮廓,具体实践过程中还有大量的细节要进行调整、尝试和优化。
不过光是现在所说的引进概率,这一点,在座乔治敦翻译机器的资深研究员们都有种恍然大悟的感觉。
前面讲的优化算法和规则设计什么的,他们感觉有道理,但判断不了具体实践是不是真的管用。
但这统计学方法的引入,光靠想象就知道,能够显著提升乔治敦翻译机器的效果。
当天的工作结束后,红石基地周边的小餐馆里,加尔文和多斯特尔特坐在角落,面前是两杯当地特色的啤酒。
加尔文放下笔记本,叹了口气说:“利昂,我们真的是蠢货吗?”
今天听完之后,加尔文都要怀疑人生了。
林燃提出了一整套的解决方案,这套解决方案里完整也就算了,其中很多点他们都想到过,但想不到要如何实现,另外就是一些他们连想都没有想到的点。
一整个团队差不多快十年的研发思路,不如林燃一下午的干货多。
加尔文已经怀疑人生了。
“教授的想法不是超前,而是太实际了。
你会感觉天马行空,但实际上结合在一起想想,又会觉得无比的实际。
哪怕现在还没开始,光是从教授提出的框架,我都能想到,采用这套完整方案对乔治敦翻译机器升级后,它的效果会有多好。”
加尔文接着感慨道。
现在他终于知道为什么NASA的研究人员和工程师能容忍林燃的毒舌了,差距太大,心服口服。
尤其统计相邻词汇共现频率,这并不难想到,但他们就是想不到。
而用统计方法处理歧义场景,增加统计学算法,这个就他们连想都想不到。
多斯特尔特转过头,微微苦笑道:“我也一直在琢磨。
他提出的统计方法,听起来像是天方夜谭,但结果摆在眼前。
我估计了一下,乔治敦翻译系统在教授的指导下,质量至少能提升一大截。
我们不需要精心准备短句,它可以应用在更广泛的场景,而不是局限在军事领域。”
加尔文点点头:“是啊,我一开始还不信,语言这种东西明明是规则驱动的,怎么能靠统计解决?可他用事实让我闭嘴了。
不愧是教授,教授对于本质的洞察力是跨越领域的。”
多斯特尔特沉思片刻:“你说的没错,感觉就好像他能看穿机器翻译的本质。
也许这是数学训练带来的好处,我怕自己再和教授多呆一段时间,我都想去念一个数学博士了。”
加尔文惊讶地看了他一眼:“数学博士?别开玩笑。”
多斯特尔特认真地说:“我没开玩笑。
如果数学真的能够帮助我们更好的洞察本质,我觉得去念一个统计学的博士未尝不可。”
加尔文沉默了一会儿,笑道:“如果你去,我也去。”
多斯特尔特举起啤酒都要溢出的酒杯:“为教授干杯!
教授将给我们带来胜利!”
加尔文笑着回应:“干杯!
我的化身正在成为最终BOSS 亡国公主娇又软,糙汉可汗夜夜宠 三年婚姻守空房,我独美你发疯 换亲后!带火婆家! 反贼之路:开局抢了和亲公主! 蓄谋已久,强扭的白月光他又酸又涩 农门悍媳有空间,嫁猎户被宠不停 请天下赴死 团宠小福星,扛着粮仓去逃荒 第四天灾:人在高武,游戏成神 重生后女帝拿了美强惨剧本 女儿喜欢后爸,我成全他们一家三口 不许没收我的人籍 奥特曼:开门啊,是我,老人迦! 重生的我只想追小姨子 平步亲芸 黄金年代从1977开始 海贼:从捡到红发断臂开始 文圣天尊 出宫第四年,清冷摄政王夜夜求复合
玄幻爽文九天大陆,天穹之上有九条星河,亿万星辰,皆为武命星辰,武道之人,可沟通星辰,觉醒星魂,成武命修士。传说,九天大陆最为厉害的武修,每突破一个境界,便能开辟一扇星门,从而沟通一颗星辰,直至,让九重天上,都有自己的武命星辰,化身通天彻地的太古神王。亿万生灵诸天万界,秦问天笑看苍天,他要做天空,最亮的那颗星辰...
江湖日报讯肯麦郎连锁客栈享誉大明各府,其总部却是京城一家名为来福的小客栈。来福客栈在江湖上大名鼎鼎,即便费用高昂,上到各派掌门下到江湖游侠,都挤破脑袋想去来福客栈吃顿饭。记者有幸请到武林盟主,揭开来福客栈的秘密!来福客栈日常一幕少林方丈,你怎么吃饭不给钱啊?偶弥陀佛,出家人身无分文,这顿饭可否算作化缘?不行!武当掌门没钱吃饭,还在后院洗碗呢!你若不给钱,就去洗茅房!来福客栈日常二幕丐帮长老,瞧你样子就没钱吃饭,你来客栈干啥?听闻来福客栈可以拿东西抵押,我这里有本上乘的秘...
一个热爱网络游戏的痴孩子,二不垃及的真神祝愿下进入了游戏的世界。。。。。。...
...
一张从始皇帝皇宫流传出的长生不老药地图,解开不死不灭之秘。一代名将,将守,从万人敌,到无人敌的重生之路!九龙吞珠读者交流群721466643)...
...