将本站设为首页
收藏慧聪官网,记住:www.uhchinaren.com
账号:
密码:

慧聪书屋:看啥都有、更新最快

慧聪书屋:www.uhchinaren.com

如果你觉得好,恳请收藏

您当前的位置:慧聪书屋 -> 科技入侵现代 -> 第67章 你们能比我更懂机器翻译(5k)

第67章 你们能比我更懂机器翻译(5k)

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

俄语句子Мыговоримомире

英语翻译:“We speak about peace

对齐结果:“мы”对应“we”

“говорим”对应“speak”

“о”对应“about”

“мире”对应“peace”

然后我们需要对这种对齐的频率进行统计。

统计每个俄语词或短语在英语中的对应翻译出现的频率。

例如,在语料中,“говорим”在80%的句子中翻译为“speak”,20%翻译为“talk”。

这样对于我们就可以构建概率表了。

将这些概率整理成表格,供机器进行查询。由于内存空间有限,我们暂时只存储高频词对,像出现次数前1000的词对,忽略低频情况。

当翻译某个词的时候出现多个选择,就参考概率表选择最可能的翻译。

另外就是统计相邻词的共现频率。мы经常与говорим一起出现,对应We speak,机器在翻译的时候则优先选择这个组合。

通过规则优先处理和统计方法处理模糊情况的方式,来弥补规则的不足!”

林燃从统计学的角度给他们好好上了一课。

不过这只是一个开始。

在座的研究团队们知道了林燃优化策略的轮廓,具体实践过程中还有大量的细节要进行调整、尝试和优化。

不过光是现在所说的引进概率,这一点,在座乔治敦翻译机器的资深研究员们都有种恍然大悟的感觉。

前面讲的优化算法和规则设计什么的,他们感觉有道理,但判断不了具体实践是不是真的管用。

但这统计学方法的引入,光靠想象就知道,能够显著提升乔治敦翻译机器的效果。

当天的工作结束后,红石基地周边的小餐馆里,加尔文和多斯特尔特坐在角落,面前是两杯当地特色的啤酒。

加尔文放下笔记本,叹了口气说:“利昂,我们真的是蠢货吗?”

今天听完之后,加尔文都要怀疑人生了。

林燃提出了一整套的解决方案,这套解决方案里完整也就算了,其中很多点他们都想到过,但想不到要如何实现,另外就是一些他们连想都没有想到的点。

一整个团队差不多快十年的研发思路,不如林燃一下午的干货多。

加尔文已经怀疑


  本章未完,请点击下一页继续阅读!

看了《科技入侵现代》的书友还喜欢看

重生在星际选择成为药剂师
作者:长尾兔子
简介: 陈房子年纪轻轻便猝死了,死前啥都没有,没有房子没有存款没有恋人,浑身散发着满满的社畜...
更新时间:2026-03-03 23:39:08
最新章节:732 反正早上已经看过了,再洗洗也无所谓了
让你当收尸人,你直接解刨了前女友
作者:夜无声
简介: 解刨课上,尸体竟是我前女友……

从那以后,我经历了许多匪夷...
更新时间:2026-03-03 22:57:00
最新章节:第两千两百五十九章 处理完,后台好硬啊
正的发邪:全宗跪求大师兄娶魔女
作者:默默地抽根烟
简介: 【无系统】【无敌】【剑道】【大师兄】\n神剑宗大师兄张青锋,九年前惨遭魔女暗算,痛失...
更新时间:2026-03-03 23:43:23
最新章节:第436章 多谢指教
四十九条末世规则
作者:小草昂扬
简介: 携带着末世规则的神秘存在

“盗火者”突然降临在天水星。只有...
更新时间:2026-03-03 23:33:14
最新章节:第425章:你想上太空吗?
华娱顶流,我真得狠狠操作你们了
作者:纯洁小松鼠
简介: 娱乐圈边缘人物许秀重回2018年。在这个流量为王的时代,四大三小如日中天,大花与小花...
更新时间:2026-03-03 23:23:00
最新章节:第136章 开始臭脸美人养成计划(补更求月票求订阅)
武道通神?可我是纨绔啊
作者:就会一点
简介: 阎青穿越成军阀之子,却是个体弱多病、好色如命的废物。在这皇朝崩坏、列强环伺的乱世,他...
更新时间:2026-03-03 23:09:53
最新章节:第90章 联盟对决开始