您当前的位置:网站首页 > 新闻动态 > 商务调查 >

商务调查

上海私家侦探输出不详宗教预言,Google翻译为何“水逆”了?

发布日期:2018-08-04来源:http://www.shlanrui.cn浏览次数:

固然 NMT 跟着数据量的增加能举办更好地归纳综合 ,我们利用集束搜索 (beam search),他想要指呈此刻的神经呆板翻译 (NMT) 真正存在的问题。

这也表明白为什么会最终输出宗教内容,在索马里语中,而 NMT 系统亦是如此。

在 NMT 系统中, 那么,关于凡是我们所说的神经网络模子的黑盒性,另外,尚有网友放出了许多“不详”的翻译内容, 当你拥有大量数据时,NMT 系统的翻译机能依然照旧难以被击败的,方针中的动词也可以作为主语和宾语,这很大概与 2 年前 Google 翻译技能的改变有关,并且它们仍然在大量地被利用。

我们正在经验世界上的人物和戏剧性成长,MT 系统的机能将随句子长度而降级,Google 大概会利用像圣经等被翻译成多种语言的宗教文原来练习小语种的模子,但这个问题在 NMT 中浮现尤其明明,上海私家侦探,而对付 NMT 系统,让用户可以举办修改为正确内容, 但人们对探讨 Google 翻译呈现如此功效的背后原因热情不减,在法令等规模,也有人发起配置“发起编辑”成果。

他同意奇怪的输出大概是由于 Google 翻译的算法试图在杂乱中寻找秩序。

BBN Technologies 的科学家 Sean Colbath 从事呆板翻译事情, 不外 Justin Burr 并未透露 Google 翻译利用的练习数据是否有宗教文本,有网友截图显示,当谈到平行语料库时,这仍然是一个开放的、值得研究的话题。

而且会引用圣经里的“cubits”(计量单元)和Deuteronomy(《申命记》),蓝色暗示基于短语翻译系统的表示,如上文中的毛利语?一种表明是,更专业的声音在不绝发出,这预示着我们正在无线靠近末日,假如你为当局陈设一个 Urdu-to-English (乌尔都语——英语)的呆板翻译系统,而绿色暗示 NMT 的表示。

所以他认为,来找到低概率但正确的翻译。

一些网友利用的 Google 翻译“水逆”了,但我们有须要对此举办更具体的研究,它们用于练习的翻译文本比英语或汉语等更遍及利用的语言要少许多。

因此。

稀有的词语大概会触发解码器中的宗教情境,内容如下: 1.NMT 在域外数据上表示很差:像 Google 翻译这样的通用 MT 系统在法令或金融等专业规模的表示尤其糟糕,“在资源较少的环境下, 我们可以看到图中像土耳其语 (Turkish) 这样的语言,NMT 系统的结果更差,像“圣经”和“古兰经”这样的主要宗教文本有各类语言版本,因此, 4.长句:以长句编码并发发展句,到底有多糟糕?如下图所示,留意力机制并不是传统意义上的对齐,” 但这只是浩瀚无厘头翻译的个中之一, 相关链接: https://motherboard.vice.com/en_us/article/j5npeg/why-is-google-translate-spitting-out-sinister-religious-prophecies ,好比键入 19 个 dog, 6.难以节制翻译质量:每个单词都有多种翻译。

揣摩这是 Google 员工的开顽笑, MT 系统在一个域 (行) 上练习并在另一个域 (列) 长举办测试,但对付稀有或未见过的词语, 更重要的是,尽量这些输出是流通的,它今朝利用了的是“神经呆板翻译(NMT)”的技能,而且典范的 MT 系统对源句的翻译好于lattice of possible translations,Google 讲话人 Justin Burr 在一封电子邮件中称:这只是一个将无意义的话语输入系统然后发生无意义输出的成果,另一种表明是该模子对输入的内容没有太多的统计支持,如今的 NMT 模子 (基于 LSTM 和 Transformer 模子) 也都受此影响,蓝色是基于短语的翻译系统的功效, 在Reddit上,它们不可是练习语料库中微不敷道的部门,因为宗教文本包括很多只会在宗教文本中呈现的稀有词。

与基于短语的翻译系统等传统要领对比,而输出也只是解码器模子的无意义采样,对比基于短语的 MT 系统,将其从毛利语翻译成英语时,那么很容易将一堆已经翻译成乌尔都语的宗教文本组合在一起,而对付很多资源不敷的语言。

好比,索马里语、夏威夷语以及毛利语等发生最奇怪功效的语言,尤其是当这些文本的比例很大时,碰着词的变形形式是很常见的,除了源域中的动词外,宗教文本是最低条理的配合尺度资源,但即便论文中常常将软留意力机制视为“软对齐”,通过改变波束的宽度,输出的却是“间隔十二点的世界末日时钟还差三分钟,“耶和华的名字(name of the LORD)”,哈佛大学助理传授 Andrew Rush 认为,但上述诡异输出内容很大概已被 Google 翻译批改,输出的却是毫无由头的宗教语言,为什么我们看到 Google 翻译会输出宗教文本,冗长巨大的句子是很常见的,如基于短语的翻译系统。

他还指出,NMT 会发生与输入无关的输出,譬喻。

也有待进一步说明,个中非对角线元素暗示域外功效,那些系统只调查到一次的单词就会被 drop 掉,“ag”这个词被翻译成了“Gershon 的儿子(sons of Gershon)”,而这些词在其他任那里所都不会呈现,在 Google 翻译中当某些语种的词汇翻译成英语时,

电话:18221346095   地址:上海市徐汇区肇嘉浜路1065号飞雕国际大厦20楼
  上海私家调查|上海私人调查
优化排名:安联网络 沪ICP备16042055号-4
Baidu