唇语识别《隐秘的角落》被改台词,比想象中更漆黑

admin 3周前 (07-24) 科技 9 0

日前神秘网友行使唇语识别,解读《隐秘的角落》中被改掉的台词,原始内容比想象中加倍漆黑。


实在让计算机读唇并不是什么新鲜事,早在 2003 年,Intel 就推出过能读唇的语音识别软件。

现在的唇语识别大要分为四步:通过图像识别找到视频中的语言人,提取延续的口型转变特征。

由识别模子找到特征对应的发音,再计算出可能性最大的自然语言语句。

2016 年,牛津大学先是团结 Deepmind 公布 WLAS(Watch, Listen, Attend band Spell )模子,通过使用 5000 个小时的 BBC 新闻节目举行训练,在测试集上可以到达 46.8% 的识别准确率。

进入申博Sunbet官网  第1张

随后他们又团结公布了 LipNet,可以在公式化语句上实现 95.2% 的准确率。两年后 Deepmind 公布论文《大规模视觉语音识别》,将词错率进一步降低至 40.9%。

进入申博Sunbet官网  第2张

端到端也好,基于单词也罢,差别语言的唇语识别模子准确率一样平常在 40% 左右。在图像识别准确率动辄 90% 以上的今天,唇语识别的准确率为什么这么低?

进入申博Sunbet官网  第3张

那是由于读唇自己准确率就很低。

很多在听觉上完全差别的声音,在唇部动作上险些一致。

进入申博Sunbet官网  第4张

有履历的专业读唇者,会借助语境、上下文、脸色、手势等边缘信息辅助还原语言。

进入申博Sunbet官网  第5张

但即使是人类中最为熟练的读唇师,也只能解读 40%-50% 左右的唇语。

进入申博Sunbet官网  第6张

准确度这么低,唇语模子有什么用?

最大的应用是为语音识别提供辅助。还记得鸡尾酒会问题吗?若是靠山声太过嘈杂,或是多人配合谈话,语音识别的准确率会受到很大影响。唇语识别可以通过定位语言人提供更多语言信息,从而提升语音识别的准确率。

进入申博Sunbet官网  第7张



,

Allbet官网

欢迎进入Allbet官网(Allbet Game):www.aLLbetgame.us,欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

申博声明:该文看法仅代表作者自己,与本平台无关。转载请注明:唇语识别《隐秘的角落》被改台词,比想象中更漆黑

网友评论

  • (*)

最新评论