【PConline 资讯】近期,谷歌DeepMind人工智能公司正与牛津大学合作研发一个具有读唇语功能的人工智能系统。为此,他们选取了BBC近5000个小时的电视节目,共118000个句子为该系统提供数据库进行读唇语测验,只需识别嘴唇部位,就能准确破译整个句子。 其实大约两周前,牛津大学研发了一个类似的唇读系统LipNet,只是系统的数据库GRID只含有51个单词,且句子语法单一;而与谷歌DeepMind合作研发的AI系统所采用的数据库包含近17500个单词,且由于谷歌DeepMind数据库来自真实的人类语句,因而语法也更加多样和复杂。另外,二者将开放其数据库资源,以便LipNet系统可以利用其进行试验。 此外,在破译从数据库中随机选取的200个片段测试中,AI唇读系统打败了专业的唇读者,专业唇读者的准确率仅12.4%,而AI系统的准确率则为46.8%。 |
正在阅读:谷歌AI唇读系统准确率46.8% 完胜专业唇读者谷歌AI唇读系统准确率46.8% 完胜专业唇读者
2016-11-24 10:05
出处:PConline原创
责任编辑:sunziyi