正在阅读：文字层面尚浅盘点五类可识别图片AI技术文字层面尚浅盘点五类可识别图片AI技术

2015-11-26 00:15 出处：PConline原创作者：佚名责任编辑：sunziyi

1TensorFlow、CamFind、Photo Magic回顶部

　　【PConline 资讯】提及人工智能（AI），恐怕大多数人首先想到的仍是多年前，斯皮尔伯格执导的那部电影。实际上，很长一段时间，人们对AI的研究尚且停留在文字层面，且计算机对普片的识别，要依靠人工添加的标签与注释。现在，这一窘境终于有望被打破。

文字层面尚浅盘点五类可识别图片AI技术

　　今年5月份，谷歌推出了Google Photos，谷歌声称搜寻特定某人，你会找到对方从现在到婴儿时期的照片；搜索品种名，则能找到相应品种狗的照片。把名字和食品类别结合起来，比如输入‘最大披萨’，就能锁定特定图片。

　　之后，谷歌以TensorFlow平台形式开源了它的人工智能主体部分。尽管TensorFlow并不是第一个开源人工智能平台，但它却是与谷歌强大图片搜索关系最为密切一个。

　　同样在今年，一家名为CamFind的图片识别和视觉搜索公司，推出了一款“云视觉”（CloudSight）公共应用平台。该API支持开发者通过CamFind的人工智能，进行图片内容分析。

　　这样，可使大多数情况下扫描具有高度特定性，例如识别汽车的制造与模型，宠物狗的品种以及食品的具体类型。一旦分析出图片中的物品，开发者便可通过这些信息来获取网络上的文字信息。

　　目前，Facebook已开始在Messenger应用上测试一项新功能“Facebook Photo Magic”，该应用会扫描手机相册照片，并对照片进行面部识别处理。“Photo Magic”会识别照片中的人物并建议你和他们一起分享这些照片。Facebook使用人工智能对面部和名字进行匹配，人工智能掌握的照片越多其识别效果越佳，即便脸部被遮住，Facebook的“面部识别”一样能够识别出你的脸部。

　　当然，除了面部特征该系统还关注发型、姿势、衣着和身材。此外，Photo Magic拓展了图片库来源。也就是说，它除了收集Facebook外，还可以收集Messenger（聊天应用）的数据，扩充数据量。

2Project Oxford、Visual Search、Pinterest回顶部

　　近日，微软也更新了自己的牛津项目（Project Oxford）。实际上，Project Oxford是一个让开发者通过旗下的Azure云平台，使用微软人工智能系统的工具包。

　　据了解，Project Oxford工具包能够支持包括口语、视频以及其他媒体在内的人工智能应用。但与这些相比，其最强大的功能要属牛津项目现在支持开发者通过牛津人脸应用平台接口项目（ Project Oxford Face API），检测照片中的人物表情。

　　例如用Project Oxford处理上图的五个人组成照片，Project Oxford可以识别照片中的人脸以及每个人的表情，或快乐或愤怒或者焦虑等等。不得不说，该项功能创造了一个全新的高度，让人工智能像人类一样“解读”图片。

　　巧合的是，Pinterest也在近期发部了自己全新的图片搜索功能“Visual Search”，帮助用户发现更多的信息，甚至帮助他们购买在固定照片中找到的产品。该功能以伯克利视觉和学习中心的深度学习人工智能为基础。

　　用户在Pinterest页面看中的图片中，来回拖动一个盒状标识以选中自己心仪的物体。随后，搜索工具会找到具有相似图案与颜色的类似产品，系统将最匹配的结果链接到购买按钮上，点击这里就能购买该产品。这点倒是与淘宝中的“查找相似款”有些类似，只不过Pinterest是通过图片。

　　最后，再来说说Deepomatic。Deepomatic网站开发了一个服务型的智能搜索引擎，可以识别图片中的各类商品数据。Deepomatic不仅可以为用户找到相匹配的颜色、图案以及其它数据，还能识别出图片中的物品，将该物品与一个全面的时尚产品数据库进行匹配。

　　对此，Deepomatic网站表示，该技术是模拟了人类大脑接收视觉信息的方式，并将这种方式用来理解各种概念。

　　实际上，这仅仅是人工智能从文字层面迈向图片识别的一个开始。通过API，开源程序以及服务化处理让人工智能识别图片能够成为实现。要知道，若想真正做到模拟人类，人工智能即计算机必须拥有自己的视觉。