NIMA:让机器学会“审美”

什么是“美”?

这似乎是一个非常主观且难以回答的问题。如何识别“美”对于机器来说就更是难上加难。图片质量该如何量化?审美要素要如何分析?长期以来,这都是计算机视觉研究领域的未解难题。

今天 Google 公布的 NIMA(Neural Image Assessment),正是用深度卷积神经网络(CNN)来学习人类感知图像质量和审美因素的一项研究成果。利用最先进的深度对象识别(object recognition)技术,NIMA 不仅能分析图片的质量,还能判断图片是否好看,更能给出让图片更美的修图建议!

NIMA 辨美丑

NIMA 对一些带有“景观”标签图片的美观程度进行了评分和排序

在计算机视觉研究领域,已经有算法可以将图像以分数或回归均值的方法来排序比较。与以往的算法不同,NIMA 可以为任何特定的图像进行 0-10的评分,并直接比较同一主题的图片。括号中是200人对图片打分后计算出的平均分数,与其他方法相比,NIMA 给出的评分与排序更接近人类的偏好。

NIMA 评质量

NIMA 对同一主题的图片的质量进行评分和排序

NIMA 同时也能对图片的质量进行比较。图片可能由于一系列的原因变得模糊、出现噪点和扭曲,导致图片质量下降。NIMA 在对图片评分的同时也能比较同一主题图片的质量。

如何优化图片?NIMA 告诉你

通过NIMA训练深度卷积神经网络(CNN)从而增强图像局部的色调和对比度

不知道怎样修图才能达到最好的优化效果?NIMA 可以给你建议!在调整图片时,明暗度、对比度、色调和细节的变化都会改变图片的评分。NIMA 能通过找到优化图片的最佳参数来给出修图建议。

NIMA 还能做什么?

Google 在 NIMA 上的研究表明,基于机器学习的质量评估模型可具有广泛的功能。例如,可以让用户轻松地在众多图片中快速找到“最美”的图片,甚至可以实时显示评分结果。在后期处理中,NIMA 可以引导修图程序产生更好的结果。

Google 很高兴能与大家分享有关 NIMA 的研究成果。尽管在计算机视觉研究领域,要更好地理解图片、视频质量和审美标准将是一个持续的挑战,Google 仍将在探索如何利用机器学习改善人们生活的道路上继续努力。