1.1.1 技术层面:计算机视觉是当下的热点
人工智能发展离不开深度学习的支撑,而计算机视觉又与深度学习有着密不可分的关系。通过深度学习算法的训练和学习,计算机能够更加准确地检测出图片里的目标,实现精准的视觉识别,从而帮助人们高效地进行图片检索和筛选。
李飞飞一直致力于计算机视觉的研究。起初,李飞飞与团队成员用数学的语言帮助计算机“理解”图片。例如,他们通过数学建模的方法,告诉计算机,猫有着圆圆的脸庞、胖胖的身子、两个尖尖的耳朵,还有一条尾巴。由于这样的描述过于共性化,计算机仍然不能识别出猫与狗的差别。另外,如果小猫换了一个卧着的姿态,计算机也不能识别出来;如果有一只小狗在追逐小猫,计算机视觉就更容易混淆这两种动物。
可是,对于2岁到3岁的儿童来讲,他们都能够很好地区分这两种动物,也容易记住很多其他动物。经过仔细地分析,李飞飞团队认为,视觉能力的提升离不开海量的训练数据。因为,儿童的视觉能力也是父母和周围的其他人不断训练的结果。
于是,李飞飞团队开始与普林斯顿大学的李凯教授合作,进行ImageNet项目的开发。为了使ImageNet项目达到良好的效果,团队成员从Internet上下载了上亿幅多元图片。同时,他们又用了3年的时间对图片进行加工处理。在这3年里,他们一共邀请了来自167个国家的5万名工作者,进行互联网图片的筛选、排序和标注。经过周密的部署与数据统计,他们将这些海量的数据分为22000个图片类别,建成了一个超级图片数据分析库。
在这之后,李飞飞与她的科研团队,又重新利用算法优化处理这些海量的图片数据资源。最终,ImageNet智能图像分析平台终于能够精准地识别出物体。李飞飞还成功地推出了ImageNet国际挑战赛,让人们对计算机视觉产生了深刻的印象。
ImageNet图像识别数据库是计算机视觉的根基。如今,许多设备都具有图像识别的功能。例如,百度网盘具有强大的图片识别功能,可以智能地将用户上传的图片进行分类整理。用户在使用产品时,也会倍感轻松。另外,智能手机的“刷脸解锁”功能、无人超市的“刷脸支付”功能,都是计算机视觉的典型应用,方便了人们的生活,为生活添加了趣味。