深度学习的计算机视觉 – 简介
Posted: Wed Jan 29, 2025 3:31 am
什么是计算机视觉(CV)?计算机视觉(CV)是计算机科学的一个领域,涉及机器解释图像和视频。如今,深度学习技术最常用于计算机视觉。卷积神经网络(CNN)的使用方法和优点如下所示。这些是模仿人眼工作方式的神经网络架构。所提出的方法也可以毫无问题地应用于视频。
什么是深度学习?
深度学习是人工智能的一个子学科,基于深度神经网络的使用。相对于普通机器学习的优势在于端到端训练的能力。这意味着您不再为深度学习网络提供单独的输入变量,而只提供图像或句子。将图像处理成特征是由神经网络自动进行的。最后做出预测,神经网络可以自动计算误差并根据反馈进行自我优化。
计算机视觉学科
在计算机视觉中,有基于不同问题的特殊学科。最简单的 医疗保险线索电子邮件列表 学科是分类:在这里,神经网络接收图像,然后为图像分配一个或多个类别。人工智能识别图像中的内容并返回最适合类别的概率。最著名的网络可能是 ResNet-50。
在下图中,您可以看到一匹斑马,它下面是它是什么类型的物体的概率。该模型表示,它是斑马的概率为 99.5%。但是,为了完整起见,仍显示其他建议。
斑马的图像识别
语义分割
语义分割涉及像素级别的分类。可以创建将每个像素分配给一个类的图像。用于此目的的一个著名网络是 U-Net。分割对于对象的精确划分和精确定位尤其重要。
这方面的例子包括肿瘤分割和自动驾驶。在下图中,您可以再次看到斑马,这次属于斑马的所有像素都被涂成红色,而草和天空的像素则具有其他颜色。
使用示例进行语义分割
物体检测
在这里,对象被分类为图像,并使用框标记它们的位置。它是图像中区域的分类。此操作不太复杂,因此速度更快。然而,识别的信息较少。仅确定班级和大致位置。用于此目的的一个著名网络是 Faster R-CNN。这次斑马被一个盒子标记,即边界框。这使得检测并突出显示斑马的准确位置成为可能。
概率:斑马 100%
使用示例进行对象检测
关键点检测
例如,关键点检测用于人体姿势估计。这是点的分类。取概率最高的类别的点。图像中可见的边缘不是由神经网络预测的,而是被定义为特定点之间的边缘。当需要识别一个人所处的位置时使用此功能。一个例子是老年人跌倒的检测。
使用示例进行关键点检测
实例分割
实例分割与语义分割相关。各个实例被分段。例如,在图像中识别和分割不同的人。可以区分类的不同类型的实例。优点是只分割和使用相关的类。
使用示例进行实例隔离
全景分割
语义分割和实例分割的组合称为全景分割。整个图像被分割,一个类的不同实例被识别并相互区分。在下图中,您可以清楚地看到这两只狗被识别为狗,但被识别为不同的狗,不是在品种方面,而是在实例方面。
什么是深度学习?
深度学习是人工智能的一个子学科,基于深度神经网络的使用。相对于普通机器学习的优势在于端到端训练的能力。这意味着您不再为深度学习网络提供单独的输入变量,而只提供图像或句子。将图像处理成特征是由神经网络自动进行的。最后做出预测,神经网络可以自动计算误差并根据反馈进行自我优化。
计算机视觉学科
在计算机视觉中,有基于不同问题的特殊学科。最简单的 医疗保险线索电子邮件列表 学科是分类:在这里,神经网络接收图像,然后为图像分配一个或多个类别。人工智能识别图像中的内容并返回最适合类别的概率。最著名的网络可能是 ResNet-50。
在下图中,您可以看到一匹斑马,它下面是它是什么类型的物体的概率。该模型表示,它是斑马的概率为 99.5%。但是,为了完整起见,仍显示其他建议。
斑马的图像识别
语义分割
语义分割涉及像素级别的分类。可以创建将每个像素分配给一个类的图像。用于此目的的一个著名网络是 U-Net。分割对于对象的精确划分和精确定位尤其重要。
这方面的例子包括肿瘤分割和自动驾驶。在下图中,您可以再次看到斑马,这次属于斑马的所有像素都被涂成红色,而草和天空的像素则具有其他颜色。
使用示例进行语义分割
物体检测
在这里,对象被分类为图像,并使用框标记它们的位置。它是图像中区域的分类。此操作不太复杂,因此速度更快。然而,识别的信息较少。仅确定班级和大致位置。用于此目的的一个著名网络是 Faster R-CNN。这次斑马被一个盒子标记,即边界框。这使得检测并突出显示斑马的准确位置成为可能。
概率:斑马 100%
使用示例进行对象检测
关键点检测
例如,关键点检测用于人体姿势估计。这是点的分类。取概率最高的类别的点。图像中可见的边缘不是由神经网络预测的,而是被定义为特定点之间的边缘。当需要识别一个人所处的位置时使用此功能。一个例子是老年人跌倒的检测。
使用示例进行关键点检测
实例分割
实例分割与语义分割相关。各个实例被分段。例如,在图像中识别和分割不同的人。可以区分类的不同类型的实例。优点是只分割和使用相关的类。
使用示例进行实例隔离
全景分割
语义分割和实例分割的组合称为全景分割。整个图像被分割,一个类的不同实例被识别并相互区分。在下图中,您可以清楚地看到这两只狗被识别为狗,但被识别为不同的狗,不是在品种方面,而是在实例方面。