传统视觉项目 | ​使用 OpenCV 进行运动检测

开发 机器视觉
在本文中,我们将引导你了解检测视频流或实时画面中运动的基本概念、工具和技术。

在技术不断重塑我们与世界互动方式的时代,计算机视觉已成为最令人兴奋的创新领域之一。从自动驾驶汽车到家庭安防系统,检测和解释运动的能力已成为现代应用的重要组成部分。在这些进步的背后,OpenCV(开源计算机视觉库)扮演了核心角色,它使开发者能够构建强大而高效的图像和视频处理系统。

在本文中,我们将引导你了解检测视频流或实时画面中运动的基本概念、工具和技术。通过本文的学习,你不仅将拥有一个可运行的原型,还会对运动检测背后的原理有更深入的理解。

运动检测的工作原理是什么?

运动检测,也称为动作检测,涉及识别视频流中连续帧之间的变化。其基本思想很简单:如果帧的某一部分随时间发生显著变化,我们假设该区域发生了运动。以下是运动检测的基本流程:

  • 帧差分:通过比较视频的连续帧,我们可以识别像素值发生变化的区域。这些差异通常表示运动。
  • 阈值处理:在识别出差异后,应用阈值以将显著变化与噪声分离。这确保忽略微小变化(如光照变化)。
  • 轮廓检测:为了定位和勾勒移动物体,分析处理后的图像以检测轮廓。这些轮廓代表移动物体的形状。
  • 背景减除(可选):在更高级的情况下,维护一个背景模型,任何与背景的偏差都被视为运动。这种方法在固定摄像头的场景中特别有效。
  • 后处理:可以使用其他技术(如过滤小范围运动或稳定检测)来优化结果,提高准确性。

为什么选择OpenCV?

OpenCV(开源计算机视觉)是一个强大的开源库,专为实时计算机视觉和图像处理而设计。它提供了广泛的工具和功能,使运动检测、人脸识别、目标跟踪等任务变得简单高效。OpenCV的主要特点包括:

  • 广泛的算法:预建的图像处理、特征提取和目标检测算法。
  • 多语言支持:与Python、C++、Java等语言无缝协作。
  • 实时性能:针对速度进行了优化,非常适合实时应用。
  • 丰富的文档:庞大的社区和优秀的文档使OpenCV对初学者友好且高度可定制。

在本文中,我们将使用OpenCV的视频处理功能构建一个运动检测系统。通过将OpenCV的工具与Python的简洁性结合,你会发现实现一个能够有效检测和突出运动的解决方案非常容易。

开始使用

步骤1:安装必要的库

pip install opencv-python numpy

步骤2:导入库

import cv2
import numpy as np

步骤3:定义运动检测逻辑

  • 使用函数calculate_motion_regions检测运动。
  • 比较连续帧以发现差异。
  • 使用轮廓突出显示运动区域。
  • 通过阈值过滤小范围运动。
def calculate_motion_regions(prev_frame, curr_frame, mask, threshold=900):
    # Apply the mask to both frames
    prev_roi = cv2.bitwise_and(prev_frame, prev_frame, mask=mask)
    curr_roi = cv2.bitwise_and(curr_frame, curr_frame, mask=mask)

    # Convert to grayscale for simplicity
    prev_gray = cv2.cvtColor(prev_roi, cv2.COLOR_BGR2GRAY)
    curr_gray = cv2.cvtColor(curr_roi, cv2.COLOR_BGR2GRAY)

    # Calculate absolute difference
    diff = cv2.absdiff(prev_gray, curr_gray)

    # Threshold the difference to binarize
    _, diff_thresh = cv2.threshold(diff, 30, 255, cv2.THRESH_BINARY)

    # Find contours of the motion regions
    contours, _ = cv2.findContours(diff_thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    motion_regions = []
    for contour in contours:
        if cv2.contourArea(contour) > threshold:  # Filter small motion areas
            motion_regions.append([contour])

    return motion_regions, diff_thresh

步骤4:初始化视频捕获和掩码

打开视频文件。

cap = cv2.VideoCapture(r"YourVideoPath") # or use 0 for webcam
if not cap.isOpened():
    print("Error: Cannot open video file.")
    exit()

读取第一帧并创建覆盖整个帧的掩码。

ret, prev_frame = cap.read()
if not ret:
    print("Error: Cannot read the first frame.")
    cap.release()
    exit()

mask = np.ones(prev_frame.shape[:2], dtype=np.uint8) * 255

步骤5:逐帧处理视频

循环遍历视频帧,计算运动区域并显示结果。

while cap.isOpened():
    ret, curr_frame = cap.read()
    if not ret:
        break

    motion_regions, motion_mask = calculate_motion_regions(prev_frame, curr_frame, mask)

    # Draw bounding boxes around motion regions

    for motion_region in motion_regions:
        cv2.polylines(curr_frame, motion_region, isClosed=True, color=(0, 255, 0), thickness=1)

    # Update the previous frame
    prev_frame = curr_frame.copy()

    # Convert motion mask to 3 channels for concatenation
    motion_mask_colored = cv2.cvtColor(motion_mask, cv2.COLOR_GRAY2BGR)

    curr_frame = cv2.resize(curr_frame, (490, 640))
    motion_mask_colored = cv2.resize(motion_mask_colored, (490, 640))

    # Concatenate the current frame and the motion mask side-by-side
    combined_frame = cv2.hconcat([curr_frame, motion_mask_colored])

    # Show the combined frame
    cv2.imshow('Motion Detection', combined_frame)

    # Break the loop with 'q'
    if cv2.waitKey(30) & 0xFF == ord('q'):
        break

步骤6:回收

cap.release()
cv2.destroyAllWindows()

工作原理

(1) 帧比较:

  • 每一帧都与前一帧进行比较,以识别差异(运动)。
  • 使用每帧的灰度版本以简化处理。

(2) 运动阈值处理:

通过阈值过滤掉微小差异,以分离出显著的运动区域。

(3) 运动区域边界:

在检测到的运动区域周围绘制轮廓以突出显示。

(4) 可视化:

将处理后的帧和运动掩码并排显示,以便更好地理解。

运行代码

  • 将完整脚本保存为.py文件。
  • 运行脚本
  • 按q键退出视频显示。
责任编辑:赵宁宁 来源: 小白玩转Python
相关推荐

2022-08-25 09:00:00

Python编程语言开源库

2024-11-27 16:06:12

2016-03-25 10:41:40

项目运维管理运维

2023-10-12 09:21:41

Java图像

2023-03-09 07:54:54

2020-10-15 12:00:01

Python 开发编程语言

2024-11-06 16:56:51

2010-06-11 16:04:34

Windows 7驱动

2024-07-02 10:28:59

2010-04-02 08:56:00

HTML 5

2023-06-26 10:44:42

2024-09-12 17:19:43

YOLO目标检测深度学习

2018-05-08 14:25:22

Pythondlib人脸检测

2024-11-29 16:10:31

2021-07-15 08:00:00

人工智能深度学习技术

2012-03-20 16:31:13

2018-06-19 11:00:33

OpenCVPythonC++

2024-12-13 15:53:58

VLM小型视觉语言模型LLM

2010-05-13 17:52:41

MySQL语句

2017-08-02 07:36:06

大数据PythonOpenCV
点赞
收藏

51CTO技术栈公众号