译者 | 朱先忠
审校 | 孙淑娟
概述
由于Python编程语言面临多个开源库可用;因此,选择Python语言进行运动检测开发是很容易的。目前,运动检测已经有许多的商业应用。例如,它可以用于在线考试的监考,也可以用于商店、银行等领域的安全目的。
Python编程语言是一种开源的且支持库极其丰富的语言,如今基于此语言已经为用户开发了大量的应用程序,并拥有大量用户。正因为如此,Python语言在市场上快速增长。Python语言的优点不胜枚举,不仅是因为它的语法简单、易于发现错误,而且其非常迅速的调试过程使其对用户更加友好。
为什么建议您学习Python呢?我们可以使用下图来简单说明:
Python于1991年设计,由Python软件基金会开发。如今已经发布了许多版本。其中,Python2和Python3最为著名。目前,Python3已经被广泛使用,用户数量也在快速增长。在本文这个项目中,我们将使用Python3作为开发语言。
什么是运动检测?
根据物理学原理,当一个物体静止不动且没有速度时,它就被认为处于静止状态;而恰恰相反的是,当一物体没有完全静止且在某个方向(无论是左右、前后或上下)上有一定的运动或速度时,它都被认为处于运动状态。在本文中,我们将尝试检测出物体的运行情况。
目前,运动检测在现实生活中已经存在大量实现或应用,这充分证明其巨大的应用价值。其中,使用网络摄像头(我们将在本文中实现)作为安全警卫进行在线考试监考等是最典型的应用。
在本文中,我们将尝试实现一个脚本。通过该脚本,我们将使用台式机或笔记本电脑上安装的网络摄像头实现对物体运动的检测。我们的想法是,我们将拍摄两帧视频,并试图找出它们之间的差异。如果两帧之间存在某种差异,那么很明显,相机前面的物体存在某种移动,这就产生了差异。
主要的参考库
在着手实现代码之前,让我们先看看我们将在代码中使用的一些模块或库,这些模块或库用于操作网络摄像头进行运动检测。正如我们所讨论的,这些开源库对于Python声誉的传播起着重要作用。让我们看看本文示例项目中需要的开源库:
- OpenCV
- Pandas
上述两个库OpenCV和Pandas都是纯粹基于Python的免费开源库,我们将通过Python语言的Python3版本来使用它们。
1.OpenCV
OpenCV是一个非常著名的开源库,可以与许多编程语言(如C++、Python等)一起使用,专门应用于处理图像和视频程序开发。通过与Python的开源库Pandas或者NumPy库集成应用,我们可以充分挖掘出OpenCV的功能。
2.Pandas
Pandas是一个开放源码的Python库,为数据分析提供了丰富的内置工具;因此,在数据科学和数据分析领域得到了广泛的应用。在Pandas中提供了数据结构形式DataFrame数据帧,这种结构对于将表格数据操作和存储到二维数据结构中提供了极方便的支持。
上述两个模块都不是Python内置的,我们必须在使用前先安装它们。除此之外,我们还将在项目中使用另外两个模块。
- Python日期时间(DateTime)模块
- Python时间(Time)模块
这两个模块都内置在Python中,以后无需安装。这些模块分别用来处理与日期和时间相关的功能。
代码实现
到目前为止,我们已经看到了我们将在代码中使用的库。接下来,让我们从视频只是许多静态图像或帧的组合这一假定开始,然后使用所有这些帧的组合来创建一个视频。
导入所需的库
在本节中,我们将首先导入所有库,如Pandas和OpenCV。然后,我们从DateTime模块导入time和DateTime函数。
#导入Pandas库
import Pandas as panda
# 导入OpenCV库
import cv2
#导入时间模块
import time
#从datetime 模块导入datetime 函数
from datetime import datetime
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
初始化数据变量
在本节中,我们要初始化一些变量,并将在代码中进一步使用这些变量。首先,我们将初始状态定义为“None”,然后通过另一个变量motionTrackList来存储跟踪的运动。
此外,我们还定义了一个列表“motionTime”,用于存储发现运动的时间,并使用Panda的模块初始化数据帧列表。
# 对于初始帧,以变量initialState的形式将初始状态指定为None
initialState = None
# 帧中检测到任何运动时存储所有轨迹的列表
motionTrackList= [ None, None ]
# 一个新的“时间”列表,用于存储检测到移动时的时间
motionTime = []
# 使用带有初始列和最终列的Panda库初始化数据帧变量“DataFrame”
dataFrame = panda.DataFrame(columns = ["Initial", "Final"])
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
关键帧捕获过程
在本节中,我们将实现本文示例项目中最关键的运动检测步骤。下面,让我们分步骤进行解说:
- 首先,我们将开始使用cv2模块捕获视频,并将其存储在视频变量中。
- 然后,我们将使用无限while循环从视频中捕获每一帧。
- 接下来,将使用read()方法读取每个帧,并将它们存储到各自的变量中。
- 我们定义了一个变量var_motion,并将其初始化为零。
- 我们使用cv2函数cvtColor和GaussianBlur创建另外两个变量grayImage和grayFrame,以找到运动中的变化。
- 如果我们的initialState为None,则我们将当前grayFrame指定为initialState;否则,使用“continue”关键字跳过后面代码的执行。
- 在后面代码中,我们计算在当前迭代中创建的初始帧和灰度帧grayscale之间的差异。
- 然后,我们将使用cv2阈值和dilate函数突出显示初始帧和当前帧之间的变化。
- 我们将从当前图像或帧中的运动对象中找到轮廓,并通过使用rectangle函数在其周围创建绿色边界来指示运动对象。
- 在此之后,我们将把当前检测到的元素添加到列表变量motionTrackList。
- 到目前为止,我们已经通过使用imshow方法显示出如灰度和原始帧等所有的关键帧。
- 此外,我们还使用cv2模块的witkey()方法来结束进程。程序中,我们选择使用按下键盘上的'm'键来结束我们的进程。
# 使用cv2模块启动网络摄像头以捕获视频
video = cv2.VideoCapture(0)
# 使用无限循环从视频中捕获帧
while True:
# 使用read功能从视频中读取每个图像或帧
check, cur_frame = video.read()
#将'motion'变量定义为等于零的初始帧
var_motion = 0
# 从彩色图像创建灰色帧
gray_image = cv2.cvtColor(cur_frame, cv2.COLOR_BGR2GRAY)
# 从灰度图像中使用GaussianBlur函数找到变化部分
gray_frame = cv2.GaussianBlur(gray_image, (21, 21), 0)
# 在第一次迭代时进行条件检查
# 如果为None,则把grayFrame赋值给变量initalState
if initialState is None:
initialState = gray_frame
continue
# 计算静态(或初始)帧与我们创建的灰色帧之间的差异
differ_frame = cv2.absdiff(initialState, gray_frame)
# 静态或初始背景与当前灰色帧之间的变化将突出显示
thresh_frame = cv2.threshold(differ_frame, 30, 255, cv2.THRESH_BINARY)[1]
thresh_frame = cv2.dilate(thresh_frame, None, iterations = 2)
#对于帧中的移动对象,查找轮廓
cont,_ = cv2.findContours(thresh_frame.copy(),
cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
for cur in cont:
if cv2.contourArea(cur) < 10000:
continue
var_motion = 1
(cur_x, cur_y,cur_w, cur_h) = cv2.boundingRect(cur)
# 在移动对象周围创建一个绿色矩形
cv2.rectangle(cur_frame, (cur_x, cur_y), (cur_x + cur_w, cur_y + cur_h), (0, 255, 0), 3)
# 从帧中添加运动状态
motionTrackList.append(var_motion)
motionTrackList = motionTrackList[-2:]
# 添加运动的开始时间
if motionTrackList[-1] == 1 and motionTrackList[-2] == 0:
motionTime.append(datetime.now())
# 添加运动的结束时间
if motionTrackList[-1] == 0 and motionTrackList[-2] == 1:
motionTime.append(datetime.now())
# 在显示捕获图像的灰度级中
cv2.imshow("The image captured in the Gray Frame is shown below: ", gray_frame)
# 显示初始静态帧和当前帧之间的差异
cv2.imshow("Difference between the inital static frame and the current frame: ", differ_frame)
# 在框架屏幕上显示视频中的黑白图像
cv2.imshow("Threshold Frame created from the PC or Laptop Webcam is: ", thresh_frame)
#通过彩色框显示物体的轮廓
cv2.imshow("From the PC or Laptop webcam, this is one example of the Colour Frame:", cur_frame)
# 创建处于等待状态的键盘按键
wait_key = cv2.waitKey(1)
# 按下'm'键时,结束整个进程执行
if wait_key == ord('m'):
# 当屏幕上有东西移动时,将运动变量值添加到motiontime列表中
if var_motion == 1:
motionTime.append(datetime.now())
break
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.
- 26.
- 27.
- 28.
- 29.
- 30.
- 31.
- 32.
- 33.
- 34.
- 35.
- 36.
- 37.
- 38.
- 39.
- 40.
- 41.
- 42.
- 43.
- 44.
- 45.
- 46.
- 47.
- 48.
- 49.
- 50.
- 51.
- 52.
- 53.
- 54.
- 55.
- 56.
- 57.
- 58.
- 59.
- 60.
- 61.
- 62.
- 63.
- 64.
- 65.
- 66.
- 67.
- 68.
- 69.
- 70.
- 71.
- 72.
- 73.
- 74.
- 75.
- 76.
- 77.
- 78.
- 79.
- 80.
- 81.
- 82.
- 83.
- 84.
- 85.
- 86.
- 87.
- 88.
- 89.
- 90.
- 91.
- 92.
- 93.
- 94.
- 95.
- 96.
- 97.
- 98.
- 99.
- 100.
- 101.
- 102.
- 103.
- 104.
- 105.
- 106.
- 107.
- 108.
- 109.
- 110.
- 111.
- 112.
- 113.
- 114.
- 115.
- 116.
- 117.
- 118.
- 119.
- 120.
- 121.
- 122.
- 123.
- 124.
- 125.
- 126.
- 127.
- 128.
- 129.
- 130.
- 131.
- 132.
- 133.
- 134.
- 135.
- 136.
- 137.
- 138.
- 139.
- 140.
- 141.
- 142.
- 143.
- 144.
- 145.
- 146.
- 147.
- 148.
- 149.
代码收尾工作
在结束循环体执行后,我们将从dataFrame和motionTime列表中添加数据到CSV文件中,最后关闭视频。这一部分代码的实现如下所示:
# 最后,我们在数据帧中添加运动时间
for a in range(0, len(motionTime), 2):
dataFrame = dataFrame.append({"Initial" : time[a], "Final" : motionTime[a + 1]}, ignore_index = True)
# 创建CSV文件记录下所有运动信息
dataFrame.to_csv("EachMovement.csv")
# 释放视频内存
video.release()
#现在,在openCV的帮助下关闭或销毁所有打开的窗口
cv2.destroyAllWindows()
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
至此,我们已经成功地创建完所有代码。现在,让我们再次归纳一下整个过程。
首先,我们使用设备的网络摄像头捕捉视频,然后将输入视频的初始帧作为参考,并不时检查下一帧。如果发现与第一帧不同的帧,则说明存在运动。该信息将被标记在绿色矩形中。
完整的代码
现在,让我们把上面所有代码片断连接到一起,如下所示:
#导入Pandas库
import Pandas as panda
# 导入OpenCV库
import cv2
#导入时间模块
import time
#从datetime 模块导入datetime 函数
from datetime import datetime
# 对于初始帧,以变量initialState的形式将初始状态指定为None
initialState = None
# 帧中检测到任何运动时存储所有轨迹的列表
motionTrackList= [ None, None ]
# 一个新的“时间”列表,用于存储检测到移动时的时间
motionTime = []
# 使用带有初始列和最终列的Panda库初始化数据帧变量“DataFrame”
dataFrame = panda.DataFrame(columns = ["Initial", "Final"])
# 使用cv2模块启动网络摄像头以捕获视频
video = cv2.VideoCapture(0)
# 使用无限循环从视频中捕获帧
while True:
# 使用read功能从视频中读取每个图像或帧
check, cur_frame = video.read()
#将'motion'变量定义为等于零的初始帧
var_motion = 0
# 从彩色图像创建灰色帧
gray_image = cv2.cvtColor(cur_frame, cv2.COLOR_BGR2GRAY)
# 从灰度图像中使用GaussianBlur函数找到变化部分
gray_frame = cv2.GaussianBlur(gray_image, (21, 21), 0)
# 在第一次迭代时进行条件检查
# 如果为None,则把grayFrame赋值给变量initalState
if initialState is None:
initialState = gray_frame
continue
# 计算静态(或初始)帧与我们创建的灰色帧之间的差异
differ_frame = cv2.absdiff(initialState, gray_frame)
# 静态或初始背景与当前灰色帧之间的变化将突出显示
thresh_frame = cv2.threshold(differ_frame, 30, 255, cv2.THRESH_BINARY)[1]
thresh_frame = cv2.dilate(thresh_frame, None, iterations = 2)
#对于帧中的移动对象,查找轮廓
cont,_ = cv2.findContours(thresh_frame.copy(),
cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
for cur in cont:
if cv2.contourArea(cur) < 10000:
continue
var_motion = 1
(cur_x, cur_y,cur_w, cur_h) = cv2.boundingRect(cur)
# 在移动对象周围创建一个绿色矩形
cv2.rectangle(cur_frame, (cur_x, cur_y), (cur_x + cur_w, cur_y + cur_h), (0, 255, 0), 3)
# 从帧中添加运动状态
motionTrackList.append(var_motion)
motionTrackList = motionTrackList[-2:]
# 添加运动的开始时间
if motionTrackList[-1] == 1 and motionTrackList[-2] == 0:
motionTime.append(datetime.now())
# 添加运动的结束时间
if motionTrackList[-1] == 0 and motionTrackList[-2] == 1:
motionTime.append(datetime.now())
# 在显示捕获图像的灰度级中
cv2.imshow("The image captured in the Gray Frame is shown below: ", gray_frame)
# 显示初始静态帧和当前帧之间的差异
cv2.imshow("Difference between the inital static frame and the current frame: ", differ_frame)
# 在框架屏幕上显示视频中的黑白图像
cv2.imshow("Threshold Frame created from the PC or Laptop Webcam is: ", thresh_frame)
#通过彩色框显示物体的轮廓
cv2.imshow("From the PC or Laptop webcam, this is one example of the Colour Frame:", cur_frame)
# 创建处于等待状态的键盘按键
wait_key = cv2.waitKey(1)
# 借助'm'键结束我们系统的整个进行
if wait_key == ord('m'):
# 当屏幕上有物体运行时把运动变量值添加到列表motiontime中
if var_motion == 1:
motionTime.append(datetime.now())
break
# 最后,我们在数据帧中添加运动时间
for a in range(0, len(motionTime), 2):
dataFrame = dataFrame.append({"Initial" : time[a], "Final" : motionTime[a + 1]}, ignore_index = True)
# 记录下所有运行,并创建到一个CSV文件中
dataFrame.to_csv("EachMovement.csv")
# 释放视频内存
video.release()
#现在,在openCV的帮助下关闭或销毁所有打开的窗口
cv2.destroyAllWindows()
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.
- 26.
- 27.
- 28.
- 29.
- 30.
- 31.
- 32.
- 33.
- 34.
- 35.
- 36.
- 37.
- 38.
- 39.
- 40.
- 41.
- 42.
- 43.
- 44.
- 45.
- 46.
- 47.
- 48.
- 49.
- 50.
- 51.
- 52.
- 53.
- 54.
- 55.
- 56.
- 57.
- 58.
- 59.
- 60.
- 61.
- 62.
- 63.
- 64.
- 65.
- 66.
- 67.
- 68.
- 69.
- 70.
- 71.
- 72.
- 73.
- 74.
- 75.
- 76.
- 77.
- 78.
- 79.
- 80.
- 81.
- 82.
- 83.
- 84.
- 85.
- 86.
- 87.
- 88.
- 89.
- 90.
- 91.
- 92.
- 93.
- 94.
- 95.
- 96.
- 97.
- 98.
- 99.
- 100.
- 101.
- 102.
- 103.
- 104.
- 105.
- 106.
- 107.
- 108.
- 109.
- 110.
- 111.
- 112.
- 113.
- 114.
- 115.
- 116.
- 117.
- 118.
- 119.
- 120.
- 121.
- 122.
- 123.
- 124.
- 125.
- 126.
- 127.
- 128.
- 129.
- 130.
- 131.
- 132.
- 133.
- 134.
- 135.
- 136.
- 137.
- 138.
- 139.
- 140.
- 141.
- 142.
- 143.
- 144.
- 145.
- 146.
- 147.
- 148.
- 149.
- 150.
- 151.
- 152.
- 153.
- 154.
- 155.
- 156.
- 157.
- 158.
- 159.
- 160.
- 161.
- 162.
- 163.
- 164.
- 165.
- 166.
- 167.
- 168.
- 169.
- 170.
- 171.
- 172.
- 173.
- 174.
- 175.
- 176.
- 177.
- 178.
- 179.
- 180.
- 181.
- 182.
- 183.
- 184.
- 185.
- 186.
- 187.
- 188.
运行结果
运行上述代码后得到的结果与下面看到的结果类似。
从这个动画中,我们可以看到该男子在视频中的动作已经被跟踪。因此,可以相应地看到输出结果。
然而,在这段代码中,跟踪是在移动对象周围的矩形框的帮助下完成,类似于下面动画中所示的。这里要注意的一件有趣的事情是,这段视频是一个实际的安全摄像头的镜头,已经对其进行了检测处理。
结论
- Python编程语言是一种开源的且有丰富的开源库支持的语言,目前已经为用户提供了许多现成的应用程序。
- 当一个物体静止不动且没有速度时,则认为它处于静止状态;反之,当一个对象未完全静止时,则视为它处于运动状态。
- OpenCV是一个开源库,可用于多种编程语言,通过将其与Python的Panda/NumPy库集成,我们可以充分发挥OpenCV的功能。
最后来归纳一下。本文中所介绍的运动检测的主要思想是,每个视频只是许多静态图像(称为帧)的组合,我们是通过判断帧之间的差异来实现运行检测的。
译者介绍
朱先忠,51CTO社区编辑,51CTO专家博客、讲师,潍坊一所高校计算机教师,自由编程界老兵一枚。早期专注各种微软技术(编著成ASP.NET AJX、Cocos 2d-X相关三本技术图书),近十多年投身于开源世界(熟悉流行全栈Web开发技术),了解基于OneNet/AliOS+Arduino/ESP32/树莓派等物联网开发技术与Scala+Hadoop+Spark+Flink等大数据开发技术。
原文标题:How to Perform Motion Detection Using Python,作者:Vaishnavi Amira Yada