视频监控技术正在向着数字化、网络化、智能化的方向发展,系统由目视解释转变为自动解释是视频监控技术的飞跃,也是安防技术发展的必然。
二十多年来,视频监控系统经历了从模拟系统(VCR)到部分数字化系统(DVR/NVR)到完全数字化系统(网络摄象机和视频服务器)三个阶段的发展演变。在这一过程中,视频监控系统与设备虽然在功能和性能上得到了极大的提高,但是仍受到了一些固有因素的限制,其中既包含人类作为监控者自身在生理上的弱点,也包含视频监控系统配置以及视频监控设备在功能上的局限性。这些限制因素使得各类视频监控系统或多或少的存在报警精确度差、误报和漏报现象多、报警响应时间长、录像数据分析困难等缺陷,从而导致整个系统在安全性和实用性的降低。
近年来,随着网络带宽、计算机处理能力和存储容量的迅速提高,以及各种视频信息处理技术的出现,全程数字化、网络化的视频监控系统优势愈加明显,其高度的开放性、集成性和灵活性为视频监控系统和设备的整体性能提升创造了必要条件,同时也为整个安防产业的发展提供了更加广阔的发展空间,崭新的应用模式和市场机遇不断涌现,而智能视频监控则是网络化视频监控领域最前沿的应用模式之一。
智能视频的概念
智能视频的概念源自计算机视觉技术。计算机视觉技术是人工智能研究的分支之一,它能够在图象及图象描述之间建立映射关系,从而使计算机能够通过数字图象处理和分析来理解视频画面中的内容。视频监控中所提到的智能视频技术主要指的是:“自动地分析和抽取视频源中的关键信息。”智能视频技术借助计算机强大的数据处理功能,对视频画面中的海量数据进行高速分析,过滤掉用户不关心的信息,仅仅为监控者提供有用的关键信息。
智能视频监控以数字化、网络化视频监控为基础,但又有别于一般的网络化视频监控,它是一种更高端的视频监控应用。智能视频监控系统能够识别不同的物体,发现监控画面中的异常情况,并能以最快和最佳的方式发出警报和提供有用信息,从而能够更加有效地协助安全人员处理危机,并最大限度地减低误报和漏报现象。在世界反恐斗争日趋严峻的今天,智能视频监控显然能够成为应对恐怖注意袭击和处理突发事件的有力辅助工具。此外,智能视频监控还可以应用在交通管理、客户行为分析、客户服务等多种非安全相关的场景,以提高用户的投资回报。
图象变化检测基本原理
目前,绝大多数智能监控系统都采用背景减除技术来进行监控图象变化的检测(遗留物体、运动目标、失盗物体等都可被看作是图象变化)。其主要思想是将每个输入视频帧和一张背景图象进行比较,如果同位置的象素特征、象素区域或其它特征内在一定程度的差别,则新视频帧中这些位置象素点或象素区域则被认为是发生了变化的区域,根据所要检测目的的不同由不同判断准则提取这些变化区域,从而构成前景目标区域。若对这些前景点做进一步处理,即可得到目标位置、大小、形状等信息,从而进行目标跟踪和视频内容理解。背景减除法适用于摄象机静止的情况,它能够完整分割出运动对象,却容易受光线、天气等光照条件的变化,前景目标短暂或长久的闯入和移出,背景自身的运动(如树叶摇动)等因素的影响。尽管如此,在实时监控系统中背景减除法仍是运动目标检测的最常用方法。
一般的图象变化检测的过程主要包含图象预处理、背景建模、前景检测和变化区域后处理四个步骤。
1、预处理是对视频数据进行简单的空间或时间滤波,以消除摄像机噪声和雨雪等瞬时环境噪声,或降低帧大小和帧率。如果发生摄像机抖动或在多摄像机的情况下,则在背景建模前,还有必要对获取的连续帧或由不同摄像机获取的视频帧进行图象融合。
2、背景建模就是通过构建某种模型得到一幅图象来表示背景。虽然背景减除技术原理简单,但背景图象的构建和更新方法却至关重要,因为其结果将直接影响背景模型对场景变化和前景目标粒度的适应性。背景建模方法是背景减除方法的核心。对于固定摄像机捕捉的监控视频,最简单的背景选择方法是采用固定的某帧图象作为背景,但由于这样不能适应光照变化和背景扰动等影响,从而不能用于长期和稍微复杂的场景。必须开发一个鲁棒的背景模型来使得背景能随时间重建和更新,以减少场景变化对图象变化检测的影响。目前主要的背景建模方法有:时间差分法(思想是利用视频序列中当前两帧与其前景某帧的差分来提取出图象中的变化区域)、中值滤波法(思想是先建立一个视频流滑动窗来缓存数张视频帧,然后把缓存中所有视频帧同位置象素的均值或中值作为背景值进行处理)、W4方法(通过观测当前临近时间段内的视频序列来记录时间段内同位置象素的最大亮度值、最小亮度值以及相邻两帧间亮度差异最大值,同时用这三个值来构成判断准则来区分背景和前景)、线性预测法(根据象素的历史值,利用线性滤波器来预测下一时刻的背景图象,以实现背景图象的自适应更新,不过由于每一帧都要根据采样协方差来估计滤波器的预测系数,因而使得该技术很难用到实时系统中)、非参数模型方法(将最近的数帧视频中的同象素点的亮度值利用高斯内核非参数化地对该位置象素的概率密度进行估计。如果当前帧亮度值的差异度量值小于预设门限,则认为它是前景象素。这种方法对场景变化的适应速度快,不仅能够处理背景中有光照变化的情况。另外,还能处理摇动的树等多模态分布情况,但是缺点是耗时,因为每个象素都要进行一个模型估计运算)、混合高斯模型法(室外环境常有摇动的树等物体,使得背景并不完全静止,因此某一个象素可能在这一帧里是天空,另一帧里是树枝,下一帧里又是树叶,每一种状态下的象素值是不同的,因此可以对这些多模态情形使用多个高斯模型来混合建模,以适应多种背景变化。这种方法在背景建模的过程中由于允许运动目标存在,因此非常适合室外有光线和天气变化的小而速度快的运动目标的检测。缺点是计算非常复杂,它不仅要对背景建模,还要对前景建模,计算复杂度与高斯模型的个数成正比,而且模型参数比较难调,另外,它对大而慢的目标检测效果也不好,还会将纹理少或对比度低的目标当作背景,还有一个致命缺点是对全局亮度的突然变化非常敏感,会将整个视频帧看作是前景)、隐马尔可夫模型法(为了解决电灯开关或晴空和乌云交替等光照突变带来的背景象素大范围变化问题,可以用隐马尔可夫模型来进行建模,它可以学习解决一些简单场景)、本征方法(思想是运用特征向量分解来对连续的数帧视频进行主成分分析,以减少空间维度,并计算背景的本征矩阵,然后用新视频图象与其由这个本征矩阵得到的重构图象的差值图象来衡量是否前景象素。这种方法比高斯混合模型方法效率高,速度快。但是该方法需要利用最初的几十帧视频来初始化背景,因此资源耗费大,且自适应能力差,对于光照变化等情况不能适应)、基于均值替换的背景估计法(需要较大内存来存储历史视频,而且迭代计算速度很慢,很难应用在实际系统中)、码本方法(通过长时间地观察视频序列,并利用量化和聚类技术来构建背景模型。该方法对每个象素都建立包含一个或多个码字的码本,其原理是先根据每个象素点的亮度和颜色在连续采样过程中的失真变化程度来生成码字,然后将代表象素的码字聚类成码本,并以不同的码字编号加以区别。在进行变化检测时,象素颜色与某个码字的失真度小,而且象素的亮度在该码字的亮度范围内的点被认为是没有发生变化的点,否则就被认为了发生了变化的点)。
3、前景检测。也就是阈值分割。指的是利用当前视频帧与背景模型的差异来检测出发生变化区域的候选象素。例如,对于目标跟踪情况,如果两幅图象的差值大于一定阈值,则判定该象素为组成前景变化区域的象素(这里,不同的背景建模方法使用不同的阈值分割规则,不同的检测目的所对应的前景点判断准则也有所不同)。
4、后处理就是去除不属于真实目标的参考象素,以便得到真正的前景目标,要考虑的问题主要有以下几个方面:(1)消除由树叶摇动等产生的小而假的前景象素。(2)消除因背景模型不能及时适应前景变化速度而出现的“重影”。(3)消除不感兴趣的变化象素,以解决目标的阴影和遮挡等问题。
基于背景减除技术的智能监控系统可以实现运动目标检测、遗留物体检测、失盗物体检测、徘徊物体检测等多种目标的检测,并在图象上框出可疑目标区域并发出报警信号提示工作人员注意,同时对检测结果按照时间顺序自动记录。
下面是一些结果图象示例:


遗留物检测


运动目标检测


失盗物检测
智能视频的优势
智能视频监控以普通的网络视频监控为基础,除了具备广为人知的网络视频监控的优势外,智能视频监控系统还能为用户带来更大收益。它具有以下的优势:1、24小时全天候可靠监控:彻底改变以往完全由安全工作人员对监控画面进行监视和分析的模式,通过嵌入在前端设备(网络摄像机或视频服务器)中的智能视频模块对所监控的画面进行不间断分析。2、大大提高报警精确度:前端设备(网络摄像机或视频服务器)集成强大的图象处理能力,并运行高级智能算法,使用户可以更加精确地定义安全威胁的特征,有效降低误报和漏报现象,减少无用数据量。3、大大提高响应速度:识别可疑活动(例如有人在公共场所遗留了可疑物体,或者有人在敏感区域停留的时间过长),在安全威胁发生之前就能够提示安全人员关注监控画面以提前做好准备,还可以使用户更加确切地定义在特定的安全威胁时应当采取的动作,并由监控系统本身来确保危机处理步骤能够按照预定的计划精确执行,有效防止在混乱中由于人为因素而造成的延误。4、有效扩展视频资源的用途:将视频资源应用到非安全领域,如利用商场大堂的监控系统自动识别VIP用户,并通知客服人员及时作好服务工作;发现人群中有人不慎跌倒,及时通知附近的商场工作人员提供协助。此外,智能视频系统还可以进行流量分析,从而运用到智能交通系统或者商业用途当中。
智能视频的主要潜在应用
智能视频可以针对各种不同应用环境的特点开发出不同类型的应用技术,提升产品的适应力。它的应用大体上可以分为安全相关应用和非安全相关应用两大类。安全类相关的应用是目前市场上存在的主要智能视频应用。特别是在911恐怖袭击、马德里爆炸案以及伦敦爆炸案发生之后,市场上对于此类应用的需求不断增长。这些应用主要是协助政府或其它机构的安全部门提高室外大地域公共环境的安全防护。此类应用主要包括:高级视频移动目标检测、目标追踪、人脸识别、车辆识别和非法滞留物品或人等。
除了安全相关类应用之外,智能视频还可以应用到一些非安全相关类的应用当中。这些应用主要面向管理、零售、服务等行业,可以被看作管理和服务的辅助工具,用以提高服务水平和营业额。此类应用主要包括:交通流量控制、人群统计、人群控制、环境监控等方面。
国内外智能视频市场概况与展望
从市场的需求情况来看,随着反恐形势的不断严峻,智能视频监控系统正在越来越多的引起人们的关注,需求量处于不断上升的过程当中。从总体上看,国外的智能视频应用市场正在从“概念验证”阶段向“规模应用”阶段转化,智能视频已经慢慢开始形成为一个产业。
在智能视频应用的概念模型出现后不久,一些国外的公司就已经开始着手研发相关的软硬件产品。例如,网络视频市场的全球领导厂商瑞典Axis网络通讯有限公司就已经推出其智能视频产品,其中包括AXIS242SIV视频服务器和AXIS IVM 120人数统计智能视频应用模块。AXIS IVM 120人数统计智能视频应用模块可以使视频监控设备通过对监控画面的分析自动为用户计算进/出特定区域的人数,能够有效帮助服务、零售等行业的管理者分析营业情况或提高服务质量。Axis还计划在不久的将来推出更多智能视频应用模块,包括车牌号识别、非法滞留等等。2005年索尼公司推出三款智能网络摄像机,它们除技术指标先进外,还具有自动甄别在监控区域内的入侵物体和可疑危险物品、隐私区遮掩、活动检测等功能。
与国外相比,国内的智能视频市场还有很大的差距,目前基本上还处于空白状态。一般在监控系统中提到的“智能视频监控”实际上还停留在普通的网络视频监控(IP监控、数字化监控)的概念上。但随着市场上开始出现了与国外类似的智能视频应用需求,已经有些国内厂商开始着手引进国外知名厂商的智能视频软硬件产品和技术,计划采用OEM的形式在国内推出。而我公司朗驰欣创则主要致力于具有自主知识产权的视频技术的研究和产品开发,预计在2007年下半年推出我们的产品。
据IMS Research预计,内容分析算法将逐渐嵌入到前端监控设备,例如摄像机、视频服务器和存储器上,智能设备能判定什么时候它所感兴趣的内容会发生,并且只有在那时才传输视频,从而有效节省带宽,因此极大地提高了可用网络带宽。此外,IT基础设施制造商希望能在他们的产品中嵌入视频分析软件,从而提高视频网络的性能。到2009年,嵌入式设备的应用预计将占据视频分析软件市场的60%左右。据IMS Research公司预测,由于智能化视频监控的巨大需求,视频内容分析软件的全球市场将在未来5年内急剧增长,从2004年代6770万美元,增加到2009年的8.39亿美元,其增长速度甚至会远远超过安防行业的增长速度。
小结
智能化、数字化、网络化是视频监控发展的必然趋势,智能视频监控的出现正是这一趋势的直接体现。智能视频监控设备比普通的网络视频监控设备具备更加强大的图象处理能力和智能因素,因此可以为用户提供更多高级的视频分析功能,它可以极大地提高视频监控系统的能力,并使视频资源发挥更大的作用。与普通的视频监控系统比较,智能视频监控系统及设备的硬件成本增加不多,成本的增加主要体现在软件成本的增加。而每个系统软件成本随着推广数量的增长会迅速下降,智能视频监控系统的性价比将凸现。市场的巨大需求、技术的进步与成熟,都将推动智能视频监控系统迅速崛起。
|