視頻分析技術之視頻摘要
來源:中安網(wǎng) 編輯:航行150 2012-09-27 05:44:31 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內容: | |
驗證碼: |
|
隨著多媒體和計算機網(wǎng)絡技術的快速發(fā)展,多媒體基于內容的訪問、檢索和交互操作的應用越來越廣泛。視頻作為各種媒體中形式和內容最豐富的媒體類型,越來越受到用戶的青睞,然而視頻信息內容的豐富性是以視頻數(shù)據(jù)的無結構性和數(shù)據(jù)量巨大為代價的。因此,無法對視頻數(shù)據(jù)直接進行基于內容的提取,如何高效、快速的把視頻媒體中用戶感興趣的內容分析并提取出來,作為快速搜尋、過濾的重點是這些應用的技術關鍵。
何為視頻摘要,我們可以通過一個比喻來分析。眾所周知,一篇文章的摘要對這篇文章的高度概括,通過文章的摘要,我們基本可以了解全文的主要內容,我們利用文字的摘要對文獻進行初選,然后再對自己感興趣的文章進行精度。
而對于視頻的摘要,我們可以理解為對視頻的結構和內容進行分析,從原始視頻文件中提取出有意義的部分,并將它以某種方式進行組合,形成簡潔的能夠充分表現(xiàn)視頻內容的概要,是對長視頻內容的簡短總結,通常用一段靜態(tài)或者動態(tài)的圖像序列來表示,并對原始信息予以保留。
由上述分析,視頻摘要的理論基礎,就是從時域、空域兩方面去除冗余信息,并結合視頻索引技術。提供給人們一個概括原始視頻主要內容,但長度卻比原始視頻短得多的較為精煉的關鍵信息。
那么,基于此理論,我們來討論一下視頻摘要的生成過程。
在此之前,我們先了解一下幾個概念。視頻,是多幅靜止圖片(圖片幀)與連續(xù)的音頻信息在時間軸上同步運動的混合媒體,多幀圖片隨時間變化而產(chǎn)生運動感,因此視頻也被稱為運動圖像。而視頻關鍵幀,是指在視頻文件的一系列圖像幀序列中,具有很強的代表性,能夠比較準確、全面的反映一個鏡頭甚至整個視頻內容的圖片幀。
視頻摘要技術,應該主要包括視頻內容提取、摘要合成、摘要表現(xiàn)等三大技術要點。
任何視頻摘要的算法,都應遵循“先分后合”的原則,要進行視頻內容的理解和分析,必須首先將視頻切分成合理的基本單位,這些基本單位包括場景、鏡頭、關鍵幀、元素、軌跡等。再采用模式識別或視頻結構探測的方法,獲取能夠被計算機直接處理?;蚰軌虮蝗说母杏^直接感覺到的信息。這就是對視頻內容的提取過程。
摘要的合成,應該能夠與視頻索引技術等相結合,通過播放速度、軌跡密度等參數(shù),將重要的元素組合在一起,進行視頻片段的重鑄,形成某種形式的視頻流。
摘要表現(xiàn),是基于內容的視頻檢索和分析,考慮符合人類的感觀和便于瀏覽的原則。其瀏覽方式包括視頻總體摘要和單個事件軌跡摘要等。
對于視頻摘要分析,它的最終目標就是讓計算機視覺達到或接近人的視覺水平,由于視頻內容的復雜性和人類理解的多樣性,因此生成完整、準確、令人滿意的視頻摘要比較困難,所以目前計算機的視覺水平與人的視覺能力相差還有一段距離。但總體來說,視頻摘要正在向更高級的方向發(fā)展,具有廣闊的研究空間和極大的應用價值
本文作者:
深圳市華尊科技有限公司
聯(lián)系電話:0755-22194696
聯(lián)系人:周小姐
公司地址:深圳市羅湖區(qū)寶安南路2014號振業(yè)大廈A座17A-B
評論comment