視頻分析技術之視頻摘要

來源：中安網(wǎng) 編輯：航行150 2012-09-27 05:44:31 加入收藏咨詢

咨詢

所在單位:	*
姓名:	*
手機:	*
職位:
郵箱:	*
其他聯(lián)系方式:
咨詢內容:
驗證碼:	不能為空驗證碼錯誤

確定

視頻摘要的理論基礎，就是從時域、空域兩方面去除冗余信息，并結合視頻索引技術。提供給人們一個概括原始視頻主要內容，但長度卻比原始視頻短得多的較為精煉的關鍵信息。

　　隨著多媒體和計算機網(wǎng)絡技術的快速發(fā)展,多媒體基于內容的訪問、檢索和交互操作的應用越來越廣泛。視頻作為各種媒體中形式和內容最豐富的媒體類型,越來越受到用戶的青睞,然而視頻信息內容的豐富性是以視頻數(shù)據(jù)的無結構性和數(shù)據(jù)量巨大為代價的。因此,無法對視頻數(shù)據(jù)直接進行基于內容的提取，如何高效、快速的把視頻媒體中用戶感興趣的內容分析并提取出來,作為快速搜尋、過濾的重點是這些應用的技術關鍵。

　　何為視頻摘要，我們可以通過一個比喻來分析。眾所周知，一篇文章的摘要對這篇文章的高度概括，通過文章的摘要，我們基本可以了解全文的主要內容，我們利用文字的摘要對文獻進行初選，然后再對自己感興趣的文章進行精度。

　　而對于視頻的摘要，我們可以理解為對視頻的結構和內容進行分析，從原始視頻文件中提取出有意義的部分，并將它以某種方式進行組合，形成簡潔的能夠充分表現(xiàn)視頻內容的概要，是對長視頻內容的簡短總結，通常用一段靜態(tài)或者動態(tài)的圖像序列來表示，并對原始信息予以保留。

　　由上述分析，視頻摘要的理論基礎，就是從時域、空域兩方面去除冗余信息，并結合視頻索引技術。提供給人們一個概括原始視頻主要內容，但長度卻比原始視頻短得多的較為精煉的關鍵信息。

　　那么，基于此理論，我們來討論一下視頻摘要的生成過程。

　　在此之前，我們先了解一下幾個概念。視頻，是多幅靜止圖片(圖片幀)與連續(xù)的音頻信息在時間軸上同步運動的混合媒體，多幀圖片隨時間變化而產(chǎn)生運動感，因此視頻也被稱為運動圖像。而視頻關鍵幀，是指在視頻文件的一系列圖像幀序列中，具有很強的代表性，能夠比較準確、全面的反映一個鏡頭甚至整個視頻內容的圖片幀。

　　視頻摘要技術，應該主要包括視頻內容提取、摘要合成、摘要表現(xiàn)等三大技術要點。

　　任何視頻摘要的算法，都應遵循“先分后合”的原則，要進行視頻內容的理解和分析，必須首先將視頻切分成合理的基本單位，這些基本單位包括場景、鏡頭、關鍵幀、元素、軌跡等。再采用模式識別或視頻結構探測的方法，獲取能夠被計算機直接處理?；蚰軌虮蝗说母杏^直接感覺到的信息。這就是對視頻內容的提取過程。

　　摘要的合成，應該能夠與視頻索引技術等相結合，通過播放速度、軌跡密度等參數(shù)，將重要的元素組合在一起，進行視頻片段的重鑄，形成某種形式的視頻流。

　　摘要表現(xiàn)，是基于內容的視頻檢索和分析，考慮符合人類的感觀和便于瀏覽的原則。其瀏覽方式包括視頻總體摘要和單個事件軌跡摘要等。

　　對于視頻摘要分析，它的最終目標就是讓計算機視覺達到或接近人的視覺水平，由于視頻內容的復雜性和人類理解的多樣性，因此生成完整、準確、令人滿意的視頻摘要比較困難，所以目前計算機的視覺水平與人的視覺能力相差還有一段距離。但總體來說，視頻摘要正在向更高級的方向發(fā)展，具有廣闊的研究空間和極大的應用價值

本文作者：

　　深圳市華尊科技有限公司

　　聯(lián)系電話：0755-22194696

　　聯(lián)系人：周小姐

　　公司地址：深圳市羅湖區(qū)寶安南路2014號振業(yè)大廈A座17A-B

免責聲明：本文來源于中安網(wǎng)，本文僅代表作者個人觀點，本站不作任何保證和承諾，若有任何疑問，請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉載,轉載請注明來源)