聲像檔案是一種特殊類型的檔案,是人們保存起來的擁有重要價值的記錄政治、經濟、文化、教育等相關工作的圖片、影像、錄音等資料,它能夠補充文字檔案信息中缺失的直觀性和形象性。在電視臺檔案體系之中,聲像檔案與電視節目相伴而生,是指電視臺在新聞采訪、社會調查、重大事件和重要人物報道過程中產生的具有重要價值的聲像資料,經過整理后進行歸檔儲存所形成的檔案。
對電視臺而言,融媒體是一種把電視與互聯網優勢互為整合、互為利用,使其功能、手段、價值得以全面提升的一種運作模式,其本質是互聯網大數據時代傳統媒體的自我革新,是在信息技術支撐下展開的媒體內容、傳播路徑、媒介終端的有機整合。融媒體時代,電視臺節目借助網站、App、微信、短視頻等新媒體渠道開展全介質跨平臺的互動與傳播,各類生產要素全部數字化,內容來源多元化,傳播渠道多樣化,節目類型異構化,產生了海量音視頻資源需要歸檔,這些資源不僅要能夠滿足電視臺準確快速查詢交換的需求,還要能支撐生產業務再次利用。這一方面給傳統聲像檔案管理帶來巨大挑戰,另一方面也意味著空前的機遇,電視臺聲像檔案比以往任何時候都更為廣泛、全面、豐富、及時地記錄了人類文明與社會演進的歷程,也比以往任何時候更加容易實現跨媒介、跨形態的傳播與增值。因此,電視臺聲像檔案的管理與利用對融媒體業務支撐、對實現其社會文化價值起著非常重要的作用。
面臨的挑戰
融媒體時代,電視臺節目從素材采編、加工制作到分發傳播的生產過程全部數字化,電視臺聲像檔案歸檔的對象也由磁帶、光盤、硬盤等介質或將其數字化后的電子文件演變為海量的原生電子數據,具有典型的大數據“5V”特征:(1)數據量大(Volume)。融媒體采編的節目素材來源渠道非常廣泛,制播產生多個節目版本多渠道傳播,文件和數據交換堪稱海量,采集和歸檔需要極大的計算和存儲資源。(2)多樣性(Variety)。聲像檔案多為音視頻等非結構化數據,素材來源以及傳播渠道、使用用途的不同導致其格式、尺寸、內容、版本呈現多樣化的特點。(3)高速性(Velocity)。聲像檔案體量增長速度快,實現有效的利用也必然要求其處理、檢索和提取快速化。(4)準確性(Veracity)。一方面要求檔案內容的真實準確,另一方面要求能夠從海量數據中準確檢索到興趣信息。(5)價值性(Value)。融媒體時代,聲像檔案除發揮其作為檔案本身的價值外,還可直接支撐生產業務或進行社會化傳播,使其價值得到充分發掘。
電視臺向融媒體轉型,其業務模式、工作方式的改變,促使其聲像檔案呈現出新的特點,現有的聲像案“MIS系統+介質/文件”的管理與利用模式不僅難以滿足最基本的歸檔查檔需求,更不能滿足反哺業務、促進社會文化建設的發展需求,可以說是面臨空前的挑戰。
1. 海量異構數據難以實時歸檔和安全存儲
融媒體時代,多格式的素材、節目及其附屬信息無時無刻不在產生,現有的先生產后歸檔的離線異步方式已與時代脫節。歸檔對象由磁帶、光盤、磁盤等載體或數字化后的電子文件演變為全流程異構原生電子數據。海量電子數據如何存儲成為需要考慮的關鍵問題,磁盤存儲采購、運行成本高昂,而磁帶、光盤等離線存儲方式,需要人為干預,讀取速度慢,調取利用困難;電子化檔案安全也成為不可忽視的問題,檔案系統的網絡安全、檔案文件的數據安全、檔案介質的物理安全,都面臨嚴峻挑戰。
2. 非結構化數據難以實現精準檢索
海量音視頻、圖像等非結構化數據無法精準檢索,導致查詢利用困難。文本、網頁等結構化、半結構化數據的檢索相對是比較容易的,而圖像、視頻、音頻等非結構化數據現有的檢索方式則是采用人工歸納部分信息,重新組織建立索引,使其結構化的方式以實現檢索,面對海量的融媒體非結構化數據,通過人工索引的方式實現精準檢索定位成為不可能完成的任務。
3. 現行交換利用機制難以滿足業務需求
檔案業務與生產業務聯系不緊密,相對獨立的規劃、建設、管理運行模式既不能快速歸檔也難以反哺業務;以查閱為主的服務模式不能適應新形勢下聲像檔案自身開發利用、服務社會文化的發展需求。檔案工作與制播生產、共享發布等業務系統之間缺少有效的數據交換與利用機制,守著“金庫”卻無法實現價值變現。
創新思考
融媒體時代對聲像檔案的影響極為深刻,檔案信息的生成、發布、傳播、利用過程都深深地打上了融媒體的烙印。而與媒體融合的快速推進、蓬勃發展相比,電視臺聲像檔案的存儲平臺、交換機制、技術平臺都較為落后,現有的管理運行模式無法適應融媒體時代聲像檔案的新特點,也無法滿足其管理、利用和事業發展的需求。面對新的形勢,必須要從“頂層設計”角度規劃電視臺聲像檔案管理運行模式,打破生產與歸檔利用之間的壁壘,實現聲像檔案與融媒體業務在管理體系、業務流程、信息構架上的統籌規劃,才能最終達到“實時歸檔、精準查詢、反哺業務、服務社會”的應用目標。
基于以上分析,筆者針對融媒體時代現有聲像檔案運行中面臨的挑戰和存在的問題,從存儲平臺架構、智能語義檢索以及交換利用機制3個方面提出一些新思路,以期為融媒體背景下電視臺聲像檔案管理與利用的改革與探索提供有益參考。
1. 升級信息平臺,重構分區分層存儲架構
針對海量多源異構聲像檔案的實時歸檔和交換問題,同步考慮總擁有成本(Total Cost of Ownership, TCO)以及數據安全,提出如圖1所示的分區分層存儲架構,將存儲構架劃分為“實時/在線存儲區”和“異步/離線存儲區”。
圖1 電視臺聲像檔案分區分層存儲架構
(1)實時/在線存儲區
采編、制播、媒資與其他融媒體業務系統,檔案管理系統以及其他檔案共享應用通過內部傳輸網絡與“實時/在線存儲區”連接,以實現海量聲像檔案數據的歸檔存儲和檢索交換,“實時/在線存儲區”基于分層存儲設計,在滿足交換速度的同時有效節約投資。熱交互層由讀寫速度更快的固態硬盤(Solid State Drive, SSD)構成,主要存儲索引、關系數據庫以及使用頻率極高的檔案文件緩存數據,以滿足實時性需求,由于SSD價格較高、壽命較短且一旦損壞數據難以恢復,所以在此架構中不將其用做永久數據存儲介質。溫運用層由15K RPM(每分鐘最高轉速)或10K RPM的SAS接口機械硬盤構成,價格適中,讀寫速度較快,主要存儲近期歸檔的文件以及調用頻率較高的檔案資料。次溫存放層介質為7.2K RPM的近線SAS或 者SATA接口機械硬盤,此類機械硬盤成本較低,讀寫速度較慢但單盤存儲容量巨大,主要用于大量檔案文件的長期在線存儲。該區域內存儲介質全部處于實時在線狀態,存儲的檔案文件可隨時供業務系統調用,數據在各層之間根據熱度頻率或業務系統需求自動移動和重分布。
(2)異步/離線存儲區
“異步/離線存儲區”分為兩層,冷存儲層由半離線的自動磁帶庫、自動光盤庫以及虛擬帶庫(Virtual Tape Library, VTL)組成,負責在線區檔案數據的全量備份以及非在線數據的半自動擺渡。凍資料層為完全離線存放的磁帶、光盤或獨立的機械硬盤,該區域存儲使用頻率極低或保密性、安全性要求極高的特殊檔案,介質成本低廉且易于保存、移動,這部分數據需在接收到業務系統查詢調取請求后,由人工介入擺渡至更高存儲層。分區分層存儲架構帶來了許多好處,在滿足業務需求的前提下有效降低投資成本,提高存儲效率,兼容舊的存儲介質且具備冗余性,保障了數據安全。
2. 應用新技術,搭建深度學習智能檢索引擎
(1)滿足聲像檔案高級語義特征提取的需求
聲像檔案管理的對象主要是視頻、音頻、圖像等非結構化數據,長期以來,非結構化數據的精準檢索一直是一個難題。近年來,以深度神經網絡為代表的深度學習技術發展迅猛,在大數據以及GPU并行計算的加持下,帶動了語音識別、計算機視覺等相關技術領域的跨越式發展,加速推動了人工智能的產業化落地。深度學習是機器學習的一個分支,它可以學習樣本數據的內在規律和表示層次,通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示,它模仿人腦的機制來解釋數據,最終目標是讓機器能夠像人一樣具有分析學習能力。深度學習具有強大的特征抽象和表示能力,可以實現對圖像、文本、語音等信號的特征抽象,學習到可計算的特征表示,基于深度學習技術可以實現聲像檔案高級語義特征的提取,進而實現精準檢索和定位。
(2)智能語義檢索應用已具備可行性
目前,相關計算機視覺以及自然語言處理等深度神經網絡模型在研究方面都取得巨大進展并在工程中得到廣泛的應用。2015年,ResNet模型在ImageNet大規模圖像識別挑戰賽(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)中以3.57%的識別錯誤率首次超越人類視覺5.1%的識別錯誤率;2017年,ILSVRC競賽中人臉識別算法的冠軍模型準確率已高達97.75%;2018年,Google的BERT模型在機器閱讀理解頂級水平測試SQuAD1.1中在總共2個衡量指標上全面超越人類,并且還在11種不同NLP(Neuro-Linguistic Programming)測試中創出最佳成績。而針對視頻進行深度神經網絡推理的算力問題,也隨著2019年Nvidia Tesla T4 GPU的發布而變得迎刃而解,T4是專用的深度學習推理加速GPU,同時具有專門設計的硬件視頻轉碼引擎。結合SPARK等大數據平臺批流一體的處理設計,實現海量聲像檔案的智能語義檢索完全具備可行性。
(3)建立基于深度學習的聲像檔案檢索引擎
基于深度學習技術的聲像檔案檢索引擎(如圖2所示),在聲像檔案庫數據基礎上進行經典深度學習模型的遷移學習訓練,不斷完善更新神經網絡模型。借助深度卷積神經網絡在計算機視覺領域的成果,實現視頻、圖像檔案中物體、人臉、文字等的特征提取,轉換為高級語義;借助循環神經網絡在自然語言方面的發展,實現語音、語言文本的特征表示和高級語義轉換;借助卷積神經網絡、循環神經網絡兩者的交叉和聯合,實現圖像描述、視頻分割與目標追蹤等視頻序列處理和語義序列提取。最終,完善神經網絡推理模型,采用批處理的方式對存量聲像檔案進行模型推理、提取特征,采用流處理的方式對實時歸檔的數據進行模型推理和特征提取,建立聲像檔案全量高級語義索引,用戶只需輸入關鍵字句即可實現對聲像檔案內容的精準檢索。
圖2 基于深度學習的聲像檔案智能檢索引擎
3. 打造數據中臺,優化交換利用機制
融媒體時代,電視臺聲像檔案資源面向業務支撐、公共服務的作用日益彰顯,這就要求其不僅能滿足存檔、查檔的基本要求,還應該能夠實現與制播生產、共享傳播等業務系統的無縫對接,實現反哺業務、賦能生產的目標。因此,應立足“頂層設計”規劃,以管理體系、業務流程、信息架構創新為依托,站在電視臺整體業務發展以及社會文化建設的高度將檔案工作納入融媒體改革大局統籌部署,打造檔案數據中臺,依托檔案數據中臺實現與業務系統間聲像檔案的交換利用。
這一過程中,應重點從以下3方面開展工作:(1)以檔案信息體系現代化建設為基礎,建立檔案管理、業務支撐、社會服務三位一體的電視臺聲像檔案管理運行機制。(2)通過標準API?接口提供檔案數據服務,優化交換利用機制,用高效協同的方式與產生、使用檔案的業務系統進行對接,加快資源整合和業務融合,充分發揮聲像檔案信息資源的價值。(3)逐步推進檔案數據治理,保障聲像檔案的數據質量,在推進檔案資源共享的同時確保數據安全。
參考文獻:
[1] 米加寧,章昌平,李大宇,徐磊.“數字空間”政府及其研究綱領:第四次工業革命引致的政府形態變革[J]. 公共管理學報,2020(17).
[2] 胡正榮,李荃. 走向智慧全媒體生態:媒體融合的歷史沿革和未來展望[J]. 新聞與寫作,2019(5).
[3] 曹筠慧,管先海,庫俊平. 深化檔案工作改革的“里程碑”式文件:對《關于加強和改進新形勢下檔案工作的意見》之17項新概括的再解讀[J]. 檔案,2018(11).
[4] 金斌,劉禮加. 數據中心分層存儲技術探究及實踐[J]. 中國金融電腦,2016(5).
[5] 黃靜. 面向大數據的智能圖像檢索方法研究[D]. 青島科技大學,2020.
作者單位:山東工藝美術學院