人工智能技術(shù)在媒體資產(chǎn)領(lǐng)域的應(yīng)用

2023/08/02-16:24 來源：

陳福生

(泉州晚報社)

【摘要】黨的十九屆四中全會首次將“數(shù)據(jù)”增列為一種生產(chǎn)要素，要求建立健全由市場評價貢獻、按貢獻決定報酬的機制，標志著以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟進入新時代。數(shù)據(jù)要素所引發(fā)的生產(chǎn)要素變革，正在重塑著我們的需求、生產(chǎn)、供應(yīng)和消費，改變著社會的組織運行方式。從媒體數(shù)字化轉(zhuǎn)型的實踐經(jīng)驗中我們可以得知，媒體的數(shù)據(jù)資產(chǎn)是媒體數(shù)字化轉(zhuǎn)型的數(shù)據(jù)底座，必須管理好媒體的寶貴數(shù)據(jù)資產(chǎn)，才能有效地進行媒體數(shù)字化轉(zhuǎn)型。而對媒體數(shù)據(jù)資產(chǎn)的數(shù)據(jù)管理需要數(shù)據(jù)資產(chǎn)框架來支撐數(shù)據(jù)資產(chǎn)的展示、記錄、分析，通過數(shù)據(jù)資產(chǎn)框架可以明晰媒體擁有的數(shù)據(jù)資產(chǎn)、實現(xiàn)數(shù)據(jù)資產(chǎn)安全分享、提升數(shù)據(jù)資產(chǎn)質(zhì)量、實現(xiàn)數(shù)據(jù)資產(chǎn)變現(xiàn)等數(shù)據(jù)管理目標。項目立項前期，報社積累了幾十萬張圖片。

隨著新媒體的發(fā)展，特別是5G落地之后，報社積累的圖片和音視頻內(nèi)容越來越多。這些內(nèi)容伴隨著刊發(fā)的轉(zhuǎn)換隨即成為沉沒資產(chǎn)，缺少二次利用甚至多次利用的可能。如果單純的在服務(wù)器開辟存儲空間，只能解決媒體資產(chǎn)存儲的問題，不能解決媒體資產(chǎn)二次加工和衍生利用的問題，如果要解決媒體資產(chǎn)使用的問題要先過媒體資產(chǎn)結(jié)構(gòu)化管理這一關(guān)。傳統(tǒng)的媒體資產(chǎn)結(jié)構(gòu)化需要依靠人工，耗時耗力還達不到效果，在人工智能技術(shù)輔助下，提升了媒體資產(chǎn)管理效率、增強了媒體資產(chǎn)管理的安全性，也帶來了媒資資產(chǎn)的多維度應(yīng)用。本文從泉州晚報社的應(yīng)用思考出發(fā)，希望給全國報業(yè)乃至媒體領(lǐng)域貢獻實踐應(yīng)用經(jīng)驗。

【關(guān)健詞】媒體資產(chǎn) 人工智能新型應(yīng)用

1 為什么要建設(shè)人工智能技術(shù)加持的媒體資產(chǎn)解決方案

1.1 報業(yè)領(lǐng)域面臨的媒體資產(chǎn)管理問題

數(shù)據(jù)成為了媒體基礎(chǔ)性戰(zhàn)略資源，良好的數(shù)據(jù)資產(chǎn)管理是釋放數(shù)據(jù)要素價值的基礎(chǔ)。數(shù)據(jù)資產(chǎn)管理包含數(shù)據(jù)資源化、數(shù)據(jù)資產(chǎn)化兩個過程，通過數(shù)據(jù)資源化構(gòu)建全面有效的、切合實際的數(shù)據(jù)資產(chǎn)管理體系，提升數(shù)據(jù)質(zhì)量，保障數(shù)據(jù)安全；通過數(shù)據(jù)資產(chǎn)化，豐富數(shù)據(jù)資產(chǎn)應(yīng)用場景，建立數(shù)據(jù)資產(chǎn)生態(tài)，持續(xù)運營數(shù)據(jù)資產(chǎn)，顯性數(shù)據(jù)資產(chǎn)的業(yè)務(wù)價值、經(jīng)濟價值和社會價值。

從信息時代到數(shù)字時代，數(shù)據(jù)由記錄業(yè)務(wù)逐漸轉(zhuǎn)變?yōu)橹悄軟Q策，成為了組織持續(xù)發(fā)展的核心引擎。未來，數(shù)據(jù)資產(chǎn)管理將朝著統(tǒng)一化、專業(yè)化、敏捷化的方向發(fā)展，提高數(shù)據(jù)資產(chǎn)管理效率，主動賦能業(yè)務(wù)，推動數(shù)據(jù)資產(chǎn)安全有序流通，持續(xù)運營數(shù)據(jù)資產(chǎn)，充分發(fā)揮數(shù)據(jù)資產(chǎn)的經(jīng)濟價值和社會價值。

近年來，隨著新媒體的發(fā)展，報業(yè)對視頻和圖片這類圖像資產(chǎn)有著共性需求，主要是圖像類資產(chǎn)的匯聚問題和管理問題。

(1)圖像類資產(chǎn)的匯聚問題

圖像類資產(chǎn)來源有多種。包括新華社通稿圖片和視頻；外購的圖片和視頻；收錄的影像資料；各地記者站提供給的圖片和視頻；以及報社編采人員大量的自采圖片和視頻。

圖像類資產(chǎn)的存儲方式有多種。如果是通過系統(tǒng)獲取的圖像類資產(chǎn)，會存在服務(wù)器的存儲空間；如果是編采人員自采的圖像類資產(chǎn)則會保存在編采人員手中。當(dāng)需要使用時，需要通過記憶回想當(dāng)時這個圖像類資產(chǎn)是哪個編采人員采集、哪個制作人員加工、發(fā)布在哪些渠道、大致發(fā)布的時間，才能找到對應(yīng)的圖像類資產(chǎn)。也可以說報社花費了成本獲取的圖像類資產(chǎn)在匯聚和存儲方面沒有形成報社統(tǒng)一管理且可以方便利用的資源。

(2)圖像類資產(chǎn)的管理問題

圖像類資產(chǎn)的非結(jié)構(gòu)化特性。圖片以及視頻都屬于非結(jié)構(gòu)化對象，無法通過關(guān)鍵詞檢索精準找到想到的圖片素材或者視頻鏡頭。如果不對圖像類資產(chǎn)進行管理，編采人員通常會通過記憶方式，按照印象中的關(guān)鍵詞檢索圖片和視頻，然后再通過人工方式從檢索結(jié)果中肉眼“掃描”圖片，通過拖動圖像時間線的方式找到想要的視頻鏡頭。這樣的資源查找方式不適合新媒體內(nèi)容快速生產(chǎn)方式。因此很多媒體采用人工方式對圖像類資產(chǎn)進行結(jié)構(gòu)化，使編采人員利用資源時能快速找到想要的內(nèi)容。

傳統(tǒng)的人工管理方式存在一些弊端。如下所述：

①需要加工人員對新聞內(nèi)容有豐富經(jīng)驗

采用人工對圖像類資產(chǎn)進行結(jié)構(gòu)化操作，需要加工人員對新聞內(nèi)容有非常豐富的經(jīng)驗。因為新聞內(nèi)容不光是時政新聞，還有體育類新聞、民生類新聞、經(jīng)濟類新聞等等，不同垂類新聞需要按照不通過的體系進行結(jié)構(gòu)化加工，需要加工人員對不同垂類新聞有豐富經(jīng)驗。我們以體育新聞舉例，體育新聞的結(jié)構(gòu)化加工很多時候依靠體育類的編采人員進行加工，但本身編采工作比較繁忙，工作重心在內(nèi)容的采編而非資產(chǎn)加工，因此依靠編采人員對資產(chǎn)進行加工的方式行不通；一些媒體成立專門的資料室或者通過外包方式對資產(chǎn)進行結(jié)構(gòu)化加工，這就需要加工人員對不同垂類新聞有經(jīng)驗要求。

②加工的標準無法與時俱進

一些媒體為了能對圖像類資產(chǎn)進行標準化加工，制定了規(guī)范，比如分類體系、標簽體系。但只代表了標準制定時的要求，無法與時俱進。比如對于人物的加工規(guī)范，隨著人物的職務(wù)變化，需要更新標準內(nèi)容；

此外，互聯(lián)網(wǎng)發(fā)展變化很快，會出現(xiàn)很多新情況，在制定規(guī)范時無法預(yù)測后續(xù)會出現(xiàn)哪些情況，因此加工規(guī)范的適用性存在局限性。

③存在遺漏的情況

由于圖像類資產(chǎn)采用人工加工的方式，無法那么精準的識別圖像類資產(chǎn)的所有要素，會存在遺漏的情況。當(dāng)遺漏出現(xiàn)時，編采人員使用就會有問題，比如找不到、找不全等情況的出現(xiàn)。

1.2 報業(yè)領(lǐng)域面臨的媒體資產(chǎn)使用問題

圖像類資產(chǎn)的使用方向也非常多。包括新聞內(nèi)容生產(chǎn)的使用、內(nèi)容衍生品的使用和內(nèi)容經(jīng)營方面的使用。

①新聞內(nèi)容生產(chǎn)有很多業(yè)務(wù)場景需要使用圖像類資產(chǎn)。

比如地區(qū)宣傳片的制作中需要使用大量的圖像類資產(chǎn)；體育類新聞內(nèi)容需要大量的圖像類素材；在新聞視頻的制作過程中會應(yīng)用到空鏡頭素材等等。如果沒有圖像類資產(chǎn)的匯聚和管理，對于新聞內(nèi)容的選題和制作都存在問題。

②衍生品制作的使用問題

圖像類資產(chǎn)特別適合內(nèi)容衍生品的制作，比如對地區(qū)歷史文化的介紹、重點企業(yè)的介紹、文創(chuàng)產(chǎn)品的應(yīng)用、數(shù)字藏品的應(yīng)用都需要圖像類資產(chǎn)。如果對圖像類資產(chǎn)沒有好的管理手段，在資產(chǎn)使用方面會存在問題。

③經(jīng)營方面的使用問題

報業(yè)的圖像類資產(chǎn)都是報社單位花費了成本采購或者采集加工而來。在作為內(nèi)容素材進行刊發(fā)后還可以作為資產(chǎn)對外進行經(jīng)營。

比如給當(dāng)?shù)匚k局進行輸出，從而獲得政府部門和行業(yè)管理部門的政策或者經(jīng)費支持。可以作為版權(quán)內(nèi)容輸出給新媒體平臺，可以按照流量情況獲得利潤分成?？梢宰鳛榘鏅?quán)內(nèi)容輸出給圖像類平臺使用，從而獲得版權(quán)收入。

圖像類資產(chǎn)在經(jīng)營方面有很多應(yīng)用模式，如果圖像類資產(chǎn)的管理手段跟不上業(yè)務(wù)發(fā)展，則報社的資產(chǎn)會成為沉沒成本。

1.3 人工智能技術(shù)在媒體資產(chǎn)管理應(yīng)用的可行性隨著人工智能技術(shù)在圖像類內(nèi)容的應(yīng)用，使圖像類內(nèi)容資產(chǎn)的管理方式得到了很大提升。

(1)利用圖像指紋技術(shù)實現(xiàn)以圖搜資源

傳統(tǒng)資源管理平臺只能以全文、關(guān)鍵詞等文本方式進行資源查找。利用人工智能技術(shù)，可以通過視頻指紋技術(shù)實現(xiàn)以圖搜資源的新穎手段：

視頻指紋是：基于視頻文件每幀畫面計算得到的特征值，只要畫面內(nèi)容(數(shù)據(jù))沒有變，該指紋就不會變。

視頻指紋識別：通過視頻指紋的比對，快速找到畫面內(nèi)容相匹配的資源文件視頻指紋的特點如下：

視頻指紋較?。好繋嬅?0字節(jié)，每小時的指紋特征大小為3.6MB。指紋生成效率高：F1-200整機提供400倍的復(fù)合指紋生成效率。首幀快速定位技術(shù)——快速判定查詢幀是否為指紋庫首幀

容錯計數(shù)與終止查詢技術(shù)——允許查詢過程中存在少量錯誤，提升查詢魯棒性丟幀匹配技術(shù)——允許查詢視頻存在少量丟幀，提升魯棒性

匹配位置修正技術(shù)——當(dāng)匹配位置出現(xiàn)偏移時(比如由于上下變化生成的黑邊),重新定位匹配位置，提升查詢魯棒性

可信度自動調(diào)節(jié)技術(shù)——自動調(diào)節(jié)容錯計數(shù)，提升查詢魯棒性關(guān)鍵幀加速技術(shù)——基于關(guān)鍵幀技術(shù)，明顯提升查詢效率

采用視頻指紋技術(shù)，可以提升搜索命中結(jié)果，帶有命中的時碼信息，使用人員可以直接快速定位到對應(yīng)的位置查看。

(2)語音轉(zhuǎn)文字

①提取圖像類資產(chǎn)的標簽。利用智能語音識別分析技術(shù)，實現(xiàn)視音頻資源入庫時，自動將視音頻的語音信息轉(zhuǎn)寫為文字，通過NLP技術(shù)，提取文字中的關(guān)鍵詞作為圖像類資產(chǎn)的標簽。

②生成視頻字幕。利用智能語音識別分析技術(shù)，可以將視頻資源的語音識別為文字。對識別結(jié)果提供純文本與時碼+文本兩種形式結(jié)果，可以導(dǎo)出用于稿件的快速編寫或者應(yīng)用到字幕的快速制作添加，大大節(jié)省同期聲制作人工成本。

(3)適配新媒體發(fā)布的編解碼技術(shù)

不同的采集設(shè)備有不一樣的格式，不同的新媒體發(fā)布渠道需要不同格式的資源。在視頻類資源采集時調(diào)用兼容上百種資源格式的編解碼技術(shù)，將資源轉(zhuǎn)換為適合新媒體制作及發(fā)布的資源。不僅提升文件轉(zhuǎn)換操作效率，也降低文件因轉(zhuǎn)碼導(dǎo)致?lián)p壞或不適配的風(fēng)險。

(4)數(shù)字水印保護知識產(chǎn)權(quán)

水印，作為保護知識產(chǎn)權(quán)的重要手段，早已被大眾習(xí)慣且接受。但是這種方法仍然存在著多方面的不足。對于觀眾來說，蓋在圖像或畫面一角的logo會破壞原圖，且影響美觀。對于內(nèi)容所有者來說，這種直接顯示在畫面上的水印也很容易被去除。針對這些問題，隱形水印這門技術(shù)被提出并逐漸發(fā)展了起來。

數(shù)字水印(隱形水印),是一種肉眼不可見的水印，可以保持圖片美觀的同時，保護資源版權(quán)。對圖片使用加入隱藏文字的水印，借此避免圖片未經(jīng)授權(quán)的復(fù)制和拷貝，可通過對原圖進行變換操作，得到水印圖來證明版權(quán)歸屬?？梢詫ν鈭D片不同用途加入不同的隱藏水印，防止泄露，如果資料被復(fù)制、傳播可根據(jù)解碼出的唯一標識得出泄露方信息。

2 人工智能技術(shù)在媒體資產(chǎn)解決方案中的創(chuàng)新性應(yīng)用

2.1 人工智能的結(jié)構(gòu)化加工

利用人工智能的能力，視頻類資源可以采用語音轉(zhuǎn)文字的方式，對視頻文件的語音內(nèi)容轉(zhuǎn)換成文字內(nèi)容，方便制作成為視頻+文字稿件的混編稿件。

2.2 人工智能的圖像檢索

為了便于后續(xù)對圖片/視頻資源進行查找，可借助人工智能技術(shù)，實現(xiàn)以圖搜圖、以圖搜視頻、以視頻搜視頻的功能。便于使用人員對資源的精準檢索。

2.3跨庫運營發(fā)布

在報社內(nèi)部和報社外部分別有一個圖像類資源庫。內(nèi)部的圖像類資源庫支持內(nèi)部內(nèi)容生產(chǎn)，外部圖像類資源庫支持對外展示、經(jīng)營。

內(nèi)部圖像類資源庫的運營人員可以將庫內(nèi)優(yōu)質(zhì)的圖片/視頻內(nèi)容推送外部圖像類資源庫，將優(yōu)質(zhì)內(nèi)容進行對外展示發(fā)布。也可以對圖像類資源進行單張或者套餐定價，實現(xiàn)資源的運營變現(xiàn)。

2.4 賽事集錦

可以通過人工智能技術(shù)，將包含有相同視頻元素的圖像類資產(chǎn)進行聚合，按照體育類人物、精彩瞬間生成賽事集錦。

2.5 數(shù)字人播報

報業(yè)缺少專業(yè)的出鏡主持人，在進行新聞視頻播報的時候如果有個數(shù)字人作為主持人，會提升視頻內(nèi)容的觀感。特別是如果新聞播報時增加手語數(shù)字人的手語播報，對于聽力障礙人士是個福音。

數(shù)字人可以是卡通形象也可以是真人形象。數(shù)字人可以模擬真人動作；能夠選配聲音、聲調(diào)、語速；可以選擇頭發(fā)、皮膚、服裝。在挑選好數(shù)字人后，給數(shù)字人輸入一段文字內(nèi)容，就可以讓數(shù)字人進行內(nèi)容播報。這種應(yīng)用在報業(yè)新媒體中已經(jīng)得到應(yīng)用。

3 人工智能技術(shù)在媒體資產(chǎn)領(lǐng)域的應(yīng)用展望

3.1 人工智能提升短視頻產(chǎn)能方面的應(yīng)用

(1)圖文一鍵轉(zhuǎn)視頻

對于報業(yè)來說，缺少專業(yè)的視頻制作人員，因此存在視頻生產(chǎn)產(chǎn)能不足的問題。報社對于生產(chǎn)圖文類內(nèi)容的經(jīng)驗比較豐富，可以借助人工智能技術(shù)將圖文類內(nèi)容一鍵轉(zhuǎn)為視頻內(nèi)容，且還不涉及版權(quán)問題。

實現(xiàn)方式為通過人工智能技術(shù)，將文字內(nèi)容提取摘要，將圖片內(nèi)容生成圖片視頻，通過文字轉(zhuǎn)語音方式，將內(nèi)容摘要作為口播內(nèi)容。當(dāng)視頻生成后，我們看到圖片素材進行播放的時候，搭配著口播內(nèi)容，且口播內(nèi)容還可以配合圖片播放的節(jié)奏進行播報。這樣的圖文轉(zhuǎn)視頻方式極大提升了視頻產(chǎn)能不足的問題。

(2)數(shù)據(jù)視頻的生產(chǎn)

數(shù)據(jù)視頻原先需要1-2周才可以制作完畢，借助人工智能方式，可在3分鐘之內(nèi)生成數(shù)據(jù)視頻。

模板選擇：數(shù)據(jù)新聞編輯器有多種形式、多種樣式的視頻模板。包括折線圖，柱狀圖等多種數(shù)據(jù)新聞模板，可根據(jù)需要選擇適合的模板。

視頻預(yù)覽：在使用數(shù)據(jù)新聞視頻編輯器時，可實時預(yù)覽視頻合成的動態(tài)效果，并在平臺上對視頻的數(shù)據(jù)、參數(shù)等信息進行調(diào)整，實現(xiàn)生成視頻效果“所見即所得”。

數(shù)據(jù)表格編輯：使用人員可以在數(shù)據(jù)新聞視頻編輯器中的數(shù)據(jù)配置頁面中，編輯新聞中所需的表格數(shù)據(jù)。編輯過程中，支持在視頻預(yù)覽區(qū)實時預(yù)覽基于當(dāng)前數(shù)據(jù)所合成的視頻的動態(tài)效果。

數(shù)據(jù)上傳：數(shù)據(jù)新聞視頻編輯器支持操作者上傳表格數(shù)據(jù)進行數(shù)據(jù)配置。對于已有的表格數(shù)據(jù)，可直接通過上傳數(shù)據(jù)功能將表格數(shù)據(jù)上傳至編輯器中，并預(yù)覽視頻效果。上傳后的數(shù)據(jù)可以在編輯器中進行實時編輯更新。

視頻配置：數(shù)據(jù)新聞視頻編輯器中，可選擇坐標軸數(shù)據(jù)數(shù)據(jù)來源，自定義編輯主標題、副標題、單位等視頻中出現(xiàn)的文案內(nèi)容。能夠選擇配色方案、自定義視頻時長。

智能配樂：可在數(shù)據(jù)新聞視頻編輯器中，為生成的視頻選擇本地化版權(quán)音樂作為配樂素材。

視頻生成：數(shù)據(jù)新聞視頻編輯器可高效合成視頻，一鍵合成視頻。

3.2 人工智能在提升短視頻制作效果方面的應(yīng)用

智能超分的應(yīng)用：通過智能超分，可以將低分辨率的視頻變?yōu)楦叻直媛实囊曨l。高分辨率視頻可以提升視頻清晰度，獲得更好的視頻觀感。

老片修復(fù)的應(yīng)用：可以通過人工智能方式，識別老片的噪點、劃痕，并通過視頻技術(shù)去掉早點、劃痕、提升視頻清晰度。

老片上色的應(yīng)用：通過對一些基礎(chǔ)幀預(yù)置色彩模式，再通過人工智能技術(shù)對圖像的運算，對黑白片進行上色。

視頻去抖的應(yīng)用：如果在視頻采集時沒有三腳架或者穩(wěn)定器，拍出來的視頻有抖動，再去重拍也不太現(xiàn)實?？梢酝ㄟ^人工智能技術(shù)，最大限度的去掉抖動幀，實現(xiàn)視頻畫面的穩(wěn)定效果。

視頻去水印的應(yīng)用：可以通過人工技術(shù)，識別水印位置，通過人工智能技術(shù)去掉水印和logo,得到一個清版視頻內(nèi)容，便于后續(xù)視頻的多渠道使用。

視頻橫轉(zhuǎn)豎的應(yīng)用：視頻橫轉(zhuǎn)豎在新媒體領(lǐng)域有應(yīng)用價值。比如網(wǎng)站發(fā)布的視頻是橫版，在手機上發(fā)布的視頻需要轉(zhuǎn)成豎版。通過人工做兩版視頻太麻煩了，可以采用人工智能技術(shù)，通過視頻橫轉(zhuǎn)豎的應(yīng)用，將適配網(wǎng)站的橫版視頻轉(zhuǎn)為豎版視頻。轉(zhuǎn)后的豎版視頻還可以實現(xiàn)主畫面居中的效果。

4結(jié)束語

媒體數(shù)據(jù)資產(chǎn)運營是指通過對媒體數(shù)據(jù)服務(wù)、數(shù)據(jù)流通情況進行持續(xù)跟蹤和分析，以數(shù)據(jù)價值管理為參考，從數(shù)據(jù)使用者的視角出發(fā)，全面評價數(shù)據(jù)應(yīng)用效果，建立科學(xué)的正向反饋和閉環(huán)管理機制，促進數(shù)據(jù)資產(chǎn)的迭代和完善，不斷適應(yīng)和滿足數(shù)據(jù)資產(chǎn)的應(yīng)用和創(chuàng)新需求。媒體數(shù)據(jù)資產(chǎn)管理是一項長期性的、體系化的工作，為保證各項數(shù)據(jù)資產(chǎn)管理活動有效開展，統(tǒng)籌推動數(shù)據(jù)資產(chǎn)管理工作順利進行，戰(zhàn)略規(guī)劃、組織架構(gòu)、制度體系、平臺工具、長效機制等保障措施變得極為重要。隨著人工智能技術(shù)的發(fā)展，媒體應(yīng)用場景的不斷創(chuàng)新，相信數(shù)據(jù)賦能媒體轉(zhuǎn)型升級的愿景將會得以實現(xiàn)。

人工智能技術(shù)在媒體資產(chǎn)領(lǐng)域的應(yīng)用

新聞技聯(lián)動態(tài)