人民網首頁
國家重點實驗室>>實驗室動態

聚焦內容安全 跨模態視頻搜索引擎“白澤”正式發布

2021年11月29日16:53 來源:人民網

      11月24日,由中央網信辦、中央廣播電視總臺、廣東省委網信委聯合主辦,人民網與華為技術有限公司聯合承辦的2021中國網絡媒體論壇技術論壇在廣州市舉行。論壇上,人民日報社傳播內容認知國家重點實驗室與人民中科共同發布了面向內容安全的跨模態視頻搜索引擎——“白澤”,人民日報社傳播內容認知國家重點實驗室主任,人民網黨委書記、董事長、總裁葉蓁蓁介紹了相關情況。

   

“白澤”搜索引擎主頁面。

       據悉,內容風控大腦是對全網海量內容進行高通量感知、機器理解、智能檢索并自主進化的計算平臺,“白澤”則是該計算平臺的核心組件。內容風控大腦全部技術組件均實現國產化部署,提供視頻搜索、內容風控、開源情報、反詐反恐、內容溯源、版權保護、實訓靶場等多功能。鑒于跨平臺、跨模態的視頻搜索引擎是探索數字世界的重要工具,有巨大社會價值和商業前景,該引擎擬獨立運營,以“白澤”作為商品名對外提供服務。據了解,“白澤”取名于中國神話傳說中一種“通萬物之情、曉萬物狀貌”的神獸,它知道天下所有鬼怪的名字、形貌和驅除的法術。

       葉蓁蓁表示,當前,各大主流媒體已進入多模態階段,可實現文字、圖片、視頻搜索,但相互間的壁壘依然存在,人民網進入跨模態搜索領域,實現文字、圖片、音視頻互聯互通。

 “白澤”搜索界面。

       當前,基于單個模態的內容提取及簡單規則匹配的內容分析策略,已無法滿足實際工作需要。對此,各廠商紛紛推出基于多模態融合和復合規則判斷的多模態策略,但仍面臨依賴大規模算力、模態之間信息相互隔離、運行和維護成本高、資源復用率低等問題。此次發布的“白澤”引擎,基于跨模態視頻檢索的策略,其跨模態引擎可實現單模態語義理解、多模態信息融合、跨模態語義關聯,補全單一模態信息不足的現狀,打破模態間信息孤島。

      據介紹,“白澤”引擎將文字、圖片、語音和視頻等不同模態信息映射到一個統一特征表示空間,以視頻為核心,學習多個模態間統一的距離度量,跨越文字、語音、視頻等多模態內容的語義鴻溝,自動關聯多模態間關鍵要素。

      在此背景下,“白澤”引擎無需配置傳統內容搜索所需的復雜匹配規則,通過自然語言描述即可快速檢索出相同語義的視頻,在不需要依賴大規模算力的情況下,有效應對新事件和突發事件,資源復用率高。

      此外,面向內容安全,“白澤”結合對境內外多平臺內容的檢索,可跨平臺實現文本搜圖片、文本搜視頻、圖片搜視頻、視頻搜視頻、圖片搜文字、視頻搜文字等功能。在論壇現場,葉蓁蓁展示了“白澤”在視頻搜索、溯源和辟謠、版權監測、視頻生產等商業化應用場景的功能。

      同時,為提升“白澤”引擎的安全和效率,人民中科基于華為昇騰芯片研發了面向內容理解的“雨燕”智能計算加速卡,并采用全自主研發的模型壓縮和加速算法,同等條件下能夠實現4倍效率的提升。(人民網記者 孫陽 栗翹楚)



(責編:郭筱鳳)
欧美一级大片