|
公司基本資料信息
|
2022網安創業新銳50強誕生,博特智能成獨一入選的內容安全企業
內容安全痛點誕生新藍海
平臺對展示用戶內容負責任,內容審核風險控制,內容監督、內容巡查等環節成了互聯網企業的生死線,如今已是整個互聯網行業公認的生存之基。
近年來內容安全事件的高發,特別是在app領域,也證明了行業中內容安全風險控制仍存在缺口。內容型、社交型、電商型等不同行業的企業品宣內容頻頻“翻車”。
不僅如此,甚至還存在低俗營銷、等高危內容風險。隨著互聯網內容越發繁雜且海量,以及市場與行業升級之后,信息傳播的媒介與形態越來越多樣化,傳統的人工審核方式已經不能從容應對內容安全危機了。
人工審核效率低、成本高、主觀成分高、評判標準不統一等等。其本身有著天然缺陷,僅人工成本不斷提高這一項就讓企業犯難。有企業曾透露,一人一天審核4萬條信息,日均100萬數據,光審核人力成本就要200萬以上。而且圖片、視頻、音頻等形式的海量內容爆發,又給人工審核帶來了新的挑戰。
海量內容,如何系統化提升內容安全風險控制能力與審核效率?
如何對涉政、涉恐、廣告等高危內容風險扼殺在審核環節?
高危內容的“漏網之魚”又該如何進行常態化的信息巡查與清理?
可以說,互聯網企業都將AI審核技術作為主要突破點,內容管控、風險監控與處理、節省人力成本與提升運營效率則是直接的硬核需求。
近年來,愈演愈烈的內容風險問題,已成了制約行業發展的痛點,同時也讓智能內容處理市場成了新的藍海賽道。
人民日報總結的機關公文寫作易錯別字200例(3)
101.別出心(新)裁 102.貽(遺)笑大方
103.不能自已(已) 104.蕓蕓(紜)眾生
105.蜂擁(涌)而出 106.集腋(掖)成裘
107.九霄(宵)云外 108.淺嘗輒(則)止
109.栩栩(詡)如生 110.旁征(證)博引
111.層巒疊嶂(障) 112.各行其是(事)
113.明火執仗(杖) 114.誤入歧(岐)途
115.共商國是(事) 116.引吭(亢)高歌
117.戴(帶)罪立功 118.和(合)盤托出
119.仗義執(直)言 120.惴惴(喘)不安
121.學以致(至)用 122.卷帙(秩)浩繁
123.高瞻遠矚(囑) 124.膾炙(灸)人口
125.養殖(值)業 126.一炷(柱)香
127.辯(辨)證法 128.-剎(霆)那
129.挖墻腳(角) 130.湊份(分)子
131.笑瞇瞇(咪) 132.棉鈴(蛉)蟲
133.碳(炭)酸鈣 134.高品位(味)
135.水蒸氣(汽) 136.一闋(闕)詞
137.-攤(灘)泥 138.暴(爆)發戶
139.熒(瑩)光屏 140.麥銹(繡)病
141炮(爆)羊肉 142.檢察(查)院
143.主旋(弦)律 144.百衲(納)本
145.璀璨(燦) 146.陷阱(井)
147.暮靄(藹) 148.黯(暗)然
149.堪(勘)輿 150.勘(諶)探
錯別字審核一般要多久?
內容審核糾錯 比人工校對審核效率提升160倍
一篇10000字的文稿,人工正常閱讀時間至少需要30分鐘,完成錯別字檢測,審核校對正常需要40-60分鐘,而一篇50000字的文件完成校對則需要花費1-2個小時。在一些對內容嚴謹性有極其嚴苛審核要求的行業場景,面對批量文稿內容,需要的審核時間與精力會更多,人工工作時間越長,越疲勞,內容風險外溢的概率就會變得更大。
可以說,傳統的人工審核校對工作量非常巨大,急需AI技術提升工作數智化效率。一篇10000字的圖文稿件,對于智能內容處理平臺(BotSmart-ICPS)而言,只需15秒就能完成快速審核。并一次性將所有錯別字、錯誤標點符號、錯誤語義表述、疑似違規廣告、疑似意識形態錯誤等問題檢測出來,對常識性的敏感信息、重要領導姓名、職務等關鍵內容也能給出準確的修改提醒,與人工相比,審核工作效率提升了160倍。
文本審核方法以及裝置
文本審核方法以及裝置,其中所述文本審核方法包括:獲取待審核文本,確定待審核文本的業務維度;基于業務維度對待審核文本中包含的關鍵詞進行標注,獲得與業務維度相關聯的業務關鍵詞集合;計算業務關鍵詞集合中包含的業務關鍵詞在待審核文本中的詞優化參數;根據詞優化參數對業務關鍵詞集合中包含的業務關鍵詞進行篩選,獲得優選關鍵詞集合;將優選關鍵詞集合中包含的每個業務關鍵詞進行向量化處理,根據向量化處理結果獲得向量特征;將向量特征輸入至審核模型,對待審核文本進行審核,獲得審核模型輸出的待審核文本的審核結果.通過文本審核方法,提高了對業務維度對應的待審核文本審核的準確性,并且提高了審核效率.