大白菜資訊

當(dāng)前位置:首頁(yè) > 大白菜資訊 > 阿里AI技術(shù)升級(jí),輕松識(shí)別攔截近30個(gè)語(yǔ)種外語(yǔ)臟話圖

阿里AI技術(shù)升級(jí),輕松識(shí)別攔截近30個(gè)語(yǔ)種外語(yǔ)臟話圖

日期:2021-09-28 | 時(shí)間:11:44

早在一年前,阿里巴巴就發(fā)現(xiàn)了一些為規(guī)避平臺(tái)審查的“臟話”的做法,一般開(kāi)始是文字形式的臟話,后面逐漸演變?yōu)榕K話圖片,后面甚至使用多國(guó)語(yǔ)言進(jìn)行偽裝。

而這些做法使得阿里巴巴,無(wú)法通過(guò)現(xiàn)有技術(shù)和規(guī)則,進(jìn)行識(shí)別和清除,因此阿里安全開(kāi)始進(jìn)行多語(yǔ)種識(shí)別技術(shù)升級(jí)。

最近,阿里安全算法團(tuán)隊(duì)宣布了一個(gè)好消息,表示網(wǎng)絡(luò)臟話的AI(OCR)技術(shù)研發(fā)升級(jí),可以識(shí)別近30種語(yǔ)言,即使是嵌入圖片中的臟話,也可以進(jìn)行識(shí)別。

之所以要進(jìn)行這這類技術(shù)的研發(fā),是因?yàn)樵诓糠謬?guó)際平臺(tái)中,“買家”在商品評(píng)論以及一些交互場(chǎng)景中,使用臟話圖片對(duì)陣。

而這部分臟話圖片中,還包含了多語(yǔ)種垃圾廣告以及不良信息,具有較大的威脅。

圖片.png

但是,全球有幾百種語(yǔ)言,即使是重點(diǎn)的語(yǔ)言也有幾十種,所以人工識(shí)別風(fēng)險(xiǎn)圖片一點(diǎn)也不現(xiàn)實(shí)的,所以這項(xiàng)技術(shù)的需求就很大了。

在研發(fā)的過(guò)程中,除了要熟悉各字體的信息之外,還要注意部分臟話圖會(huì)以置換正常字符順序的方法,試圖瞞天過(guò)海。

現(xiàn)在,經(jīng)過(guò)一年多努力研究,阿里安全算法團(tuán)隊(duì)總算是得到了一個(gè)好結(jié)果,可以更加好地?cái)r截危險(xiǎn)圖片,確保安全。

大白菜超級(jí)U盤啟動(dòng)盤制作工具