當(dāng)前位置:首頁(yè) > 大白菜資訊 > 阿里AI技術(shù)升級(jí),輕松識(shí)別攔截近30個(gè)語(yǔ)種外語(yǔ)臟話圖
阿里AI技術(shù)升級(jí),輕松識(shí)別攔截近30個(gè)語(yǔ)種外語(yǔ)臟話圖
早在一年前,阿里巴巴就發(fā)現(xiàn)了一些為規(guī)避平臺(tái)審查的“臟話”的做法,一般開(kāi)始是文字形式的臟話,后面逐漸演變?yōu)榕K話圖片,后面甚至使用多國(guó)語(yǔ)言進(jìn)行偽裝。
而這些做法使得阿里巴巴,無(wú)法通過(guò)現(xiàn)有技術(shù)和規(guī)則,進(jìn)行識(shí)別和清除,因此阿里安全開(kāi)始進(jìn)行多語(yǔ)種識(shí)別技術(shù)升級(jí)。
最近,阿里安全算法團(tuán)隊(duì)宣布了一個(gè)好消息,表示網(wǎng)絡(luò)臟話的AI(OCR)技術(shù)研發(fā)升級(jí),可以識(shí)別近30種語(yǔ)言,即使是嵌入圖片中的臟話,也可以進(jìn)行識(shí)別。
之所以要進(jìn)行這這類技術(shù)的研發(fā),是因?yàn)樵诓糠謬?guó)際平臺(tái)中,“買家”在商品評(píng)論以及一些交互場(chǎng)景中,使用臟話圖片對(duì)陣。
而這部分臟話圖片中,還包含了多語(yǔ)種垃圾廣告以及不良信息,具有較大的威脅。
但是,全球有幾百種語(yǔ)言,即使是重點(diǎn)的語(yǔ)言也有幾十種,所以人工識(shí)別風(fēng)險(xiǎn)圖片一點(diǎn)也不現(xiàn)實(shí)的,所以這項(xiàng)技術(shù)的需求就很大了。
在研發(fā)的過(guò)程中,除了要熟悉各字體的信息之外,還要注意部分臟話圖會(huì)以置換正常字符順序的方法,試圖瞞天過(guò)海。
現(xiàn)在,經(jīng)過(guò)一年多努力研究,阿里安全算法團(tuán)隊(duì)總算是得到了一個(gè)好結(jié)果,可以更加好地?cái)r截危險(xiǎn)圖片,確保安全。
推薦內(nèi)容
- 高通新旗艦SoC或沿用驍龍855命名,并將于下周揭曉
- Uber被罰117萬(wàn)美元!英國(guó)荷蘭共300萬(wàn)用戶數(shù)據(jù)遭泄露
- 龍芯3A3000 CPU深入實(shí)測(cè):國(guó)產(chǎn)芯片的春天即將來(lái)臨
- AI芯片年度最大融資!制作商地平線正籌資高達(dá)10億美元
- Moto G7 Play信息大曝光,預(yù)計(jì)19年第一季度正式發(fā)布
- 英特爾公布晶圓工廠擴(kuò)建計(jì)劃,首要任務(wù)提升14nm芯片產(chǎn)能
- iPhone違反法院禁令在中國(guó)照賣,高通再次死磕蘋果
- 中國(guó)移動(dòng)11月份數(shù)據(jù)曝光:寬帶用戶量NO.1
- 高通聯(lián)發(fā)科等與阿里達(dá)成合作共識(shí):將推芯片模組產(chǎn)品
- iOS 12.1.2再現(xiàn)老問(wèn)題:4G網(wǎng)絡(luò)無(wú)法上網(wǎng)