互聯網是當今最大的資訊資源庫之一,其資訊發布的及時性與全球互聯性使得其對整個社會的發展起著巨大的影響。由於網路相關技術快速發展,它已經影響了日常生活的方方面面,對整個社會起著革命性的影響。網路在為人們提供各種前所未有的便利的同時,也為有害訊息的廣泛傳播提供了便捷。這些資訊特別是敏感資訊對社會尤其是未成年人的影響日益引起人們的極大關注。如何淨化網路環境,有效辨識並過濾有害資訊成了當前迫切需要解決的問題。
常見的方法是基於中文資訊處理技術和多模式匹配技術,結合機器學習方法訓練得到的詞表,能夠有效地辨識敏感詞,進而辨識有害文字。敏感詞辨識要求能夠處理「拆字」、「同音字」、「拼音字」、「縮寫」等幾種模式和模式的組合。敏感詞辨識技術幫助使用者擺脫有害資訊的侵擾,進一步杜絕各種不文明資訊內容的出現,可對各類有害資訊及時有效地發起預警,並嚴防此類嚴重錯誤見諸報端。
靈玖軟體Nlpir Parser敏感資訊過濾系統是針對互聯網內容處理的需要,融合了自然語言理解、網絡搜索和文本挖掘的技術,可以導入大批量用戶業務敏感的關鍵字列表,實現對記憶體與檔案的即時智慧掃描,產生命中的敏感關鍵字、敏感類別與權重等資訊。
靈玖軟體Nlpir Parser敏感資訊過濾系統應用
1、敏感內容資訊過濾
可設定敏感關鍵字,針對文章內容、資訊關鍵字進行掃描,可以將敏感資訊、事件、人物等資訊剔除或抓取,適用於網站、出版、上網行為管理。透過針對特定關鍵字設定,可以過濾大量垃圾訊息,淨化網路環境,適用於資訊網站、各種論壇的資訊整理。
2、敏感帳號掃描
透過設定一個或一組敏感帳號進行掃描,可以追蹤相關帳號的傳播路徑、權重、受眾群體及社會反應等網路訊息,適用於產品、人物追蹤。
3、特定情報即時發現
可以快速便捷地匹配大量自訂的業務關鍵字,智慧發現不良資訊的內容,達到淨化網路空間、提取情報的目的,確保國家、社會與個人的資訊內容安全。
Nlpir Parser敏感資訊過濾系統包括敏感詞偵測子系統、人工幹預操作子系統、敏感資訊替換子系統以及敏感詞判定分數效果回饋子系統組成,其特徵在於所述敏感詞偵測子系統,它實現對包含敏感資料的檢查,即在一定時間間隔內對原始資料建立索引,再透過對已建立索引的檢查,分離出包含敏感資訊的資料。
以上是Nlpir Parser敏感資訊過濾系統實例詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!