5G 나쁜 소식 보안 관리 및 관제 플랫폼에 딥러닝 기반 문자 감정인식 기술 적용
작성자 │ Sun Yue, 단위: China Mobile (Hangzhou) Information Technology Co., Ltd. | China Mobile Hangzhou R&D 센터
연구소 소개
5G 네트워크가 계속 대중화되면서 많은 사용자가 시작되었습니다. 5G 네트워크에 접속하고 사용합니다. 5G 네트워크는 기존 네트워크의 음성, 영상, 문자 및 기타 정보를 전송할 수 있을 뿐만 아니라 실시간 전장 정보, 위성 위치 확인, 내비게이션 등 지연 시간이 짧고 고정밀 위치 확인 기능을 갖춘 보다 실용적인 애플리케이션 시나리오에서도 사용할 수 있습니다. 등.
인터넷 정보에는 정치 관련 정보, 음란물 정보, 흑인 관련 정보, 사기 관련 정보, 상업 광고 정보 등 나쁜 정보가 섞여 있는 경우가 많고, 그 양이 어마어마합니다. 나쁜 정보가 해마다 늘어나고 있으며, 이로 인해 사용자는 엄청난 괴롭힘을 당하고 있습니다. 네트워크 환경을 정화하고 악성 정보의 확산을 효과적으로 통제하기 위해 China Mobile의 5G 악성 뉴스 보안 관리 및 제어 플랫폼이 탄생했습니다.
다 소스 : 중국 모바일 그룹 정보 보안 센터 5G 잘못된 정보 관리 및 제어 플랫폼의 응용 프로그램 시나리오. 문자메시지, 음성정보, 영상정보, 리치미디어정보 등의 정보환경에서는 해당 정보를 정치 관련, 음란 관련, 폭력 관련, 사기 관련, 상업 광고 메시지, 일반 정보로 분류합니다. 메시지 등을 전달하고, 이에 상응하는 전략을 통해 나쁜 소식의 심각도에 따라 적시에 차단 및 후속처벌을 실시하고, 근본 원인부터 네트워크 환경을 정화하여 좋은 사이버 공간을 조성합니다.
2. 기존 5G 불량정보 관리·통제 플랫폼의 기술적 포인트11차 키워드 설정
: 1차 키워드는 일반적으로 매우 민감한 단어로 설정됩니다. 사용자가 1차 키워드 내용이 포함된 메시지를 보내면 메시지가 즉시 차단되어 메시지 내용이 유포될 수 없습니다. , 그리고 이 사용자를 태그하세요.
②공통 키워드 설정: 공통 키워드는 상대적으로 민감한 단어로 설정되며, 사용자가 공통 키워드 내용을 포함하는 메시지를 보낼 경우 일정 기간 동안 민감한 메시지를 보내는 횟수가 초과됩니다. 시스템이 미리 지정한 수 차단 임계값이 설정되면 시스템은 사용자를 블랙리스트에 등록하게 되며 일정 시간 내에 사용자는 완전한 5G 네트워크 서비스를 사용할 수 없게 됩니다.
3복잡한 텍스트 정보 모니터링 설정
: 사용자가 텍스트와 그림이 포함된 PDF 파일을 전송하면 파일 내 텍스트가 추출되고 1단계 키워드와 공통 키워드가 필터링되며, 리치 미디어 메커니즘 필터링은 텍스트와 이미지의 필터링 결과를 기반으로 파일 처리 결과를 대량 처리하는 원칙을 채택합니다.
3.기존 5G 나쁜 소식 관제 플랫폼의 기술적 약점
기존 5G 나쁜 소식 보안 관제 플랫폼의 필터링 메커니즘은 지정되고 제한된 문구와 짧은 문장만 필터링할 수 있습니다. 인터넷의 대중화로 인해 매일 새로운 어휘가 대량으로 등장하고 있으며, 수동으로 어휘를 추가하는 것만으로는 더 이상 적시에 신속하게 어휘 라이브러리를 업데이트할 수 없습니다. 더욱이 오늘날 많은 수의 사용자가 문자 메시지를 보낼 때 문자 메시지 전체에 불법적인 단어가 포함되어 있지 않더라도 표현된 생각과 감정에는 부정적인 감정 경향이 많이 포함될 수 있으며 짧은 문장만으로는 부정적인 감정 내용을 성공적으로 차단할 수 없습니다. . 따라서 텍스트 감정 분석을 활용하여 부정적인 감정 성향이 풍부한 문장을 검토 및 차단할 수 있도록 제출하면 불량 정보 통제 효과를 더욱 강화하고 스팸 정보로 인한 사용자 침식 및 중독을 줄일 수 있습니다.
인터넷에서 인기 있는 짧은 문장과 뉴스 메시지를 담은 텍스트 감정 라이브러리를 구축하여 텍스트에 풍부한 감정을 긍정적인 감정, 중립적인 감정, 부정적인 감정의 세 가지 범주로 나누고 각각을 이에 따라 분류합니다. 세 가지 카테고리에 해당하는 라벨을 추가하고 딥러닝 네트워크를 사용해 감정 라이브러리에서 텍스트를 훈련합니다. 훈련된 모델은 5G 나쁜 소식 관리 및 제어 플랫폼에서 나쁜 감정 메시지를 차단하는 데 사용될 수 있습니다.
4. 딥러닝 기반 5G 불량 관리 및 제어 시스템 기술 구현 내용
이 기술에는 지에바 단어 분할 시스템, 구문 벡터화, 텍스트 감정 인식 알고리즘, 각 과목 간의 상호 작용은 다음과 같습니다.
각 모듈의 상호 작용 흐름도크롤러 기술을 사용하여 인터넷 단어 및 뉴스 메시지를 원본 텍스트로 크롤링하고 원본 텍스트를 8:2 비율로 훈련 세트와 테스트 세트로 나누고 훈련 세트의 텍스트 정보에 레이블을 지정한 다음 텍스트를 전달합니다. jieba 단어 분할 도구를 통해 테스트 세트에 포함된 정보는 단어 분할 처리를 수행합니다. 예: He came to Mobile Hangyan Building. jieba 단어 분할 도구를 통해 단어 분할 후 결과는 그/왔다/이동/한얀/건물이며, 최종적으로 단어 분할 후 데이터는 말뭉치로 구성됩니다. 훈련 세트와 테스트 세트의 텍스트 정보 양이 매우 크기 때문에(보통 수백만 개의 데이터), 단어 후 분할 코퍼스의 데이터 양도 매우 큽니다(수천만 개의 데이터). 이러한 코퍼스는 코퍼스에 번호가 매겨진 형태로 저장될 수 있지만, 엄청난 양의 데이터로 인해 차원성의 재앙을 겪기 쉽습니다. 따라서 "le", "的", "我" 등과 같이 텍스트 정보에 나타나는 조동사에 대해 이러한 단어는 매우 자주 나타나지만 감정 효과에 거의 기여하지 않으므로 선택하겠습니다. 차원 축소 목적을 달성하기 위해 코퍼스 구문에서 이러한 단어를 제거합니다.
학습 세트의 벡터화된 문구를 학습 및 훈련을 위해 딥러닝 네트워크로 보내고, 마지막으로 테스트 세트의 데이터를 모델에 넣어 해당 인식 결과를 봅니다. 모델은 더 나은 결과를 얻을 수 있습니다. 정확도가 좋으면 모델이 5G 불량 관리 및 제어 플랫폼에 연결되고 사용자는 필터링을 위해 엔드투엔드 정보를 보냅니다. 필터링 과정에서 불량 정보가 발견되면 적시에 차단하여 5G 불량 정보 관리 및 제어 시스템의 불량 정보 차단이 더욱 체계적이고 포괄적으로 이루어집니다.
구체적인 단계는 다음과 같습니다.
- 모달 입자 제거, 텍스트에 나타나는 문장 부호 삭제 등을 포함하여 원본 텍스트를 전처리합니다. 텍스트, 빈 영역에서 텍스트에 나타나는 종결어미, 희박한 단어 및 특정 단어를 삭제하고 단어 분할을 위해 jieba 라이브러리를 사용하여 문구에 따라 텍스트 문장을 정확하게 자르고 별도의 문구로 나눕니다. 특정 비율에 따라 훈련 세트와 테스트 세트로 나뉘며, 훈련 세트의 텍스트 문장에는 수동으로 긍정적인 감정, 부정적인 감정, 중립적인 감정으로 주석이 추가됩니다. 그리고 jieba 라이브러리를 사용하여 훈련 세트와 테스트 세트의 텍스트 문장을 각각 분할하고 분할된 훈련 세트를 코퍼스로 구성합니다.
- 각 분할이 다차원 연속 값에 매핑되도록 1단계의 구문을 벡터화합니다. 벡터, 전체 데이터 세트의 단어 벡터 행렬을 가져옵니다.
- 감정 단어가 위치한 절을 먼저 추출하여 문장의 복잡도를 줄이고, 다양한 특징을 바탕으로 절 내 감정 대상의 위치를 예측한 후 해당 위치에서 감정을 추출합니다. 감정 추출은 텍스트 내 귀중한 감정 정보를 얻고, 감정 표현자 식별, 평가 대상 식별, 감정 관점 단어 식별 등의 작업을 포함하여 감정 표현에서 단어나 문구가 하는 역할을 파악하는 것입니다.
- 위의 연산으로 얻은 감정 벡터를 딥러닝 네트워크로 보내 텍스트 감정 인식 모델을 얻은 후, 테스트 세트의 감정 벡터를 모델로 보내고, 테스트 결과를 보고, 계속해서 정규식으로 데이터를 필터링합니다. 텍스트 일치, 리치 미디어 인식 등과 같은 기존 전략을 사용한 탐지 결과.
5. 딥러닝과 통합된 5G 차단 시스템의 장점
기존 5G 차단 시스템과 비교하여 딥러닝과 통합된 5G 차단 시스템은 다음과 같은 장점이 있습니다.
딥 러닝 기술을 사용하여 높은 신뢰성과 신뢰성을 제공합니다. 수동 개입이 적고 작업 효율성이 높은 딥 러닝 기술을 사용합니다.- 텍스트 감정 인식을 사용하여 키워드 차단 단점을 효과적으로 보완합니다. 텍스트 감정 인식을 활용하면 적시에 새로운 입력 정보를 자동으로 업데이트하고 보완하여 효율성을 높일 수 있습니다.
- 마지막에 작성:
현재 딥 러닝의 적용 분야는 반복 학습과 자가 학습 방법을 기반으로 하여 수동 작업량을 크게 줄이고 효율성과 정확성을 향상시킬 수 있습니다. 위에서 언급한 불량 정보 차단 시스템에 적합할 뿐만 아니라 가까운 미래에 이 기술이 다른 신흥 분야에서도 빛을 발할 것이라고 믿습니다. 물론 딥러닝 자체가 완벽하지도 않고 난제를 모두 해결할 수는 없습니다. 그렇기 때문에 우리는 새로운 돌파구를 마련하고 더 나은 미래 스마트 라이프를 창조하기 위해 새로운 시나리오와 새로운 분야에 딥러닝 기술에 지속적으로 투자해야 합니다.
위 내용은 5G 나쁜 소식 보안 관리 및 관제 플랫폼에 딥러닝 기반 문자 감정인식 기술 적용의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











BERT는 Google이 2018년에 제안한 사전 훈련된 딥러닝 언어 모델입니다. 전체 이름은 BidirectionEncoderRepresentationsfromTransformers이며 Transformer 아키텍처를 기반으로 하며 양방향 인코딩의 특성을 가지고 있습니다. 기존 단방향 코딩 모델과 비교하여 BERT는 텍스트를 처리할 때 상황 정보를 동시에 고려할 수 있으므로 자연어 처리 작업에서 잘 수행됩니다. 양방향성을 통해 BERT는 문장의 의미 관계를 더 잘 이해할 수 있어 모델의 표현 능력이 향상됩니다. 사전 훈련 및 미세 조정 방법을 통해 BERT는 감정 분석, 이름 지정 등 다양한 자연어 처리 작업에 사용될 수 있습니다.

활성화 기능은 딥 러닝에서 중요한 역할을 하며 신경망에 비선형 특성을 도입하여 네트워크가 복잡한 입력-출력 관계를 더 잘 학습하고 시뮬레이션할 수 있도록 합니다. 활성화 함수의 올바른 선택과 사용은 신경망의 성능과 훈련 결과에 중요한 영향을 미칩니다. 이 기사에서는 일반적으로 사용되는 네 가지 활성화 함수인 Sigmoid, Tanh, ReLU 및 Softmax를 소개부터 시작하여 사용 시나리오, 장점, 단점과 최적화 솔루션은 활성화 기능에 대한 포괄적인 이해를 제공하기 위해 논의됩니다. 1. 시그모이드 함수 시그모이드 함수 공식 소개: 시그모이드 함수는 실수를 0과 1 사이에 매핑할 수 있는 일반적으로 사용되는 비선형 함수입니다. 통일하기 위해 자주 사용됩니다.

이전에 작성했던 오늘은 딥 러닝 기술이 복잡한 환경에서 비전 기반 SLAM(동시 위치 파악 및 매핑)의 성능을 향상할 수 있는 방법에 대해 논의합니다. 심층 특징 추출과 깊이 일치 방법을 결합하여 저조도 조건, 동적 조명, 질감이 약한 영역 및 심한 지터와 같은 까다로운 시나리오에서 적응을 향상하도록 설계된 다목적 하이브리드 시각적 SLAM 시스템을 소개합니다. 우리 시스템은 확장 단안, 스테레오, 단안 관성 및 스테레오 관성 구성을 포함한 여러 모드를 지원합니다. 또한 시각적 SLAM을 딥러닝 방법과 결합하여 다른 연구에 영감을 주는 방법도 분석합니다. 공개 데이터 세트 및 자체 샘플링 데이터에 대한 광범위한 실험을 통해 위치 정확도 및 추적 견고성 측면에서 SL-SLAM의 우수성을 입증합니다.

잠재 공간 임베딩(LatentSpaceEmbedding)은 고차원 데이터를 저차원 공간에 매핑하는 프로세스입니다. 기계 학습 및 딥 러닝 분야에서 잠재 공간 임베딩은 일반적으로 고차원 입력 데이터를 저차원 벡터 표현 세트로 매핑하는 신경망 모델입니다. 이 벡터 세트를 "잠재 벡터" 또는 "잠재 벡터"라고 합니다. 인코딩". 잠재 공간 임베딩의 목적은 데이터의 중요한 특징을 포착하고 이를 보다 간결하고 이해하기 쉬운 형식으로 표현하는 것입니다. 잠재 공간 임베딩을 통해 저차원 공간에서 데이터를 시각화, 분류, 클러스터링하는 등의 작업을 수행하여 데이터를 더 잘 이해하고 활용할 수 있습니다. 잠재 공간 임베딩은 이미지 생성, 특징 추출, 차원 축소 등과 같은 다양한 분야에서 폭넓게 응용됩니다. 잠재공간 임베딩이 핵심

오늘날 급속한 기술 변화의 물결 속에서 인공지능(AI), 머신러닝(ML), 딥러닝(DL)은 정보기술의 새로운 물결을 이끄는 밝은 별과도 같습니다. 이 세 단어는 다양한 최첨단 토론과 실제 적용에 자주 등장하지만, 이 분야를 처음 접하는 많은 탐험가들에게는 그 구체적인 의미와 내부 연관성이 여전히 수수께끼에 싸여 있을 수 있습니다. 그럼 먼저 이 사진을 보시죠. 딥러닝, 머신러닝, 인공지능 사이에는 밀접한 상관관계와 진보적인 관계가 있음을 알 수 있습니다. 딥러닝은 머신러닝의 특정 분야이며, 머신러닝은

2006년 딥러닝이라는 개념이 제안된 지 거의 20년이 지났습니다. 딥러닝은 인공지능 분야의 혁명으로 많은 영향력 있는 알고리즘을 탄생시켰습니다. 그렇다면 딥러닝을 위한 상위 10가지 알고리즘은 무엇이라고 생각하시나요? 다음은 제가 생각하는 딥 러닝을 위한 최고의 알고리즘입니다. 이들은 모두 혁신, 애플리케이션 가치 및 영향력 측면에서 중요한 위치를 차지하고 있습니다. 1. 심층 신경망(DNN) 배경: 다층 퍼셉트론이라고도 불리는 심층 신경망(DNN)은 가장 일반적인 딥 러닝 알고리즘으로 처음 발명되었을 때 최근까지 컴퓨팅 성능 병목 현상으로 인해 의문을 제기했습니다. 20년, 컴퓨팅 파워, 데이터의 폭발적인 증가로 돌파구가 찾아왔습니다. DNN은 여러 개의 숨겨진 레이어를 포함하는 신경망 모델입니다. 이 모델에서 각 레이어는 입력을 다음 레이어로 전달하고

CNN(Convolutional Neural Network)과 Transformer는 다양한 작업에서 뛰어난 성능을 보여준 두 가지 딥 러닝 모델입니다. CNN은 주로 이미지 분류, 타겟 감지, 이미지 분할과 같은 컴퓨터 비전 작업에 사용됩니다. 컨볼루션 연산을 통해 이미지의 국소적 특징을 추출하고, 풀링 연산을 통해 특징 차원 축소 및 공간 불변성을 수행합니다. 반면 Transformer는 기계 번역, 텍스트 분류, 음성 인식 등 자연어 처리(NLP) 작업에 주로 사용됩니다. 이는 self-attention 메커니즘을 사용하여 시퀀스의 종속성을 모델링하고 기존 순환 신경망의 순차적 계산을 피합니다. 이 두 모델은 서로 다른 작업에 사용되지만 시퀀스 모델링에는 유사점이 있으므로

RMSprop은 신경망의 가중치를 업데이트하는 데 널리 사용되는 최적화 프로그램입니다. 이는 Geoffrey Hinton et al.이 2012년에 제안했으며 Adam 최적화 프로그램의 전신입니다. RMSprop 최적화 프로그램의 출현은 주로 SGD 경사하강법 알고리즘에서 발생하는 경사 소멸 및 경사 폭발과 같은 일부 문제를 해결하기 위한 것입니다. RMSprop 옵티마이저를 사용하면 학습률을 효과적으로 조정하고 가중치를 적응적으로 업데이트하여 딥러닝 모델의 훈련 효과를 향상시킬 수 있습니다. RMSprop 최적화 프로그램의 핵심 아이디어는 서로 다른 시간 단계의 기울기가 가중치 업데이트에 서로 다른 영향을 미치도록 기울기의 가중 평균을 수행하는 것입니다. 특히 RMSprop은 각 매개변수의 제곱을 계산합니다.
