보안을 위한 머신러닝은 아름다운 거짓말인가요?
번역가 | Bugatti
리뷰어 | Sun Shujuan
머신러닝(ML)은 마법의 기술이 아닙니다. 일반적으로 ML은 대규모 데이터 세트의 좁은 문제를 해결하는 데 적합하며 관심 패턴은 반복 가능성이 높거나 예측 가능합니다. 대부분의 보안 문제에는 ML이 필요하지 않거나 ML이 도움이 되지 않습니다. Google을 포함한 많은 전문가들은 복잡한 문제를 해결할 때 다른 방법을 모두 사용한 후에만 ML을 시도해야 한다고 권장합니다.
ML은 광범위한 통계 기법을 결합합니다. ML을 사용하면 사전에 정답이 프로그래밍되어 있지 않더라도 문제에 대한 답을 추정하도록 컴퓨터를 훈련시킬 수 있습니다. 잘 설계된 ML 시스템을 사용하여 올바른 유형의 문제를 해결하면 다른 방법으로는 얻을 수 없는 통찰력을 얻을 수 있습니다.
모든 조직의 IT 환경에는 목적, 아키텍처, 우선순위 및 위험 허용 범위가 다릅니다. 모든 시나리오에서 보안 사용 사례를 광범위하게 지원하는 알고리즘, ML 또는 기타 제품을 만드는 것은 불가능합니다. 이것이 바로 보안 분야에서 ML을 성공적으로 적용한 대부분이 매우 특정한 문제를 해결하기 위해 여러 접근 방식을 결합하는 이유입니다. 일반적인 예로는 스팸 필터, DDoS 또는 봇 완화, 맬웨어 탐지 등이 있습니다.
1. 쓰레기는 넣으면 쓰레기가 나옵니다
ML의 가장 큰 과제는 실제 문제를 해결하는 데 관련 있고 유용한 데이터를 확보하는 것입니다. 지도 ML의 경우 적절하게 레이블이 지정된 대규모 데이터 세트가 필요합니다. 예를 들어 고양이 사진을 인식하는 모델을 구축하려면 '고양이'라는 라벨이 붙은 많은 고양이 사진과 '고양이 아님'이라는 라벨이 붙은 고양이가 아닌 사진 여러 개로 모델을 훈련해야 합니다. 사진이 부족하거나 라벨이 정확하게 지정되지 않으면 모델이 잘 나오지 않습니다.
보안 분야에서 잘 알려진 지도 ML 사용 사례는 시그니처 없는 악성 코드 탐지입니다. 많은 EPP(엔드포인트 보호 플랫폼) 공급업체는 ML을 사용하여 다수의 악성 및 양성 샘플에 라벨을 지정하고 "맬웨어의 형태"에 대한 모델을 교육합니다. 이러한 모델은 회피적인 돌연변이 악성 코드 및 기타 속임수(시그니처 탐지 방법을 회피할 수 있도록 변조되었지만 여전히 악성인 파일)를 올바르게 식별할 수 있습니다. 기능을 일치시키는 대신 ML은 다른 기능 세트를 사용하여 악성 콘텐츠를 예측하고 기능 기반 방법이 놓친 악성 코드를 포착하는 경우가 많습니다.
ML 모델은 확률적이므로 장단점이 있습니다. ML은 서명 방법으로 놓친 악성 코드를 포착할 수 있지만 서명 방법으로 놓친 악성 코드도 포착할 수 있습니다. 이것이 바로 최신 EPP 도구가 ML과 기능 기반 기술을 결합하여 최대 보호 범위를 달성하는 하이브리드 접근 방식을 사용하는 이유입니다.
2. 거짓양성 문제
모델이 잘 설계되었더라도 ML은 출력을 해석할 때 다음을 포함하여 몇 가지 추가적인 문제를 야기합니다.
- 결과는 확률입니다. ML 모델은 가능성을 출력합니다. 모델이 고양이를 식별하도록 설계된 경우 "이것이 고양이일 확률이 80%입니다."와 같은 결과가 표시됩니다. 이러한 불확실성은 ML 시스템에 내재되어 있으며 결과를 해석하기 어렵게 만들 수 있습니다. 고양이일 확률이 80%면 충분히 정확할까요?
- 적어도 최종 사용자는 모델을 조정할 수 없습니다. 확률적 결과를 처리하기 위해 도구는 공급업체가 설정한 임계값을 사용하여 이를 이진 결과로 처리할 수 있습니다. 예를 들어, 고양이 인식 모델은 모든 "고양이"가 고양이일 확률이 90% 이상이라고 보고할 수 있습니다. 이 영역에 대한 조직의 허용 오차는 공급업체가 설정한 허용 오차보다 높거나 낮을 수 있습니다.
- 진정한 악성 콘텐츠를 탐지하지 못하는 FN(False Negatives)은 ML 모델, 특히 제대로 조정되지 않은 모델의 주요 단점입니다. 우리는 시간을 낭비하기 때문에 거짓양성(FP)을 좋아하지 않습니다. 그러나 PF 금리와 FN 금리 사이에는 본질적인 상충 관계가 있습니다. ML 모델은 이러한 균형을 최적화하도록 조정되어 FP 비율-FN 비율의 "최상의" 균형을 우선시합니다. 그러나 "올바른" 균형은 개별 위협 및 위험 평가에 따라 조직마다 다릅니다. ML 기반 제품을 사용하는 경우 공급업체가 적절한 임계값을 선택한다는 것을 신뢰해야 합니다.
- 경보 분류에 대한 컨텍스트가 충분하지 않습니다. ML의 마법 중 하나는 데이터 세트에서 뚜렷하면서도 임의적인 '특징'을 추출하는 것입니다. 고양이를 식별하는 것이 날씨와 높은 상관관계가 있다고 상상해 보세요. 아무도 이런 식으로 추론하지 않을 것입니다. 하지만 이것이 ML의 핵심입니다. 다른 방법으로는 찾을 수 없는 패턴을 찾고 이를 대규모로 수행하는 것입니다. 예측된 원인이 사용자에게 노출되더라도 경보 분류나 사고 대응 상황에서는 도움이 되지 않는 경우가 많습니다. 이는 ML 시스템의 결정을 궁극적으로 정의하는 "기능"에 의한 예측 기능의 최적화 때문입니다.
3. "통계" 방법
에 대한 다른 이름이 아름답게 들리나요?
ML의 장단점 외에도 주목해야 할 사항이 하나 더 있습니다. 모든 "ML"이 실제로 ML인 것은 아닙니다. 통계적 방법은 데이터에 대한 몇 가지 결론을 제공할 수 있습니다. ML은 보유하고 있는 데이터와 보유하지 않은 데이터를 기반으로 예측을 수행합니다. 마케터들은 "ML"과 "인공 지능"이 일종의 현대적이고 혁신적이며 진보된 기술 제품이라고 주장하면서 이러한 인기를 활용하고 싶어합니다. 그러나 사람들은 ML이 올바른 접근 방식인지는 고사하고 이 기술이 ML을 사용하는지 여부에 대해 거의 생각하지 않는 경우가 많습니다.
4.ML이 악성 콘텐츠를 감지할 수 있나요?
ML은 '악성 콘텐츠'가 잘 정의되어 있고 범위가 좁은 경우를 감지할 수 있습니다. 또한 예측 가능성이 높은 시스템에서 예상되는 동작과의 편차를 감지할 수도 있습니다. 환경이 안정적일수록 ML이 이상치를 정확하게 식별할 가능성이 높아집니다. 그러나 모든 예외가 악의적인 것은 아니며 운영자가 항상 대응할 수 있는 충분한 컨텍스트를 갖고 있는 것은 아닙니다.
ML의 힘은 최적의 적용 범위와 효율성을 달성하기 위해 기존 방법, 시스템 및 팀을 대체하는 것이 아니라 강화하는 데 있습니다.
원본 링크: https://www.darkreading.com/vulnerabilities-threats/the-beautiful-lies-of-machine-learning-in-security
위 내용은 보안을 위한 머신러닝은 아름다운 거짓말인가요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











기계 학습 및 데이터 과학 분야에서 모델 해석 가능성은 항상 연구자와 실무자의 초점이었습니다. 딥러닝, 앙상블 방법 등 복잡한 모델이 널리 적용되면서 모델의 의사결정 과정을 이해하는 것이 특히 중요해졌습니다. explainable AI|XAI는 모델의 투명성을 높여 머신러닝 모델에 대한 신뢰와 확신을 구축하는 데 도움이 됩니다. 모델 투명성을 향상시키는 것은 여러 복잡한 모델의 광범위한 사용은 물론 모델을 설명하는 데 사용되는 의사 결정 프로세스와 같은 방법을 통해 달성할 수 있습니다. 이러한 방법에는 기능 중요도 분석, 모델 예측 간격 추정, 로컬 해석 가능성 알고리즘 등이 포함됩니다. 특성 중요도 분석은 모델이 입력 특성에 미치는 영향 정도를 평가하여 모델의 의사결정 과정을 설명할 수 있습니다. 모델 예측 구간 추정

C++의 기계 학습 알고리즘이 직면하는 일반적인 과제에는 메모리 관리, 멀티스레딩, 성능 최적화 및 유지 관리 가능성이 포함됩니다. 솔루션에는 스마트 포인터, 최신 스레딩 라이브러리, SIMD 지침 및 타사 라이브러리 사용은 물론 코딩 스타일 지침 준수 및 자동화 도구 사용이 포함됩니다. 실제 사례에서는 Eigen 라이브러리를 사용하여 선형 회귀 알고리즘을 구현하고 메모리를 효과적으로 관리하며 고성능 행렬 연산을 사용하는 방법을 보여줍니다.

머신 러닝은 명시적으로 프로그래밍하지 않고도 컴퓨터가 데이터로부터 학습하고 능력을 향상시킬 수 있는 능력을 제공하는 인공 지능의 중요한 분야입니다. 머신러닝은 이미지 인식, 자연어 처리, 추천 시스템, 사기 탐지 등 다양한 분야에서 폭넓게 활용되며 우리의 삶의 방식을 변화시키고 있습니다. 기계 학습 분야에는 다양한 방법과 이론이 있으며, 그 중 가장 영향력 있는 5가지 방법을 "기계 학습의 5개 학교"라고 합니다. 5개 주요 학파는 상징학파, 연결주의 학파, 진화학파, 베이지안 학파, 유추학파이다. 1. 상징주의라고도 알려진 상징주의는 논리적 추론과 지식 표현을 위해 상징을 사용하는 것을 강조합니다. 이 사고 학교는 학습이 기존을 통한 역연역 과정이라고 믿습니다.

번역기 | 검토자: Li Rui | Chonglou 인공 지능(AI) 및 기계 학습(ML) 모델은 오늘날 점점 더 복잡해지고 있으며 이러한 모델에서 생성되는 출력은 이해관계자에게 설명할 수 없는 블랙박스입니다. XAI(Explainable AI)는 이해관계자가 이러한 모델의 작동 방식을 이해할 수 있도록 하고, 이러한 모델이 실제로 의사 결정을 내리는 방식을 이해하도록 하며, AI 시스템의 투명성, 이 문제를 해결하기 위한 신뢰 및 책임을 보장함으로써 이 문제를 해결하는 것을 목표로 합니다. 이 기사에서는 기본 원리를 설명하기 위해 다양한 설명 가능한 인공 지능(XAI) 기술을 살펴봅니다. 설명 가능한 AI가 중요한 몇 가지 이유 신뢰와 투명성: AI 시스템이 널리 수용되고 신뢰되려면 사용자가 의사 결정 방법을 이해해야 합니다.

C++에서 기계 학습 알고리즘의 구현에는 다음이 포함됩니다. 선형 회귀: 연속 변수를 예측하는 데 사용됩니다. 단계에는 데이터 로드, 가중치 및 편향 계산, 매개변수 업데이트 및 예측이 포함됩니다. 로지스틱 회귀: 이산형 변수를 예측하는 데 사용됩니다. 이 프로세스는 선형 회귀와 유사하지만 예측에 시그모이드 함수를 사용합니다. 지원 벡터 머신(Support Vector Machine): 지원 벡터 계산 및 레이블 예측을 포함하는 강력한 분류 및 회귀 알고리즘입니다.

Java 프레임워크 디자인은 보안 요구 사항과 비즈니스 요구 사항의 균형을 유지하여 보안을 가능하게 합니다. 즉, 주요 비즈니스 요구 사항을 식별하고 관련 보안 요구 사항의 우선 순위를 지정합니다. 유연한 보안 전략을 개발하고, 계층적으로 위협에 대응하고, 정기적으로 조정하세요. 아키텍처 유연성을 고려하고 비즈니스 발전을 지원하며 보안 기능을 추상화합니다. 효율성과 가용성의 우선순위를 정하고 보안 조치를 최적화하며 가시성을 향상시킵니다.

Golang의 기계 학습을 사용하여 지능형 알고리즘 및 데이터 기반 솔루션 개발: 기계 학습 알고리즘 및 유틸리티용 Gonum 라이브러리를 설치합니다. 지도 학습 알고리즘인 Gonum의 LinearRegression 모델을 사용한 선형 회귀입니다. 입력 변수와 목표 변수가 포함된 학습 데이터를 사용하여 모델을 학습합니다. 모델이 선형 관계를 추출하는 새로운 특성을 기반으로 주택 가격을 예측합니다.

PHP 마이크로프레임워크에서 Slim과 Phalcon의 보안 비교에서 Phalcon에는 CSRF 및 XSS 보호, 양식 유효성 검사 등과 같은 보안 기능이 내장되어 있는 반면 Slim에는 기본 보안 기능이 부족하고 수동 구현이 필요합니다. 보안 조치. 보안이 중요한 애플리케이션의 경우 Phalcon은 보다 포괄적인 보호 기능을 제공하며 더 나은 선택입니다.
