나이브 베이지안 예제

통계 및 컴퓨터 과학 문헌에서, 순진한 베이즈 모델은 간단한 베이즈와 독립 베이즈를 포함하여 다양한 이름으로 알려져있다. [5] 이러한 모든 이름은 분류자의 결정 규칙에서 베이즈의 정리를 사용하는 것을 참조하지만, 순진한 베이즈는 (반드시) 베이지안 방법이 아니다. [4] [5] 3단계: 이제 Naive Bayesian 방정식을 사용하여 각 클래스의 사후 확률을 계산합니다. 사후 확률이 가장 높은 클래스는 예측결과입니다. 다음은 문서 분류 문제에 대한 순진한 베이지안 분류의 작업 예입니다. 예를 들어 스팸 및 스팸이 아닌 전자 메일로 문서를 콘텐츠별로 분류하는 문제를 고려합니다. 문서가 클래스 C에서 문서에서 문서에서 발생하는 (독립적 인) 확률이 클래스 C에서 문서에서 발생할 수있는 단어 의 집합으로 모델링 할 수있는 문서의 여러 클래스에서 그려진 다고 가정해 보십시오. , 순진한 베이즈 분류기는 감독 학습 환경에서 매우 효율적으로 훈련 할 수 있습니다. 많은 실용적인 응용 프로그램에서 순진한 Bayes 모델에 대한 매개 변수 추정은 최대 가능성의 방법을 사용합니다. 즉, 베이지안 확률을 수락하거나 베이지안 메서드를 사용하지 않고 순진한 베이즈 모델로 작업할 수 있습니다. Naive Bayes 분류기 기술은 소위 베이지안 정리를 기반으로 하며 입력의 치수성이 높을 때 특히 적합합니다. 단순함에도 불구하고 Naive Bayes는 종종 보다 정교한 분류 방법을 능가할 수 있습니다. Naïve 베이지 분류의 개념을 보여 주기 위해 위의 그림에 표시된 예제를 고려하십시오.

표시된 대로 개체는 녹색 또는 빨간색으로 분류할 수 있습니다. 우리의 임무는 새 서비스 케이스가 도착할 때 분류하는 것입니다( 즉, 현재 종료중인 개체에 따라 속하는 클래스 레이블을 결정). 이전 확률은 X가 GREEN에 속할 수 있음을 나타내지만(RED에 비해 녹색이 두 배 더 많다는 점을 감안할 때) 가능성은 그렇지 않으면 나타냅니다. X의 클래스 멤버 자격이 빨간색임을(녹색보다 X 근처에 더 많은 RED 개체가 있음을 감안할 때). 베이지안 분석에서 최종 분류는 정보의 두 소스, 즉 이전및 가능성을 결합하여 소위 베이즈 규칙(토마스 베이즈 목사 1702-1761의 이름을 따서 명명)을 사용하여 사후 확률을 형성함으로써 생성됩니다. 순진한 디자인과 지나치게 단순화 된 가정에도 불구하고, 순진한 Bayes 분류자는 많은 복잡한 실제 상황에서 꽤 잘 작동했습니다. 2004년에, 베이지안 분류 문제점의 분석은 순진한 베이즈 분류기의 명백하게 믿을 수 없는 효험을 위한 건전한 이론적인 이유가 있다는 것을 보여주었습니다. [6] 여전히, 2006년에 다른 분류 알고리즘과의 포괄적인 비교는 베이즈 분류가 부스트 트리 또는 무작위 숲과 같은 다른 접근법에 의해 능가되는 것으로 나타났습니다. [7] 레드보다 두 배 많은 녹색 물체가 있기 때문에, 새로운 사례(아직 관찰되지 않은 경우)가 레드가 아닌 녹색 멤버십을 가질 확률이 두 배라고 생각하는 것이 합리적입니다. 베이지안 분석에서, 이 믿음은 이전 확률로 알려져 있습니다. 이전 확률은 이전 환경을 기반으로 하며, 이 경우 녹색 및 빨간색 개체의 백분율을 기반으로 하며 실제로 발생하기 전에 결과를 예측하는 데 자주 사용됩니다.

Mentalny Teatr Hipnozy > 나이브 베이지안 예제