algorytm Bayesa

Algorytm Bayesa jest prostym klasyfikatorem, który jest wykorzystywany do klasyfikacji poczty elektronicznej pod względem zawartości. Mechanizm ochrony oparty na algorytmie Bayesa polega na analizowaniu częstotliwości występowania określonych słów w każdej wiadomości i opiera się na stosunku prawdopodobieństwa. Dana wiadomość klasyfikowana jest jako spam w przypadku, gdy zaburzona jest proporcja pomiędzy wyrażeniami należącymi do kategorii spam, a słowami niesklasyfikowanymi. Ten mechanizm stosowany jest powszechnie w wielu programach pocztowych, między innymi Microsoft Outlook, ale także we wtyczkach antyspamowych, które potrafią uczyć się i rozszerzać definicje spamu, analizując dokonywane przez użytkownika oznaczenia niechcianych wiadomości, dzięki czemu potrafią osiągać bardzo wysoką skuteczność. Nazwa „naiwnego klasyfikatora bayesowskiego” wywodzi się od nazwiska angielskiego matematyka Thomasa Bayesa (1702-1761).

Shares

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Wymagane pola są oznaczone *