Anda mungkin telah melihat peningkatan jumlah surat sampah yang muncul di kotak email Anda, atau di newsgroup favorit Anda. Aktivitas sejumlah kecil orang menjadi masalah yang lebih besar bagi Internet. Surat berantai yang meminta uang, baik untuk laporan atau langsung, adalah ilegal di AS baik dalam surat pos atau email. Laporkan penipuan ini ke Postmaster AS setempat. Anda mungkin melihat email yang datang dari Nigeria atau negara Afrika lainnya, dikirim oleh seseorang yang ingin menggunakan rekening bank Anda untuk mentransfer 20 juta dolar. Ini disebut penipuan '419' dan orang-orang telah terbunuh karenanya.
Spam membanjiri Internet dengan banyak salinan dari pesan yang sama, dalam upaya untuk memaksa pesan pada orang-orang yang tidak memilih untuk menerimanya. Sebagian besar spam adalah iklan komersial, sering kali untuk produk yang meragukan, skema cepat kaya, atau layanan kuasi-legal.
Spam sangat sedikit membebani pengirim untuk dikirim -- sebagian besar biaya ditanggung oleh penerima atau operator, bukan oleh pengirim. Bagi penerima, spam mudah dikenali. Jika Anda mempekerjakan seseorang untuk membaca email Anda dan membuang spam, mereka tidak akan kesulitan melakukannya.
Berapa banyak yang harus kita lakukan, selain AI, untuk mengotomatisasi proses ini? Saya pikir kita akan dapat memecahkan masalah dengan algoritma yang cukup sederhana. Faktanya, saya telah menemukan bahwa Anda dapat memfilter spam masa kini dengan baik dengan menggunakan tidak lebih dari kombinasi Bayesian dari probabilitas spam dari setiap kata.
Dengan menggunakan filter Bayesian yang sedikit diubah (seperti dijelaskan di bawah), kami sekarang kehilangan kurang dari 5 per 1000 spam, dengan 0 positif palsu.
Salah satu varian spam email yang sangat buruk adalah mengirim spam ke milis (forum diskusi email publik atau pribadi.) Karena banyak milis membatasi aktivitas pelanggan mereka, spammer akan menggunakan alat otomatis untuk berlangganan milis sebanyak mungkin, sehingga mereka dapat mengambil daftar alamat, atau menggunakan milis sebagai target langsung serangan mereka.