3 Ongewenste e-mail
In dit thema worden de volgende onderwerpen besproken:
3.1 Spam
Ongevraagde berichten via e-mail, via de mobiele telefoon (SMS of MMS) of via een ander elektronisch kanaal worden spam genoemd.
"SPAM" is een merknaam uit de voedselindustrie: het is ingeblikte ham.
De makers van de Engelse televisieserie Monty Python gebruikten het in een sketch, die zich afspeelt in een café waarvan de menukaart vrijwel geheel uit gerechten met spam bestaat. Een groep Vikingen zingt voortdurend luidkeels: "Spam, spam, lovely spam, wonderful spam". Door het voortdurend gebruik van het woord spam wordt normaal converseren onmogelijk. Hierin zit de overeenkomst met elektronische spam: door de toename van e-mail spam wordt normaal e-mailen ook steeds moeilijker.
Behalve e-mailadressen, is het ook mogelijk om het internet te spammen. Dit kan bijvoorbeeld worden gedaan met een zogenaamde googlebom. Een googlebom is een methode om een bepaalde pagina hoog in de resultaten van Google te laten verschijnen terwijl de trefwoorden waar je op zoekt, niet eens voorkomen in de pagina. Probeer het maar eens met bijvoorbeeld de woorden "raar kapsel" of "miserable failure". Google bombing is mogelijk doordat Google niet alleen de frequentie van woorden op een pagina telt, maar ook het aantal links dat naar die pagina verwijst. Als veel mensen dus een link naar een bepaalde pagina plaatsen en daarbij trefwoorden gebruiken, dan zal Google deze pagina hoger ranken wanneer deze trefwoorden worden opgegeven in de zoekopdracht.
Naast SPAM bestaan er ook SPIM (ongewenste berichten via instant messaging) en SPIT (automatische oproep via de internettelefoon).
3.2 Hoaxes
Een hoax is een nepwaarschuwing. Meestal is het geschreven als een e-mailbericht. De e-mail probeert zich te verspreiden als een kettingbrief. Dit betekent dat in de boodschap de lezer wordt aangespoord om zoveel mogelijk mensen te informeren en de mail dus door te sturen. Het woord hoax komt uit het Engels, waar het zoveel betekent als nep, bedrog, truc of oplichterij.
Bekende voorbeelden van hoaxes zijn:
November 2005
heey iedereen,
vanaf 1 november moet je gaan betalen voor je MSN en mail van hotmail,
tenzij je dit mailtje doorstuurt naar 18 mensen. als je het niet gelooft
kijkt dan op www.msn.com. als je dit naar 18 mensen doorstuurt word je
MSN-poppetje blauw.
Maart 2006
Music Top 50, een nieuw tv-programma dat binnenkort op SBS6 komt, deelt gratis I-pods uit! Wanneer je dit mailtje doorstuurt naar ten minste 15 vrienden (of kennissen) krijg je een gratis I-pod thuisgestuurd. Je moet het mailtje ter controle ook naar bart@musictop50.com sturen, administratief medewerker Bart van Domburg die registreert wie er allemaal een gratis I-pods moeten krijgen.
Music Top 50 doet dit om aan meer naamsbekendheid te komen. Stuur je dit mailtje door naar 15 vrienden maak je dus reclame voor Music Top 50 en krijg je een gratis i-pod.
Als je het zelfs doorstuurt naar 50 vrienden, dan krijg je alle singles uit de Top 50 bijgeleverd met I-pod!
Stuur het door!
Januari 2003
Onderwerp: Waarschuwing voor virus !!
We hebben een boodschap ontvangen van een van onze contacten dat ons adresboek wel eens geïnfecteerd kan zijn door een virus (genaamd jdbgmgr.exe) dat niet gedetecteerd wordt door de Norton of McAfee antivirus scanners. Het virus slaapt ongeveer een 14 dagen voordat het je computer gaat beschadigen. Het wordt automatisch doorgestuurd naar je contacten uit je adresboek, of je nu hen een e-mail stuurt of niet. Als het aanwezig is op uw PC is het mogelijk geïnstalleerd in c:\Windows\system.
Wat moet u doen:
1.. Ga in Windows Verkenners naar Extra, Zoeken, Bestanden of mappen, of gewoon in het start menu "zoeken" etc.
2.. In het "Naam:" venster schrijft u "jdbgmgr.exe"
3.. In het "Zoeken in:" venster gaat u naar "Drive_c (C:)"
4.. Klik op "Nu zoeken"
5.. Het virus heeft een klein beertje als icoon en de naam "jdbgmg.exe" OPEN DIT NIET !!!!!!!!!
6.. Aanklikken met uw RECHTER muisknop en verwijderen (het gaat dan naar je Prullenbak)
7.. Ga nu naar de Prullenbak en verwijder het bestand of maak de Prullenbak helemaal leeg
ALS U HET VIRUS VINDT, MOETEN ALLE ADRESSEN IN UW ADRESBOEK GEWAARSCHUWD WORDEN, OOK AL HEEFT U DE LAATSTE TIJD GEEN E-MAILS GESTUURD, ZIJ KUNNEN DAN OP HUN BEURT OOK HUN CONTACTEN WAARSCHUWEN.
Een hoax herken je aan de volgende punten:
- Ze roepen op om het bericht door te sturen naar alle contactpersonen.
- Er wordt vaak gewezen op een groot gevaar of een beroep gedaan op medelijden.
- Er is overmatig gebruik gemaakt van leestekens.
- Er staan vaak spelfouten in.
Op de site www.nepwaarschuwing.nl kun je zien welke e-mailberichten hoaxes zijn.
Opdracht
Schrijf nu zelf een (onschadelijke!) hoax met de opdracht "Hoax" uit het menu-onderdeel "Opdrachten en Toetsen".
3.3 E-mailadressen
Ongewenste e-mail kan alleen maar verstuurd worden als bedrijven weten waar ze het naar toe moeten sturen. Hoe komen spammers nu aan deze e-mailadressen? Als je weet hoe bedrijven aan je e-mailadres komen dan weet je ook gelijk hoe je dit kunt voorkomen. Spammers en phishers hebben e-mailadressen nodig waar ze hun berichten naar toe kunnen sturen. Er zijn verschillende manieren om aan e-mailadressen te komen.
De eerste manier waarop spammers aan adressen kunnen komen is door gebruik te maken van een zogenaamde spider. Een spider is een programma dat het hele internet afzoekt naar @ symbolen. Dus op elke pagina die de spider tegenkomt zoekt hij naar het @-symbool. De spider slaat het woord voor en na het apenstaartje op in een bestand en zo vindt de spider een hoop e-mailadressen. Spiders zijn krachtige programma’s, dus als je geen ongewenste e-mailberichten wilt kun je het beste je e-mailadres geheim houden en het in ieder geval niet op internet zetten.
Een tweede manier waarop spammers aan adressen komen is door te gokken. Er bestaan computerprogramma’s die miljoenen adressen kunnen genereren: zoals jan1@hotmail.com, jan2@hotmail.com enzovoort. Je kunt dus overwegen om niet een standaard e-mailadres te nemen, maar een e-mailadres dat moeilijk te raden is door dit soort programma’s. Spammers hoeven niet eens zelf deze programma’s te gebruiken. Er zijn op internet dvd’s te koop vol met e-mailadressen.
Als spammers een adres gokken weten ze natuurlijk niet of dat adres bestaat. Wat ze daarom vaak doen is in een spam bericht een unieke verwijzing naar een plaatje of pagina opnemen. Zodra deze wordt geopend weten ze dat het adres dat hoort bij die unieke verwijzing bestaat. Het is dus verstandig om niet altijd alle plaatjes en links te bekijken als je een bericht niet vertrouwt.
3.4 Captcha
Als je een spam of phishing bericht wilt sturen, wil je dat natuurlijk niet van je gewone e-mailadres doen. Je wilt liever anoniem zijn. Daarom schakelen professionele spammers programma’s in om heel veel e-mailaccounts aan te maken bij een gratis webmaildienst zoals Hotmail of Gmail. Een computerprogramma dat dit automatisch kan doen wordt een bot genoemd. Een bot kan ook gebruikt worden om op gastenboeken of weblogs reclame achter te laten. Bots zijn voor spammers dus heel krachtige programma’s die veel werk in korte tijd kunnen doen.
Om te voorkomen dat een bot automatisch een formulier kan invullen kan op het formulier gebruik gemaakt worden van een captcha. Captcha is een afkorting voor "Completely Automated Public Turingtest to tell Computers and Humans Apart".
De bekendste voorbeelden van captcha’s zie je hieronder. Het is de bedoeling dat je de tekst overtypt. Pas als je de tekst goed overtypt kan je het formulier inleveren. Een bot heeft heel veel moeite om de teksten te lezen.
Hoewel Captcha’s nog veel worden gebruikt, werken ze niet meer zo goed als vroeger. De bots worden steeds slimmer en met behulp van patroonherkenning is het mogelijk voor de bots om de captcha’s te lezen.
Opdracht
Maak nu de opdracht "Captcha" uit het menu-onderdeel "Opdrachten en Toetsen".
3.5 Spamfilters
Men schat dat tegenwoordig bijna 90 procent van de e-mails die worden verzonden spam is. Daarom wordt er erg veel gedaan aan het bestrijden van spam. Een manier om dit te doen is gebruik te maken van spamfilters. Als gebruiker heb je dan weinig last van de spam, omdat die er voor je uit wordt gefilterd. Maar hoe werkt dat filteren precies?
De makkelijkste manier om mail te filteren is gebruik maken van een woordfilter. Alle berichten die binnenkomen, worden door de computer gescand. Als er een bepaald woord uit het woordfilter in voorkomt (bijvoorbeeld viagra), dan bestempelt de computer het bericht als spam.
Woordfilters kunnen werken met verboden woorden, zoals hierboven, en ook met toegestane woorden. Door te tellen hoeveel toegestane en verboden woorden een bericht bevat, kan de computer bepalen of een bericht wel of geen spam is. Dit heet een heuristisch filter. Zo een filter bepaalt eigenlijk de kans dat een bericht spam is.
Nog slimmer is het om geen vaste woordenlijsten te gebruiken, maar de woordenlijsten steeds aan te passen. In zo een geval wordt een spamfilter Bayesiaans genoemd. Bayesiaanse filters moeten worden getraind. Dit betekent, dat je het filter van tevoren moet vertellen welke berichten wel spam zijn, en welke berichten geen spam zijn. Het programma scant dan alle berichten, en maakt een lijst van alle woorden die in die berichten voorkomen.
Voor elk woord wordt geteld in hoeveel spamberichten het voorkomt en in hoeveel ham-berichten het voorkomt. Een ham-bericht is hetzelfde als een niet-spam bericht. Dit levert dus een lijst op met voor elk woord dat in de berichten voorkomt twee getallen: het aantal spamberichten waar het in voorkomt in en het aantal ham-berichten waar het in voorkomt. Een spamfilter wordt natuurlijk steeds beter als je het traint met meer berichten.
Voorbeeld
Bijvoorbeeld: Het filter is getraind met 1000 berichten, waarvan er 700 spam zijn en 300 ham. De lijst ziet er als volgt uit:
woord |
aantal keer in spam |
aantal keer in ham |
Aanbieding |
200 |
30 |
! |
500 |
100 |
boeken |
7 |
6 |
twee |
7 |
50 |
Het filter krijgt nu het volgende bericht binnen:
Aanbieding! Koop nu gloednieuwe boeken bij ons. Op is op. Betaal over twee jaar.
Is dit bericht nu spam of ham? Met de formule van Bayes kunnen we dit berekenen.
De formule is het makkelijkst uit te leggen aan de hand van een voorbeeld. Stel dat we alleen kijken naar woord aanbieding dat voorkomt in ons binnengekomen bericht en we willen weten of het bericht spam of ham is.
- P(spam|aanbieding) = De kans dat een bericht spam is als het woord aanbieding voorkomt. Dit is wat we gaan berekenen.
- P(aanbieding|spam) = de kans dat het woord aanbieding voorkomt in een spambericht = aantal keer dat het woord aanbieding in een spambericht voorkomt gedeeld door het totaal aantal spamberichten = 200/ 700 = 0.29
- P(spam) = de kans dat een bericht spam is = aantal spamberichten gedeeld door het totaal aantal berichten = 700/1000 = 0.7
- P(aanbieding) = de kans dat het woord aanbieding voorkomt = totaal aantal keer dat het woord aanbieding voorkomt gedeeld door totaal aantal berichten = 230/1000 = 0.23
We krijgen nu dus:
De kans dat een bericht met het woord aanbieding erin spam is, is 87%.
Naïeve Bayes
We hadden niet alleen een bericht waar het woord aanbieding in voorkwam maar we hadden een langer bericht. Hier komen de woorden aanbieding, !, boeken en twee voor in de lijst van het spamfilter. Je krijgt nu de naïeve Bayes formule:
We kunnen nu berekenen of het bericht met deze 4 woorden spam is.
- P(aanbieding|spam) = aantal keer dat het woord aanbieding in een spambericht voorkomt gedeeld door het totaal aantal spamberichten = 200/ 700 = 0.29
- P(!|spam) = aantal keer dat het woord ! in een spambericht voorkomt gedeeld door het totaal aantal spamberichten = 500/ 700 = 0.72
- P(boeken|spam) = aantal keer dat het woord boeken in een spambericht voorkomt gedeeld door het totaal aantal spamberichten = 7/ 700 = 0.01
- P(twee|spam) = aantal keer dat het woord twee in een spambericht voorkomt gedeeld door het totaal aantal spamberichten = 7/ 700 = 0.01
- P(spam) = aantal spam berichten gedeeld door het totaal aantal berichten = 700/1000 = 0.7
- P(aanbieding|ham) = aantal keer dat het woord aanbieding in een hambericht voorkomt gedeeld door het totaal aantal hamberichten = 30/ 300 = 0.1
- P(!|ham) = aantal keer dat het woord ! in een hambericht voorkomt gedeeld door het totaal aantal hamberichten = 100/ 300 = 0.33
- P(boeken|ham) = aantal keer dat het woord boeken in een hambericht voorkomt gedeeld door het totaal aantal hamberichten = 6/ 300 = 0.02
- P(twee|ham) = aantal keer dat het woord twee in een hambericht voorkomt gedeeld door het totaal aantal hamberichten = 50/ 300 = 0.17
- P(ham) = aantal ham berichten gedeeld door het totaal aantal berichten = 300/1000 = 0.3
De uitkomst is nu:
Opdracht
Maak nu de opdracht "Ongewenste e-mail " uit het menu-onderdeel "Opdrachten en Toetsen".