E-klas Bioinformatica

E-klas Bioinformatica

Home

Welkom bij de module bioinformatica.

In deze module wordt je kennis over DNA en DNA technieken opgefrist en leer je meer over wat bioinformatica inhoudt.

Je kunt deze module zelfstandig uitvoeren of je kunt samenwerken met een klasgenoot, dat wordt bepaald door je docent.

Studiewijzer

Welkom bij de e-klas Bioinformatica.
Hieronder vind je de studiewijzer zodat je aan de slag kunt met deze e-klas.

De module is als volgt opgebouwd

Bij deze e-klas maak je gebruik van een werkdocument waarin vragen en opdrachten staan. Vanuit de module zal regelmatig verwezen worden naar het werkdocument. Sla je werkdocument ergens op waar je er makkelijk bij kunt, zoals op een USB-stick

Open bestand Werkdocument bioinformatica.doc

Halverwege de module maak je een toets over DNA. Deze toets maakt deel uit van de beoordeling. Je docent zal aangeven wat nog meer telt bij de beoordeling. Dat kan bijvoorbeeld het maken van de conceptmap zijn, de eindopdracht of de uitwerking van je werkdocument.

Ga naar het lesmateriaal.

Succes!

Start

Introductie

Welkom bij de e-klas 'bioinformatica'.

Je gaat met deze module zelf aan de slag als bioinformaticus. Je gebruikt een aantal van de tools die een bioinformaticus tot zijn beschikking heeft en je komt meer te weten over actueel onderzoek op het gebied van bioinformatica. Je onderzoekt de oorzaak van een erfelijke ziekte, schrijft een artikel over forensisch onderzoek en lost een moord op. Dat levert een aantal producten op, die je bij je docent inlevert. Je zult veel opdrachten in een werkdocument maken. Dat werkdocument vind je hier.

Open bestand werkdocument Bioinformatica

Sla het bestand op, bijvoorbeeld op een usb-stick of in je e-mail.

Eerst haal je je kennis op en leer je meer over de bouw en werking van DNA. Ook verken je hoe DNA-onderzoek in een laboratorium wordt uitgevoerd en leer je meer over een aantal belangrijke technieken. Halverwege deze module zal je kennis over DNA en DNA-onderzoek getest worden: je maakt een toets en samen met twee klasgenoten maak je een conceptmap. De begrippen die je in je conceptmap moet verwerken vind je cursief dikgedrukt in de verschillende hoofdstukken. Hou ze tijdens het uitvoeren van de module bij in de begrippenlijst.

Veel plezier bij het uitvoeren van deze module!

 

Anton Feenstra, Miranda Jansen en Bregje van den Berg

Inhoudsopgave

Inhoudsopgave
Start

Inhoud

Inleiding
Wat is bioinformatica?
Waar vind je bioinformatica?

Hoofdstuk 1
    1.1 Chromosomen
    1.2 Lichaamscellen
    1.3 Geslachtscellen
    1.4 Genen
    1.5 Karyogram

Hoofdstuk 2
    2.1 De bouw van DNA
    2.2 Nucleotiden
    2.3 Basenparen
    2.4 Suikermolecuul
    2.5 Sequencing

Hoofdstuk 3
    3.1 DNA replicatie
    3.2 Het replicatieproces
    3.3 Mutaties
    3.4 DNA-replicatie in het lab

Hoofdstuk 4
    4.1 Gen expressie
    4.2 Transcriptie
    4.3 Splicing
    4.4 Translatie
    4.5 Eiwitten
    4.6 Microarray

Hoofdstuk 5
    Conceptmap

Hoofdstuk 6
    6.1 Bioinformatica tools deel I
    6.2 Bioinformatica tools deel II
    6.3 Bioinformatica tools deel III
    6.4 Een gen of eiwit vinden

Hoofdstuk 7
    7.1 Moord op het vliegveld
    7.2 Identificatie - deel I
    7.3 Identificatie - deel II
    7.4 Identificatie - deel III

Hoofdstuk 8
    8.1 Misdrijven
    8.2 Misdrijven oplossen deel II

Hoofdstuk 9
    9.1 DNA onderzoek bij Stefanie
    9.2 DNA onderzoek deel I
    9.3 DNA onderzoek deel II
    9.4 DNA onderzoek deel III

Hoofdstuk 10
    10.1 Bioinformatica in het nieuws
    10.2 Een bioinformatica onderzoek opzetten

Inleiding

Hoe kan een Playstation 3 bijdragen aan onderzoek naar Alzheimer?

Bekijk het filmpje.

(bron: Youtube)
(bron: Youtube)

Open bestand Klik hier voor film.

Lees het volgende artikel: 'Playstation 3 geeft enorme boost aan onderzoek naar Alzheimer'

 

 Maak nu opgave 1 en 2 in je werkdocument. (Het volledige werkdocument vind je hier)

Open bestand werkdocument bioinformatica

Waar vind je bioinformatica?

Bioinformatica is het gebruiken van computers om biologische problemen op te lossen. Bioinformatica past kennis uit de informatica toe op biologische gegevens, met name op de gegevens die voortkomen uit genetisch onderzoek. Laboratoriumonderzoek op dit terrein levert zulke gigantische hoeveelheden gegevens op, dat ze alleen met behulp van informatica te verwerken zijn. Voor het ontrafelen, opslaan en het op een overzichtelijke manier toegankelijk en inzichtelijk maken van deze (bio)informatie worden computers gebruikt. Daarom heet dit werkterrein bioinformatica. Tegelijkertijd komen de vraagstukken die we willen oplossen uit de biologie.
De bioinformatica heeft zich ontwikkeld tot een breed multidisciplinair onderzoeksgebied op het grensvlak van de levenswetenschappen en de informatietechnologie. Zo levert bioinformatica bijdragen op het gebied van landbouw, veeteelt, medische wetenschap, biologisch onderzoek aan o.a. virussen, biotechnologie, genetic engineering, evolutieleer en forensisch onderzoek.

Lees het artikel 'Wat is bioinformatica?' van het NBIC (Netherlands Bioinformatics Centre).

1 Chromosomen

In de eerste vier hoofdstukken kijken we naar de bouw en werking van DNA. Dit rond je af met een toets en het maken van een conceptmap. We beginnen met het bestuderen van chromosomen en genen.

Wat zijn chromosomen?

Als we met een microscoop naar lichaamscellen van een mens kijken, zien we daarin een kern met chromosomen.
Als je de chromosomen in de celkern bekijkt, zie je dat deze bestaan uit twee chromatiden. De chromatiden zitten in het midden aan elkaar vast; dit noem je een centromeer. De langere uiteinden heten telomeren.
In de chromatiden zitten eiwitten die ervoor zorgen dat het DNA opgerold en bijeen gepakt zit. Chromosomen zijn de dragers van het erfelijk materiaal en komen in elke lichaamscel voor, in gewone lichaamscellen en in geslachtscellen.

Bekijk ook deze link op Bioplek over chromosomen.

Figuur1 : Chromosoom (bron: Wikipedia)
Figuur1 : Chromosoom (bron: Wikipedia)

1.2 Lichaamscellen

Elke gewone lichaamscel van een mens bevat 46 chromosomen, oftewel 23 chromosoomparen. Van elk paar is één chromosoom afkomstig van de moeder en de ander is afkomstig van de vader. Dit is tijdens de bevruchting tot stand gekomen, zie ook geslachtscellen.

Andere organismen kunnen een ander aantal chromosomen bevatten.

Maak opgave 3 in je werkdocument.

 

Bij de groei van lichaamsdelen of de aanmaak van nieuwe cellen delen lichaamscellen zich. De cel, inclusief celkern, wordt verdubbeld. Hierdoor ontstaan er twee nieuwe lichaamscellen. Dit proces wordt mitose genoemd.

Bekijk onderstaand filmpje over de mitose.

Open bestand Klik hier voor film.

Bekijk daarna deze link op Bioplek.

1.3 Geslachtscellen

Bij de vorming van de geslachtscellen delen cellen zich niet op dezelfde manier als bij een gewone celdeling. Dit gaat volgens een ander proces, namelijk de meiose. De chromosomen splitsen zich hierbij in haploïden: in één geslachtscel zitten 23 enkele chromosomen.

Bekijk onderstaand filmpje over de meiose.

Open bestand Klik hier voor film.

Bekijk daarna deze link naar Bioplek.

 

Tijdens de bevruchting komen de 23 chromosomen van de vader en de 23 chromosomen van de moeder bij elkaar. Op die manier ontstaat weer een cel met 46 chromosomen. Door verdere celdeling ontstaat er dan een lichaam met weer in elke lichaamscel 46 chromosomen.

Het 23e chromosoom is het geslachtschromosoom. Dit chromosoom bepaalt het geslacht van een individu. De vrouw heeft twee X-chromosomen en de man heeft een X en een Y chromosoom. Het 23e chromosoom van de moeder bepaalt samen met het 23e chromosoom van de vader het geslacht van het individu.

1.4 Genen

De chromosomen bevatten de genen. Een gen is een stukje van het chromosoom waarop de aanleg voor een erfelijke eigenschap ligt. De complete set chromosomen van een organisme noemen we het genoom. Het genoom omvat de volledige erfelijke aanleg van een organisme.

De twee chromosomen van een paar bevatten dezelfde genen in dezelfde volgorde, maar de invulling van de betreffende eigenschap kan verschillend zijn. Zo ligt het gen voor haarvorm bij beide chromosomen van een paar op dezelfde plaats, maar het kan op het ene chromosoom de aanleg voor krullend haar zijn en op het andere voor sluik haar. We noemen dit twee allelen van hetzelfde gen. Als beide allelen gelijk zijn, is de persoon voor deze eigenschap homozygoot. Zijn de twee allelen verschillend, dan is hij/zij heterozygoot. Een heterozygoot vertoont de eigenschap van het dominante allel. Bijvoorbeeld: de aanleg voor een bruine oogkleur is dominant over de aanleg voor een blauwe oogkleur, dus iemand met een bruin en een blauw allel heeft bruine ogen. Als een allel dominant is t.o.v. het andere, dan noemen we het andere recessief.

Thalassemie

 

In een dagblad stond de volgende vraag van een moeder en het daarbij behorende antwoord:

Sinds kort is er bij mijn zoon en bij mijzelf ontdekt dat wij allebei een vorm van α-thalassemie hebben.
Het enige dat ik erover is dat het een vorm van bloedarmoede is en dat het ook wel Middelandse Zeeziekte genoemd wordt.
En verder weet ik dat het erfelijk is.
Wat is nu kenmerkend voor deze vorm van bloedarmoede?

Thalassemie is een erfelijke vorm van bloedarmoede. Er bestaan verschillende vormen van: α-, β- en δ-thalassemie.
De lichte vorm is α-thalassemie en berust op verandering van de erfelijke code voor de bouw van α-globine, een van de polypeptiden in het hemoglobine. Het afwijkende Hb wordt eerder afgebroken dan normaal het geval zou zijn.

In chromosoom 16 zijn op twee plaatsen genen gelokaliseerd die coderen voor de aanmaak van α-hemoglobine. Het aantal functionele α-hemoglobinegenen dat ontbreekt bepaalt de ernst van de symptomen. In onderstaande tabel zijn mogelijke genotypen en hun uitwerkingen gegeven.

Figuur 15. Mogelijke genotype
Figuur 15. Mogelijke genotype

Bij de vrouw uit de vragenrubriek en bij haar zoon is een vorm van α-thalassemie aangetoond.

1.5 Karyogram

Bij het onderzoek naar erfelijke ziekten wordt eerst een karyogram (karyos = kern in het Grieks) gemaakt. Dit gaat als volgt:

1. Cellen worden in deling gebracht (gekweekt).
2. Tijdens de deling worden de cellen met chemische middelen stilgelegd en gekleurd.
3. De cel en de celkern worden stuk gemaakt, zodat de chromosomen los komen te liggen.
4. De chromosomen worden gefotografeerd en geordend op grootte en patroon van de gekleurde banden.

Soms is in het karyogram een afwijking te zien: er is een chromosoom teveel of te weinig aanwezig. Ook kan een deel van een chromosoom missen of groter zijn dan normaal.

 

 

 

Onderstaand karyogram toont geen afwijking.

Figuur 2: Karyogram (bron: Wikipedia)
Figuur 2: Karyogram (bron: Wikipedia)

Chromosomen zijn onder de microscoop alleen te zien tijdens de celdeling. Dit komt omdat ze zich voorafgaand aan de celdeling sterk verkorten, als het ware opwinden tot een heel compact figuurtje. We zien dan dat het chromosoom uit twee chromatiden bestaat die in het centromeer aan elkaar vast zitten: de typische vorm een chromosoom, zoals het altijd wordt afgebeeld.

Chromosoom betekent letterlijk 'gekleurd lichaam', zo genoemd omdat de chromosomen bij de gebruikelijke kleuringen van microscopische preparaten veel kleurstof opnemen, zodat ze duidelijk gekleurd zijn. Bij sterker uitvergroten zien we een kenmerkend patroon van donkere en lichte banden op de chromosomen; aan de hand van dit patroon (en hun lengte) kunnen ze in het karyogram van elkaar worden onderscheiden

Maak opgave 4 in je werkdocument.

Het hoofdstuk over chromosomen is nu afgerond. Werk de begrippenlijst in je werkdocument bij.

2 De bouw van DNA

2.1 De bouw van DNA

Hoe is DNA opgebouwd?

Bekijk onderstaande animatie.

DNA is de afkorting van Deoxyribo Nucleic Acid (Desoxyribonucleïnezuur) en bevat de complete erfelijke informatie van een organisme. Het molecuul bevindt zich in de celkern van de cel. De meeste lichaamscellen hebben een celkern en bevatten identiek DNA, dat is opgeslagen in de vorm van chromosomen.

Maak opgave 5 en 6 in je werkdocument.

2.2 Nucleotiden

Het DNA molecuul bestaat uit twee zeer lange ketens van nucleotiden, die als een wenteltrap om elkaar heen draaien en samen een dubbele helix vormen. Lange ketens die zijn opgebouwd uit gelijksoortige bouwstenen noemen we polymeren. De bouwstenen zijn in dit geval de nucleotiden, dus DNA is een polymeer van nucleotiden. De term 'nucleotide' is afgeleid van het Latijnse woord 'nucleus', wat 'kern' betekent.

Bekijk het volgende filmpje:

bron: YouTube
bron: YouTube

Open bestand Klik hier voor flim.

Elk nucleotide bestaat uit drie onderdelen: een base, een suiker en een fosfaatgroep. De nucleotiden verschillen wat betreft hun basen: er komen vier verschillende basen voor in DNA: adenine (A), thymine (T), cytosine (C) en guanine (G). De suiker in de nucleotide is desoxyribose. Dit suikermolecuul heeft de vorm van een vijfhoek. Via de fosfaatgroepen, aangeduid met P, zijn de nucleotiden in de DNA-keten met elkaar verbonden. Miljoenen aan elkaar gekoppelde suiker-fosfaat-suiker-fosfaat-groepen vormen de ruggengraat van de DNA-keten.

De grote ontdekking van Watson en Crick in de jaren vijftig van de vorige eeuw was dat het DNA-molecuul uit twéé van deze nucleotide ketens bestaat, waarbij ze om elkaar heen gedraaid zijn als een wenteltrap. Deze structuur noemen we de dubbele helix. De ene keten van nucleotiden is met de andere keten verbonden via waterstofbruggen tussen de basen. De waterstofbruggen vormen dus als het ware de treden van de wenteltrap. De beide ketens zijn complementair: adenine gaat alleen een binding aan met thymine, cytosine bindt alleen aan guanine. In schematische tekeningen zul je dus alleen A-T of C-G bindingen zien. Een A-T of C-G paartje noemen we een basenpaar.

Maak nu opgave 7 in je werkdocument.

2.3 Basenparen

Het basenpaar G-C heeft altijd drie bindingen, het A-T paar heeft twee bindingen. De binding tussen G en C is daardoor sterker dan die tussen A en T. Stukken DNA met veel GC bindingen kunnen bijvoorbeeld beter tegen hitte dan stukken waar veel AT bindingen zitten. Stukken DNA met veel AT basenparen zijn, doordat ze zwakker zijn, ook eenvoudiger van elkaar los te maken door enzymen.

De reden dat G niet aan A kan binden, is dat zij niet tegenover elkaar in de helix passen. Om dezelfde reden staan C en T te ver uit elkaar om een sterke binding te kunnen vormen. Op basis van grootte zouden zowel T en G als A en C wel samen 'in de helix passen'. Maar doordat zij voor deze binding niet de juiste atomen op de juiste plek hebben, kan er ook geen goede binding ontstaan. Daardoor vindt er dus alleen binding plaats tussen A en T en tussen C en G.

figuur 3: Basenparen (bron: NLT module)
figuur 3: Basenparen (bron: NLT module)

Even oefenen

 

 

Hieronder staat een gedeelte van een DNA streng. Maak dit stuk van het DNA-molecuul compleet door de basevolgorde van de tegenoverliggende streng in te vullen:

AAGTTACCGAGCCATTCACT

Plaats hier je muis

2.4 Suikermolecuul

De C-atomen van het suikerdeel van de nucleotide zijn genummerd. Daardoor is het makkelijker te zien op welke manier nucleotiden een polymeer vormen. Bekijk het volgende plaatje van een nucleotide. Dit is guanine, maar bij de andere nucleotiden is de opbouw van de C-atomen hetzelfde.

Figuur 4: Suikermolecuul en fosfaatgroep in DNA
Figuur 4: Suikermolecuul en fosfaatgroep in DNA

 

 

 

Terug naar de helix. Deze heeft een 3' uiteinde (spreek uit als 3 accent) en een 5' uiteinde. Dit is gebaseerd op de nummering van de C-atomen in de suiker. Het 5' uiteinde is het uiteinde van de keten waar nog een fosfaatgroep aan zit. Aan het 3' uiteinde van de keten zit het vrije 3' C-atoom.

Figuur 5: Structuur DNA (bron: NLT module)
Figuur 5: Structuur DNA (bron: NLT module)

Maak nu opgave 8 en 9, deze staan in je werkdocument.

2.5 Sequencing

Sequencen of sequencing is een techniek waarmee de basenvolgorde van een DNA-streng kan worden bepaald.

Bekijk de animatie op Bioplek om te kijken hoe het sequencen in zijn werk gaat.

 

Lees het artikel en bekijk de infographic over sequencen op deze website over genomics.

 

 

Bekijk onderstaande afbeelding:

bron: wikipedia
bron: wikipedia

Dit is het resultaat van een stuk gesequenced DNA.
Bepaal van het gele gedeelte de complementaire streng van het DNA. Doe dit per 3 nucleotiden.

Plaats hier je muis

 

Maak nu opgave 10 in je werkdocument.

Het hoofdstuk over de bouw van DNA is nu afgerond. Werk de begrippenlijst in je werkdocument bij.

 

3 DNA replicatie

Wat is DNA replicatie?

Voorafgaand aan de celdeling wordt het DNA verdubbeld. We noemen dit DNA-replicatie. Eerst worden de twee DNA-ketens een stukje van elkaar gescheiden. Vervolgens worden beide DNA-ketens 'afgelezen' en wordt langs elk van beide een nieuwe keten gevormd. De oude DNA-keten vormt een sjabloon voor de nieuwe keten: tegenover elke A in de oude keten komt een T in de nieuwe keten, en hetzelfde geldt voor C en G.

Een nucleotide bestaat uit een suikermolecuul, een fosfaatgroep en een base. Bekijk het suikermolecuul van DNA - desoxyribose -eens in detail (zie figuur 6): het bevat 5 C-atomen; vier daarvan vormen samen met een O-atoom een vijfhoek, het vijfde C-atoom steekt er als een los armpje uit. In het DNA-molecuul is de C1-punt van de suikervijfhoek naar het midden gericht: hieraan zit de base vast (A, T, C of G).

Figuur 6: structuur van desoxyribose. Aan C1 zit de base en aan C5 zit de fosfaatgroep in het DNA. (bron: NLT module)
Figuur 6: structuur van desoxyribose. Aan C1 zit de base en aan C5 zit de fosfaatgroep in het DNA. (bron: NLT module)

Twee nucleotiden zijn in het DNA met elkaar verbonden via een fosfaatgroep tussen de C3 van het ene suikermolecuul en de C5 van de volgende. Zie ook BINAS.

Bij de replicatie kan alleen aan de 3'-kant van een nucleotide een nieuwe nucleotide bevestigd worden. Daarom vindt replicatie plaats in één richting. De bestaande DNA-keten wordt afgelezen van 3' naar 5' (zie figuur 7).

Figuur 7: DNA-replicatie (bron: NLT module)
Figuur 7: DNA-replicatie (bron: NLT module)

Het enzym helicase draait de nucleotideketens van de DNA-spiraal uit elkaar door het verbreken van de waterstofbruggen ertussen: het dubbelstrengs DNA 'ritst open'. Een door het enzym DNAprimase gemaakte RNA-primer hecht zich aan de uit elkaar gedraaide nucleotideketens. Vanaf deze plek begint de DNA-replicatie. Wanneer het primermolecuul zich geplaatst heeft, hecht het enzym DNA-polymerase telkens een volgend nucleotide - complementair aan de 'oude' keten - aan de primer, tot de hele streng is afgelezen. Tijdens de verdubbeling van het DNA-molecuul wordt de DNA-streng in de 3'- naar 5'-richting afgelezen (en de nieuwe streng in de 5'- naar 3'-richting opgebouwd).

De Japanse onderzoeker Reiji Okazaki ontdekte dat de antiparallelle streng in kleine fragmenten wordt gerepliceerd. Eerst hecht een RNA-primer aan de streng. Deze wordt vervolgens in de 5'- naar 3'-richting verlengd met nucleotiden door DNA-polymerase. Zo'n RNA-primer met een kortstukje DNA (ongeveer honderd nucleotiden) wordt een Okazaki-fragment genoemd. DNA-polymerase vervangt uiteindelijk ook het RNA in het fragment door DNA. Vervolgens worden de korte DNA-fragmenten door het enzym ligase aan elkaar geplakt.

3.2 Het replicatieproces

 Bekijk het volgende filmpje.

Open bestand Klik hier voor film.

Maak bijbehorende opgaven (11 t/m 14) in je werkdocument.

3.3 Mutaties

Bij de verdubbeling van het DNA voorafgaand aan de celdeling kunnen fouten optreden. Hierdoor ontstaan mutaties in het DNA. Ook andere invloeden kunnen mutaties veroorzaken. Het DNA kan bijvoorbeeld beschadigd worden door UV-straling.
Als dergelijke fouten optreden bij de vorming van geslachtscellen, zullen deze doorgegeven worden aan de nakomelingen.

We onderscheiden verschillende soorten fouten in het DNA:
- Een nucleotide kan vervangen zijn door een andere nucleotide (puntmutatie, meer specifiek: een substitutiemutatie)
- Eén of meerdere nucleotiden zijn verdwenen (deletie)
- Er is/zijn een of meer extra nucleotiden ingevoegd (insertie)

Lees meer over mutaties en mogelijke gevolgen ervan in het artikel 'Kanker, een ziekte van het DNA'

 

 Maak opgaven 15 en 16 in je werkdocument.

Figuur 8: SNP (bron: Wikipedia)
Figuur 8: SNP (bron: Wikipedia)

3.4 DNA replicatie in het lab

Omdat een (DNA-)molecuul zo klein is, is het moeilijk te bestuderen. De analyse wordt vergemakkelijkt door het DNA te vermenigvuldigen. Een techniek om vele kopieën te maken van een kleine hoeveelheid DNA is de polymerase-kettingreactie (polymerase chain reaction, PCR). Het principe van de PCR-techniek is gebaseerd op de manier waarop DNA in de natuur wordt vermenigvuldigd als de cel zich deelt. Bij de PCR-techniek wordt het DNA verwarmd, waardoor de twee strengen uit elkaar gaan. Deze strengen fungeren elk als mal voor een nieuw te vormen streng DNA.

Figuur 9: principe van PCR (bron: NLT module)
Figuur 9: principe van PCR (bron: NLT module)

Het enzym DNA-polymerase zorgt ervoor dat de toegevoegde vrije DNA-nucleotiden aan elkaar worden geregen, waardoor er een stukje nieuw DNA ontstaat dat identiek is aan het origineel. Dit proces wordt een aantal malen herhaald door afwisselend te verwarmen en te koelen, zodat een grote hoeveelheid kopieën ontstaat. Na 30 cycli zijn er al meer dan één miljard kopieën van een DNA-molecuul gemaakt (zie figuur 9).
De gevoeligheid van de PCR-techniek is zo groot dat DNA-diagnostiek uitgaande van een enkel DNA-molecuul mogelijk is. Toepassingen liggen op verschillende gebieden, zoals genetica, microbiologie, virologie en kankeronderzoek.

Bekijk ook de animatie over PCR op Bioplek en de duidelijke infographic in het artikel 'Zo werkt PCR'.

 

Het hoofdstuk over DNA replicatie is nu afgerond. Werk je begrippenlijst in je werkdocument bij.

4. Genenexpressie

4.1 Genenexpressie

Wat doet een gen?

Hoe kan een gen regelen dat er iets gebeurt in de cel? Hoe bepaalt een gen een erfelijke eigenschap zoals oogkleur of haarvorm? En hoe komt het dat een verandering in een gen - een mutatie - soms zulke dramatische gevolgen heeft?
Dit heeft te maken met genexpressie: de uitwerking die een gen heeft.
Eigenlijk 'doen' genen zelf niets, maar zij zijn als het ware de 'bouwtekening' voor eiwitten en eiwitten vervullen alle mogelijke belangrijke functies in en buiten de cel.

Een gen codeert voor een eigenschap doordat de nucleotide volgorde van dit gedeelte van het DNA vertaald kan worden in een bepaald eiwit; dit gebeurt door specifieke aminozuren in een bepaalde volgorde aan elkaar te koppelen.

MeMet andere woorden: de nucleotide volgorde van een stuk DNA (een gen) wordt vertaald in de aminozuur volgorde van een eiwit. Als dit eiwit goed gemaakt is, vervult het een bepaalde functie in of buiten de cel: het eiwit 'doet iets'. Wanneer een gen wordt afgeschreven en wordt vertaald naar eiwit, noemen we dit genexpressie.t andere woorden: de nucleotide volgorde van een stuk DNA (een gen) wordt vertaald in de aminozuur volgorde van een eiwit. Als dit eiwit goed gemaakt is, vervult het een bepaalde functie in of buiten de cel: het eiwit 'doet iets' en deze activiteit kun je genexpressie noemen.

De informatie op het DNA wordt via RNA vertaald in eiwitten. De vraag hoe deze vertaling precies gereguleerd wordt, is nog steeds een bron voor veel wetenschappelijk onderzoek.

 

4.2 Transcriptie

De vertaling van DNA naar eiwit verloopt in twee stappen: transcriptie en translatie.

In de eerste stap wordt het DNA van het gen 'afgelezen': er wordt een nieuw molecuul gevormd, complementair aan een van de twee polymeerketens in het DNA. Het molecuul dat gevormd wordt heet boodschapper- of messenger RNA, afgekort mRNA. Het vormen van mRNA langs een DNA-keten wordt transcriptie genoemd (zie figuur 10).

Figuur 10: Transcriptie (bron: NLT module)
Figuur 10: Transcriptie (bron: NLT module)

Net als DNA is RNA een polymeer van nucleotiden. Het suikerbestanddeel van het RNA-nucleotide is anders dan van DNA: ribose in plaats van desoxyribose, vandaar de naam RNA in plaats van DNA:

Figuur 11: Suikermolecuul in DNA en in RNA
Figuur 11: Suikermolecuul in DNA en in RNA

De basen zijn dezelfde als bij DNA, met uitzondering van Thymine (T), dat vervangen is door Uracil (U).

Bij de vorming van mRNA langs de DNAketen wordt (net als bij de DNA-replicatie) tegenover een C een G ingebouwd en omgekeerd, en tegenover een T een A. Tegenover een A komt nu echter een U in plaats van een T (zie figuur 10).

Het vormen van een mRNA-molecuul gaat per gen. Als de hele nucleotidevolgorde van één gen is 'overgeschreven' in een mRNA-molecuul, laat het mRNA los van het DNA, verlaat het de celkern en brengt het de informatie naar de ribosomen in het cytoplasma. Hier zal op basis van de informatie in het mRNA een eiwit worden gemaakt: mRNA is de boodschapper die informatie vanuit de celkern overbrengt.

Niet al het DNA codeert voor eiwitten, het proces dat dit beschrijft noemt men splicing.

4.3 Splicing

Tot ongeveer 1977 dacht men dat elk gen volledig werd omgezet in mRNA, dat vervolgens codeert voor een eiwit. Dit blijkt niet het geval te zijn. Er blijken stukken DNA in de genen te zitten die niet terugkomen in het mRNA en dus ook niet in de aminozuurvolgorde van het gecodeerde eiwit. De stukken DNA van een gen die niet omgezet worden in mRNA worden intronen genoemd. De stukken DNA die wel omgezet worden in mRNA heten exonen.
 
Het verwijderen van de intronen vindt plaats in het transcriptieproces naar mRNA. Zowel de intronen als de exonen worden eerst vertaald naar pre-mRNA. Vervolgens worden de intronen uit het pre-mRNA geknipt en worden de exonen aan elkaar vastgemaakt. Dit nieuwe mRNA, dat dus alleen nog uit exonen bestaat, wordt in eiwit vertaald.
Het verwijderen van de intronen en het vastmaken van de exonen wordt splicing genoemd. Het is nog niet precies duidelijk waarom intronen bestaan.

Figuur 12: Een gen vertaald in pre-mRNA bevat nog stukken die moeten worden verwijderd. Na splicing ontstaat mRNA. (bron: NLT module)
Figuur 12: Een gen vertaald in pre-mRNA bevat nog stukken die moeten worden verwijderd. Na splicing ontstaat mRNA. (bron: NLT module)

Zonder het splicing proces zouden er eiwitten ontstaan met een compleet andere aminozuursamenstelling en een totaal afwijkende functie. Het is zelfs nog maar de vraag of het gevormde eiwit een functie zou hebben.

Intronen zijn dus stukken DNA van een gen die niet coderen voor aminozuren. Maar intronen zijn niet de énige stukken DNA in het genoom die niet voor eiwitten coderen. Het is zelfs zo dat 97% van het menselijk DNA voor geen enkel eiwit codeert en geen bekende functie heeft. Verklaringen hiervoor gaan in de richting van de evolutie van de mens en/of wijzen op een mogelijke taak in het reguleren van de 'echte' genen.
Genen vormen dus slechts 3% van ons gehele genoom. Het aantal genen van de mens wordt geschat op 25 à 30 duizend.
De gekoppelde exonen vormen het definitieve mRNA dat gebruikt wordt om een eiwit te maken.

Bekijk deze animatie op Bioplek over splicing.

4.4 Translatie

Hoe komt een eiwit tot stand?

De volgorde van de basen in het DNA - de sequentie - vormt de code waarin de genetische informatie is vastgelegd. Een groepje van 3 opeenvolgende basen (b.v. ATG, GCC, TAG) noemen we een triplet of codon. De opeenvolgende codons van één gen bevatten de instructie voor het maken van één eiwit.

Eiwitten zijn polymeren van aminozuren. In de 'eiwitfabriekjes' van de cel - de ribosomen - worden de aminozuren aan elkaar geregen tot een lange keten. Wélke aminozuren en in welke volgorde: dat 'werkvoorschrift' wordt door het mRNA naar de ribosomen gebracht. De benodigde aminozuren - de 'onderdelen' - worden naar de ribosomen gebracht door een ander soort RNA, het zogeheten transport- of transfer RNA, afgekort tRNA. Een tRNA-molecuul heeft aan één uiteinde een codon van drie nucleotiden (complementair aan een codon van het mRNA) en aan het andere uiteinde een bindingsplaats voor een aminozuur. In BINAS kun je de structuurformule van tRNA zien.

De tRNA's brengen de aminozuren naar het ribosoom. Hier worden de aminozuren aan elkaar gekoppeld in de volgorde die gedicteerd wordt door de volgorde van de tripletten in het mRNA. Als 'zijn' aminozuur aan de eiwitketen is gekoppeld, laat het tRNA los.

Het vertalen van mRNA naar eiwitten heet translatie. Dit is de tweede stap in de vertaling van DNA naar eiwit. De eerste stap was de transcriptie van DNA naar mRNA.

Translatie vindt plaats in de ribosomen, bolvormige structuren in het cytoplasma van de cel.

Doordat er vier verschillende basen zijn, zowel in het DNA als in het mRNA, zijn er 64 verschillende tripletten mogelijk. Er zijn echter maar twintig verschillende aminozuren. De meeste aminozuren worden dan ook gecodeerd door meerdere tripletten.

De synthese van een peptideketen begint altijd met het aminozuur methionine, gecodeerd in het mRNA door het triplet AUG. Dit is dus het startcodon. Aan methionine worden stap voor stap andere aminozuren gekoppeld, waarbij elk volgend triplet bepaalt welk aminozuur wordt ingebouwd. Verlenging van de keten gaat door tot een stopcodon wordt ontmoet.
De drie tripletten UAG, UGA en UAA coderen niet voor inbouw van een aminozuur, maar geven het einde van de eiwitketen aan. Dit zijn de stopcodons.

Bekijk nu deze animatie op Bioplek voor het gehele transcriptie en translatieproces voordat je zelf aan de slag gaat.

 

Voer nu onderstaande applet uit.

4.5 Eiwitten

Eiwitten zijn grote moleculen die zijn opgebouwd uit aminozuren. De aminozuren worden in het ribosoom aan elkaar gekoppeld door middel van de zogenaamde peptidebinding:

Figuur 13: Bouwstenen van eiwitten
Figuur 13: Bouwstenen van eiwitten

De aminozuren hebben allemaal dezelfde basisstructuur: H2 N-CH-COOH. Aminozuren verschillen van elkaar door verschillende atomen of groepen atomen aan het koolstofatoom naast het stikstofatoom, R1 in aminozuur 1 en R2 in aminozuur 2. De aminozuren waaruit eiwitten zijn opgebouwd staan allemaal in de Binas, hier staan ook de verschillende restgroepen afgebeeld.

De aminozuren worden tijdens de translatie aan elkaar gekoppeld. Zo ontstaan eerst korte ketens van aminozuren (oligopeptiden); deze groeien uit tot polypeptiden, bestaande uit enkele tientallen aminozuren, en uiteindelijk kunnen hieruit de zeer lange aminozuurketens ontstaan die we eiwitten noemen. De keten 'vouwt zich op' tot een ingewikkelde ruimtelijke structuur, op een voor elk eiwit specifieke manier.

Bekijk onderstaand filmpje.

 

4.6 Microarray

Een microarray is een plaatje waarin het complete genoom van een bepaald organisme zichtbaar is.

Op een microarray zijn veel verschillende vakjes te zien. Via verschillende technieken is het mogelijk om in elk vakje één specifiek gen van een bepaald organisme te laten zien. Omdat alle vakjes samen het complete genoom van dat organisme laten zien, wordt een microarray ook wel een DNA-chip genoemd.

Figuur 14 Microarray (bron: Wat is genomics)
Figuur 14 Microarray (bron: Wat is genomics)

Lees dit artikel om meer over een microarray te leren.

 

Bekijk deze link waarin een animatie is te zien wat een microarray is. Deze site is wel in het Engels.

 

Het hoofdstuk over genexpressie is nu afgerond. Werk de begrippenlijst in je werkdocument bij

5. Conceptmap

Conceptmap over DNA

 

De afgelopen hoofdstukken heb je je verdiept in DNA en verschillende DNA-technieken. Je hebt nu een begrippenlijst opgebouwd van de kernbegrippen uit de verschillende hoofdstukken. Van die begrippen ga je met een klasgenoot een conceptmap maken. In een conceptmap maak je op een overzichtelijke manier duidelijk wat de verschillende begrippen met elkaar te maken hebben. Ga als volgt aan de slag:

1. Schrijf de begrippen die met elkaar te maken hebben op een papier.
2. Bespreek samen hoe die begrippen met elkaar te maken hebben.
3. Pak een groot vel papier en schrijf middenin het vel het woord 'DNA'.
4. Schrijf de andere begrippen ook op het vel. Probeer dit zo overzichtelijk mogelijk te doen.
5. Trek pijlen tussen de begrippen die met elkaar te maken hebben. Zet bij elke pijl wat de relatie tussen de begrippen is. Voorbeelden hiervan zijn:
- bestaat uit
- heeft invloed op
- remt
- produceert
- speelt een rol bij
- noemt men
- etc.

voorbeeld van een conceptmap ( bron: http://library.usu.edu/instruct/tutorials/cm/CMSamples.htm)
voorbeeld van een conceptmap ( bron: http://library.usu.edu/instruct/tutorials/cm/CMSamples.htm)

DNA en bio-informatica

Je bent klaar met de basis over DNA. In de komende hoofdstukken leer je meer over bio-informatica en je gaat zelf als bio-informaticus aan de slag. Zo onderzoek je een moord en achterhaal je welke ziekte Stefanie heeft. Aan het einde van deze e-klas ga je op zoek naar bio-informatica in het nieuws. Succes!

6. Bioinformatica tools

6.1 Bioinformatica tools - deel I

Waar werken bioinformatici mee?

In 1990 is de Human Genome Organisation (HUGO) gestart met een project om het volledige genoom van de mens op te helderen: het Human Genome Project. In 2003 was dit project afgerond, waardoor de hele nucleotidenvolgorde van het DNA van de mens nu bekend is. Gebleken is dat het genoom van de mens ongeveer 3 miljard basenparen bevat. Om zo'n grote hoeveelheid informatie op te kunnen slaan wordt gebruik gemaakt van databases. De databases van het genoom van de mens en van andere organismen zijn te vinden op het internet. Zo is de informatie wereldwijd toegankelijk. Vanwege de enorme hoeveelheid informatie wordt steeds slechts één streng van het DNA opgeslagen in de database.

De toegankelijkheid van de bioinformatica databases op het internet maakt het mogelijk om een te onderzoeken sequentie te vergelijken met al bekende sequenties. Het doet er daarbij niet toe of de sequentie uit een tiental of uit tienduizenden nucleotiden bestaat. Je kunt hem vergelijken als geheel of in fragmenten, met gehele of fragmentarische sequenties van organismen van de eigen soort of van andere soorten. In de bioinformatica databases vind je sequenties van gezonde mensen en sequentie-afwijkingen van patiënten, gemiddelde gensequenties van planten, dieren, bacteriën, virussen, schimmels, eigenlijk alles wat maar een eiwit of erfelijk materiaal bij zich draagt.
De kunst is om gericht te zoeken. Met de juiste computerprogramma's, die het vele rekenwerk overnemen, kunnen de gewenste analyses en vergelijkingen dan snel gemaakt worden.
Bijzonder is dat je niet alleen statistisch kunt bepalen of er een zekere verwantschap is tussen sequenties, maar dat je ook toegang hebt tot alle (onderzoeks)literatuur omtrent de betreffende sequenties, omdat die hieraan gekoppeld is op het internet.

Bekijk het filmpje uit het programma Nieuwslicht.

 

6.2 Bioinformatica tools - deel II

Zoeken naar een gen

Slechts een klein deel van het DNA bestaat uit genen. Een zeer klein deel van een heel erg lange reeks basen bestaat uit betekenisvolle sequenties. Als je een bepaald gen zoekt, moet je - ook al is het zoekgebied al beperkt tot een bepaald deel van een chromosoom - toch nog een geweldig lange reeks basen onderzoeken. Zonder bioinformatica zou dit onmogelijk zijn.

De informatie in het DNA is gerangschikt in groepjes van drie nucleotiden (tripletten, codons) op de beide ketens van de dubbele helix. De meeste tripletten coderen elk voor een aminozuur. De code voor het aminozuur methionine (ATG) is tevens startcodon: hiermee begint elk eiwit. En drie tripletten (TAA, TAG en TGA) coderen niet voor aminozuren, het zijn zgn. stopcodons.

Bij het onderzoek van een bepaalde DNA-sequentie weet je niet van tevoren hoe het DNA in tripletten is verdeeld, je weet namelijk niet waar een triplet begint. Er zijn drie mogelijkheden per DNA-streng om te beginnen met het lezen van de tripletten: bij de eerste nucleotide, bij de tweede of bij de derde. Gaan we uit van dubbelstrengs DNA, dan zijn er dus zes mogelijkheden voor het lezen, ofwel zes mogelijke 'reading frames'. Alle zes reading frames moeten dan ook worden onderzocht op de aanwezigheid van start- en stopcodons.
Een lange reeks tripletten zonder stopcodon noemen we een Open Reading Frame (ORF). Zo'n lang stuk tussen een start- en een stopcodon kan mogelijk de code voor een eiwit bevatten. Verreweg de meeste ORF's blijken echter geen gen te zijn.

6.3 Bioinformatica tools - deel III

Sequenties vergelijken

De databases van genomen die op het internet te vinden zijn maken het mogelijk om een stuk DNA te vergelijken met het DNA uit de database. De computer vergelijkt de nucleotide volgorde van het stuk DNA met de nucleotide volgorde van het hele genoom uit de database. Het stuk genoom dat het meest overeenkomt met het stuk DNA wordt weergegeven. Het vergelijken van de nucleotide volgorde van twee stukken DNA wordt alignen genoemd. Door DNA te alignen kunnen mutaties worden gevonden.

Bij het alignen en het interpreteren van de resultaten ervan, moeten we rekening houden met de volgende aspecten:

- Een DNA-sequentie heeft zes mogelijke reading frames. Alle zes reading frames moeten worden onderzocht op de aanwezigheid van start- en stopcodons.
- Twee DNA-sequenties die veel overeenkomst hebben in de volgorde van hun nucleotiden kunnen door een verschil in reading frame toch voor totaal andere eiwitten coderen.
- Het kan zo zijn dat een stuk DNA ten opzichte van een ander stuk slechts één nucleotide mist. Dit stuk DNA geeft dan echter een totaal ander eiwit, aangezien de aminozuren door tripletten gecodeerd worden. Een ander stuk DNA kan wel op drie plaatsen verschillen, maar toch beter alignen. Het computerprogramma moet hier rekening mee houden. Verder worden de meeste aminozuren door meerdere tripletten gecodeerd. Een mutatie die een triplet verandert in een ander triplet dat voor hetzelfde aminozuur codeert, zal geen effect hebben voor de functie van het eiwit.
- Het is belangrijk rekening te houden met de kans dat een DNA-sequentie toevallig voorkomt in een genoom. Bij een hele korte sequentie is de kans dat die toevallig voorkomt uiteraard groter dan bij een hele lange sequentie.

Om de problemen met het open reading frame en de problemen met de verwijdering van slechts één nucleotide te vermijden, worden vaak de eiwitsequenties met elkaar vergeleken in plaats van de DNA-sequenties. Dit heet het alignen van eiwitsequenties. Hierbij is het wel van belang dat je zeker weet welke van de zes ORF de juiste eiwitsequentie oplevert.

6.4 Een gen of eiwit vinden

Even oefenen

 

 

Een lange reeks basen heeft, zoals je hebt gelezen, meerdere reading frames (ORF). Vul in de volgende tabel de drie mogelijk aminozuurketens in. Verdeel de gegeven DNA-sequentie in tripletten; dit kan op drie manieren. In frame 1 vul je de aminozuurketen in die ontstaat als de DNA-sequentie vanaf de eerste nucleotide wordt afgelezen. In frame 2 begin je bij de tweede en in frame 3 bij de derde. Geef de aminozuren aan met hun eenletterige symbool (kijk in BINAS 70E of BioData 5.7).

Plaats hier je muis

 

Dit is natuurlijk niet te doen bij lange reeksen basen. In de bioinformatica wordt gebruik gemaakt van een programma dat ORF's zoekt.

Een eiwit vinden

Haal de sequentie (FASTA format) ‘Reading Frame 01’ van vaklokaal NLT. Klik hiertoe op het kopje sequenties en vervolgens op ‘reading frames’. Kopieer de sequentie (digitaal) en plaats deze in de tool: ORF Finder.

Voer de randvoorwaarden in zoals in de onderstaande figuur is weegegeven.

Klik dan op submit en de ORF Finder geeft aan waar in de gegeven sequentie een ORF gevonden is. Ga dit na voor de drie frames van de forward strand (direct strand) en voor de drie frames van de reverse strand. Let op de ORFs staan niet van groot naar klein gesorteerd.

Zoek het grootste ORF. Als je niet zo snel kunt zien welke ORF het grootste is, kun je gebruik maken van een andere ORF Finder. Plak daar de nucleoridesequentie in en druk vervolgens op OrfFind. Vervolgens verschijnen van boven naar beneden de gevonden ORFs van groot naar klein. + beteket de formward strand en - de reserve strand.

 

Kopieer de langste nucleotidesequentie naar het programma BLAST. Klik eerst op human en vervolgens op blast. Plak de sequentie in het lege witte vak en klik op BLAST.

 

Komt het overeen met een humaan gen of een deel ervan? 

 

 

 

Ga verder met het volgende hoofdstuk om erachter te komen wat BLAST is en om daarmee te oefenen.

7. Moord op het vliegveld

7.1 Moord op het vliegveld

In dit hoofdstuk ga je een een misdrijf oplossen met behulp van bioinformatica. Hieronder staat de zaak beschreven.

Inleiding

Als lid van het CSI-genomics team ben je opgeroepen om te assisteren bij een crimescene. Er is een lijk van een Amerikaanse toerist gevonden op het vliegveld. Hij ligt in een soort kramp en heeft inwendige bloedingen. Naast hem is een flesje gevonden waaruit hij blijkbaar gedronken heeft, met daarin nog een restje vloeistof dat lijkt op melkresten. De vloeistof gaat naar het lab. Zodra de resultaten bekend zijn, worden ze aan je doorgestuurd. Jij hebt de taak om te onderzoeken of je aanwijzingen kunt vinden voor de dood van de Amerikaan.

Achtergrondinformatie

Het onderwerp van dit practicum is bioinformatica, het gebruik van computers bij het zoeken naar en bestuderen van informatie over genen, nucleïnezuren en eiwitten. Terwijl je aan het speuren bent naar een aantal mysterieuze eiwitten zul je in het practicum een aantal tools en databanken uit de bioinformatica gebruiken, namelijk:

- SwissProt, de databank met alle honderdduizenden eiwitsequenties die we tot nog toe kennen.
- BLAST, het programma om eiwitsequenties in de database SwissProt te vinden die heel veel lijken op (of gelijk zijn aan) de sequentie die je ingevoerd hebt.
- MRS, het zoeksysteem waarmee je zowel SwissProt als BLAST kunt gebruiken.

Dit practicum is een bewerking van het practicum 'Speur surfend in je genen' van de reizende DNA-labs en het Netherlands Bioinformatics Centre (NBIC). http://www.nbic.nl/.

Meer informatie over dit practicum, de lesmaterialen en tools vind je op: http://www.bioinformaticaindeklas.nl/.

7.2 Identificatie - deel I

Identificatie van de vier verdachte eiwitten

De resultaten uit het lab zijn binnen: je krijgt een lijstje met stoffen die in de melk zaten. Naast een aantal kleine moleculen, zoals suiker, blijkt dat er een viertal verschillende eiwitten in voorkomen. Deze ga je verder onderzoeken met behulp van de database SwissProt en het zoekprogramma BLAST. In je werkdocument vind je het 'CSI GENOMICS FORMULIER SCREENING VERDACHTE EIWITTEN', waar je de opdracht in kan maken.

Om je kennis te laten maken met het zoekprogramma BLAST leggen we eerst voor eiwit kandidaat 1 uit welke stappen uitgevoerd moeten worden. Daarna kun je kandidaat 2, 3 en 4 zelf doen en uitzoeken welk van de vier eiwitten schuldig is aan de dood van de toerist.

BLAST is een programma waarmee je een eiwitsequentie kunt vergelijken met alle eiwitsequenties in de database SwissProt. Deze database bevat alle eiwitsequenties die de wetenschap op dit moment kent. We zullen BLAST gebruiken vanuit het programma MRS.

Ga als volgt aan de slag:

1. Start MRS.

2. Kies "BLAST" in de balk bovenaan het scherm.

3. Hieronder staan de resultaten uit het lab: de sequenties van de vier eiwitten. Kopieer de aminozuurvolgorde van kandidaat1 in het venstertje van MRS. De eerste regel moet altijd beginnen met een ">" met daarachter de naam van het eiwit (dit is het zogenaamde FastA formaat). Hier is gekozen voor de naam "kandidaat1".

Let op: De aminozuursequenties worden gegeven in 1-lettercode, dit is de notatie die wetenschappers gebruiken. Kijk voor de aminozuren en hun notatie op deze link.

>kandidaat1
RPKHPIKHQG LPQEVLNENL LRFFVAPFPE VFGKEKVNEL SKDIGSESTE DQAMEDIKQM
EAESISSSEE IVPNSVEQKH IQKEDVPSER YLGYLEQLLR LKKYKVPQLE IVPNSAEERL
HSMKEGIHAQ QKEPMIGVNQ ELAYFYPELF RQFYQLDAYP SGAWYYVPLG TQYTDAPSFS
DIPNPIGSEN SEKTTMPLW

>kandidaat2
QYSSNTQQGR TSIVHLFEWR WVDIALECER YLAPKGFGGV QVSPPNENVA IHNPFRPWWE
RYQPVSYKLC TRSGNEDEFR NMVTRCNNVG VRIYVDAVIN HMCGNAVSAG TSSTCGSYFN
PGSRDFPAVP YSGWDFNDGK CKTGSGDIEN YNDATQVRDC RLSGLLDLAL GKDYVRSKIA
EYMNHLIDIG VAGFRIDASK HMWPGDIKAI LDKLHNLNSN WFPEGSKPFI YQEVIDLGGE
PIKSSDYFGN GRVTEFKYGA KLGTVIRKWN GEKMSYLKNW GEGWGFMPSD RALVFVDNHD
NQRGHGAGGA SILTFWDARL YKMAVGFMLA HPYGFTRVMS SYRWPRYFEN GKDVNDWVGP
PNDNGVTKEV TINPDTTCGN DWVCEHRWRQ IRNMVNFRNV VDGQPFTNWY DNGSNQVAFG
RGNRGFIVFN NDDWTFSLTL QTGLPAGTYC DVISGDKING NCTGIKIYVS DDGKAHFSIS
NSAEDPFIAI HAESKL

>kandidaat3
QQNLPQRYIE LVVVADHRVF MKYNSDLNTI RTRVHEIVNF INGFYRSLNI HVSLTDLEIW
SNEDQINIQS ASSDTLNAFA EWRETDLLNR KSHDNAQLLT AIELDEETLG LAPLGTMCDP
KLSIGIVQDH SPINLLMGVT MAHELGHNLG MEHDGKDCLR GASLCIMRPG LTKGRSYEFS
DDSMHYYERF LKQYKPQCIL NKP

>kandidaat4
LIVTQTMKGL DIQKVAGTWY SLAMAASDIS LLDAQSAPLR VYVEELKPTP EGDLEILLQK
WENGECAQKK IIAEKTKIPA VFKIDALNEN KVLVLDTDYK KYLLFCMENS AEPEQSLACQ
CLVRTPEVDD EALEKFDKAL KALPMHIRLS FNPTQLEEQC HI

7.3 Identificatie - deel II

4. Klik op "Run BLAST" (rechts bovenaan).

5. Als de zoektocht klaar is, zie je een balkje met resultaten dat lijkt op wat hieronder staat:

Deze output betekent dat er 101 hits zijn gevonden in de database SwissProt, d.w.z. er zijn 101 eiwitten gevonden waarvan de aminozuurvolgorde lijkt op die van kandidaat1. Het getal dat je ziet bij e-Value geeft aan hoe goed het beste resultaat is. Als dit getal heel klein is (en dat is in dit geval zo: het is 3,7 x 10-113), betekent dat dat het een betrouwbaar resultaat is.

Let op: Deze lijst met BLAST resultaten kun je altijd later weer oproepen via "BLAST results" (in de balk bovenaan) om naar de resultaten van de verschillende kandidaten te kijken.

6. Klik nu de regel aan (hij verandert van kleur) om naar de gevonden resultaten te kijken.

Je ziet nu een scherm met de zogenaamde hitlist, de lijst van eiwitsequenties die gevonden zijn in de database SwissProt en die lijken op kandidaat1. Op nummer 1 staat de sequentie uit de database die het meest lijkt op (of zelfs identiek is aan) jouw ingevoerde sequentie kandidaat1. De code van deze sequentie is CASA1_BOVIN.

Van links naar rechts lees je op elke regel de output van een van de hits:

- Nr: Het nummer van het gevonden resultaat. Op nummer 1 staat de beste hit, etc.
- ID: Dit is de code van de gevonden eiwitsequentie uit de database. Het eerste deel (bij de eerste hit 'casa1') slaat op de naam van het eiwit. Het tweede deel van de naam (bij de eerste hit "bovin") wordt gevormd door een afkorting van het organisme, in dit geval "bovine". Zoek op welk organisme dit is.
- Coverage: Hier zie je in kleur welk deel van jouw zoeksequentie (kandidaat1) overeenkomt met de database sequentie (die is in grijs gegeven). Op de eerste regel zie je dat jouw zoeksequentie van begin tot eind overeenkomt met CASA1_BOVIN.
- Description: de tekstuele omschrijving van de database sequentie die gevonden is als antwoord op jouw vraag.
- Hsps, Bitscore en E-value: Getallen die het programma berekent en die jou een idee kunnen geven over hoe betrouwbaar het resultaat is. De beste hit staat bovenaan.

7.4 Identificatie - deel III

7. We gaan de eerste hit CASA1_BOVIN verder analyseren. Klik op het gekleurde balkje en daarna nog een keer op het tweekleurige balkje. Bekijk de gegevens.

Je ziet een zogenaamde 'alignment' van twee aminozuursequenties. Q (query) is de sequentie van jouw zoekvraag, in dit geval kandidaat1. S is de eiwitsequentie uit de database die het meest op kandidaat1 lijkt, in dit geval CASA1_BOVIN.

De regel tussen de 2 sequenties bevat de letters van de identieke aminozuren tussen Q en S. Als niet alle aminozuren hetzelfde zijn tussen Q en S zie je hier 'gaten' vallen.

Je kunt zien dat de volgorde van kandidaat1 voor 100% overeenkomt met de volgorde van CASA1_BOVIN, het alfa-S1-caseine eiwit (alle 199 aminozuren zijn identiek). Je hebt dus één van de vier eiwitten geïdentificeerd!

8. Klik op CASA1_BOVIN. Je gaat nu naar de database en ziet de gegevens die bekend zijn over dit eiwit. Vul voor kandidaat1 het formulier in je werkdocument 'CSI Genomics Formulier Screening Verdachte Eiwitten' in. Maak gebruik van de informatie die je vindt bij:

- Protein name
- From; zoek ook de Nederlandse naam op in onderstaande lijst met organismen.
- Keywords
- Comments

9. Doe nu zelf een BLAST search met sequenties van de andere 3 gevonden eiwitten en vul de resultaten in op het formulier in je werkdocument.

Wat is nu je eindconclusie over de moord? Waaraan is het slachtoffer overleden? Vul deze eindconclusie in op het formulier in je werkdocument.

Lijst met organismen en hun Latijnse namen
Lijst met organismen en hun Latijnse namen

8. Misdrijven oplossen

8.1 Misdrijven oplossen - deel I

In het vorige hoofdstuk heb je gezien dat bioinformatica kan helpen bij het oplossen van misdrijven. In dit hoofdstuk ga je hierover meer informatie verzamelen in een webquest. Gebruik ook weer je werkdocument.

Inleiding

Bij forensisch onderzoek van misdrijven zijn DNA- en eiwittechnieken onmisbaar geworden de laatste jaren. Op het plaats delict wordt standaard gezocht naar DNA-sporen die vervolgens op een forensisch laboratorium verder onderzocht worden.

Webquest

 

 

Jij werkt op een forensisch laboratorium bij de afdeling bioinformatica. Je krijgt een verzoek vanuit een politiebureau om daar een presentatie te komen geven over wat er in een forensisch laboratorium gebeurt. Een beter begrip hierover kan politieagenten helpen nog beter met de gevonden sporen om te gaan. Je besluit een artikel over jouw werkzaamheden te schrijven voor jullie politietijdschrift. Om het verhaal zo duidelijk mogelijk te maken, bedenk je een casus. Aan de hand van de casus leg je uit wat de rol is van bioinformatica bij het oplossen van een misdrijf.
Eerst verdiep je je in wat bioinformatica inhoudt en hoe forensisch onderzoek verloopt.

bron: Wikipedia
bron: Wikipedia

8.2 Misdrijven oplossen - deel II

Werkwijze

Gebruik de bronnen om de volgende vragen in jouw werkdocument te beantwoorden.

1. Naar wat voor sporen wordt gezocht bij sporenonderzoek? Noem drie voorbeelden.
2. Leg uit hoe een DNA-profiel wordt gemaakt. Welke verschillende stappen zijn er?
3. Wat is een DNA-databank?
4. Wat wordt bedoeld met bioinformatica?
5. Hoe helpt bioinformatica bij forensisch onderzoek?
6. Schrijf een artikel over de rol van bioinformatica bij forensisch onderzoek. Ga als volgt aan de slag:

- bedenk een misdrijf om te gebruiken als casusvoorbeeld;
- leg stapsgewijs uit hoe het oplossen van een misdrijf aan de hand van sporen plaatsvindt;
- verwerk de rol van bioinformatica hierin;
- schrijf een helder artikel voor je doelgroep.

Bronnen
Informatie over het werk van een forensisch laboratorium

Artikel over DNA voor de rechtbank

Website over wat bioinformatica inhoudt

Afsluiting
In deze webquest heb je je verdiept in bioinformatica en de rol daarvan bij forensisch onderzoek:

- Je bent bezig geweest met het vinden van informatie uit verschillende bronnen.
- Je bent meer te weten gekomen over bioinformatica.
- Je hebt geleerd hoe forensisch onderzoek gebruikt maakt van DNA-technieken.
- Je hebt een artikel geschreven op basis van de aanwezige bronnen.

Maker van de webquest: De Praktijk in opdracht van het Centre for Society en Genomics

Op dit lesmateriaal is de Creative Commons Naamsvermelding-Niet-commercieel 3.0 Nederland License van toepassing http://creativecommons.org/licenses/by-nc/3.0/nl/

9 DNA onderzoek bij Stefanie

9.1 DNA onderzoek bij Stefanie

De afgelopen hoofdstukken heb je gezien hoe bioinformatica wordt gebruikt bij het oplossen van misdrijven, maar ook in de medische wetenschap wordt het als middel ingezet. Je gaat nu kijken naar de casus van Stefanie.

Inleiding

Frank en Eva de Wit zijn heel blij met de geboorte van hun tweede kindje. Het is een meisje, ze noemen haar Stefanie. De eerste twaalf maanden ontwikkelt Stefanie zich zoals elke baby: ze lacht, ze begint te kruipen en ze reageert leuk op haar oudere broertje. Maar vlak na haar eerste verjaardag verandert haar gedrag plotseling. Ze heeft geen interesse meer in haar speelgoed. Vaak zit ze urenlang angstig en handenwringend om zich heen te kijken.

Na uitgebreid medisch onderzoek wordt vastgesteld dat Stefanie lijdt aan een syndroom dat veroorzaakt wordt door een afwijking in het DNA. Jij gaat onderzoeken wat er mis is. Als eerste krijg je uit het lab de volgende DNA-sequentie aangeleverd.

(bron:NLT module)
(bron:NLT module)

Maak opgave 1 in je werkdocument.

9.2 DNA onderzoek deel I

Vergelijk de DNA-sequentie van Stefanie met die van een gezond persoon, zie hieronder.

(bron: NLT module)
(bron: NLT module)

Maak nu opgave 2 tot en met 5 in je werkdocument.

9.3 DNA onderzoek deel II

Als een echte bioinformaticus ga je met een deel van het gen dat bekend is aan de slag. Met behulp van een tool die door elke bioinformaticus gebruikt wordt ga je op zoek naar een bepaalde sequentie. De techniek die je hierbij gebruikt noem je BLASTen. Je hebt hier al mee gewerkt in hoofdstuk 7.

De Basic Local Alignment and Search Tool (BLAST) is een van de krachtigste instrumenten van de bioinformaticus. Door sequenties te BLASTen vergelijk je ze met andere sequenties in een database. Dit kan je doen met nucleotide- of aminozuursequenties (DNA of eiwitten).
Door te BLASTen vind je sequenties die homologie (overeenkomst) hebben met de sequentie die je ingevoerd hebt. Omdat van de sequenties in de database al een hoop bekend is, geeft dit mogelijk meer informatie over de betreffende sequentie die je ingevoerd hebt zonder dat je daarvoor 'wet lab' experimenten hoeft te doen.

Maak nu opgave 6 tot en met 8 in je werkdocument.

9.4 DNA onderzoek deel III

In de volgende figuur is een X-chromosoom schematisch weergegeven met daarop aangegeven de plaatsen waar de genen voor enkele specifieke erfelijke afwijkingen zich bevinden.

(bron: NLT module)
(bron: NLT module)

Maak nu opgave 9 in je werkdocument.

10 Bioinformatica in het nieuws

10.1 Bioinformatica in het nieuws

Opdracht

 

 

Bioinformatica is geregeld in het nieuws. Je merkt er waarschijnlijk niet veel van. Toch is het er, en jij gaat er naar op zoek. Samen met twee klasgenoten zoek je een nieuwsbericht waarbij bioinformatica een rol heeft gespeeld. Over dat artikel maak je een presentatie, waarbij je laat zien wat die rol kan zijn geweest. Ga als volgt aan de slag:

1. Vorm een groepje met twee klasgenoten.
2. Ga naar de achtergrondenpagina van de website http://www.allesoverdna.nl/achtergrondinfo.html.
3. Bekijk recente nieuwsberichten en kies er één die je het meeste aanspreekt.
4. Lees het artikel goed en bespreek het volgende met je groepje:

- waar gaat dit bericht over?
- wat is het nieuws van dit bericht?
- op welke manier heeft het onderzoek met DNA te maken?
- welke rol kan bioinformatica hierin hebben gespeeld?

Je bereidt samen een presentatie voor. Het doel is om je klas te vertellen waar het nieuwsbericht over gaat, wat voor onderzoek er is gedaan en wat bioinformatica daaraan heeft bijgedragen. Dat kan bijvoorbeeld door te vertellen welke bioinformatica tools mogelijk zijn gebruikt. Ook vertel je iets over wat dat onderzoek betekent of welke impact het kan hebben. Verdiep je in het onderwerp van het bericht zodat je daar iets over kunt vertellen; de website http://www.allesoverdna.nl// is daar een goede bron voor.

Je kunt een presentatie met PowerPoint geven, maar je kunt bijvoorbeeld ook een poster maken. De presentatie mag maximaal 10 minuten duren.

 

10.2 Een bioinformatica onderzoek opzetten

Inleiding

Je gaat je kennis en vaardigheden over bioinformatica toepassen door een onderzoek naar een (afwijkend) gen op te zetten. Deze sequentie zou het ziektebeeld van een patiënt kunnen verklaren. Het behandelend team van artsen hoopt erop dat ze met jouw onderzoeksresultaat de juiste behandeling kunnen starten.

Opdracht

 

 

Kies in overleg met je docent een reading frame om te onderzoeken. Je vindt de reading frames op vaklokaal NLT onder het kopje sequenties en vervolgens op 'reading frames'.

Bepaal of er een gen er in het gegeven reading frame aanwezig is en zo ja, welk. Ga na of de eventuele genvariatie (afwijking) in het gegeven reading frame leidt tot een functioneel afwijkend expressieproduct, d.w.z. een eiwit dat zijn taak niet kan vervullen

Werkwijze

Ga als volgt aan de slag:

1. Formuleer de onderzoeksvraag/vragen en maak een lijst van de stappen die gezet moeten worden om de onderzoeksvragen te beantwoorden. Neem hierin in elk geval de casusvragen op, die hieronder staan.

2. Maak een werkplan waaruit duidelijk wordt welke stappen gezet moeten worden en welke tools je daarbij gaat inzetten.

3. Voer het onderzoek uit en verwerk de resultaten.

4. Maak een verslag volgens de richtlijnen ‘werkinstructie onderzoeksverslag' in de NLT Toolbox.

 

Casusvragen

Je gaat het gekozen/toegewezen reading frame met behulp van de geleerde vaardigheden onderzoeken. Deze DNA-sequentie is weergegeven in de 5'-3' richting. De volgende vragen en opdrachten dienen in het verslag, volgens gegeven richtlijnen, uitgewerkt te worden:

- Hoeveel OLR's met een minimale grootte van 300 nucleotiden zijn er aanwezig binnen het opgegeven reading frame?
- Bepaal binnen het gekozen/opgegeven reading frame het grootste OLR fragment. Geef dit aan in het gegeven FASTA-bestand.
- Uit hoeveel nucleotiden bestaat dit OLR?
- Wat is het stopcodon van het gevonden OLR?
- Vertaal de gevonden mRNA-sequentie naar een aminozuursequentie.
- BLAST de aminozuursequentie.
- Gebruik de gevonden internationale gennaam en internationale codering om te weten te komen op welk chromosoom dit gen is gelegen en welke functie het heeft. Gebruik hiervoor de website NCBI Entrez Gene.
- Wat zou het gevolg van een fout in deze sequentie kunnen zijn? Tip: kijk bij de omschrijving van het gen bij ‘Summary' of ‘Bibliography'.

D-toetsen

D-toets 1 DNA

D-toets 2 mRNA

D-toets 3 Begrip en inzicht

D-toets 4 Eiwit

D-toets 5 Begrippenkennis 1

D-toets 6 Begrippenkennis 2

Over deze module

Documenten

Docentenhandleidingen, antwoorden op opgaven en toetsen zijn voor docenten verkrijgbaar via de bètasteunpunten: zie colofon.