Hoofdstuk 06

6.1 Bioinformatica tools - deel I

Waar werken bioinformatici mee?

In 1990 is de Human Genome Organisation (HUGO) gestart met een project om het volledige genoom van de mens op te helderen: het Human Genome Project. In 2003 was dit project afgerond, waardoor de hele nucleotidenvolgorde van het DNA van de mens nu bekend is. Gebleken is dat het genoom van de mens ongeveer 3 miljard basenparen bevat. Om zo'n grote hoeveelheid informatie op te kunnen slaan wordt gebruik gemaakt van databases. De databases van het genoom van de mens en van andere organismen zijn te vinden op het internet. Zo is de informatie wereldwijd toegankelijk. Vanwege de enorme hoeveelheid informatie wordt steeds slechts één streng van het DNA opgeslagen in de database.

De toegankelijkheid van de bioinformatica databases op het internet maakt het mogelijk om een te onderzoeken sequentie te vergelijken met al bekende sequenties. Het doet er daarbij niet toe of de sequentie uit een tiental of uit tienduizenden nucleotiden bestaat. Je kunt hem vergelijken als geheel of in fragmenten, met gehele of fragmentarische sequenties van organismen van de eigen soort of van andere soorten. In de bioinformatica databases vind je sequenties van gezonde mensen en sequentie-afwijkingen van patiënten, gemiddelde gensequenties van planten, dieren, bacteriën, virussen, schimmels, eigenlijk alles wat maar een eiwit of erfelijk materiaal bij zich draagt.
De kunst is om gericht te zoeken. Met de juiste computerprogramma's, die het vele rekenwerk overnemen, kunnen de gewenste analyses en vergelijkingen dan snel gemaakt worden.
Bijzonder is dat je niet alleen statistisch kunt bepalen of er een zekere verwantschap is tussen sequenties, maar dat je ook toegang hebt tot alle (onderzoeks)literatuur omtrent de betreffende sequenties, omdat die hieraan gekoppeld is op het internet.

Bekijk het filmpje uit het programma Nieuwslicht.

 

6.2 Bioinformatica tools - deel II

Zoeken naar een gen

Slechts een klein deel van het DNA bestaat uit genen. Een zeer klein deel van een heel erg lange reeks basen bestaat uit betekenisvolle sequenties. Als je een bepaald gen zoekt, moet je - ook al is het zoekgebied al beperkt tot een bepaald deel van een chromosoom - toch nog een geweldig lange reeks basen onderzoeken. Zonder bioinformatica zou dit onmogelijk zijn.

De informatie in het DNA is gerangschikt in groepjes van drie nucleotiden (tripletten, codons) op de beide ketens van de dubbele helix. De meeste tripletten coderen elk voor een aminozuur. De code voor het aminozuur methionine (ATG) is tevens startcodon: hiermee begint elk eiwit. En drie tripletten (TAA, TAG en TGA) coderen niet voor aminozuren, het zijn zgn. stopcodons.

Bij het onderzoek van een bepaalde DNA-sequentie weet je niet van tevoren hoe het DNA in tripletten is verdeeld, je weet namelijk niet waar een triplet begint. Er zijn drie mogelijkheden per DNA-streng om te beginnen met het lezen van de tripletten: bij de eerste nucleotide, bij de tweede of bij de derde. Gaan we uit van dubbelstrengs DNA, dan zijn er dus zes mogelijkheden voor het lezen, ofwel zes mogelijke 'reading frames'. Alle zes reading frames moeten dan ook worden onderzocht op de aanwezigheid van start- en stopcodons.
Een lange reeks tripletten zonder stopcodon noemen we een Open Reading Frame (ORF). Zo'n lang stuk tussen een start- en een stopcodon kan mogelijk de code voor een eiwit bevatten. Verreweg de meeste ORF's blijken echter geen gen te zijn.

6.3 Bioinformatica tools - deel III

Sequenties vergelijken

De databases van genomen die op het internet te vinden zijn maken het mogelijk om een stuk DNA te vergelijken met het DNA uit de database. De computer vergelijkt de nucleotide volgorde van het stuk DNA met de nucleotide volgorde van het hele genoom uit de database. Het stuk genoom dat het meest overeenkomt met het stuk DNA wordt weergegeven. Het vergelijken van de nucleotide volgorde van twee stukken DNA wordt alignen genoemd. Door DNA te alignen kunnen mutaties worden gevonden.

Bij het alignen en het interpreteren van de resultaten ervan, moeten we rekening houden met de volgende aspecten:

- Een DNA-sequentie heeft zes mogelijke reading frames. Alle zes reading frames moeten worden onderzocht op de aanwezigheid van start- en stopcodons.
- Twee DNA-sequenties die veel overeenkomst hebben in de volgorde van hun nucleotiden kunnen door een verschil in reading frame toch voor totaal andere eiwitten coderen.
- Het kan zo zijn dat een stuk DNA ten opzichte van een ander stuk slechts één nucleotide mist. Dit stuk DNA geeft dan echter een totaal ander eiwit, aangezien de aminozuren door tripletten gecodeerd worden. Een ander stuk DNA kan wel op drie plaatsen verschillen, maar toch beter alignen. Het computerprogramma moet hier rekening mee houden. Verder worden de meeste aminozuren door meerdere tripletten gecodeerd. Een mutatie die een triplet verandert in een ander triplet dat voor hetzelfde aminozuur codeert, zal geen effect hebben voor de functie van het eiwit.
- Het is belangrijk rekening te houden met de kans dat een DNA-sequentie toevallig voorkomt in een genoom. Bij een hele korte sequentie is de kans dat die toevallig voorkomt uiteraard groter dan bij een hele lange sequentie.

Om de problemen met het open reading frame en de problemen met de verwijdering van slechts één nucleotide te vermijden, worden vaak de eiwitsequenties met elkaar vergeleken in plaats van de DNA-sequenties. Dit heet het alignen van eiwitsequenties. Hierbij is het wel van belang dat je zeker weet welke van de zes ORF de juiste eiwitsequentie oplevert.

6.4 Een gen of eiwit vinden

Even oefenen

 

 

Een lange reeks basen heeft, zoals je hebt gelezen, meerdere reading frames (ORF). Vul in de volgende tabel de drie mogelijk aminozuurketens in. Verdeel de gegeven DNA-sequentie in tripletten; dit kan op drie manieren. In frame 1 vul je de aminozuurketen in die ontstaat als de DNA-sequentie vanaf de eerste nucleotide wordt afgelezen. In frame 2 begin je bij de tweede en in frame 3 bij de derde. Geef de aminozuren aan met hun eenletterige symbool (kijk in BINAS 70E of BioData 5.7).

Plaats hier je muis

 

Dit is natuurlijk niet te doen bij lange reeksen basen. In de bioinformatica wordt gebruik gemaakt van een programma dat ORF's zoekt.

Een eiwit vinden

Haal de sequentie (FASTA format) ‘Reading Frame 01’ van vaklokaal NLT. Klik hiertoe op het kopje sequenties en vervolgens op ‘reading frames’. Kopieer de sequentie (digitaal) en plaats deze in de tool: ORF Finder.

Voer de randvoorwaarden in zoals in de onderstaande figuur is weegegeven.

Klik dan op submit en de ORF Finder geeft aan waar in de gegeven sequentie een ORF gevonden is. Ga dit na voor de drie frames van de forward strand (direct strand) en voor de drie frames van de reverse strand. Let op de ORFs staan niet van groot naar klein gesorteerd.

Zoek het grootste ORF. Als je niet zo snel kunt zien welke ORF het grootste is, kun je gebruik maken van een andere ORF Finder. Plak daar de nucleoridesequentie in en druk vervolgens op OrfFind. Vervolgens verschijnen van boven naar beneden de gevonden ORFs van groot naar klein. + beteket de formward strand en - de reserve strand.

 

Kopieer de langste nucleotidesequentie naar het programma BLAST. Klik eerst op human en vervolgens op blast. Plak de sequentie in het lege witte vak en klik op BLAST.

 

Komt het overeen met een humaan gen of een deel ervan? 

 

 

 

Ga verder met het volgende hoofdstuk om erachter te komen wat BLAST is en om daarmee te oefenen.

  • Het arrangement Hoofdstuk 06 is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

    Auteur
    Bètapartners Je moet eerst inloggen om feedback aan de auteur te kunnen geven.
    Laatst gewijzigd
    2015-04-24 09:43:44
    Licentie

    Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding-GelijkDelen 3.0 Nederland licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding en publicatie onder dezelfde licentie vrij bent om:

    • het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
    • het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
    • voor alle doeleinden, inclusief commerciële doeleinden.

    Meer informatie over de CC Naamsvermelding-GelijkDelen 3.0 Nederland licentie.

    Dit materiaal is achtereenvolgens ontwikkeld  en getest in een SURF-project  (2008-2011: e-klassen als voertuig voor aansluiting VO-HO) en een IIO-project (2011-2015: e-klassen&PAL-student).  In het SURF project zijn in samenwerking met vakdocenten van VO-scholen, universiteiten en hogescholen e-modules ontwikkeld voor Informatica, Wiskunde D en NLT.  In het IIO-project (Innovatie Impuls Onderwijs) zijn in zo’n samenwerking modules ontwikkeld voor de vakken Biologie, Natuurkunde en Scheikunde (bovenbouw havo/vwo).  Meer dan 40 scholen waren bij deze ontwikkeling betrokken.

    Organisatie en begeleiding van uitvoering en ontwikkeling is gecoördineerd vanuit Bètapartners/Its Academy, een samenwerkingsverband tussen scholen en vervolgopleidingen. Zie ook www.itsacademy.nl

    De auteurs hebben bij de ontwikkeling van de module gebruik gemaakt van materiaal van derden en daarvoor toestemming verkregen. Bij het achterhalen en voldoen van de rechten op teksten, illustraties, en andere gegevens is de grootst mogelijke zorgvuldigheid betracht. Mochten er desondanks personen of instanties zijn die rechten menen te kunnen doen gelden op tekstgedeeltes, illustraties, enz. van een module, dan worden zij verzocht zich in verbinding te stellen met de programmamanager van de Its Academy (zie website). 

    Gebruiksvoorwaarden:  creative commons cc-by sa 3.0

    Handleidingen, toetsen en achtergrondmateriaal zijn voor docenten verkrijgbaar via de bètasteunpunten.

     

    Aanvullende informatie over dit lesmateriaal

    Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

    Toelichting
    Deze les maakt onderdeel uit van de e-klas 'Bio-informatica voor VWO 5 en 6 voor het vak NLT.
    Leerniveau
    VVE; VWO 6; Praktijkonderwijs; VWO 5;
    Leerinhoud en doelen
    Natuur, leven en technologie; Wisselwerking tussen natuurwetenschap en technologie;
    Eindgebruiker
    leerling/student
    Moeilijkheidsgraad
    gemiddeld
    Trefwoorden
    e-klassen rearrangeerbaar