6.3 Bioinformatica tools - deel III

Sequenties vergelijken

De databases van genomen die op het internet te vinden zijn maken het mogelijk om een stuk DNA te vergelijken met het DNA uit de database. De computer vergelijkt de nucleotide volgorde van het stuk DNA met de nucleotide volgorde van het hele genoom uit de database. Het stuk genoom dat het meest overeenkomt met het stuk DNA wordt weergegeven. Het vergelijken van de nucleotide volgorde van twee stukken DNA wordt alignen genoemd. Door DNA te alignen kunnen mutaties worden gevonden.

Bij het alignen en het interpreteren van de resultaten ervan, moeten we rekening houden met de volgende aspecten:

- Een DNA-sequentie heeft zes mogelijke reading frames. Alle zes reading frames moeten worden onderzocht op de aanwezigheid van start- en stopcodons.
- Twee DNA-sequenties die veel overeenkomst hebben in de volgorde van hun nucleotiden kunnen door een verschil in reading frame toch voor totaal andere eiwitten coderen.
- Het kan zo zijn dat een stuk DNA ten opzichte van een ander stuk slechts één nucleotide mist. Dit stuk DNA geeft dan echter een totaal ander eiwit, aangezien de aminozuren door tripletten gecodeerd worden. Een ander stuk DNA kan wel op drie plaatsen verschillen, maar toch beter alignen. Het computerprogramma moet hier rekening mee houden. Verder worden de meeste aminozuren door meerdere tripletten gecodeerd. Een mutatie die een triplet verandert in een ander triplet dat voor hetzelfde aminozuur codeert, zal geen effect hebben voor de functie van het eiwit.
- Het is belangrijk rekening te houden met de kans dat een DNA-sequentie toevallig voorkomt in een genoom. Bij een hele korte sequentie is de kans dat die toevallig voorkomt uiteraard groter dan bij een hele lange sequentie.

Om de problemen met het open reading frame en de problemen met de verwijdering van slechts één nucleotide te vermijden, worden vaak de eiwitsequenties met elkaar vergeleken in plaats van de DNA-sequenties. Dit heet het alignen van eiwitsequenties. Hierbij is het wel van belang dat je zeker weet welke van de zes ORF de juiste eiwitsequentie oplevert.