Proces af genforudsigelse og tælling

Proces af gen forudsigelse og tælling!

Annonation er en proces, der identificerer gener, deres regulatoriske sekvenser og mulige funktioner. Annonation indikerer de ikke-proteinkodende gener, kodende gener for r-RNA, t-RNA og nukleare RNA'er, mobile genetiske elementer og gentagne sekvensfamilier til stede i genom.

Opgave af annoncering starter kun efter at genomsekvens er opnået. Genforudsigelse er et vigtigt problem for beregningsbiologi, og der findes forskellige logaritmer, som kan anvendes til genforudsigelse ved at udnytte identificerede gener som et træningsdatasæt.

Tælling af gener bliver vanskelig på trods af at kende genstanden for gener i et genom. Tilstedeværelse af overlappende gener og splejsningsvarianter gør opgaven vanskeligere. Det bliver svært at forudsige, hvilke dele af DNA der skal betragtes som samme eller mange forskellige gener.

Fig.6.70. En SNP-kort

Mange gener i eukaryoter bærer et mønster af exoner (kodende regioner) efterfulgt af introner (ikke-kodende regioner). På grund af disse gener er ikke organiseret som kontinuerlige ORF'er (åbne læserammer). En ORF har en række kodoner, som angiver en aminosyresekvens.

Anden gener i eukaryoter er sædvanligvis bredt indbyrdes adskilte, hvorved der er flere chancer for at lokalisere falske gener. Men nye teknikker til ORF-scanningsprogrammer til eukaryotiske gener gør scanning mere effektiv. Nu kan vi tælle gener af en organisme (med nogle eksperimentelle fejl).

Det siges, at omkring 99, 8% af 3, 2 milliarder basepar mellem to mennesker er de samme og kun 0, 2% forskellige. For hver 500 nukleotider adskiller kun ét nukleotid mellem to individer. Det betyder variation i nogle steder i DNA-sekvensen kan føre til alvorlig sygdom og forskellige tegn hos mennesker.

Genom lighed, SNP og Comparative Genomics:

Som allerede sagt at 99, 8% af hvert humant genom er ligner ethvert andet humant genom og 0, 2% anderledes. Det betyder, at to personer kun adskiller sig i 6 millioner steder ud af 3, 2 mia.

Hvis disse steder har ringe virkning, vil to mennesker være identiske. Mennesker er mere end 98% svarende til chimpanser. Således forskel på få steder i DNA fører til at gøre individet unikt. For hver 500-1000 nukleotider varierer et nukleotid mellem to individer.

Vigtige variationer i individuelle genomer er enkelt nukleotidpolymorfier eller SNP'er, som er blevet observeret i både kodende og ikke-kodende regioner af genom. SNP'er er grundlæggende ændring i enkeltbase, dvs. A, C, G eller T, der fører til DNA-variationer, der fører til eksistensen af ​​forskellige bogstaver ved sådanne stillinger. Typen af ​​nukleotid eller base, der er til stede på et givet sted på et kromosom, kan variere med forskellige mennesker.

Det siges at - 90% af sekvensvariationen hos mennesker skyldes tilstedeværelsen af ​​SNP'er. Således tilvejebringer SNP'er en molekylær markør, der er til stede i høj densitet.

I DNA-fingerprintning i især ikke-kodende dele af genom udnyttes sådanne genetiske variationer blandt forskellige mennesker.

Sådanne genetiske variationer er også ansvarlige for sværhedsgrad af sygdom og respons fra kroppen til behandling. En enkelt basisforskel i Apo E-genet fører til Alzheimers sygdom, og en deletion inden for CCRS (kemokinreceptorgen) er ansvarlig for resistens af HW og AIDS.

SNP'er bruges til at kortlægge gener involveret i menneskelige sygdomme. Ved at bruge SNP'er som markører kan hvert gen i menneskeligt genom kortlægges. SNP'er er enten placeret inden for genet eller kan vise tæt sammenhæng.

Sekvensdata lagres i databaser og analyseres for at kende SNP'erne. DNA-chips og mikroarrays er blevet udviklet til identifikation af SNP'er. Læger ved hjælp af DNA-prøver af patienter kan identificere mønsteret af SNP genotype profil. Således er de i stand til at fortælle patienternes respons til den specifikke type medicin.

Branchen af ​​medicin, der undersøger virkningen af ​​genetisk variation på sygdomsmodtagelighed og medicinrespons kaldes farmakogenomikum.

Fordi få SNP'er varierer i frekvens i forskellige populationer, kan SNP-analyse anvendes til undersøgelse af populationsgenetik.

Det er interessant at bemærke, at genomerne af mus og mand ligner hinanden (ca. 97, 5%). Chimpanser og humant genom udelukkes kun i forholdet 1 - 3%. Så det kan konkluderes, at der skyldes deling af fælles forfædre for 100 millioner år siden, og ikke meget ændring i genom har fundet sted.

Fra disse små genetiske forskelle opstår den menneskelige variation som forskelle i øjenblik, hårfarve, fodstørrelse osv. Nogle af SNP'erne er knyttet til specifikke menneskelige populationer og giver information om menneskelige migreringer, der fandt sted for flere år siden og om mere fjern evolutionær fortid .