Psi genom III - genetyczny odcisk palca
: sobota 04 sty 2020, 11:30
Struktura genomu, sekwencje mikrosatelitarne.
Jak wiadomo linie papilarne tworzą niepowtarzalny i niezmienny układ bruzd na skórze. Jest to cecha fenotypowa przypisana konkretnemu osobnikowi, wykorzystywana w procesie ustalania tożsamości. Ale również w genotypie (człowieka, psa, innych ssaków) zawarta jest informacja, również niepowtarzalna, niezmienna i jednoznaczna, która może być przypisana tylko konkretnemu osobnikowi. Jest możliwa do odtworzenia z różnych tkanek (ale tylko z takich w których komórki zawierają jądra), również po jego śmierci. Taka informacja nazywana jest często „genetycznym odciskiem palca” (DNA fingerprinting) lub profilem DNA. Takie testy DNA (w przypadku psów) służą tylko do potwierdzenia lub zaprzeczenia pochodzenia psa. Oczywiście aby to zbadać należy określić nie tylko profil DNA konkretnego psa ale też profile jego rodziców, czy rodzeństwa albo dalszych kuzynów no bo takie profile potem muszą być z soba porównane.
Profile DNA (genetyczne odciski palców) nie udzielają żadnych informacji na temat genetycznych wad i chorób, nosicielstwa, koloru oczu, umaszczenia, wielkości, psychiki, itp. Te bowiem cechy zależą od informacji zawartej w genach (czyli części informacyjnej DNA) a informacje przypisane tożsamości (profilowi DNA) znajdują się w części poza genowej, która nie zawiera informacji zdolnej do odczytania przez enzymy i nie warunkuje tych wcześniej wymienionych cech.
Genom psa już został zsekwencjonowany (i to pewnie nie jednego) ale do badań porównawczych nie są potrzebne całe genomy, wystarczą tylko pewne sekwencje tandemowo (ułożone jeden obok drugiego) powtarzające się w genomie, zwane sekwencjami mikrosatelitararnymi. Używa się też określeń STR (short tandem repeats), mikrosatelita czy marker. Marker DNA to konkretny odcinek DNA (o znanej sekwencji nukleotydów),którego położenie w chromosomie (locus) jest znane. W naszym przypadku będą to markery odpowiadające sekwencjom mikrosatelitarnym.
Jakie sekwencje i genomie można wyróżnić? Główny podział to podział na część informacyjną i nieinformacyjną. Najważniejsze oczywiście są te które mają zakodowaną informację ale i te z których niczego nie można odczytać też nie są bez znaczenia, przynajmniej niektóre. I tak:
Geny to sekwencje kodujące informacje o jakimś produkcie (o jakimś białku). Mogą występować w licznych lub mniej licznych kopiach lub pojedynczo. Mogą też mieć różną długość (ciąg sekwencji nukleotydów). Jeden gen może mieć jedną lub kilka wersji z których każda dobrze funkcjonuje i jest w stanie „wyprodukować” zakodowane białko. Znajdują się na różnych chromosomach w genomie a ich położenie na nim określa się locus (l. mn. to loci). To od nich zależy nasz wygląd, zdrowie, psychika, charakter, predyspozycje. Są bardziej konserwatywne niż sekwencje poza genowe niekodujące, tzn. podlegają mutacjom tylko w niewielkim stopniu.
Sekwencje związane z genami to przede wszystkim tzw. promotory (sekwencje położone przed początkiem danego genu) i sekwencje regulatorowe (położone w miejscach bardziej odległych). To one zapoczątkowują odczyt informacji i ją regulują. Nie zawierają wprawdzie, tak jak geny, informacji o ciągu aminokwasów w białku, ale ich funkcja jest znacząca. Niekorzystna mutacja w takich obszarach spowoduje, że pomimo właściwej sekwencji w genie, informacja nie zostanie odczytana i produkt (jakieś białko) nie powstanie.
Pseudogeny to zmutowane wersje genów, które już nie mogą spełniać swojej funkcji „produkowania” biologicznie aktywnego białka. Ich sekwencje mogą przypominać jakieś sekwencje genowe ale są one nie do odczytania.
Pozagenowy DNA to ta nieinformacyjna część genomu która stanowi w przypadku psa ok. 70 % jego całości. Część tych sekwencji jest unikatowa, część występuje w małej liczbie kopii. Jeszcze inne części stanowią umiarkowane lub wielokrotne powtórzenia które mogą być rozproszone po całym genomie lub uszeregowane w długie tandemowe ciągi powtórzeń. I te właśnie powtarzające się tandemowo regiony będą przedmiotem naszego zainteresowania bo to dzięki nim możliwa jest identyfikacja osobników i szukanie pokrewieństwa między nimi. Do tego celu można wykorzystać sekwencje minisatelitarne określane tez jako VNTR (variable number tandem repeats) lub mikrosatelity STR. Na tych ostatnich się skupimy gdyż to one obecnie są wykorzystywane do sporządzania profili DNA.
Jest jeszcze wiele ciekawych sekwencji w genomie ale poprzestanę na tych wymienionych powyżej. Dla naszych rozważań głównie będą potrzebne mikrosatelity.
Przykłady zapisu takich tandemowych sekwencji :
1. (AGAT)n ,
2. (AGC)nTGT(AGC)m,
3. (AT)n(GC)m(AT)p
gdzie :
m,n,p – liczba kopii, czyli tandemowych powtórzeń
(AGAT), (AGC), (AT), (GC) – sekwencje podstawowe, tzw. motywy powtórzeń
TGT – wstawka (bez powtorzeń)
A, G, T, C – oznaczenia nukleotydów
W przypadku 1. mamy n-krotne powtórzenie jednego motywu. W przypadku 2. powtórzenia motywu n-krotne i m-krotne są rozdzielone wstawką. W przypadku 3. występują 3 różne motywy.
Rozpiszmy przypadek 2. Niech n=2, m=3.
……………..AGCAGCTGTAGCAGCAGC………………………...
W następnej części będzie o polimorfiźmie sekwencji mikrosatelitarnych STR.
CDN
Jak wiadomo linie papilarne tworzą niepowtarzalny i niezmienny układ bruzd na skórze. Jest to cecha fenotypowa przypisana konkretnemu osobnikowi, wykorzystywana w procesie ustalania tożsamości. Ale również w genotypie (człowieka, psa, innych ssaków) zawarta jest informacja, również niepowtarzalna, niezmienna i jednoznaczna, która może być przypisana tylko konkretnemu osobnikowi. Jest możliwa do odtworzenia z różnych tkanek (ale tylko z takich w których komórki zawierają jądra), również po jego śmierci. Taka informacja nazywana jest często „genetycznym odciskiem palca” (DNA fingerprinting) lub profilem DNA. Takie testy DNA (w przypadku psów) służą tylko do potwierdzenia lub zaprzeczenia pochodzenia psa. Oczywiście aby to zbadać należy określić nie tylko profil DNA konkretnego psa ale też profile jego rodziców, czy rodzeństwa albo dalszych kuzynów no bo takie profile potem muszą być z soba porównane.
Profile DNA (genetyczne odciski palców) nie udzielają żadnych informacji na temat genetycznych wad i chorób, nosicielstwa, koloru oczu, umaszczenia, wielkości, psychiki, itp. Te bowiem cechy zależą od informacji zawartej w genach (czyli części informacyjnej DNA) a informacje przypisane tożsamości (profilowi DNA) znajdują się w części poza genowej, która nie zawiera informacji zdolnej do odczytania przez enzymy i nie warunkuje tych wcześniej wymienionych cech.
Genom psa już został zsekwencjonowany (i to pewnie nie jednego) ale do badań porównawczych nie są potrzebne całe genomy, wystarczą tylko pewne sekwencje tandemowo (ułożone jeden obok drugiego) powtarzające się w genomie, zwane sekwencjami mikrosatelitararnymi. Używa się też określeń STR (short tandem repeats), mikrosatelita czy marker. Marker DNA to konkretny odcinek DNA (o znanej sekwencji nukleotydów),którego położenie w chromosomie (locus) jest znane. W naszym przypadku będą to markery odpowiadające sekwencjom mikrosatelitarnym.
Jakie sekwencje i genomie można wyróżnić? Główny podział to podział na część informacyjną i nieinformacyjną. Najważniejsze oczywiście są te które mają zakodowaną informację ale i te z których niczego nie można odczytać też nie są bez znaczenia, przynajmniej niektóre. I tak:
Geny to sekwencje kodujące informacje o jakimś produkcie (o jakimś białku). Mogą występować w licznych lub mniej licznych kopiach lub pojedynczo. Mogą też mieć różną długość (ciąg sekwencji nukleotydów). Jeden gen może mieć jedną lub kilka wersji z których każda dobrze funkcjonuje i jest w stanie „wyprodukować” zakodowane białko. Znajdują się na różnych chromosomach w genomie a ich położenie na nim określa się locus (l. mn. to loci). To od nich zależy nasz wygląd, zdrowie, psychika, charakter, predyspozycje. Są bardziej konserwatywne niż sekwencje poza genowe niekodujące, tzn. podlegają mutacjom tylko w niewielkim stopniu.
Sekwencje związane z genami to przede wszystkim tzw. promotory (sekwencje położone przed początkiem danego genu) i sekwencje regulatorowe (położone w miejscach bardziej odległych). To one zapoczątkowują odczyt informacji i ją regulują. Nie zawierają wprawdzie, tak jak geny, informacji o ciągu aminokwasów w białku, ale ich funkcja jest znacząca. Niekorzystna mutacja w takich obszarach spowoduje, że pomimo właściwej sekwencji w genie, informacja nie zostanie odczytana i produkt (jakieś białko) nie powstanie.
Pseudogeny to zmutowane wersje genów, które już nie mogą spełniać swojej funkcji „produkowania” biologicznie aktywnego białka. Ich sekwencje mogą przypominać jakieś sekwencje genowe ale są one nie do odczytania.
Pozagenowy DNA to ta nieinformacyjna część genomu która stanowi w przypadku psa ok. 70 % jego całości. Część tych sekwencji jest unikatowa, część występuje w małej liczbie kopii. Jeszcze inne części stanowią umiarkowane lub wielokrotne powtórzenia które mogą być rozproszone po całym genomie lub uszeregowane w długie tandemowe ciągi powtórzeń. I te właśnie powtarzające się tandemowo regiony będą przedmiotem naszego zainteresowania bo to dzięki nim możliwa jest identyfikacja osobników i szukanie pokrewieństwa między nimi. Do tego celu można wykorzystać sekwencje minisatelitarne określane tez jako VNTR (variable number tandem repeats) lub mikrosatelity STR. Na tych ostatnich się skupimy gdyż to one obecnie są wykorzystywane do sporządzania profili DNA.
Jest jeszcze wiele ciekawych sekwencji w genomie ale poprzestanę na tych wymienionych powyżej. Dla naszych rozważań głównie będą potrzebne mikrosatelity.
Przykłady zapisu takich tandemowych sekwencji :
1. (AGAT)n ,
2. (AGC)nTGT(AGC)m,
3. (AT)n(GC)m(AT)p
gdzie :
m,n,p – liczba kopii, czyli tandemowych powtórzeń
(AGAT), (AGC), (AT), (GC) – sekwencje podstawowe, tzw. motywy powtórzeń
TGT – wstawka (bez powtorzeń)
A, G, T, C – oznaczenia nukleotydów
W przypadku 1. mamy n-krotne powtórzenie jednego motywu. W przypadku 2. powtórzenia motywu n-krotne i m-krotne są rozdzielone wstawką. W przypadku 3. występują 3 różne motywy.
Rozpiszmy przypadek 2. Niech n=2, m=3.
……………..AGCAGCTGTAGCAGCAGC………………………...
W następnej części będzie o polimorfiźmie sekwencji mikrosatelitarnych STR.
CDN