• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Projekt 1000 genomów publikuje wstępne dane

    24.06.2010. 21:12
    opublikowane przez: Redakcja Naukowy.pl

    Wiemy, że w ponad 99% genomy (schematy genetyczne) dowolnych 2 osób są takie same, ale ten maleńki 1% materiału genetycznego, zawierający kluczowe informacje na temat naszej wrażliwości i podatności sprawia, że ludzie różnią się od siebie. Projekt "1000 genomów", oparty na międzynarodowym projekcie HapMap, tworzy szczegółowy katalog wspólnej zmienności genetycznej ludzi, układającej się w haplotypy czyli "sąsiedztwa" chromosomów. Baza danych będzie dostępna dla naukowców bezpłatnie.

    Od uruchomienia w 2008 r., programu "1000 genomów" jego partnerzy zakończyli trzy projekty pilotażowe i opracowują publiczną bazę danych, zawierającą informacje pozyskane z genomów 2.500 osób pochodzących z 27 populacji na świecie. W ramach tych trzech projektów przetestowano wiele strategii budowania katalogu wariantów genetycznych, które występują na poziomie 1% lub wyższym w próbkach z różnych populacji (np. europejskich i wschodnioazjatyckich).

    Zdaniem partnerów katalog będzie ogromną pomocą dla naukowców zainteresowanych badaniem powiązania zmienności genetycznej z chorobami. Zestaw danych pilotażowych jest dostępny w witrynie projektu "1000 genomów" oraz za pośrednictwem serwisów internetowych przetwarzania w chmurze Amazon (AWS).

    "Jestem wdzięczny wszystkim naukowców pracującym przy projekcie, dzięki którym ta współpraca jest tak udana" - mówi dr Richard Durbin z Wellcome Trust Sanger Institute w Wlk. Brytanii, który jest również współkierownikiem projektu "1000 genomów". "W ramach projektów pilotażowych poczyniliśmy ogromny postęp w optymalizacji wykorzystania platform sekwencjonowania kolejnej generacji do badania zmienności genetycznej człowieka i możemy obecnie wykorzystać to, czego się nauczyliśmy do zintensyfikowania naszych prac nad sekwencjonowaniem tego referencyjnego zbioru ludzkich genomów."

    Komentując ostatnie dokonanie projektu, współkierownik dr David Altshuler z Broad Institute z USA powiedział: "Osiągnięcie celów przez te początkowe projekty pilotażowe miało decydujące znaczenie dla poznania sposobu zastosowania metod sekwencjonowania nowej generacji w badaniach genetycznych człowieka i zapewniło solidne podstawy dla kolejnego etapu projektu."

    Dr Altshuler zauważył, że partnerzy chcieliby "poczynić szybkie postępy w całym zestawie 2.500 genomów i przedstawić dane wynikowe", które będą wykorzystywane przez naukowców badających choroby genetyczne. "Jestem przekonany, że te dane precyzyjniej zdefiniują genetyczne czynniki ryzyka już odkryte i przyczynią się do odkrycia wielu nowych czynników ryzyka wystąpienia choroby" - dodaje.

    Naukowcy pracujący nad międzynarodowym projektem HapMap stworzyli wstępną bazę danych, zawierającą ponad 3 miliony wariantów DNA (kwasu dezoksyrybonukleinowego) człowieka, które odkryto w 270 próbkach DNA i posunęli naprzód pierwszą generację badań asocjacyjnych całego genomu (GWAS), które ustaliły ponad 600 nowych, genetycznych czynników ryzyka zapadnięcia na rozmaite choroby, w tym nowotwory piersi, cukrzycę czy schizofrenię. Projekt "1000 genomów" napędza dalsze badania, dzięki wykorzystywaniu technologii sekwencjonowania DNA nowej generacji, tworząc obszerną, a przy tym dostępną bezpłatnie, bazę danych.

    Członkowie konsorcjum twierdzą, że nowa baza danych będzie zawierać niezliczone informacje np. o zmianach jednoliterowych (SNP), małych insercjach i delecjach (indele) oraz dużych zmianach w strukturze i liczbie kopii chromosomów (różnice w liczbie kopii).

    "Podwyższona rozdzielczość mapy 1000 genomów dostarczy naukowcom znacznie dokładniejszych informacji na temat sekwencji poza wspólnymi wariantami, w tym o milionach mniej powszechnych i rzadszych wariantów" - wyjaśnia dr Elaine Mardis z Ośrodka Genomicznego Uniwersytetu Waszyngtońskiego w USA, członkini komitetu zarządczego projektu. "Naukowcy, którzy odkryli regiony genomu powiązane z chorobami będą w stanie, przyglądając się tym danym, zobaczyć niemal kompletny zestaw wariantów genetycznych w regionach, które mogą bezpośrednio przyczyniać się do choroby."

    Istotny wkład w badania wnieśli eksperci z Chin, Niemiec, USA i Wlk. Brytanii.

    Za: CORDIS

    Czy wiesz ĹĽe...? (beta)
    KEGG (Kyoto Encyclopedia of Genes and Genomes) - zbiór dostępnych w Internecie bioinformatycznych baz danych, które zawierają informacje nt. genomów i genów, szlaków metabolicznych (reakcji chemicznych i enzymów) i metabolitów. Znajdują się one w osobnych sieciach: białkowej, genetycznej i biochemicznej. GenBank - otwarta i dostępna w Internecie amerykańska, bioinformatyczna baza danych zawierająca zbiór genowych sekwencji nukleotydowych.
    GenBank, wraz z instytucjami współpracującymi zbiera poznawane sekwencje z laboratoriów całego świata. Zawiera dane dotyczące ponad 100 tys. różnych organizmów. Baza rośnie wykładniczo, podwajając swoje zasoby co 10 miesięcy. GenBank przyjmuje także dane z poszczególnych laboratoriów jak i depozyty informacyjne z wielkoskalowych centrów sekwencyjnych. MetaCyc - dostępna w Internecie, naukowo opracowana baza danych szlaków metabolicznych organizmów żywych. Zawiera informacje dotyczące ponad 1100 szlaków metabolicznych, występujących u ponad 1500 różnych organizmów opartych na sprawdzonych danych z literatury naukowej.

    Kartotekowa baza danych (lub prosta baza danych) - baza danych złożona z jednej lub kilku tablic zawierających rekordy, z których każdy zawiera identyczną strukturę pól. Każda tablica danych jest samodzielnym dokumentem i nie może współpracować z innymi tablicami, w przeciwieństwie do relacyjnej bazy danych. Hybrydogeneza – termin z dziedziny embriologii rozumiany zwykle jako sposób rozmnażania się mieszańców (hybryd), w którym mieszaniec podczas wytwarzania gamet (gametogenezy) usuwa jeden z genomów gatunków rodzicielskich. Inaczej mówiąc, wytwarza takie gamety, jakby należał do jednego z gatunków rodzicielskich, a nie zawierające mieszaninę ich genomów.

    Strumieniowa baza danych to baza danych, w której dane są przedstawione w postaci zbioru strumieni danych. System zarządzania taką bazą nazywany jest strumieniowym systemem zarządzania danymi (DSMS - ang. Data Stream Management System). Moon Zoo – jeden z ogólnodostępnych internetowych projektów astronomicznych, zapoczątkowanych projektem Galaxy Zoo. Z tego projektu wywodzi się zakrojona na szeroką skalę inicjatywa nazwana "Zooniverse", do której należą również takie zoo-projekty jak: Galaxy Zoo Mergers, Galaxy Zoo Supernovae, Solar Stormwatch, Galaxy Zoo Hubble i inne. Celem "Zooniverse" jest stworzenie miejsca dla całego pakietu projektów, które pozwolą każdemu, kto ma dostęp do internetu, przyczynić się do rozwoju nauki. Wszystkie z nich wykorzystują możliwości internetu poprzez udział internautów w badaniach naukowych, wspierających projekty badawcze opracowane przez astronomów, a które wymagają udziału dużej liczby uczestników. Są to badania, które wymagają szczególnie inteligencji oraz spostrzegawczości człowieka (wykorzystanie komputerów nie daje w tych badaniach oczekiwanych rezultatów).

    Baza danych – zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego programu komputerowego specjalizowanego do gromadzenia i przetwarzania tych danych. Program taki (często pakiet programów) nazywany jest „systemem zarządzania bazą danych” (ang. database management system, DBMS). Big data – termin odnoszący się do dużych zbiorów danych, których przetwarzanie wymaga zastosowania specjalistycznego oprogramowania. W praktyce pojęcie dużego zbioru danych oznacza rozmiar wyrażany przy pomocy co najmniej dziesiątek terabajtów, a często nawet petabajtów. Big data ma zastosowanie wszędzie tam, gdzie dużej ilości cyfrowych danych towarzyszy potrzeba zdobywania nowych informacji lub wiedzy. Szczególne znaczenie odgrywa wzrost dostępności Internetu oraz usług świadczonych drogą elektroniczną, które w naturalny sposób są przystosowane do wykorzystywania baz danych.

    Przestrzenna baza danych (ang. spatial database) - jest bazą danych zoptymalizowaną do składowania i odpytywania danych powiązanych z obiektami w przestrzeni, takimi jak: punkty, linie i wielokąty. Tradycyjne bazy danych mogą przyjmować dane w postaci liczbowej i znakowej, natomiast do przetwarzania przestrzennych typów danych potrzebują dodatkowej funkcjonalności. Open Geospatial Consortium stworzył specyfikację i zbiór standardów dodawania przestrzennych funkcjonalności do systemów bazodanowych.

    Usługa metakatalogu służy przepływowi danych między jednym lub więcej serwerem usług katalogowych i baz danych w celu zapewnienia synchronizacji danych. Jest ważną częścią systemów zarządzania tożsamością. Synchronizowane dane to zwykle profile użytkowników i informacje o polisach i autoryzacji. Większość implementacji metakatalogu synchronizuje dane do minimum jednego serwera usług katalogowych by zapewnić aplikacjom działającym w oparciu o katalogi, takim jak pojedyncze logowanie, dostęp do bieżących danych nawet jeśli źródłowe dane nie znajdują się w katalogu.

    Operacyjne bazy danych - bazy wykorzystywane wszędzie tam, gdzie istnieje potrzeba nie tylko na gromadzenie danych, ale również na możliwość ich modyfikowania. Ten typ baz przechowuje dane dynamiczne, tzn. takie, które ulegają ciągłym zmianom i przedstawiają aktualny stan rzeczy, której dotyczą. Zazwyczaj to ten typ bazy można spotkać w różnych organizacjach i firmach. Przykładem takiej bazy danych są np. bazy inwentaryzacyjne lub bazy obsługi zamówień. Duży Obiekt Znakowy (lub CLOB) jest kolekcją danych znakowych w Systemie zarządzania bazą danych. Obiekty CLOB są najczęściej przechowywane w wydzielonym miejscu, do którego odwołanie znajduje się w tabeli. Przykładowo systemy zarządzania bazą danych Oracle oraz DB2 dostarczają typu nazwanego wprost CLOB. Wiele innych systemów zarządzania bazą danych obsługuje w jakiejś formie ten typ danych często oznaczany jako text lub też long character.

    Dodano: 24.06.2010. 21:12  


    Najnowsze