Warning: A skin using autodiscovery mechanism, boinc_poland, was found in your skins/ directory. The mechanism will be removed in MediaWiki 1.25 and the skin will no longer be recognized. See https://www.mediawiki.org/wiki/Manual:Skin_autodiscovery for information how to fix this. [Called from Skin::getSkinNames in /data/www/www.boincatpoland.org/htdocs/wiki/includes/Skin.php at line 74] in /data/www/www.boincatpoland.org/htdocs/wiki/includes/debug/Debug.php on line 303

Warning: A skin using autodiscovery mechanism, fratman_enhanced, was found in your skins/ directory. The mechanism will be removed in MediaWiki 1.25 and the skin will no longer be recognized. See https://www.mediawiki.org/wiki/Manual:Skin_autodiscovery for information how to fix this. [Called from Skin::getSkinNames in /data/www/www.boincatpoland.org/htdocs/wiki/includes/Skin.php at line 74] in /data/www/www.boincatpoland.org/htdocs/wiki/includes/debug/Debug.php on line 303

Strict Standards: Declaration of Skinboinc_poland::initPage() should be compatible with Skin::initPage(OutputPage $out) in /data/www/www.boincatpoland.org/htdocs/wiki/skins/boinc_poland.php on line 5
SIMAP – Wiki B@P Wspieramy naukę

SIMAP

Z Wiki B@P


Logo SIMAP@home


Oparty o BOINC projekt przetwarzania rozproszonego ma za zadanie pomóc w porównywaniu sekwencji różnych białek. Jest to dosyć istotne, gdyż białka o zbliżonych sekwencjach, mają najprawdopodobniej wspólnego "przodka", a co ważniejsze, często pełnią podobne funkcje.

Co to jest SIMAP ?

SIMAP to baza podobieństw białek i domen białek. Zawiera ona wszystkie dotychczas opublikowane sekwencje białkowe i jest stale aktualizowana. Podobieństwa białek są obliczane za pomocą algorytmu FASTA, który zapewnia optymalną prędkość i czułość. Domeny białek są obliczane przy użyciu metody InterPro oraz bazy danych. SIMAP jest prawdopodobnie jedynym projektem, który łączy w sobie obszerną wiedzę na temat znanych białek oraz możliwość bieżącej aktualizacji.

Do czego używany jest SIMAP ?

Ze względu na ogromną liczbę znanych sekwencji białkowych w publicznych bazach danych okazało się, że większość z nich nie będzie doświadczalnie scharakteryzowana w najbliższej przyszłości. Niemniej jednak, białka które ewoluowały od wspólnego przodka posiadają często te same funkcje (tzw. ortologi). Możliwe jest więc wywnioskowanie funkcji niescharakteryzowanego białka na podstawie jego ortologa o znanej funkcji. Dobrze znanym przykładem są badania dotyczące genów i białek myszy. Wyniki te są prawdziwe dla wielu ortologów ludzkich genów i białek. Podobieństwa białek dostarczają informacji na temat relacji między białkami i są konieczne do przewidywania ortologów.

Domeny białek (często nazywane domenami funkcjonalnymi) są strukturalnymi blokami białek. Są one odpowiedzialne za działania niektórych białek, np. wiązanie małych cząsteczek, reakcje katalityczne lub wiązanie innych białek w większe struktury. Wiedza na temat domen białek jest przechowywana w ogromnych repozytoriach, takich jak baza danych InterPro. Przewidywanie domen w nowych sekwencjach białek opiera się na tych bazach danych i zapewnia w pełni automatyczne, funkcjonalne przypisywanie tych białek. Dlatego obliczamy domeny białek dla wszystkich białek w SIMAP, zapewniając tym samym największy system przewidywania funkcji białek na świecie.

Istnieje wiele innych bioinformatycznych metod, które opierają się na podobieństwie białek i domenach. Nasza baza danych zawiera wstępnie przeliczone dane podobieństwa białek oraz domen białkowych i odzwierciedla całą znaną przestrzeń białek. To otwiera zupełnie nowe perspektywy w porównaniu do powszechnie stosowanych metod wielokrotnego przeliczania tego rodzaju danych. SIMAP jest regularnie aktualizowany. Macierz podobieństw jest stopniowo rozszerzana, w miarę występowania nowych sekwencji. Wykorzystanie SIMAP jest całkowicie bezpłatne dla edukacji i badań naukowych.

Dlaczego potrzebujemy przetwarzania rozproszonego dla SIMAP ?

Koszt obliczeniowy sprawdzania podobieństwa danych jest proporcjonalny do kwadratu liczby zawartych sekwencji. W efekcie moc obliczeniowa potrzebna do uaktualniania macierzy stale rośnie. Nasze wewnętrzne zasoby, które wykonują obliczenia dla SIMAP od lat, nie są już wystarczające aby śledzić wszystkie nowe sekwencje. Dlatego też wdrożyliśmy klienta SIMAP dla platformy BOINC (Berkeley Open Infrastructure for Network Computing), który jest oparty (klient) na algorytmie FASTA do wykrywania podobieństw sekwencji.

Sytuacja domen białek jest inna, ale o podobnej złożoności. Koszty obliczeniowe są proporcjonalne do liczby sekwencji i liczby modeli domen. Ze względu na wzrost przestrzeni sekwencji oraz częstych aktualizacji baz danych domen, moc potrzebna do aktualizacji przewidywań domen także stale rośnie.

Jakie instytucje stoją za SIMAP ?

SIMAP jest wspólnym projektem GSF National Research Center for Environment and Health, Neuherberg and Technical University Munich, Center of Life and Food Science Weihenstephan. Prosimy o kontakt Thomas Rattei (Department of Genome Oriented Bioinformatics, TU Munich).


WU mogą być bardzo zróżnicowane, począwszy od 15 minut do 3 godzin. Rozmiar próbek od 600 kB do 1,35 MB każdy, średnio około 1,20 MB. Systemy operacyjne obsługiwane przez SIMAP to: Linux, Windows, Mac OS i inne z platformy UNIX.

Kliknij poniższy obrazek w celu uzyskania szczegółowych statystyk naszej drużyny:

team_9063_project18.gif

Projekty powiązane z SIMAP

Projekty których dane i oprogramowanie wykorzystuje SIMAP

Projekty które wykorzystują rezultaty projektu SIMAP

Przydatne linki

Strona główna projektu

SIMAP na forum BOINC@Poland

Wiadomości SIMAP

Personel projektu

  • Dr. Thomas Rattei - Koordynator
  • Mathias Walter- Programista

Administratorzy forum:

  • Alexander Kräutler
  • Roland Arnold "surveillant"
  • Jonathan Hoser "Jonathan"

Moderatorzy forum

  • Corinna Klausing "Cori"
  • Jörg Glasing "Joogie"