BOINC@Poland

Projekty => Astronomia i Astrofizyka => Einstein@home => Wątek zaczęty przez: zoom_mctwist w 02 Grudzień 2012, 02:24

Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: zoom_mctwist w 02 Grudzień 2012, 02:24
Ciekawi mnie jak wygląda Wasz czas obliczania jednego WU: Binary Radio Pulsar Search (Arecibo) 1.32 na GPU, w zależności od konfiguracji komputera (CPU, GPU).
Jeżeli ktoś liczy kilka próbek równolegle (utilization factor: 0.5, 0.33 itp.) to jak przedstawia się wzrost wydajności w porównaniu do pojedynczego zadania.

Jako, że próbka próbce nierówna, najlepiej wyciągnąć średnią z kilku wyników przedstawionych na stronie E@H. Wynik do analizy to czas Run time (sec).

Wasze posty pozwolą opracować bazę danych najlepszych kart graficznych, procesorów i ustawień przeznaczonych do tego projektu.

// Podobny wątek znajduje się tutaj: http://einstein.phys.uwm.edu/forum_thread.php?id=9500#117815 (http://einstein.phys.uwm.edu/forum_thread.php?id=9500#117815) z podsumowanymi wynikami: http://www.dskag.at/images/Research/EinsteinGPUperformancelist.pdf (http://www.dskag.at/images/Research/EinsteinGPUperformancelist.pdf) jednak nie uwzględnia on mocy CPU, który ma również wpływ na szybkość obliczeń.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: stiven w 02 Grudzień 2012, 17:42
BRP nie potrzebuje mocnego CPU. Możesz spokojnie bazować na tym co podali i wg nie są potrzebne dodatkowe testy. O ile nie wepchniesz jakiejś super karty pod atoma na przykłąd. Wąskim gardłem jest GPU zupełnie odwrotnie niż w POEM.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: zoom_mctwist w 02 Grudzień 2012, 21:34
Pewien wpływ jednak jest. Wg ich forum GTX460 liczy 2 próbki w 2900 sec. U mnie ta sama karta z mocno wykręconym CPU leci poniżej 2500 sec.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: stiven w 03 Grudzień 2012, 01:30
Bardziej stawiałbym na inne taktowanie GPU albo pamięci karty lub większej ilości próbek wziętych do uśredniania (jakieś rozrzuty są). Moja gt430 liczy 2 próbki jakieś 300-400s krócej niż podają.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: Sebastian M. Bobrecki w 04 Grudzień 2012, 16:49
Phenom II X4 940 (3,2GHz) + GTX270 (PCIe 2.0 x16) jedno zadanie na raz ~1870s/zadanie
Phenom II X4 965 (3,4GHz) + 2x GTX660Ti (PCIe 2.0 x8) ~2592s dwa zadania na jedno GPU -> ~1296s/zadanie, ~3365s trzy zadania na jedno GPU -> ~1122s/zadanie
Phenom II X6 1075T (3,495GHz) + GTX680 (PCIe 2.0 x16) ~2740s trzy zadania -> ~913s/zadanie, ~3410s cztery zadania -> ~852s/zadanie
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: krzyszp w 04 Grudzień 2012, 16:56
Q6600 i GT430, jedno zadanie naraz - 5,457.92s (Linux 64bit)
Athlon2x3, ATI 7750, jedno zadanie naraz - od 3,943.11s do... 50'000s... tragedia... (Windows 7-64)

ATI nie nadaje się moim zdaniem do Einsteina...
Jak uruchomić dwie próbki naraz dla tego kompa z GT430?
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: stiven w 04 Grudzień 2012, 17:13
Bardzo prosto: GPU utilization factor of BRP apps na stronie projektu w Preferences for this project   Ustawienia Einstein@Home.
0.5 to 2 WU naraz, 0.33 to 3. Od razu Ci poradzę, że 3 nie ma sensu odpalać. 2 zapchają GPU pod korek robotą.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: krzyszp w 04 Grudzień 2012, 17:15
Cytat: stiven w 04 Grudzień 2012, 17:13
Bardzo prosto: GPU utilization factor of BRP apps na stronie projektu w Preferences for this project   Ustawienia Einstein@Home.
Ustawiłem to, ale nic się nie zmieniło - dalej liczy tylko jedną próbkę naraz...
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: stiven w 04 Grudzień 2012, 17:52
Zaktualizuj projekt i jak tę doliczy to następne już pójdą zgodnie z Twoimi ustawieniami.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: krzyszp w 04 Grudzień 2012, 18:02
Cytat: stiven w 04 Grudzień 2012, 17:52
Zaktualizuj projekt i jak tę doliczy to następne już pójdą zgodnie z Twoimi ustawieniami.
Nie idą, te ustawienie zmieniłem 3 dni temu, aktualizowałem kilka razy..
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: stiven w 04 Grudzień 2012, 18:07
Kiedyś tez tak nie mogłem się doczekać aż się okazało, że komputer ma lokalizację home a zmieniałem konfig dla default  :facepalm2:

Poprawiłem i pomyka.
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: krzyszp w 04 Grudzień 2012, 18:08
Cytat: stiven w 04 Grudzień 2012, 18:07
Kiedyś tez tak nie mogłem się doczekać aż się okazało, że komputer ma lokalizację home a zmieniałem konfig dla default  :facepalm2:

Poprawiłem i pomyka.
To również sprawdziłem, mam lokalizację work i ustawienia "0.5" dla default i work...
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: stiven w 04 Grudzień 2012, 18:13
No to nie wiem. U mnie działa. Proponuję zmontować aap_info. Tu: http://www.boincatpoland.org/smf/einsteinhome/wiele-wu-na-raz-na-gpu/ masz jakieś przykładowe myślę że sobie poradzisz.   
Tytuł: Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji
Wiadomość wysłana przez: tito w 28 Luty 2013, 01:44
Cytat: zoom_mctwist w 02 Grudzień 2012, 21:34
Pewien wpływ jednak jest. Wg ich forum GTX460 liczy 2 próbki w 2900 sec. U mnie ta sama karta z mocno wykręconym CPU leci poniżej 2500 sec.
Po długiej analizie co jest nie tak, zgadzam się z powyższym.
Mam AMD 7950 i za cholerę nie mogę jej wykarmić.
CPU to dosyć leciwy C2D @ 2600MHz + DDR2.
Jeśli zwolnię jedno jajko dla CPU (drugie coś sobie tam liczy) to obciążenie GPU wynosi ~63% a czas przeliczeń to ~ 2500 sek.
Jeśli przestanę liczyć na drugim jajku to obciążenie GPU wzrasta do ~75% a czas spada do 1700sek. Ciągle znacznie więcej niż u ludzi.
Być może wąskim gardłem jest pamięć, ale tego na odległość już nie przetestuję.