Aktualności:

Nowy polski projekt BOINC - Universe@Home

Menu główne

Optymalizacja ATI 0.82 dla MilkyWay i ograniczenie użycia GPU

Zaczęty przez Adam Sawicki, 06 Lipiec 2011, 17:59

Adam Sawicki

Witam!

Może komuś z Koleżanek i Kolegów się przyda. Ostatnia optymalizacja 0.82 ATI MilkyWay dla 32/64 bit dostępna tu: http://www.arkayn.us/forum/index.php?action=downloads;cat=11
razem z plikiem app_info. W pliku app_info dla systemu 32bit jest błąd który należy poprawić, tzn. podwójna litera ''m'' w wyrazie mmilkyway, którą należy skasować  :)
<name>mmilkyway_separation_0.82_windows_intelx86__ati14.exe</name>

Wiele godzin spędziłem przed google zanim znalazłem ostatnią optymalizację dla MilkyWay, gdyż ta 0.82 ściągana z automatu przez BM 6.12.26 po przeliczeniu każdej WU wywalała błąd, czy ktoś z kolegów miał ten sam problem ? Nigdy wcześniej nic takiego mi się nie zdarzało. Moja karta to 4870 i Win XP 32bit oraz najnowsze stery ATI 11-6
Ponieważ moja karta ATI 4870 (830MHz) do demonów prędkości nie należy to postanowiłem ograniczyć MilkyWay priorytet przetwarzania danych bo obraz się strasznie tnie nawet podczas normalnego przeglądania Internetu o odtwarzaniu filmów nie wspominając.
Wypróbowałem sposób podany przez AiDec tzn. zmianę priorytetu w wierszu <cmdline></cmdline> na <cmdline>p1</cmdline> a potem na <cmdline>w2.0 p1</cmdline> ale u mnie to nie działa. Jedynym rezultatem tego było to że od razu na początku liczenia wywalało błąd przy każdym WU.
Drogą dedukcji doszedłem do wniosku że może zmiana w wierszu
<count>1</count>
coś pomoże i faktycznie pomogło po zmianie na <count>0.60</count> obraz tnie się znacznie mniej ale do normalności jeszcze trochę brakuje. Jeżeli GPU nie jest obciążone innymi zadaniami to i tak 100% mocy jest wykorzystane do obliczeń w MilkyWay, można to sprawdzić choćby za pomocą GPU-Z
Jako ciekawostkę podam że po ustawieniu <count>0.50</count> MilkyWay liczy 2 WU naraz na jednym GPU
Zapomniałem dodać że w czasie liczenia na GPU MilkyWay mój CPU zajmuje się liczeniem Rosetta@home
Czy ktoś posiada jakiś inny wypróbowany sposób ograniczenia priorytetu dla MilkyWay ?

apohawk

Witam na forum  :parrrty:

Szukanie optymalizacji po sieci sobie darowałem, wziąłem aplikację dostarczaną przez projekt i dopisałem sobie app_info.xml, aby lepiej mi to pracowało.
Sporo się zmieniło w opcjach <cmdline> od czasu, kiedy AiDec pisał te opisy.
Na mojej 4850 używałem opcji --gpu-polling-mode 30, co dawało load na GPU ok. 50-70%. Te 30 to odstęp w ms między dorzucaniem danych do GPU, czy jakoś tak. Dopasuj sobie wedle potrzeb. Inną ciekawą opcją w 0.8x są checkpointy na GPU. Podobno wolne to jest wedle tego, co piszą w newsie, więc przyda się zapewne dorzucić opcję --gpu-disable-checkpointing.

Jak dotrę wieczorem do domu, to wrzucę swoje app_info.xml.
No good deed goes unpunished.

apohawk

<app_info>
<app>
<name>milkyway</name>
</app>
<file_info>
<name>milkyway_separation_0.82_windows_x86_64__ati14.exe</name>
<executable/>
</file_info>
<app_version>
<app_name>milkyway</app_name>
<version_num>82</version_num>
<avg_ncpus>0.05</avg_ncpus>
<max_ncpus>1</max_ncpus>
<plan_class>ati14ati</plan_class>
<cmdline>--gpu-polling-mode 30 --gpu-disable-checkpointing</cmdline>
<coproc>
<type>ATI</type>
<count>1</count>
</coproc>
<flops>1.0e11</flops>
<file_ref>
<file_name>milkyway_separation_0.82_windows_x86_64__ati14.exe</file_name>
<main_program/>
</file_ref>
</app_version>
</app_info>

dla systemu 64 bitowego. zmień sobie nazwę aplikacji na x86.
No good deed goes unpunished.

Adam Sawicki

dzięki apohawk, ale teraz obciążenie GPU wynosi 65-70% na stałe, niezależnie czy GPU ma coś do roboty oprócz liczenia MilkyWay czy też nie, więc 30% mocy się marnuje, jeszcze jakieś propozycje?

apohawk

Dopasuj gpu-polling-mode wedle potrzeb. Im mniejsze, tym większe obciążenie.
No good deed goes unpunished.

AiDec

Cytat: Adam Sawicki w 06 Lipiec 2011, 17:59
(...)znalazłem ostatnią optymalizację dla MilkyWay, gdyż ta 0.82 ściągana z automatu przez BM 6.12.26 po przeliczeniu każdej WU wywalała błąd, czy ktoś z kolegów miał ten sam problem ?

Tak, nie jestes jedyny. Mialem ten sam problem dla graf 5850, 5870, 5970 i 6970. Nie chcialo mi sie grzebac, wiec sobie projekt odpuscilem - sa tez inne projekty :). Mozesz sprobowac Collatza, obciaza grafe troche mniej niz Milka.


Btw, Twoja wersja BM byla ciut pechowa, nie wszystko dzialalo jak powinno. Jesli bedziesz mial okazje, to zmien na inna.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Krzysiak

Może ja też wtrącę swoje trzy grosze
Milke z powodu lata sobie odpuściłem - zbyt wysokie temperatury grafika łapała
a po drugie zbyt duże  mulenie kompa - powodowało to utratę stabilności

Collatza -podczas działania można spokojnie słuchać muzyki przeglądać strony a nawet oglądać filmy i jest chłodniej


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Adam Sawicki

CytatDopasuj gpu-polling-mode wedle potrzeb.
Jeszcze się pobawię tymi ustawieniami.
CytatMozesz sprobowac Collatza, obciaza grafe troche mniej niz Milka.
Projekty czysto matematyczne mnie nie interesują, ale astronomia to zupełnie inna sprawa :) Na razie pozostanę przy MilkyWay. Moje Twin Turbo Pro spokojnie daje radę nawet w czasie upałów, a przy tym jest naprawdę ciche, bo oryginalne chłodzenie to była masakra %)

mimeq

Cytat
Projekty czysto matematyczne mnie nie interesują, ale astronomia to zupełnie inna sprawa

Odpal sobie SETI na GPU a zaistniejesz odrazu w Projekcie Miesiaca  :attack:


Adam Sawicki


mimeq

Dla chcacego nic trudnego:   ;)

http://i53.tinypic.com/2rh4ig1.jpg

http://setiathome.berkeley.edu/results.php?hostid=6073345&offset=0&show_names=0&state=3&appid=

Obciazenie GPU rzadko dochodzi do 90% ogolnie oscyluje  w granicach 80-85% - niestety jeden rdzen GPU pochlania praktycznie 1 rdzen CPU:

http://i56.tinypic.com/2u9ptl2.jpg

Poczytaj wiecej tu:

http://www.boincatpoland.org/smf/setihome-115/astropulse-na-gpu-ati/


Adam Sawicki

Dzięki za info, jak mnie najdzie wena twórcza to się tym zajmę  :attack:

lolek

Jak dla mnie liczenie SETI na ATI to paranoja: powolnie, dużo roboty, mała wydajność, wysokie obciążenie CPU, mulenie kompa  :facepalm2:
Swoją drogą co wszyscy mają z tym zamulaniem przy milce i wysokimi temp? Na spokojnie da się oglądać filmy w HD, a temp podobny jak przy CC, czy PG - niższy niż przy DNETC  :P

Krzysiak

Lolek ty chyba żartujesz co do Milky albo masz jakieś magiczne ustawienia  XD


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

aborek

Ja też jakoś specjalnie MW nie odczuwam. To już prędzej PG na NV.

Krzysiak

Może zacznę od tego
Macie Ati czy NV

Co może pozmieniać w pliku konfiguracyjnym


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

aborek

#16
Cytat: Krzysiak_PL_GDA w 20 Lipiec 2011, 13:55
Może zacznę od tego
Macie Ati czy NV

Co może pozmieniać w pliku konfiguracyjnym
Milka na ATI (2x5870), ustawienia standardowe taktów, nic nie ruszane w plikach konfiguracyjnych.

lolek

ATI HD4770
System win 7 x64
Zero jakichkolwiek ustawień. Podłączyłem się do projektu, zostawiłem jeden rdzeń CPU wolny, podkręciłem grafę (Core w górę, mem w dół) i temp<70 w CC >75  (wyższe taktowanie pamięci). Coś czuję ze u Ciebie te mulenie to może być efekt CF (o ile dobrze pamiętam masz więcej niż jedną grafę).

Teraz sobie pomyślałem, że skoro u większości osób muli to może to być efekt ustawienia zmiennych środowiskowych (bawiłem się trochę w folding@home).
edit
FLUSH_INTERVAL = 80
ROOK_YIELD = 2
CAL_PRE_FLUSH = 2
CAL_NO_FLUSH = 1

michaou

czyli jak to jest teraz , nie używać  <cmdline>w2.0 p1</cmdline>     ale tylko gpu polling mode?

tromba

Wpisuję się tu, bo najbardziej pasuje do moich boleści.

Jako, że POEM był zszedł, mój radek 7770 leży odłogiem. Podłączyłem się do SETI, ale nie karmi. Podłączyłem się do Milki i działa, ale:
Gpu load na poziomie 50 %, próbka schodzi po 800 sekundach średnio. BM pokazuje użycie cpu 0.05. Znalazłem w okolicznych wątkach app_info, ale po dołożeniu go nie pobiera próbek w ogóle i wysypuje stare.

Znalazłem garść informacji o optymalizacji, ale po pobraniu i odpaleniu Milka dalej nie pobiera danych.

1. Czy te czasy to już wszystko co ta karta potrafi?
2. Czy może ktoś (jak krowie na rowie) napisać krok po kroku ( po polsku - to ważne), co i gdzie dopisać/dograć, żeby liczyło się wydajniej.   


Zima idzie i mi karta marznie... :cold:

krzyszp

A czasami milce nie brakuje zadań trochę?
W statusie serwera widzę "unsent" 308 WU, ale może to być niezauktualizowana wartość...
MilkyWay@Home                      308 388,412 0.83 (0.01 - 8.51) 12,820
MilkyWay@Home N-Body Simulation 0    350 0.10 (0.01 - 0.76) 10

Na te 308 WU jest prawie 13k chętnych...


Należę do drużyny BOINC@Poland
Moja wizytówka

tromba

Podpiąłem się wczoraj i mam próbek pod dostatkiem. Nowe dosypują się na bieżąco zgodnie z preferencjami.

Ania

Cytat: lolek w 20 Lipiec 2011, 14:51
ATI HD4770
System win 7 x64

Mam tą kartę i winXP 32b. Czy obecnie powinne móc liczyć mi się ten projekt ?

mimeq

#23
Cytat: Ania w 30 Listopad 2012, 14:01
Cytat: lolek w 20 Lipiec 2011, 14:51
ATI HD4770
System win 7 x64

Mam tą kartę i winXP 32b. Czy obecnie powinne móc liczyć mi się ten projekt ?

z odpowiednim app_info chyba tak - potaram sie odpalic swoja 4770 wieczorem, obecnie licze na app_info z 5970 jeszcze 2 tyg RAC ponad 2xxk i rosl obecnie duzo sie nie waliduje  (moze byc wina umierajacego GPU) load obu rdzeni ~97%

Data: All (4042) | In progress (80) | Pending (983) | Valid (2410) | Invalid (555) | Error (14)

EDIT:

Komp odpalony WU pobrane licza sie:

http://milkyway.cs.rpi.edu/milkyway/show_host_detail.php?hostid=400221


tromba


mimeq

#25
sprawdz to app_info.xml z tym exe`kiem milkyway_separation_0.82_windows_x86_64__ati14.exe do katalogu projektu. Restart BM (wszystkie pobrane wczesniej WU zostana usuniete). Przy moich kartach 4xxx i 5xxx dziala czy bedzie przy 7xxx nie wiem to juz inna architektura ...
Mozesz sprobowac liczyc 2 Wu naraz jesli load zbyt niski zmieniajac parametr <count>1</count>

<app>
<name>milkyway</name>
</app>
<file_info>
<name>milkyway_separation_0.82_windows_x86_64__ati14.exe</name>
<executable/>
</file_info>
<app_version>
<app_name>milkyway</app_name>
<version_num>82</version_num>
<flops>1.0e11</flops>
<avg_ncpus>0.05</avg_ncpus>
<max_ncpus>1</max_ncpus>
<plan_class>ati14ati</plan_class>
<coproc>
<type>ATI</type>
<count>1</count>
</coproc>
<cmdline></cmdline>
<file_ref>
<file_name>milkyway_separation_0.82_windows_x86_64__ati14.exe</file_name>
<main_program/>
</file_ref>
</app_version>



tromba

Działa :p_arr:

Load 100%

Poczekam, aż zejdzie parę próbek i zamelduję o wynikach. W planach na jutro testy optymalki 1.02 :attack:

Dzięki mimeq

Teech

#27
 dla karty ati 7850 ster 0,82 win 7 (64) filma nie oglądniesz o 2WU można zapomnieć ciężko wyłączyć BOINC-a najlepiej reset i F8

353000857 275068175 475274 2 Dec 2012 | 4:58:41 UTC 2 Dec 2012 | 14:57:52 UTC Completed and validated 376.75 3.35 213.76 MilkyWay@Home
Anonymous platform (ATI GPU)
353000856 275068174 475274 2 Dec 2012 | 4:58:41 UTC 2 Dec 2012 | 14:35:22 UTC Completed and validated 379.58 3.40 213.76 MilkyWay@Home
Anonymous platform (ATI GPU)



a to dla ster 1,02 pkt ten sam oglądniesz film i zrobisz 2WU na raz czasówkę wbiję później

353310695 275292944 475274 2 Dec 2012 | 15:00:06 UTC 2 Dec 2012 | 15:12:07 UTC Completed and validated 348.88 3.92 213.76 MilkyWay@Home
Anonymous platform (ATI GPU)


dla 2WU

353310690 275292939 475274 2 Dec 2012 | 15:00:06 UTC 2 Dec 2012 | 15:24:46 UTC Completed and validated 731.37 5.29 239.78 MilkyWay@Home
Anonymous platform (ATI GPU)
353310684 275292933 475274 2 Dec 2012 | 15:00:06 UTC 2 Dec 2012 | 15:24:46 UTC Completed and validated 730.37 4.85 239.78 MilkyWay@Home
Anonymous platform (ATI GPU)


mimeq

1,02 to chyba standardowa app wysylana przez serwer - u mnie z powodow opisanych wyzej nie uzywana. Po co uzywac app_info ? Chyba tylko dla 2WU liczonych jednoczesnie jesli jest taka potrzeba.


Teech

#29
masz racje ale się przyglądnij jest mały zysk licząc 2WU na raz  ;D  i oglądniesz film

tromba

To jeszcze ja się dołożę:

Dla radka 7770 i optymalki 0.82 próbka schodzi po 400-450 sek. ale, jak napisał Teech, muli okrutnie.

Dla optymalki 1.02 próbki schodzą po ok 700 sek., a komputer chodzi płynnie.

Ciekawe, że 7770 i 7850 tak odmiennie reagują na optymalizacje.

Teech

To ja mam 731sek przy 2WU na raz za duża ta różnica  stery AMD_Catalyst_12.11_Beta8_NET4