Aktualności:

W MEDIA znajdziesz grafiki, banery i avatary

Menu główne

Milkyway@home

Zaczęty przez Bober, 28 Sierpień 2007, 22:40

mindc

hehehe

Cytat
<app_info>
<app>
<name>astronomy</name>
</app>
<file_info>
<name>astronomy_sse2_app.exe</name>
<executable/>
</file_info>
<app_version>
<app_name>astronomy</app_name>
<version_num>1</version_num>
<file_ref>
<file_name>astronomy_sse2_app.exe</file_name>
<main_program/>
</file_ref>
</app_version>
<app_info>

może i mają szybką aplikację do milky, tylko sądząc po pliku app_info.xml,
ta aplikacja jest do starszej wersji WU i każdy dostaje "no work" z schedulera  XD
a nawet jeśli ich aplikacja jest ok, to i tak mają złe parametry w app_info.xml

tak czy siak, spokojnie kamrrrraci, liczmy sobie dalej...  :attack:



[PBT] Horpah

dobrze by było żeby nasza aplikacja znalazła się na ftp chronionym hasłem, może jeszcze jej nie mają

sesef

#202
Cytat: mindc w 14 Styczeń 2009, 15:16
tak czy siak, spokojnie kamrrrraci, liczmy sobie dalej...  :attack:

Wersja xml-a z Planet 3D Now
Cytat<app_info>
<app>
<name>milkyway</name>
</app>
<file_info>
<name>astronomy_sse2_app.exe</name>
<executable/>
</file_info>
<app_version>
<app_name>milkyway</app_name>
<version_num>7</version_num>
<file_ref>
<file_name>astronomy_sse2_app.exe</file_name>
<main_program/>
</file_ref>
</app_version>
</app_info>

tylko ci na forum milky są tak nie ogarnięci że im nie działa. Z tych działających linków od niemców działa tylko wersja SSE2 ale i tak liczy wolniej :) na razie niemcy kombinują coś tam z OpenCL i kartami ATI zobaczymy jak im to pójdzie, śmiesznie będzie jak coś zrobią a system punktowy nie zostanie zmieniony, 1 pkt za 30 sec czasu proca może będą dostawać :P no chyba że nowsze wersje BOINC zaczną liczyć również GPU time a nie tylko CPU time.



Teraz już chyba wiem skąd żabojadom punkty skoczył wciągu ostatnich 2 tyg.

AiDec

Jedyne co mogloby mnie zainteresowac z ichniego 4um to aplikacja pod SSE4.1 (dla QX9770). Ale akurat ta jedyna nie jest dostepna :P. Wiec na chwile obecna nihil novi sub sole.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

sesef

#204
Cytat: AiDec w 14 Styczeń 2009, 19:07
Jedyne co mogloby mnie zainteresowac z ichniego 4um to aplikacja pod SSE4.1 (dla QX9770). Ale akurat ta jedyna nie jest dostepna :P. Wiec na chwile obecna nihil novi sub sole.

Linki zaczęły działać zobacz to [nie ma linka bo aplikacja zwraca błędny wynik przepraszam za zamieszanie] jest tam SSE4, oraz jak ktoś ma SSSE3.



Edit
Wychodzi na to, że jest trochę szybciej u mnie jakieś 2,5-3 min na wersji SSE3.



Skoro optymalki są dostępne publicznie można by na stronie głównej dać info żeby więcej osób wiedziało.

Pigu

tzn dla quada mają lepszą opto niż nasza?

[PBT] Horpah

przeliczyłem dwie próbki na ichnich opt i wygląda ze jest sporo szybciej

Pigu

na której opto? no i jak zwałować czasy by lepiej karmiło?

[PBT] Horpah

te dwa linki powyżej dotyczą tej samej paczki
ja użyłem ssse3 na moim q6600 i wygląda że jest szybciej
by lepiej karmiło potrzebna jest korekta

mindc

#209
@sesef
sprawdź czy poprawnie liczy ta ich opto


kacperek70

Cytat: sesef w 14 Styczeń 2009, 19:58
jest tam SSE4

niestety, ale ma Xeon'ie z SSE4 nie działa...

[PBT] Horpah

#211
było szybko ale cóż, wróciłem do naszego tworka.

tito

#212
SSE3 jest szybsza o około 30% - nie wiem, czy wyniki są poprawne. (pomimo szybkości limit 2500 ciągle działa i ogranicza...a szkoda)
Ciekawe, czy znowu ktoś będzie bojkotować ten projekt jako nieuczciwy? Przy poprzednich optymalkach chodziły nawet słuchy, że punkty w projekcie zostaną wyzerowane... Trzeba uważnie śledzić ich forum.

sesef

Cytat: mindc w 15 Styczeń 2009, 00:59
@sezef
sprawdź czy poprawnie liczy ta ich opto

zapomniałem sprawdzić :(, i wyszło szydło z worka

Nasz tworek:
Cytatfitness: -3.046272445362277

Ich tworek:
Cytatfitness: -3.046289346362010

Oryginalny tworek:
Cytatfitness: -3.046272445362277

Tak więc przepraszam wszystkich za zamieszanie, "haste make waste" :(, tak więc jak ktoś zmienił proszę wrócić do starej wersji do wyjaśnienia sprawy.

AiDec

Czekaj, czekaj... Bo nie bardzo zrozumialem. Znaczy ze ichni tforek liczy zle, czy znaczy nie wiadomo? Bo wlasnie mialem testowac ichnie SSE3 i SSE4.1



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

sesef

Cytat: AiDec w 15 Styczeń 2009, 16:19
Czekaj, czekaj... Bo nie bardzo zrozumialem. Znaczy ze ichni tforek liczy zle, czy znaczy nie wiadomo? Bo wlasnie mialem testowac ichnie SSE3 i SSE4.1

Tak źle liczy, i za te wu źle przeliczone ma nie być podobno kredytorów.


Pigu

hehehe kablować kamrrraci kablować na forrrum milki rrrr :attack: tylko my mamy prrrawo do łatwych punktów rrr XD

[PBT] Horpah

na stronie głównej projektu jest info że zaktualizowali asymilator i od tej chwili ci którzy używają złych optymalizacji nie będą dostawali kredytów. :)

mindc

#218
@sesef
dzięki za sprawdzenie

tak coś czułem, że ta ich opto nie pachnie zbyt dobrze
bo tam naprawdę już ciężko się czegoś pozbyć, aby było szybciej i poprawnie jednocześnie

Cytat: Horpah w 15 Styczeń 2009, 21:36
na stronie głównej projektu jest info że zaktualizowali asymilator i od tej chwili ci którzy używają złych optymalizacji nie będą dostawali kredytów. :)

...no i właśnie dlatego zależało mi na dokładności na poziomie 1 LSB, bo to nigdy nic nie wiadomo




w związku z pytaniami o pozostałe optymalizacje na SSSE3 i SSE4.1 oraz wersje x64
stwierdzam (poza wersją SSE4.1, bo nie mam możliwości sprawdzenia, chętnego testera poproszę o PM)
że kompilacje te są wolniejsze od czystego SSE3



sesef

#219
Cytat: mindc w 16 Styczeń 2009, 01:23
bo tam naprawdę już ciężko się czegoś pozbyć, aby było szybciej i poprawnie jednocześnie

Jest jeszcze możliwość napisania wstawek/modułów assemblerowych bo te optymalizacje kompilatora z SSE itp generują 1.5-2x więcej linijek kodu niż by napisał to po przemyśleniu człowiek, do tego jeszcze można zawsze trochę pokombinować z assemblerem danego procka, jednak to już jest wyższa technologia i najpierw to trzeba by się assemblerka nauczyć, żeby w ogóle się w to pchać.

BTW Sesef nie Sezef



http://milkyway.cs.rpi.edu/milkyway/forum_thread.php?id=551&nowrap=true#8437
Czy dobrze zrozumiałem że liczy się dokładność do 10 miejsca po przecinku?

mindc

Cytat: sesef w 16 Styczeń 2009, 07:20
Sesef nie Sezef

Najmocniej przepraszam kamrrrracie Sesef  :)
więcej się to nie powtórzy


sesef

Cytat: mindc w 16 Styczeń 2009, 10:42
Cytat: sesef w 16 Styczeń 2009, 07:20
Sesef nie Sezef

Najmocniej przepraszam kamrrrracie Sesef  :)
więcej się to nie powtórzy


Spoko nie gniewam się :)

Z tego co się doczytałem to błąd nie może być większy niż 0,00000000001 (10^-10) a u nas błąd jest nie większy niż 10^-15, coś można by pokminić i kosztem błędu przyspieszyć.

mindc

Cytat: sesef w 16 Styczeń 2009, 11:53
Z tego co się doczytałem to błąd nie może być większy niż 0,00000000001 (10^-10) a u nas błąd jest nie większy niż 10^-15, coś można by pokminić i kosztem błędu przyspieszyć.

też to czytałem
tylko że raz piszą że zależy im na dokładności i żeby przy kompilacji nie używać -ffast-math i tego typu rzeczy
a teraz wyskakują z 1e-10, ech...

...mam jeden tip ale dokładność i czas przeliczenia zależy od konkretnej próbki
znajdę chwilę, postukam w klawisze i dam znać


sesef

Cytat: mindc w 16 Styczeń 2009, 12:11
a teraz wyskakują z 1e-10, ech...

Oni sami nie widzą chyba czego chcą, wcześniej jakby im wysyłał losowe wyniki to też by punkty się pewnie dostało.



U towarzyszów niemieckich pojawiła się aplikacja SSE3, której błąd mieści się w granicach a liczy szybciej niż ta nasza jak ktoś chce może potestować.

http://www.speedyshare.com/315443626.html

Do archiwum dałem również przykładowe pliki testowe wystarczy odpalić exe i jak się przeliczy to otworzyć plik "out" i porównać wynik z tym:
Cytatfitness: -3.046272445362277

Jak się zgodzi pierwsze 10 cyfr po przecinku to powinno być ok. U mnie wychodzi wynik fitness: -3.046272445362275 więc według nich mieści się w granicy błędu.

Pigu

jak i co ustawić by zawyżać czas liczenia wu? np *2?

AiDec

Ustawic laptopa w kierunku ksiezyca ;).

A tak powaznie to usmiechnac sie na PW do sesefa.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Pigu

konsultuję - mam ciut bardziej skomplikowaną sytuację :P

tito

Dane od genka dotyczące dokładności optymalek ze strony www.arizmoon.com
Sprawdzone na dwu próbkach.
Oryginalny - fitness: -2.995617917242637
      fitness: -2.995617917245859
optymalka astronomy_sse3_app.exe (909.824 bytes)  (tu totalna niezgodność wyników)
      fitness: -2.902433307966717
      fitness: -2.902433307983750
optymalka astronomy_sse2_app.exe 913.408  (909.824 bytes)  (tu totalna niezgodność wyników)
      fitness: -2.902433307966717
      fitness: -2.902433307983750

optymalka astronomy_SSE3_s.exe              (błędy na dwu ostatnich miejscach)
      fitness: -2.995617917242672
      fitness: -2.995617917245897

optymalka astronomy_sse2_app.exe (257.536 bytes)            (pełna zgodność)
      fitness: -2.995617917242637
      fitness: -2.995617917245859

[PBT] Horpah

#228
@tito  OK, dziękujemy za info
niestety ta poprawna optymalizacja "astronomy_sse2_app.rar" jest bardzo wolna, to już nie to.

E D I T
wkrótce wejdzie aplikacja serii 8, więc optymalki będą musiały być na nowo tworzone

sesef

#229
na chwilę obecną chyba najlepiej używać tej optymalki co podałem w tym poście http://www.boincatpoland.org/smf/milkywayhome/milkywayhome/msg55634/#msg55634 (astronomy_SSE3_s.exe) u mnie liczy ona najszybciej a błąd mieści się w dopuszczalnej granicy. Jak ktoś jednak obawia się zwracania błędnego wyniku zawsze może liczyć na optymalkach skompilowanych przez mindc-a zwracają one wynik taki sam jak aplikacja ze strony milky.

@mindc
Patrzyłeś na source 0.8? Coś ciekawego się zmieniło czego u nas jeszcze nie ma?

[PBT] Horpah

ja uważam że kredyty są fajne, ale nie kosztem dokładności wyników
wracam do op. mindc-a, przynajmniej będę spokojny że mi nie skasują tego co już mam

mindc

Cytat: sesef w 16 Styczeń 2009, 23:07
@mindc
Patrzyłeś na source 0.8? Coś ciekawego się zmieniło czego u nas jeszcze nie ma?

wow, zauważyli że 1/pow(a,b) = pow(a,-b)  ;D u nas to już jest
a tak to zmiany kosmetyczne, 100% kompatybilność z wersją 0.7


Aegis Maelstrom

Witam, do kogo można aktualnie się uśmiechnąć o dobrze liczącą optymalizację dla SSE2?

Chciałbym sprawdzić ten projekt, licząc go rotacyjnie z innymi na laptopie i choć symbolicznie wspomóc drużynę. :)

mindc

w wiadomym miejscu, wrzuciłem opto oparte na źródłach 0.8, kompilacje dla wszystkich SSE
:attack:


sesef

Cytat: mindc w 19 Styczeń 2009, 04:13
w wiadomym miejscu, wrzuciłem opto oparte na źródłach 0.8, kompilacje dla wszystkich SSE
:attack:


Jakieś zmiany w szybkości?

Pigu

zwłaszcza w porównaniu z mniej dokładną wersją konkurencji?  ???

emik



[PBT] Horpah

wszystko co dobre w końcu się kończy

mindc

Cytat: sesef w 19 Styczeń 2009, 19:07
Jakieś zmiany w szybkości?

niestety, pomysłów brak

wrzuciłem wersję z poprawionym zapisywaniem checkpointów, bo niby była zła,
chcę utrzymać 100% poziom kompatybilności z oryginalna aplikacją


[PBT] Horpah

Cytat: Horpah w 20 Styczeń 2009, 00:12
wszystko co dobre w końcu się kończy

czy wy też tak macie ? , czy to tylko u mnie tak jest
pomimo że mój klient raportuje czas przeliczenia próbki 26min. to na koncie widnieje 300s niekiedy 560s no i w związku z tym mniej kredytów. Choć bywa i tak że są przyznawane czasy 1 100 czy 1 300 s. taka duża rozpiętość.