Aktualności:

Nowy polski projekt BOINC - Universe@Home

Menu główne

Zoptymalizawana apka dla RakeSearch

Zaczęty przez sirzooro, 25 Listopad 2017, 21:31

sirzooro

Udostępniłem na GitHib zoptymalizowane aplikacje dla RakeSearch. Dostępne są wersje bez instrukcji SIMD, SSE2, AVX, AVX2 i AVX512, Windows i Linux. Na testowym spreparowanym WU aplikacja AVX2 dla Linuxa jest 10 razy szybsza. Dla rzeczywistych WU przyrost wydajności jest trochę mniejszy, ale i tak spory - większość WU na mojej maszynie liczy się w czasie poniżej godziny. Zapraszam do liczenia :)


http://rake.boincfast.ru/rakesearch/forum_thread.php?id=39&postid=172
https://github.com/sirzooro/RakeSearch/releases/tag/v1.0

necavi

Dzięki ci dobry człowieku!  :respect: Apka zapieprza aż miło  :boing:
Na standardowej waliło błędami i nic nie mogłem policzyć.

tito


tito

Sirzooro - nie masz zamiaru czasem skleić czegoś dla projektu ODLK?

sirzooro

Cytat: tito w 28 Listopad 2017, 21:14
Sirzooro - nie masz zamiaru czasem skleić czegoś dla projektu ODLK?
Najpierw niech opublikują kody źródłowe do swoich apek, to się pomyśli :parrrty: :parrrty: :parrrty:

tito


sirzooro

Hej,
Okazało się że na procesorach AMD Ryzen i Threadripper aplikacja w wersji AVX2 jest wolniejsza niż wersja AVX. Winowajcą okazała się instrukcja PEXT która na procesorach AMD działa znacznie wolniej niż na Intelach. Przygotowałem nową wersję aplikacji bez niej (avx2nopext), która żeby te procesory też mogły choć trochę skorzystać z dobrodziejstw AVX2.

Poza tym chwilę temu dodałem aplikacje dla Linux na procesory ARM i AARCH64. Dzisiaj tą ostatnią wzbogaciłem o obsługę instrukcji NEON. Kto już ją używa, niech dokona upgrade - NEON przyśpieszył ją o jakieś 20%.

sknd

są te pliki gdzieś poza githubem? od rana próbuję zassać windows_64_sse2, idzieto jak krew z nosa - góra 1-6 kB/s, i zawsze w końcu się wykrzacza - "niepowodzenie - zabroniony"  :wth:

sirzooro

Cytat: sknd w 04 Grudzień 2017, 12:21
są te pliki gdzieś poza githubem? od rana próbuję zassać windows_64_sse2, idzieto jak krew z nosa - góra 1-6 kB/s, i zawsze w końcu się wykrzacza - "niepowodzenie - zabroniony"  :wth:
Czy dalej jest to samo? Przed chwilą spróbowałem ściągnąć i poszło bez problemów.

sknd

wiesz co w końcu ściągnąłem jakoś korzystając z windowsowego terminala, też szło wolno ale zeszło całe...

sirzooro

Odkopuję stary temat, ale mam dobry powód: wypuściłem kolejną wersję zoptymalizanej aplikacji dla RakeSearch, Opti v1.1. Nowa wersja jest ok. 30% szybsza od poprzedniej (Opti v1.0). Tak jak poprzednio, są dostępne wersje SSE2, AVX, AVX2 i AVX512, dla Windows i Linux. W najbliższym czasie zamierzam też wypuścić nową wersję aplikacji dla procesorów ARM i AARCH64.

PoznanskaPyra

Właśnie wbiłem kolejne 500k i zastanawiałem się co dalej. Twoja appka zdecydowała że padło na RakeSearch :P Pobrałem, wersja AVX2 na i7-4770k.

Jeśli chodzi o AVX mam jeszcze trochę niewykorzystanej mocy pod postacią Intel PHI 5110p. Czy jest możliwość zrobienia appki korzystającej z tego dziwadła?
WIZYTÓWKA
Kompy:
AMD Ryzen 9-3900X + GTX980Ti
Intel i5 4570 + HD7970

sirzooro

Cytat: PoznanskaPyra w 04 Luty 2019, 14:50
Jeśli chodzi o AVX mam jeszcze trochę niewykorzystanej mocy pod postacią Intel PHI 5110p. Czy jest możliwość zrobienia appki korzystającej z tego dziwadła?
Odpowiem tak jak 2 tygodnie temu, nie widziałem tego yeti na oczy :parrrty:


sirzooro

Hej, zabawię się archeologa raz jeszcze. Wypuściłem nowy zestaw zoptymalizowanych aplikacji dla RakeSearch Rank 10. Nowe apki są szybsze ok. 3.5 razy niż oficjalne. Tak jak poprzednio są w wersjach SSE2/SSSE3/AVX/AVX2/AVX512 dla Windows i Linux, oraz dla ARM in AARCH64. Zapraszam do liczenia :)

https://rake.boincfast.ru/rakesearch/forum_thread.php?id=224
https://github.com/sirzooro/RakeSearch/releases/tag/RakeSearch10.v1.0

Tomislaw

1. Czy dla Ryzena 2700 bardziej odpowiednia będzie wersja SSSE3 czy AVX2 ?
2.  Czy ma znaczenie system: - Lepiej się sprawdzi Windows 10 czy Linux ?
3. Nigdy nie bawiłem się optymalkami więc mam kolejne pytanie. Czy mam ją dograć do tej instalki  BOINCa którą mam obecnie (standardowa z VBoxem) czy odinstalować wszystko i wgrać tylko optymalkę z założeniem, że będę liczył tylko ten jeden projekt ?

...i przede wszystkim dzięki za wykonaną pracę  :parrrty: :p_arr:



sirzooro

Cytat: Tomislaw w 18 Kwiecień 2020, 19:06
1. Czy dla Ryzena 2700 bardziej odpowiednia będzie wersja SSSE3 czy AVX2 ?

AVX2.

Cytat: Tomislaw w 18 Kwiecień 2020, 19:06
2.  Czy ma znaczenie system: - Lepiej się sprawdzi Windows 10 czy Linux ?

Ja wolę Linux, bo jest za darmo :). Poza tym Linux trochę lepiej zarządza procesami - nie pływają one po rdzeniach CPU jak w Windows, przez co wydajność jest lepsza o kilka %. No i Linux sam się nie restartuje co jakiś czas tak jak Windows, co ma znaczenie przy liczeniu 24/7.

Cytat: Tomislaw w 18 Kwiecień 2020, 19:06
3. Nigdy nie bawiłem się optymalkami więc mam kolejne pytanie. Czy mam ją dograć do tej instalki  BOINCa którą mam obecnie (standardowa z VBoxem) czy odinstalować wszystko i wgrać tylko optymalkę z założeniem, że będę liczył tylko ten jeden projekt ?

...i przede wszystkim dzięki za wykonaną pracę  :parrrty: :p_arr:

Musisz ją dograć do istniejącej instalacji BOINC - zoptymalizowana aplikacja zastępuje tą dostarczaną przez projekt RakeSearch. Dokładna instrukcja instalacji jest w podlinkowanym wątku na forum RakeSearch.

krzyszp

Cholerka, była gdzieś u nas na forum instrukcja jak ozywać optymalek, ale aż mi włosy stają dęba jak pomyślę o jej szukaniu ;)

A przyznam bez bicia, że mimo kilkuletniego już stażu, w temacie używania własnych binarek jestem totalnie zielony... :/
Przyznam, że z chęcią bym zobaczył na naszej stronie dokładny, łopatologiczny opis.


Należę do drużyny BOINC@Poland
Moja wizytówka

Tomislaw

Czy tutaj dla AVX2 powinno się wyłączyć HT ?



sknd

Cytat: krzyszp w 18 Kwiecień 2020, 23:52
Cholerka, była gdzieś u nas na forum instrukcja jak ozywać optymalek, ale aż mi włosy stają dęba jak pomyślę o jej szukaniu ;)

A przyznam bez bicia, że mimo kilkuletniego już stażu, w temacie używania własnych binarek jestem totalnie zielony... :/
Przyznam, że z chęcią bym zobaczył na naszej stronie dokładny, łopatologiczny opis.
bodajże ze cztery posty wyżej od twojego jest link  :)

SP7LX

Cytat: sirzooro w 25 Listopad 2017, 21:31
Udostępniłem na GitHib zoptymalizowane aplikacje dla RakeSearch. Dostępne są wersje bez instrukcji SIMD, SSE2, AVX, AVX2 i AVX512, Windows i Linux. Na testowym spreparowanym WU aplikacja AVX2 dla Linuxa jest 10 razy szybsza. Dla rzeczywistych WU przyrost wydajności jest trochę mniejszy, ale i tak spory - większość WU na mojej maszynie liczy się w czasie poniżej godziny. Zapraszam do liczenia :)


http://rake.boincfast.ru/rakesearch/forum_thread.php?id=39&postid=172
https://github.com/sirzooro/RakeSearch/releases/tag/v1.0


A co to dokładnie znaczy i z czym się to je, bo ja się nie znam dlatego pytam?

SzaMoT🍀

Cytat: SP7LX w 08 Lipiec 2022, 11:41
Cytat: sirzooro w 25 Listopad 2017, 21:31
Udostępniłem na GitHib zoptymalizowane aplikacje dla RakeSearch. Dostępne są wersje bez instrukcji SIMD, SSE2, AVX, AVX2 i AVX512, Windows i Linux. Na testowym spreparowanym WU aplikacja AVX2 dla Linuxa jest 10 razy szybsza. Dla rzeczywistych WU przyrost wydajności jest trochę mniejszy, ale i tak spory - większość WU na mojej maszynie liczy się w czasie poniżej godziny. Zapraszam do liczenia :)


http://rake.boincfast.ru/rakesearch/forum_thread.php?id=39&postid=172
https://github.com/sirzooro/RakeSearch/releases/tag/v1.0


A co to dokładnie znaczy i z czym się to je, bo ja się nie znam dlatego pytam?

Jeśli mnie pamięć nie myli optymalizacja dotyczyła zakresu który się zakończył.
Jeśli się coś zmieniło to poprawcie mnie

tito

Zdaje się, że tak.
Na chwilę obecną chyba jedyna optymalka jest dla Einstein Na Linuxa na GPU NVidii.