AlmereGrid

Zaczęty przez Troll81, 21 Październik 2008, 08:31

RAD-Poland

#80
Results ready to send   1  :attack:
Results in progress   1,213

nowe próbki są tworzone średnio ok 200-300 na godzinę (ale bywają przerwy)

już
Results ready to send   15
Results in progress   1,243

EDIT: trochę cierpliwości i do  :attack: :attack: :attack:
EDIT: ja chwilowo wypadłem z obiegu brak VM i Windy (brak czasu)  :book:

   
WCG:
PG:         YOYO:

     

AiDec

#81
Poczekam az bedzie results ready to send co najmniej 100. Przy mniejszej ilosci nie oplaca mi sie nawet kasowac noncpuintensive (na ktorym jade 24h/dobe). Trzy dni temu skasowalem noncpu, podlapalem kilkadziesiat junitow i 700pkt w kilka godzin :) - awansowalem na 4-te miejsce na swiecie :). Nawet nie zauwazylem ze sie przeliczaly (i-RAMy :) ). Ale od tamtej pory nie moge dorwac na tyle duzo junitow, zeby sie w ogole oplacalo restartowac BM, zmieniac client_state...

Teraz bede pilnowal statusu serwera (dzieki za linka! :) ). Az sobie zrobilem 15GB wolnego miejsca na to :).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

malpi

Aidec odpal z 10-20 TJM-owych menadżerów i na nich bez <non_cpu> licz almere na iramach, (wtedy praktycznie wszystkie próbki z serwera będą twoje) a jak będą próbki to komp będzie brał je w zapas



AiDec

Cytat: malpi w 15 Styczeń 2009, 07:35
Aidec odpal z 10-20 TJM-owych menadżerów i na nich bez <non_cpu> licz almere na iramach, (wtedy praktycznie wszystkie próbki z serwera będą twoje) a jak będą próbki to komp będzie brał je w zapas

Potrzebuje czasu zeby sie ze wszystkim uporac. Na razie walcze z Linuksem + i-RAM`y. A TJM`owych klientow jeszcze nie zgrokowalem do konca :). Zrobie to najszybciej jak bede mogl.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Szopler

Zaczynam walkę tyle, że na CompactFlash :).
Wrzucić tam C:\Temp i C:\Windows\Temp czy tylko jeden z nich?

AiDec

Chyba projekt lezy i kficzy.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

sesef

Cytat: AiDec w 01 Luty 2009, 21:35
Chyba projekt lezy i kficzy.

Cargo im się w porcie skończyło i nie mają co sobie ustawiać :/

malpi

Obecnie do pobrania jest 750 WU, wiec tak do końca nie leży :-[



AiDec

No to jedziemy... po pierwsze miejsce na swiecie :).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

AiDec

WU na serwerze sa. Moj BM poprawnie requestuje, kontakt z serwerem jest poprawny, a mimo to `got 0 tasks`. Mam to od wczorajszego popoludnia, po sciagnieciu i przeliczeniu wielu WU. Zrozumialbym np. limit dzienny i dlatego wczoraj jeszcze nic nie pisalem. Ale dzisiaj rowniez mam to samo. Mozliwe ze jest limit nie na dobe, ale np. na 24h? W takiej sytuacji limit by mi sie odnowil za kilka godzin. Ale deczko to dla mnie dziwne. Czy ktos cos moze wie w tym temacie?



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

AiDec

Dziwne to to, ale wszystko wskazuje na to ze jest limit na 48h.

Tak czy inaczej plan na dzisiaj: pierwsze miejsce na swiecie w Almere ;).




Co bedziemy robic dzisiaj w nocy? To samo co kazdej nocy - sprobujemy zawladnac swiatem!     :arrr:



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

KrzychuP

#91
Czy Almere korzysta z CPU?

Bo wydawało mi się, że nie (a przynajmniej śladowo), a nie chce mi uruchomić przeliczania.

Coś trzeba ustawić (np. w cc_config)?

AiDec

1. Korzysta tylko sladowo.
2. Nalezy recznie dopisac non cpu intensive (wez np, z FreeHAL`a).

3. A co, chcesz sobie HDD zajezdzic? ;) Czy masz RAMdysk?



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

TJM

Swoją drogą, testował ktoś Almere na Win98 ? Tam keszowanie plików na dysku było jakieś takie sprawniejsze niż w późniejszych systemach, może nie łomotałoby tak dyskiem i nawet na zwykłym HDD dałoby się odpalić  ;D Gorzej z tym, że Win98 raczej nie da się na żadnym w miarę nowym kompie zainstalować normalnie (co najwyżej posiłkując się drugim, starszym kompem w dwóch pierwszych fazach instalacji), a potem praca systemu także pozostawia wiele do życzenia.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Troll81

A może by tak wirtualkę w ramdisku umieścić ??

malpi

Ja almere od ponad miesiąca licze (oczywiście komp w pracy chodzący 24h/dobe) i żadnych dziwnych dźwięków nie wydaje,
a co do pena to bardzo szybko zajeżdża - około 48h działał, a później same błędy sie sypały



KrzychuP

Cytat: AiDec w 13 Luty 2009, 14:34
2. Nalezy recznie dopisac non cpu intensive (wez np, z FreeHAL`a).
A jak się to obsługuje - bo mi manager coś nie rozpoznaje tego

AiDec

#97
1. Zresetuj Almere.
2. Jak sie juz od nowa polaczy, to wyjdz z BM (zakoncz BM) i upewnij sie ze wszystkie BOINCowe procesy sa zakonczone.
3. Otworz client_state.xml.
4. Znajdz Almere (CTRL+F Almere).
5. Dodaj linijke:
    <non_cpu_intensive/>

Ma to wygladac tak:

    <send_time_stats_log>0</send_time_stats_log>
    <send_job_log>0</send_job_log>
    <non_cpu_intensive/>
    <attached_via_acct_mgr/>
    <ams_resource_share>100.000000</ams_resource_share>


lub tak:

    <send_time_stats_log>0</send_time_stats_log>
    <send_job_log>0</send_job_log>
    <attached_via_acct_mgr/>
    <non_cpu_intensive/>
    <ams_resource_share>100.000000</ams_resource_share>



Jakby mimo wszystko cos bylo dla Ciebie niejasne, to podepnij sie pod projekt FreeHAL i zobacz jak to wyglada w clientstate (bo to identyczna sytuacja z noncpu, tyle ze FreeHAL automatycznie zapina noncpu, a w Almere trzeba dopisac).




Ale uprzedzam - tego sie nie liczy na normalnym HDD. Chyba ze masz juz odlozona kase na nowy HDD ;). Jak chcesz liczyc cos na noncpu a nie masz BOINCa na RAMdysku (lub podobnym), to bierz FreeHAL`a. Tym bardziej ze we FreeHALu przyda sie kazda pomoc dla teamu, a w Almere to moge za caly team robic ;).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

TJM

HDD od tego nie padnie tak za łatwo, gdyby tak było to dyski w serwerach umierałyby w ciągu paru dni, a przecież tak nie jest. U mnie w serwerze Enigmy dyski młócą głowicami 24/7/365 i póki co nic im nie jest. Ale i tak strata czasu liczyć raczej almere na zwykłym dysku, po prostu za długo to trwa i za mało zadań na raz da się odpalić, żeby miało to sens.


W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

KrzychuP

Dzięki Aidec.
W swojej ciemnocie wciskałem <non_cpu_intensive/> do pliku cc_config.xml zamiast client_state.xml  ::)
i się dziwiłem że mi nie działa.
FreeHALa już cisnę ile mogę, a że często zerkam na status próbek to staram się jak najczęściej resetować projekt, żeby liczył po 3 na raz.
A Almere chciałem tylko dociągnąć do 1000pkt. Czy bez sztuczek licząc normalnie po jednej próbce na raz też mogę zajechać dysk? (miałoby chodzić na firmowym kompie... sami rozumiecie)

malpi

Raczej nie, ja licze po 5 naraz, juz od ponad miesiąca i dysk nie narzeka 8)



KrzychuP

#101
Cytat: AiDec w 13 Luty 2009, 15:58
1. Zresetuj Almere.
2. Jak sie juz od nowa polaczy, to wyjdz z BM (zakoncz BM) i upewnij sie ze wszystkie BOINCowe procesy sa zakonczone.
3. Otworz client_state.xml.
4. Znajdz Almere (CTRL+F Almere).
5. Dodaj linijke:
    <non_cpu_intensive/>

Ma to wygladac tak:

    <send_time_stats_log>0</send_time_stats_log>
    <send_job_log>0</send_job_log>
    <non_cpu_intensive/>
    <attached_via_acct_mgr/>
    <ams_resource_share>100.000000</ams_resource_share>


lub tak:

    <send_time_stats_log>0</send_time_stats_log>
    <send_job_log>0</send_job_log>
    <attached_via_acct_mgr/>
    <non_cpu_intensive/>
    <ams_resource_share>100.000000</ams_resource_share>

Pytanie:
1. Przy ponownym połączeniu, po resecie, ma pobrać nowe próbki, czy dopiero po zmianie w pliku?
2. Almere pojawia mi się w dwóch miejscach w pliku xml, w jednym jest <ams_resource_share>100.000000</ams_resource_share> a w drugim nie

EDIT:
Zagadka 2 Almere się już wyjaśniła, jestem podpięty dwa razy. Tylko który adres jest właściwy...
Ten podpięty przez BAM czy ten ręcznie?

AiDec

Ad 1, 2 i reszta :):

Reset projektu po to, zeby Ci wyczyscic projekt (ewentualne niepoprawne zmiany w clien_state). W Twojej sytuacji najlepiej odepnij Almere w kazdy mozliwy sposob i zapnij od nowa (przez BAM lub nie - jak wolisz). Zacznij od nowa z `czystym wpisem`, to bedzie Ci latwiej. Wtedy wylacz BOINCa, wprowadz zmiany i bedzie liczyl na non-cpu. Juz nic wiecej nie musisz robic.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

KrzychuP

Już jakoś poszło. Bez odłączania. Zobaczymy jak będzie chodził.

Troll81

czy jest sens podpinania do almere takiego kompa?

amd 450mhz ze 128 ramu i dwa dyski (jeden to 1,7 a drugi to 1,0 GB) Oba dyski mogą iść na zarżnięciea komp i tak jest na wylocie (oddam w dobre ręce albo za jakiś czas wyleci na śmietnik)

Szopler

Spróbować możesz... ja odpalałem Almera i FreeHAL'a na Celeronie 525MHz z 392MB RAM... i szło

TJM

Mam pytanie do aktywnie liczących w tym projekcie: od dawna brakuje zadań i serwer niby 'shutdown for maintenance' ? Wróciły mi z serwisu dwa dyski, kanalie wymienili na takie z zielonymi obwódkami i napisem 'Certified Repaired HDD' więc chcę im dobrze dać w palnik w ramach testu sprawności, jak mają się posypać to niech to zrobią szybko %)

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Troll81

Results ready to send 213
Results in progress 797
Workunits waiting for validation 6


czyli chyba nie maintenance :D

data-driven web pages aqua Running
upload/download server aqua Running
scheduler aqua Running
feeder aqua Running
transitioner aqua Running
file_deleter aqua Disabled
db_purge aqua Running
aqua_validator aqua Running
aqua_assimilator aqua Running
aqua_cuda_validator aqua Running
aqua_cuda_assimilator aqua Running

TJM

Manager pokazywał przez dłuższy czas maintenance, ale teraz widzę, że się już odblokowało, pozostaje czekać na zassanie zadań %)

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

KrzychuP

czasami są przestoje z próbkami, ale da się trochę nałapać

mnie pobrał jedną przed jakąś godziną (więcej na raz nie mielę, bo to pracowy komp i nie chciałbym, żeby coś padło  ;) )

TJM

Nie mieli już dyskiem tak jak kiedyś, ale nadal pojedyńcze zadanie pare milionów operacji I/O wykonuje w ciągu ~5 minut przeliczania.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

KrzychuP

właśnie pobiera mi następny WU

TJM

U mnie w końcu poszło hurtem i zassało kilkanaście na raz, muszę zaraz pokombinować jak to się robiło z tym non_cpu_intensive żeby trochę rozpędzić obliczenia (i głowice w dyskach). Zobaczymy co warte są dyski po naprawie  :D

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

TJM

Dziwna sprawa, parę zadań mi przeliczyło i zaczęły się schody: przy każdym WU informacje, że przekroczył maksymalny czas elapsed po czym zadanie zostaje zatrzymane i odesłane z błędem, punktów nima. Ktoś z was też ma coś takiego, czy to kolejny z wielu bugów managerów 6.6.x ?



W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

KrzychuP

U mnie normalnie działa, ale jadę na 6.5.0

A co do bugów 6.6.x to zaraz zgłoszę kolejny w odpowiednim wątku...  ::)

AiDec

#115
- Almere wciaz licze, choc na cwierc gwizdka bo mam inne zajecia, ale licze caly czas.

- Probki sa dostepne prawie zawsze, serwery dzialaja prawie zawsze.

- @TJM: nie mialem takich klopotow - wszystkie probki przeliczaja sie u mnie bezproblemowo.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

sesef

Cytat: TJM w 25 Czerwiec 2009, 00:23
Dziwna sprawa, parę zadań mi przeliczyło i zaczęły się schody: przy każdym WU informacje, że przekroczył maksymalny czas elapsed po czym zadanie zostaje zatrzymane i odesłane z błędem, punktów nima. Ktoś z was też ma coś takiego, czy to kolejny z wielu bugów managerów 6.6.x ?




Miałem ten sam problem, dałem sobie po prostu spokój z tym projektem.

TJM

Oczywiście manager 6.6.31 po niecałych 24h liczenia zdziczał mi kompletnie i przestał pobierać zadania (klasyk dla tej serii - work request ale pusty). Przeinstalowałem na 6.6.36 żeby sprawdzić czy coś się zmieni, ale akurat serwer chyba ma jakieś problemy bo nic nie chce się zassać.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

TJM

Jest rozwiązanie na problem auto anulowania zadań. Po ich pobraniu trzeba zamknąc managera, otworzyć plik client_state i we wszystkich rsc_fpops_bound dla tych zadań dopisać co najmniej jedno zero, a lepiej jeszcze dwa. Domyślnie timelimit jest ustawiony na około 7 minut (przynajmniej na moim cpu, według benchmarka). W starych managerach było to 7 minut czasu CPU, w nowych jest to 7 minut wall clock time, przez co każde zadanie trwające dłużej zostanie anulowane. Dopisanie jednego zera zamienia to w 70 minut, dlatego lepiej od razu dopisać dwa - u mnie niektóre WU sięgają 40 minut przeliczania, zwłaszcza jak odpala się po kilka na raz.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

sesef

Cytat: TJM w 25 Czerwiec 2009, 18:11
Jest rozwiązanie na problem auto anulowania zadań. Po ich pobraniu trzeba zamknąc managera, otworzyć plik client_state i we wszystkich rsc_fpops_bound dla tych zadań dopisać co najmniej jedno zero, a lepiej jeszcze dwa. Domyślnie timelimit jest ustawiony na około 7 minut (przynajmniej na moim cpu, według benchmarka). W starych managerach było to 7 minut czasu CPU, w nowych jest to 7 minut wall clock time, przez co każde zadanie trwające dłużej zostanie anulowane. Dopisanie jednego zera zamienia to w 70 minut, dlatego lepiej od razu dopisać dwa - u mnie niektóre WU sięgają 40 minut przeliczania, zwłaszcza jak odpala się po kilka na raz.


A, wiesz gdzie to może jest zakopane w kliencie?, ja wolałbym sobie przekompilować core niż za każdym razem bawić się w zmianę w xml-ach