Dzienniki SKB@P

Zaczęty przez Cyfron, 28 Wrzesień 2010, 09:02

Cyfron

Pojawiły siepoważne problemy z systemem na SKB@P1
Jest właśnie na nim na nowo instalowany system i konfigurowany komputer.

Cyfron

SKB@P1 jest w trakcie przygotowywania do ciągłej pracy. Pojawiają się kolejne problemy na bieżąco rozwiązywane.

Wsadziłem do SKB@P2 Pamięci 2x2GB od Tomka Gwiazdy, a 4x1GB poszło do SKB@P3 czekać na wsadzenie tam obu grafik GTX295, które otrzymałem od b0b3ra.
Zdjęcia:


Jednak się okazało, że żaden ze słabszych zasilaczy (nie licząc Tagan 1300 liczącego w SKB@P2 z dwoma kartami 5XXX) nie ma złącza zasilającego 8mio pinowego dla kart PCIe. Podobno jutro mają być w sklepie niedaleko mnie, więc czekam z wsadzeniem ich.

Na razie wsadzę po jednej karcie, potestujemy jak się spisują a następnie kupi się odpowiedni zasilacz i wsadzi obie na raz.
Na czas testów karty NV będą liczyły primegrid.

AiDec

#122
SKB@P1 gotowy.






Poniewaz juz kilkukrotnie bylem o to pytany, wyjasniam tutaj dla wszystkich (tak pobieznie):

Cyfron:
- generalny opiekun SKB@P
- jedyna osoba z dostepem fizycznym do kompow
- hardware
- instalacje OS
- BAM
- podlaczanie do projektow itp.

AiDec:
- BM
- grafy/stery
- projekty `graficzne`

Rafal:
- OS konfiguracja/optymalizacje



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Cyfron

Po wsadzeniu do SKB@P2 2x2GB chodzi on ok (okazuje się, że do 2ki można tylko 2 kości wsadzić, bo ma 2 sloty na ram :) )
Po wsadzeniu do SKB@P3 4x1GB komputer zaczął sięwieszać, restartować i ogólnie porażka.
Wróciłem do 2x1GB. Jak będzie w nim brakować pamięci to jeszcze spróbuje zrobić tak, żeby w SKB@P2 i 3 było po 3GB pamięci (2+1 GB - myślę, że powinno to pójść)

Cyfron

dziś wykonałem też "myk" z zasilaniem grafiki w SKB@P3 (przypomnę, że zasilacz z SKB@P3 nie ma złącza potrzebnego do zasilenia GTX295)
Zrobiłem taki "bypass" - otóż grafika jest zasilana z zasilacza pracującego w SKB@P2 - na czas testów myślę, że może tak zostać (może jutro kupie przelotkę (jeśli będzie, aby nie robić takich akcji w przyszłości).

Grafika już coś liczy i nie widać raczej jakiś problemów z którymś z komputerów.

GRID

takie triki są stosowane często w silniejszych komputerach niż SKB@P, np w tym
http://fastra2.ua.ac.be/


AiDec

#126
Ano sa stosowane w silniejszych :). Mp. w moich (Kosmos itp.). Uzywam takich rozwiazan od lat - jeszcze sie nie zawiodlem. Wazne aby uzywac `dobrych` zasilaczy (Tagan, Silverstone). A ze mamy w S2 zupelnie nie obciazonego, pieknego Tagana 1300W, to czemu nie :).

A ze cos sie moze zdarzyc... Cos sie moze sie zdarzyc nawet jak `poprawnie` podlaczysz  ;D





S3 ladnie liczy z jedna grafa. Na chwile obecna chodzi tam GPUGrid na obu rdzeniach. Liczy elegancko, zobaczymy dalej jak przeliczy kilka WU. Grafe leciutko podkrecilem, tempy perfekcyjne <65C :).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Cyfron

co do temperatur, to producent podaje, że mogą się grzać do 105 stopni  :whip:

AiDec

Nie wierz w to :).

Potrzymaj je na 105C przez 3-6 m-cy, a bedzie po grafach. Max dopuszczalna dla nich a bezpieczna temp. przy pracy 24/7 z 100% obciazenia to 80C. Niektore modele moga wy3mac 85C.


To co podaje producent, to jest do `typowego` uzytku. Granie w gry przez 4h dziennie...



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

AiDec

#129
Pokusilem sie o osobny wpis, zamiast edycji poprzedniego. Osobny wpis z dedykacja dla b0b3ra.



SKB@P3 zapunktowal po raz pierwszy w GPUGrid. Przeliczone zostaly pierwsze 4 WU, najdluzsze jakie sa w GPUGrid dostepne. Po ca. 17,5h liczenia probki zostaly odeslane, zapunktowaly po 34k kazda, co daje:

ca. 1900 pkt /h /GPU.


Zapieta byla jedna grafa, czyli 2 GPU. OC GPU 7%.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Cyfron

Dziś zakupiłem przelotkę z 2x 6pin PCIe na 1x 8pin PCIe
Myślałem, że wystarczy ją zasilić jednym PCIe 6pin, ale karta nie wstawała (po przestudiowaniu połączeń okazało się, że muszą byćobie PCIe 6pin) i podpiąłem na drugie PCIe molex od dysku twardego przez inną przelotkę, jaką znalazłem w pudełkach, które przyszły z SKB@P.

SKB@P3 pracuje już autonomicznie z jedną grafiką GTX295.
Pozwolę sobie zacytować AiDec'a wiadomość do mnie:
CytatTe krotsze WU GPUGrida nie dogaduja sie zbyt dobrze z ta grafa. Wszystko niby ok, ale stanowczo za dluga sie licza. Przepialem zatem z powrotem na dlugasne WU.

Poza tym wszystko wyglada ok.

Do końca tego tygodnia będzie pracowała pierwsza grafika, a w piątek wymienię na drugą.
Jak obie przejdą tygodniowe testy to kupujemy zasilacz i wsadzamy obie karty w komputer.

SKB@P1 zaliczył zwiechę i wróciły mu ustawienia sprzed postawienia BM! - trzeba sprawdzić powody...

Cyfron

założyłem konto SKB@P na uptimeprj.com

W pierwszym poście będą sygnaturki poszczególnych komputerów jakby kogoś interesowało:)
(http://www.boincatpoland.org/smf/superkomputer-boincpoland/dzienniki-skbp/msg117892/#msg117892)

Cyfron

Nastąpił u mnie dziś ogólny pad prądu w budynku i na chwile obecną prądu jeszcze nie przywrócili, więc SKB@P sobie odpoczywają  :dunno:

Cyfron

SKB@P1 wymaga pogrzebania w nim, ponieważ są problemy z instalatorem (najprawdopodobniej potrzebny jest kolejny reinstal systemu).

Niestety w najbliższym czasie (ok. tydzień) nie mam na to czasu, więc komputer, który i tak już nie liczy kilka dni zostanie wyłączony (niech niepotrzebnie nie ciągnie prądu jak i tak nic nie robi)

Cyfron

mała aktualizacja, bo dawno nic nie pisałem.
Mam swojego rodzaju urlop, który się kończy, więc nie zajmowałem się SKB@P jakoś szczególnie (czyt. w cale ;) )
Z tego co widzę, to SKB@P 2, 3, 4 chodzą bardzo ładnie.
W poniedziałek wymienię grafikę w SKB@P3 (jednego GTX295 na drugiego, bo jeszcze tego nie zrobiłem (do testów) )
W poniedziałek też postaram się zająć SKB@P1 (chociaż nie wiem, jak będzie z czasem, bo już słyszałem, że szykują się pomiary, więc może się to przesunąć na wtorek lub środę.

AiDec

Potwierdzam. SKB@P 2, 3 i 4 chodza bez zastrzezen, pierwsza sprezentowana grafa liczy prawidlowo. Mamy wciaz problem sprzetowy z S1, nie znalezlismy do tej pory przyczyny nieprawidlowego dzialania kompa.

(szczerze to moze nam sie nigdy nie udac - zdarzaja sie w zyciu takie zagwozdki - planujemy zatem postawic dobry system, dopracowac i zrobic backup, a pozniej po kazdej awarii po prostu przywracac z backupu, przynajmniej do czasu az byc moze kiedys znajdziemy przyczyne nieprawidlowosci w dzialaniu S1)

Tymczasowo S1 jest wylaczony.


Czekamy na powrot Cyfrona.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Cyfron

Witajcie
Właśnie wymieniłem grafikę w SKB@P3 z GTX295 na GTX295 (tylko, że na drugą ;) )
Rozpoczynamy kolejny tydzień testów, jak się wszystko uda, to będzie trzeba zakupić zasiłkę (trzymajcie kciuki!  :whip: )

Cyfron

po zmianie grafiki na SKB@P3 wywaliło wszystkie próbki GPUGrid - najprawdopodobniej mój błąd, że nie doliczyłem do końca tamtej serii próbek - teraz, aby grafika się nie nudziła (wykorzystany limit na dziś) zapuściłem Primegrid na niej - niech coś ją grzeje :)

Cyfron

SKB@P1 znowu liczy.
Jakoś w weekend postaram się zrobić backup systemu.

Przygotowałem także komputery do nowego PM.

Cyfron

dziś wykonałem backup systemu na SKB@P1  :arrr:

Cyfron

Kolejny backup SKB@P1 po poprawkach AiDec'a zrobiony.

Cyfron

Dzisiaj zakupiłem myszkę:
http://www.crann.pl/store/show_detail/28939-mysz-optyczna-gembird-usb-czarna-musopti7-usb
Koszt: 10PLN

Do tego zamówiłem zasilacz:
http://www.x-kom.pl/p/29451-zasilacz-komputerowy-corsair-1000w-cmpsu-1000hxeu-box.html
Koszt całkowity: 791,80PLN, zapłaciłem zaliczkę 91,80PLN
Planowany odbiór w poniedziałek (wtedy też kwota za zasilacz zostanie zaktualizowana w http://www.boincatpoland.org/smf/superkomputer-boincpoland/lista-darczyncow-projektu-skbp-modernizacja/msg111302/#msg111302 )

Cyfron

jako że SKB@P3 nie dawał rady z bliżej nieokreślonego powodu policzyć PM Docking@Home, dlatego został podpięty do projektu, który zajął drugie miejsce według głosowania: http://www.boincatpoland.org/smf/projekt-miesiaca/co-policzymy-w-kwietniu/ czyli Mersenne@Home

Cyfron

Dziś odebrałem zasilacz - Corsair 1000W - zdjęcia jego wrzucę jak będę miał czas.

Chciałem tylko jeszcze pochwalić się, że SKB@P jest na 6tym miejscu w naszym zespole, 23cim w Polsce i 620 na świecie!
a RAC ciągle rośnie:

a dopiero jutro (jak będzie czas) wsadzę zasilacz i drugą grafę do SKB@P3!

Cyfron

ze względu na problemy z aplikacją i validatorem w Milce SKB@P został właśnie przełączony na Collatz'a

Cyfron

wczoraj przy próbie backupu (nieudanej z mojej winy - nie umiałem obsłużyć programu  :shame: ) poruszałem trochę taśmami od dysku (bo podpinałem inny dysk do SKB@P2) i komp potem zwariował - miał z nim problemy. W ogóle dysk ten (jakieś40GB) jest dość stary i chyba powoli umiera. Backupowanie, które normalnie trwać powinno około 5-6h dziś trwało ponad 12!.
Więc jak się odrobię z robotą na uczelni, to będzie kupowanie dysków do komputerów.
SKB@P2 teraz działa - nie wiem jak długo (bo może sobie znowu z dyskiem coś zrobić...)

Szopler

Jeżeli ten dysk to Samsung 40GB na IDE to on się gryzie z innymi dyskami. Możliwe że ma coś zwalone z rozpoznawaniem SLAVE/MASTER.
Samodzielnie na taśmie dobrze działał u mnie :P...

a może to było 20GB :dunno:
tak, chyba 20GB miałem... (skleroza)

Cyfron

Udało mi się odpalić obie grafiki NV w SKB@P3 ale niestety są problemy z poprawną ich pracą...
Trochę wiadomości z frontu walki AiDec'a z SKB@P3 z dwoma grafikami 2-rdzeniowymi:

CytatOd strony technicznej grafy dzialaja prawidlowo. Niemniej mobo nie obsluguje ich poprawnie. Wykrywane i dzialajace sa tylko 3 GPU, na dodatek to trzecie GPU nie zawsze dziala ok i czasami sypie bledami. Moge cos wiecej podzialac w czasie swiat (to spory kawalek roboty), ale nie mam wiekszych zludzen... Gdyby zadzialalo, to bylby maly cud.

CytatNiestety zadne operacje nie przyniosly idealnych rezultatow. Wciaz tylko 3 GPU licza jak nalezy.

Wiadomość z dziś:
CytatW ten weekend znow bede mial ciut czasu, to sprobuje ponownie. Jeszcze mi kilka pomyslow przyszlo do glowy. Ale bez wielkiego entuzjazmu prosze ;).

AiDec

Udalo sie. Dzialaja wszystkie, aczkolwiek glowy nie dam czy to bedzie chodzilo perfekt. Obserwowac WU.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

GRID

Jakieś 5 min temu obserwowałem WU. Pięknie liczy na 4 wątkach.  :)

AiDec

Dzieki za pochwaly w imieniu swoim i Cyfrona (w koncu ja bylem tylko od softu, a Cyfron od hardware`u).


Wszystko wskazuje na to ze SKB@P3 liczy ok, wszystkie 4 GPU licza poprawnie, brak wysypywanych probek po 48h (przy okazji ponowne podziekowania za grafy dla darczyncy :) ). Niemniej, nie bede narzekal na ew. feedback gdyby cos szlo nie tak jak powinno - jesli ktos raz na jakis czas sprawdzi WU PrimeGrid i zauwazy jakies nieprawidlowosci, to prosze o wpis w watku `Serwis SKB@P`.


Zatem (na chwile obecna) nie musimy myslec o wymianie mobo. Ta sytuacja oznacza rowniez ze generalnie rzecz biorac wszystkie SKB@P sa `zapelnione`. Jedyna opcja obecnie jest ew. upgrade graf, czyli np. wyjmowanie 4850 i wrzucanie 5970/6990 w jej miejsce. Na chwile obecna nie ma problemow z zasilkami - mamy nadwyzki mocy.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Cyfron

SKB@P podpięty pod nowy PM - mersenne@home

Cyfron

http://blog.boincatpoland.org/obudowa-rackowa-na-skbp2/

Cyfron

nie napisałem, ale SKB@P oczywiście liczy obecny projekt miesiąca einstein@home, do tego SKB@P3 na tej jednej NV liczy też Einsteina

Cyfron

AiDec zoptymalizował app_info na SKB@P3, żeby liczył kilka próbek Einsteina na raz na GPU, ale nie liczył wtedy nic na CPU, więc podpiąłem SKB@P3 do AQUA celem dociążenia procesora  :arrr:

Cyfron

wczoraj przepiąłem komputery na nowy projekt miesiąca (SETI)

Cyfron

Dziś podpiąłem czujniki Radioactive@home do SKB@P1 i SKB@P2.
Po restarcie SKB@P1 nie wstał - problemy z dyskiem, szczegóły i dyskusja tutaj

Cyfron

Dziś GRID spędził 4 bite godziny siedząc przy SKB@P, stawiając system na numerze 1 (po wymianie dysków na jeden z otrzymanych od niego).

SKB@P otrzymały także dziś internet po kablu (z GRIDem się nieźle napociliśmy przeprowadzając kabel), więc jeden problem mniej (ze zrywaniem połączenia wi-fi). Powiedzmy że Kabel to moja darowizna na SKB@P :)

Cyfron

komputery przełączone na nowy PM (ditributed Data Mining), przez co doistalowałem na komputerach javę.

aborek

No właśnie, co jest z SKB@P?