Zawieszanie sie pracy czujnika/programu

Zaczęty przez kriu, 20 Grudzień 2013, 20:45

kriu

Mam problem z działaniem czujki (JoyWarrior 24F8 USB), która niedawno kupiłem i podłączyłem. Dzieje się tak, że zadanie często nie może dojść do końca w ciągu doby, czyli za minimalny okres przeliczania. Jeden z przypadków jest taki, że po wykryciu drgań następuje wysłanie pliku zip i zaraz potem zawieszenie się dalszej pracy programu. Ostatnio dodatkowo w katalogu triggers projektu nie było pliku zip z wynikami dla wykrytych drgań a na stronie projektu jest podana nazwa pliku, że niby został wysłany. Innym razem znowu czujnik/program po prostu przestaje komunikować się z serwerem projektu. Jak wyświetlę ,,pokaż grafikę" widać komunikat o kalibracji czujnika, która nie może dojść do końca. Może ten czujnik jest jakiś ,,walnięty"? Dopiero wyłączenie i ponowne włączenie programu pomaga, ale np. przeliczanie zaczyna się od początku – czyli od 0% - poprzednie przeliczanie jest więc jakby stracone. Najgorsze jest to, że po zawieszeniu działania przestaje pracować (wysyłać) zgłoszenia działania i dopiero ja muszę ręcznie np. przerywać projekt. Poza tym dziwne jest to, że za każdym razem, gdy wysyła zgłoszenie działania (czyli standardowo co 30min) robi to podwójnie – poniżej jest link z detalami dla mojego komputera:
http://qcn.stanford.edu/sensor/show_host_detail.php?hostid=31416
Są tam jeszcze widoczne te momenty, kiedy następowało zawieszanie działania np.:
20 Dec 2013, 0:40:02 UTC – wysłał plik zip i się zawiesił.
19 Dec 2013, 7:20:51 UTC – program po prostu przestał działać.
Akcelerometr dołączony jest na stałe do komputera typu terminal. Parametry "ustrojstwa" widoczne w powyższym linku.

A tutaj jest link do zadań: http://qcn.stanford.edu/sensor/results.php?hostid=31416

Dodam jeszcze, że dość często wykonuje się kalibracja czujnika – widać to nawet w szczegółach łączeń w postaci ilości resetów. 
Proszę o jakieś wskazówki, co zrobić czy też ustawić, aby działało to właściwie i nie wymagało mojej częstej interwencji. Czujnik mam umocowany do stalowego kątownika porządnie przykręconego do ściany kominowej 40cm nad podłogą, wypoziomowany i skierowany osią Y na północ.
http://kriu.cba.pl/LT1/pomiary.htm

Szopler

Miałem tak na starym kompie jak obciążyłem wszystkie rdzenie - mnóstwo resetów. Po prostu podsystem USB nie wyrabia wtedy z jakiegoś powodu.

Troll81

Potwierdzam. czasem pomaga przepięcie na inny port USB.

kriu

A czy oprócz tych resetów był coś innego złego - czyli takie rzeczy jak opisałem wyżej?

Niedawno zwiększyłem priorytet dla programu na normalny i kiedyś też powyżej normalnego (standardowo jest ustawiony poniżej normalnego) i resetów jest mało. Ale te zawiechy są dalej. Może jeszcze wyższy priorytet? Dodam tylko, że ten serwerek jest w zasadzie do tego czujnika, do Radioactive@Home (RAD@H działa super) i do stacji pogodowej (program Cumulus - najniższy priorytet)

A propos - można na stałe ustawić inny (np. wyższy priorytet dla tego projektu/zadania)?
http://kriu.cba.pl/LT1/pomiary.htm

Troll81

może zasilanie USB nie wyrabia? Spróbuj przez aktywny switch podłączyć

kriu

Cytat: Troll81 w 20 Grudzień 2013, 21:37
może zasilanie USB nie wyrabia? Spróbuj przez aktywny switch podłączyć
Hmmm - może coś w tym jest. Nie mam na razie aktywnego huba USB. W specyfikacji sensora, strona 11: elmicro.com/files/codemercs/jw24f_datasheet.pdf podane jest jakby pobierał max=300mW co daje tylko jakieś 60mA. Stacja pogodowa też trochę pobiera, bo jak działa z USB to odcina zasilanie bateryjne.
A ile pobiera czujka RAD@H z włączonym podświetlaniem? (wersja 2.52)
http://kriu.cba.pl/LT1/pomiary.htm

Szopler

Też w granicach 60mA, a może mniej.

kriu

Dzisiaj rano zobaczyłem, że nie wysyłane są triggery na serwer. Wyłączyłem BOINC'a i po ponownym włączeniu nie uruchamia się menager QCN czyli ten program qcn_7.33_windows_intelx86__nci.exe
Nie pomógł restart komputera. Potem przeinstalowałem BOINC'a - nic to nie dało. Akcelerometr działa poprawnie bo w innym programie to widać. Projekt można usunąć i dodać ale potem nie startuje ten program *.exe
Czyli QCN jest widoczny w projektach ale nie uruchomiony w zadaniach. Ręczne odpalenie tego *.exe nic nie daje.
Komputer był uruchamiany ponownie w sumie chyba 3 razy
http://kriu.cba.pl/LT1/pomiary.htm

Szopler

Prawdopodobnie serwer uznał, że zbyt dużo błędnych próbek dostał w ciągu ostatnich 24h i przestał wysyłać WU więc BOINC nie ma co przetwarzać i nie odpala aplikacji.
Spróbuj zaktualizować projekt - zaznacz go i kliknij przycisk "Zaktualizuj projekt". Jeżeli w dzienniku zdarzeń (Ctrl+Shift+E lub ostatnia opcja z menu Zaawansowane) zobaczysz potem wpis dla QCN w stylu "Computer reached daily quota ... for ..." lub podobnie to zostaje tylko czekać.

kriu

#9
Samo ruszyło - dziwne nie wiem jak to się stało. QCN był nieaktywny a działał tylko RAD@H. Być może nastąpił restart BOINC'a i automatyczne uruchomienie obu projektów.
Nie, tu nie chodziło o błędy - ich wcale nie było. Zresztą akcelerometr mam dobrze umocowany i wysyłane są tylko puste "dane" - te co 30min. Poza tym po zwiększeniu priorytetu zadania/programu resetów jest bardzo mało. Drgania wykrywa coś ok. 1 raz na dobę a i tak nie wiem czy to prawdziwe.
Wczoraj nawet na próbę czy działa "pstryknąłem" czujnik - "Magnitude" poszło ponad 3.8  XD
http://kriu.cba.pl/LT1/pomiary.htm

kriu

#10
Jak na razie QCN działa nieprzerwanie.
Ale mam inne pytanie - co może być powodem, że komputer wysyła zawsze po dwa Triggery.
Można zobaczyć to na tym listingu: http://qcn.stanford.edu/sensor/show_host_detail.php?hostid=31416
Moment wysłania jest ten sam i kolejne dwa numery ID triggerów.
Sprawdzałem wiele obcych hostów pod tym kątem i tylko ten jeden mój komputer tak robi. Mój laptop IBM wysyła po jednym razie.
=====================
Dodano: 25.12.2013
Niestety ale dzisiaj w nocy znowu się zwiesiło. Po wykryciu drgań przestały postępować procenty w analizie - czyli stanęło przeliczanie. Co ciekawe w katalogu triggers nie było wysłanego pliku zip. Pomogło tylko przerwanie projektu.
Ale jest tez inna zmiana - komputer wysyła już tylko po jednym "pingu" - pusty trigger.
A tak na marginesie serwer projektu coś często nie jest dostępny.
http://kriu.cba.pl/LT1/pomiary.htm

kriu

#11
Niestety dalej pojawiają się zawieszenia działania programu. Tera wygląda mi to raczej na problemy z BOINC a konkretnie programu do QCN.
Dzisiaj wyświetliłem informacje na temat zadań (tasks), które zostały zakończone (bądź nie) przez mój komputer:
http://qcn.stanford.edu/sensor/results.php?hostid=31416
Oprócz standardowych informacji i paru resetów w każdym zadaniu pojawiają się także wpisy, po których następowało zawieszanie się programu a w zasadzie zatrzymanie się dalszych działań. Najczęściej były to takie wpisy (różne adresy):

Unhandled Exception Detected...
- Unhandled Exception Record -
Reason: Access Violation (0xc0000005) at address 0x7C93A282 read attempt to address 0x04922635
Engaging BOINC Windows Runtime Debugger...


Bardzo często jak nastąpi wykrycie drgań pojawiają się te wpisy iprogram przestaje reagować (nie postępują procenty).

Poza tym jeden raz, w tym zadaniu: http://qcn.stanford.edu/sensor/result.php?resultid=1857985,
pojawiło się coś takiego:
11:43:34 (3744): Can't acquire lockfile (32) - waiting 35s
11:44:09 (3744): Can't acquire lockfile (32) - exiting
11:44:09 (3744): Error: Proces nie może uzyskać dostępu do pliku, ponieważ jest on używany przez inny proces.
11:44:10 (2960): Can't acquire lockfile (32) - waiting 35s


Ale to tylko jeden raz. Te wcześniejsze błędy są najczęstsze.
Czyli po przetłumaczeniu:
Unhandled Exception Detected - Wykryto nieobsługiwany wyjątek
Reason: Access Violation - Powód: Naruszenie zasad dostępu


Właśnie w chwili pasania tego posta nastąpiło zawieszenie się (brak postępów procentowych i dalszej komunikacji z serwerem) programu. Nastąpiło wykrycie drgań i brak dalszych postępów. Co ciekawe na stronie QCN jest informacja o tym, że zostało to wykryte i nazwa pliku, który został wysłany natomiast w katalogu triggers u mnie nie ma tego pliku zip. I jeszcze ciekawostka. Okazało się, że wstrzymanie i ponowne uruchomienie projektu spowodowało, że wszystko ruszyło (od miejsca/procentów zatrzymania).
Dodam tylko, że dwa inne projekty na tym komputerze (w tym managerze BOINC) działają bezbłędnie.

Proszę o pomoc, może ktoś wie o co w tym wszystkim chodzi.
http://kriu.cba.pl/LT1/pomiary.htm

Troll81

ja już od jakiegoś czasu mam problem z QCN. jak postawię netbooka to spróbują na nim odpiąć. podejrzewam albo zonki z moim USB albo cuś...

kriu

Chciałbym napisać, że problem jest rozwiązany. Pomógł aktywny hub USB. Co prawda trochę wzbraniałem się przed nim ale teraz widzę, że jest niezbędny. Jak na razie działa nieprzerwanie od 3 tygodni. Trigeruje regularnie, raz-dwa razy na dobę wyśle zipa z wykrytymi drganiami.
I jeszcze ciekawostka. Sam hub USB podłączony do zasilacza pobiera ok. 1,1 wata (razem z zasilaczem) ale jak dołączę go do komputera pobór mocy wzrasta do ok. 4 watów (razem z zasilaczem) - dziwne! Nawet czuć to po zasilaczu - jest wtedy ciepły. Może jakiś prąd z huba płynie do komputera przez USB?
http://kriu.cba.pl/LT1/pomiary.htm

Troll81


tito

Podepnę się pod temat.
Główny host Win 7 64bit. QCN podłączony do jakiegokolwiek portu USB (również przez aktywny HUB). I same errory po paru sekundach. QCN LIVE również przy uruchamianiu wali błędem.
To samo z inną czujką na innym hoscie (również WIN 7 64).
Natomiast te same czujki pod Win XP 32 hulają bezproblemowo.
Sytuacja jest irytująca, bo na chwilę obecną z 3 czujek działa jedna i tylko przez 12h dziennie.
Na ichnim forum nic na ten temat nie znalazłem.
Czujki to te "nasze", ze zbiórek.
A, nie ważne, czy CPU jest zajęte, czy też nie.
Update:
Jeśli czujka jest niepodłączona to QCN LIVE się odpala. Jeśli wtedy podłączę czujkę to działa poprawnie. Wygląda na jakieś problemy z inicjalizacją.

Troll81


kriu

#17
A spróbujcie uruchomić software do tych akceleratorów: http://www.codemercs.com/uploads/tx_sbdownloader/JW24F8WIN.zip a dokładnie program AS-Programmer.exe z pakietu *zip i ustawić na sztywno wartości dla czułości.
Sensitivity: Range 2g, Bandwidth 50Hz (albo 25Hz - już nie pamiętam) czyli takie wartości jakie wymaga QCN.
Na tej stronie jest trochę o tych czujnikach: http://www.codemercs.com/uploads/tx_sbdownloader/
http://kriu.cba.pl/LT1/pomiary.htm

tito

Hmmm.
Dziwne, dziwne.
Czujka była podłączona cały czas - uruchomiłem Twój programik i - brak dostępnego urządzenia.
Programu nie zamykałem za to wyjąłem i włożyłem ponownie czujkę i się pojawiła w opcjach.
Jakieś opcje oszczędzania energii? Coś w BIOSie?

Troll81

ja mam wrażenie że buba po stronie obsługi oszczędzania energii.. Ponoć aktywny hub mocno rozwiązuje sprawę.

tito

Takowego też już podłączałem i nic.
W Win wszystkie możliwe oszczędzanie łącznie z USB dałem na "wyłącz". Zobaczę później w BIOSie.

Troll81

http://social.technet.microsoft.com/Forums/getfile/321904 - to próbowałeś?

tito

#22
Tak.
W BIOSie nic na temat oszczędzania energii przez USB nie znalazłem.
hmmm - może update BIOSu?
Update: nowy BIOS nie pomógł.