Elektroda.pl
Elektroda.pl
X

Search our partners

Find the latest content on electronic components. Datasheets.com
Elektroda.pl
Please add exception to AdBlock for elektroda.pl.
If you watch the ads, you support portal and users.

BSODy, restarty - prawdopodobny problem sprzętowy

wlw_wl 29 Apr 2011 15:55 5447 39
  • #1
    wlw_wl
    Level 38  
    Witam,

    otóż dzieje się tak:
    komputer działa bardzo niestabilnie. Częste BSODy, głównie 0xF4 Critical Object Termination (ntoskrnl.exe) oraz 0x124 (hal.dll), czasem "zamarza" z takim oto widokiem:
    BSODy, restarty - prawdopodobny problem sprzętowy
    a czasem tuż po uruchomieniu systemu, jak tylko pokaże się pulpit, to po prostu zawiesza się i koniec.
    Często również zawiesza się w trakcie działania na ok. pól minuty - minutę, po czym wraca do życia jakby nigdy nic.
    Dodatkowo przeważnie jest tak, że po restarcie/BSOD'ie przy próbie ponownego uruchomienia systemu wita mnie kolejny BSOD, tym razem CI.dll - oznaczałoby to, że pliki systemowe są uszkodzone
    Sprzęt z sygnatury. Windows 7 x64 Pro.

    Męczyłem procesor, blokowałem go na dwa rdzenie, zmieniałem zegar, napięcie - nic nie pomogło.
    Testowałem pamięci, błędów brak.
    To samo z GPU.
    Dyski też sprawdzałem (MHDD, HDTune, chkdsk) i najgorsze co było, to kilka zielonych sektorów (<150ms) na jednym z nich.

    Najdziwniejsze z resztą jest to, że mogę go męczyć podkręcaniem i testami wydajności i wszystko jest w porządku, po czym wywali się przy czytaniu jakiejś strony w internecie albo dosłownie przy poruszeniu myszką.
    Mówiąc krótko, nie jest to związane z obciążeniem.



    Podejrzewam problem sprzętowy, konkretnie płytę główną.

    Załączam niektóre zrzuty, ogółem jest ich już dwadzieścia w przeciągu ośmiu dni. Dodając do tego, że nie zawsze kończy się to BSODem, można sobie wyobrazić jak często się wywala.

    System jest to już trzeci z kolei, zawsze te same problemy. Za pierwszym razem na jakiś czas pomogło wyłączenie kontrolera USB3, od tej pory jest wyłączony stale a problemy nadal są.

    Konsultowałem sprawę z pomocą techniczną ASRock'a dwukrotnie, najpierw przy kwestii USB3 (próbowali zreplikować kwestię na niemal identycznym systemie, bez skutku) oraz ostatnio. Zgodzili się, że płyta główna może nadawać się do wymiany, ale ponieważ trzeba to zrobić przez sklep (ram.net.pl) to niezbyt mi się spieszy.

    Jeżeli ktoś wyczyta ze zrzutów coś, co skieruje podejrzenia w inną stronę, to chętnie uniknę realizacji gwarancji w tym sklepie (tak, wiem, trzeba było tam nie kupować).
  • #2
    RoStER
    Level 30  
    Witam, na wstępie chciałem zaproponować nowe wgranie systemu bądź sprawdzenie na linuxie. Po przeczytaniu całego twojego postu (zmiany systemów i ciągle to samo), pomyślałem skoro stawiasz na płytę główną to:

    Próbowałeś ją uruchomić z 1 kością ramu?, lub najlepiej jak byś miał jakieś stare części które podłączyłbyś do tej płyty głównej aby się upewnić czy problem dalej by występował.

    Oczywiście mój post pewnie nie za wiele ci pomógł ale mam nadzieję że coś się przyda.

    Temat bd śledził bo na ładnym sprzęcie pracujesz i jestem ciekaw co nawaliło. Pozdrawiam.
  • #3
    wlw_wl
    Level 38  
    Problemem jest to, że komputer sobie może chodzić kilka dni albo dłużej bez protestów, a potem nagle BSODy i resety jeden za drugim.

    Pamięć kilkukrotnie wałkowałem Memtestem z bootowalnego USB i żadnych błędów.

    Procesora na podmianę nie mam, ale OCCT godzinami może chodzić i wszystko dobrze. Wszystko tu jest nowe więc nic starego się użyć nie da za bardzo.

    Nie udało mi się znaleźć jakiegoś ustalonego wyzwalacza, typu: klikam to a komputer się wywala. Mogę siedzieć godzinami, odejdę na chwilę do drugiego pokoju, a po powrocie wita mnie blue screen.

    Przeszło mi nawet przez myśl, że może to być kwestia przegrzewającego się mostka północnego po zmianie chłodzenia na Fortisa z BOXowego, ale myśl ta szybko upadła, bo przecież na BOXowym było dokładnie to samo. VRM też się nie grzeje.
    Poza tym najczęściej nawala jak nic się nie dzieje, procesor 800MHz/33°C, grafika 100MHz/150MHz/38°C, płyta główna 35°C. Fakt faktem radiator na NB parzy poważnie, ale gość z ASRocka powiedział, że te płyty (770 i 870 ex3) tak mają z natury, więc powiedzmy, że to normalne.
  • #4
    MichalXY
    Level 11  
    Witam!

    Ja na twoim miejscu przyjrzał się karcie graficznej(patrząc na screena).
    Możliwe że sterowniki mają jakiś problem...
    Kiedyś jak miałem problem z kartą graficzną(było to dawno temu) to też "zamrażało" obraz i zniekształcało go.

    Jeśli chodzi o BSODy to zastanawia mnie fakt że pojawiają się nieregularnie - możliwe że masz jakiegoś wirusa który gdzieś głęboko siedzi i robi ten "bałagan" w systemie.

    Jeszcze jedno, ja bym sprawdził BIOSa w sensie czy działa poprawnie, możliwe że to on powoduje te problemy - dla spokoju ducha zaktualizuj go.

    Odnośnie płyt głównych ASROCKa to słyszałem niepochlebne opinie więc również tam może być przyczyna.



    Również będę śledził temat bo tymi BSODami to zawsze jest spory problem bo bardzo często nie wiadomo od czego się pojawia mimo tych kodów STOP.

    Pozdrawiam!
  • #5
    beo
    Level 36  
    Wspominasz, że to już trzeci system z kolei. Pomijając już sam fakt orginalności, upewnij się że systemy same w sobie nie posiadają wad. Próbowałeś wersji 32bitowej? Sterowniki zgodne z architekturą systemu? Od razu ten problem wystąpił, czy po pewnym czasie się ujawnił? BSOD'y wskazują na problem sprzętowy, jądra systemu, a jeden z nich na, prawdopodobnie konflikt sterowników.
  • #6
    wlw_wl
    Level 38  
    MichalXY nic nie wskazuje na problemy z kartą graficzną, mimo to sterowniki do niej sprawdzałem różne. Gdyby problem był na poziomie karty graficznej, zniekształcenie dotyczyłoby całego bufora obrazu, a tymczasem kursor, jak widać, ma się dobrze.
    BIOS jest w najnowszej dostępnej wersji - 1.60.

    Nie rozumiem w jaki sposób fakt, że słyszałeś niepochlebne opinie o firmie ASRock jest przyczyną powyższego? Sugerujesz, że płyta strzeliła focha, bo źle mówili o producencie?

    beo system jest oryginalny, ilość instalacji tego nie zmienia. Instalowane z różnych nośników na różnych dyskach. Nie, nie próbowałem wersji 32-bitowej i nie spróbuję, bo nie posiadam na taki system licencji.
    Problem występuje jak mu się spodoba, np. wczoraj i dziś nic się nie działo zupełnie, przedwczoraj z kolei w ogóle nie chciał działać.

    Ponieważ w pierwszym przypadku wystąpienie problemów zbiegło się w czasie z wprowadzeniem SP1, druga instalacja systemu była czysto eksperymentalna, bez żadnych poprawek, w tym bez SP1. Jak już wspominałem, nic to nie zmieniło.
    Wtedy wróciłem do poprzedniej instalacji która niby zaczęła działać dobrze, ale ponieważ był to system instalowany jeszcze na poprzedniej płycie głównej z innym chipsetem i kartą graficzną, w rejestrze był bajzel i często np. karta graficzna zamiast jako 6850 była rozpoznawana jako "4800 series" - pozostałość po poprzedniej 4850.
    Dlatego wykonałem kolejną, czystą instalację, która podziałała jakiś czas aż szlag wszystko trafił.

    Jedyne wystąpienie KMODE_EXCEPTION_NOT_HANDLED (dxgmms1.sys) było spowodowane eksperymentalną wersją sterowników do karty graficznej (11.4 Early Preview), to tyle w kwestii konfliktów sterowników.
  • Helpful post
    #7
    elektron1956
    Level 14  
    Witam!

    Chcialbym polecic ten Debugger link http://msdn.microsoft.com/en-us/windows/hardware/gg463016 .Tez mialem podobne problemy i tym wlasnie Toolsem
    doszedlem gdzie byl problem (zly sterownik).Juz nie pamietam jak to sie obslugiwalo
    ale mozna tam poczytac link http://thebackroomtech.com/2008/01/31/howto-u...debugging-tools-to-analyze-a-crash-dump-bsod/

    Powodzenia !!

    Przepraszam za "l" i "s" bo nie mam polskiej czcionki!
  • #8
    wlw_wl
    Level 38  
    elektron1956 kiedyś walczyłem z tym narzędziem, ale symbole mi nie chciały działać, ale teraz mnie zachęciłeś i sporo się dowiedziałem z analizy.

    Dużo zrzutów jako winowajcę podaje csrss.exe, ale też przewija się nieskorygowany błąd pamięci podręcznej procesora (żegnaj czwarty rdzeniu).

    Dzięki za zmobilizowanie do skorzystania z tego narzędzia, o czym zapomniałem.

    Przygoda jednak się na tym nie kończy, bo jak pisałem wcześniej, problemy występowały również po zablokowaniu procesora z powrotem do dwóch rdzeni (czyli po wykluczeniu czwartego rdzenia, posiadającego wadliwy cache).

    Najprawdopodobniej teraz muszę zaczekać na powtórzenie się tych okoliczności.
  • #9
    DAREK BIELSKO
    Level 11  
    Kolego-od paru tygodni mam to samo.Sprawdziłem wszystko co się dało i nic,a zaczęło to się dziać po ostatnich(kwietniowych)aktualizacjach Microsoftu.Dobra rada-format i Linuks.Po problemach :)
  • #10
    wlw_wl
    Level 38  
    Nie przypominam sobie, żeby w lutym były kwietniowe aktualizacje, a wtedy to się zaczęło.

    Daj mi linuksa z Visual Studio 2008 i DirectX to spróbuję :yes:

    Nadal brak problemów.
  • #11
    wacek1974
    Level 12  
    Sprawdź dobrze kartę graficzną a najlepiej podmień na kilka dni .
    Drugim winowajcą może być zasilacz .
    Na trzecim miejscu płyta główna , ale jak dla mnie mało prawdopodobne .
  • #12
    wlw_wl
    Level 38  
    wacek1974
    Z kartą graficzną jest wszystko w porządku, co już tłumaczyłem. Poza tym nie ma absolutnie niczego, co wskazywałoby kartę graficzną jako winowajcę.

    Czemu winny ma być zasilacz? Ma on dwa tygodnie...


    Znów kilka wystąpień F4 CRITICAL_OBJECT_TERMINATION, csrss ubite, niestety nie ma możliwości dowiedzieć się dlaczego i przez co (brak LPC message), nic więcej się nie wymyśli bez pełnego zrzutu pamięci.
  • #13
    Brodi
    Level 29  
    wlw_wl ignorując dobre rady mądrych ludzi daleko nie zajdziesz. Prosisz o pomoc, dostajesz ją , ale i tak ignorujesz ją.

    Sprawdziłeś kompa z inną kartą graficzną? Pewnie nie więc nic nie wyjaśnisz w tym temacie.

    Dalej Pamięć - ddr3 są dosyć kapryśne. Ustaw ręcznie taktowanie na sztywno, oczywiście z tylko jedną kością.
    Zresztą testy syntetyczne jak memtest nie radzą sobie z dwukanałową obsługą przez oba rdzenie. W skrócie tłumacząc 1 rdzeń w trybie single lub dual - testy memtestem wychodza OK. W trybie Unganged czyli 2 rdzenie w trybie dual channel korzystają równocześnie z pamieci - pamięc sypie błędami , a memtest tego nie wykryje bo to nie jest test korzystający z dwóch rdzeni/smp.
    Zasilacz - co w temacie zmienia wiek zasilacza ? Nie jeden 3 letni zasilacz jest w lepszej kondycji niż wiele nówek. Nie będziesz mial pewności dopóki nie podmienisz go.
    Zakładam ze twój komp to ten ze stopki. Pamięci GEIL - mnie nie lubią. Płyta asrock - pomimo wielu wielbicieli asrocka na tym forum ja osobiście skreślam je na starcie.

    / doczytałem że to komp z ram.net.pl, znajomy w zeszłym roku miałe podobny problem, ale BSODy sypało już podczas instalacji systemu, do wymiany poszła płyta asrock i ramy już nie pamiętam jakie :]
  • #14
    wlw_wl
    Level 38  
    Nie ignoruję dobrych rad, ale trzeba umieć odróżnić dobre rady, za którymi stoi wiedza i fakty, od gdybania "a może to karta graficzna bo są śmieszne wzorki na monitorze a innego pomysłu nie mam to napiszę". "Pamięci GeIL mnie nie lubią więc to pewnie ich wina" jest świetnym przykładem wyciągania wniosków bez zapoznania się z faktami (przedstawionymi w zrzutach pamięci) - to nie jest wartościowa rada i z całym szacunkiem, ale takich rzeczy nie piszą mądrzy ludzie, a przynajmniej nie tacy znający się na temacie, na który się wypowiadają.

    Wyjaśniłem już z 17 razy - to nie jest wina karty graficznej. Nic, absolutnie nic na to nie wskazuje, a stress testy potwierdzają jej niewinność.
    Jedno jedyne wystąpienie, gdzie pojawiła się wzmianka o karcie graficznej, było spowodowane błędem sterownika - była to wersja Beta, po zmianie na WHQL problem się nigdy nie powtórzył. Nie obcina się głowy z powodu bólu nogi. Jaka jest podstawa Twojej tezy, że problem leży w karcie graficznej?

    Były owszem problemy z pamięcią, ale nie RAM, a Cache procesora. Precyzując, był to błąd DCACHEL1_DRD_ERR. Powyższe potwierdza (moim osobistym zdaniem wybitny) specjalista pisząc:
    cluberti wrote:
    Błędy DCACHE mogą również wskazywać na błędy RAM, ale zazwyczaj tylko na procesorach Intel (ze względu na ich zdolność do rozpraszania instrukcji w rejestrze i częściowo w RAMie, zależnie od obciążenia). Nie robią tego procesory AMD, więc niemal na 100% ten błąd na procesorze AMD wskazuje na błąd CPU.

    Reasumując był to błąd pamięci podręcznej poziomu pierwszego (Cache L1) w rdzeniu, który został już wyłączony.
    Stąd właśnie pochodziły liczne błędy 0x124 (hal.dll) WHEA_UNCORRECTABLE_ERROR - była cała masa skorygowanych błędów sprzętowych (o czym z resztą zakładałem osobny wątek tu na forum), ale w momencie, kiedy któryś nie został skorygowany - BSOD 0x124.

    Zasilacz. Wyjaśnij mi więc, w jaki sposób zasilacz przerywa wątek systemowy, notorycznie ten sam wątek, i to wcale nie pod obciążeniem, bo najczęściej jak nic się na komputerze nie dzieje. Pomijając już fakt, że działo się to również przed zakupem aktualnego zasilacza, na poprzednim - Zalman ZM 600-HP.
    Podpowiem Ci, nie robi tego przy pomocy napięć, bo te są wzorowe.

    Zapewne nawet nie zajrzałeś do zrzutów pamięci jądra, które załączyłem. Gdybyś to zrobił i wiedział na co patrzysz, nie byłoby tej zbędnej wymiany zdań.


    System został skonfigurowany do pełnego zrzutu pamięci, pozostaje czekać na powtórzenie się okoliczności (chociaż znając złośliwość rzeczy martwych, przez miesiąc nic się nie będzie działo).
  • #15
    michallesz2
    Level 12  
    Na pokazanym obrazie widać ,że twój monitor nie ma właściwej synchronizacji.Ale jeśli piszesz , że czasami jest dobrze to winą może być uszkodzona karta graficzna .Sprawdź z jaką częstotliwością wyświetlany jest obraz .Podstawowa wartość to 60 Hz.Może wgrywając aktualizacje jakiś program przestawił synchronizację.Możesz również przywrócić system do czasu kiedy chodził dobrze.

    Dodano po 10 [minuty]:

    Możesz spróbować podmienić kartę graficzną .Jeśli po podmienieniu karty dalej będzie tak samo to wtedy mogłoby oznaczać iż wina leży w monitorze.Jeśli monitor masz starszego typu to prawdopodobnie synchronizacja pionowa jest w nim uszkodzona.Za synchronizację w telewizorze odpowiada układ scalony i to on może być uszkodzony.
  • #16
    wlw_wl
    Level 38  
    michallesz2 nawet tego nie skomentuję. Pisząc w wątku, należałoby się z nim najpierw zapoznać.

    Ktoś jeszcze chciałby coś ciekawego o karcie graficznej napisać?

    Kolejne wystąpienie F4 oraz jedno 1E, mimo poprawnej konfiguracji, system zrzutu nie zapisał, raz nawet nie zaczął, drugim razem utknął na 75%. Nawet BlueScreeny się wieszają na tym g...nie. "You fail at failing" :|
  • #17
    Brodi
    Level 29  
    No i dalej stoisz w miejscu. A może miałeś już 2 uszkodzone zasilacze i dalej ciągniesz wątek nie robiąc nic. To jest elektronika na poziomie kilkuset megaherzów. Jak chcesz tutaj coś sprawdzić w domowych warunkach ? Multimetrem sprawdzisz stabilność napięcia ? No powodzenia z szumami o częstotliwości kilkudziesieciu Khz.
    Dumpy pamieci coś pomogą ? A może masz walniętą płytę a dokładnie porta ata/sata i w momencie awarii zapisuje ci na dysk "random shit" . To jak zweryfikujsz ?
    Prosty test stabilności kompa, i to nie syntetyczny - tworzysz archiwum rar powiedzmy 1GB ( kompresja store ), rozpakowujesz to i znowu kompresujesz i tak w kółko kilka razy. Na końcu robisz md5 wszystkich plików rar. Sporo kompów które naprawiałem tego nie przechodzi. I gdzie szukać usterki ? ALe to już OT

    Pytanie właściwe : Co wymieniłeś w kompie poza zasilaczem ?

    Widze że strasznie drążysz temat BSODów. Podejrzewasz że gdzieś cię to naprowadzi ? Stery najnowsze ze stron ati realtek nec bios 1.60 ? Te biosy mają auto overclocking ?
    No i nie wiem czy zdajesz sobie sprawe ale windows 7 ma ze 40 000 plików. Myślisz że znajdziesz ten uszkodzony ? Jeśli to wogóle jego wina. Może podczas któregoś restartu/zwisu systemu padł rejestr i teraz to już musztarda po obiedzie. To tylko program. To nie porucznik Data, sam się nie naprawi. W niktórych sytuacjach mierząc temperaturę podzespołów swoim palcem wskazującym rozwiąże więcej problemów niż analizując jakieś logi czy numery błędów o których nawet google nie słyszało. Samo życie.
    I jak diagnoza kompa pod innymi systemami linux bsd xp ?
  • #18
    DriverMSG
    Admin of Computers group
    Podaj pełną specyfikację komputera, ze szczególnym uwzględnieniem zasilacza i napięć sprawdzone miernikiem. Daj screeny ze wszystkich zakładek programów HDTune, CPU-Z, GPU-Z i w załączniku pełny raport sprzętu z Everest. Przykład.
  • #19
    wlw_wl
    Level 38  
    Przecież wszystkie informacje zostały podane.
    Ale co tam, redundancji nigdy za wiele.

    ASRock 870 Extreme3
    2x2GB DDR3 GeIL 1600MHz CL8 1.6V Value Plus
    Sapphire HD6850 1GB wersja zwykła (nie Toxic)

    Reszta w raporcie Everest'a.

    Zasilalcz OCZ ModXStream Pro 600W, to samo działo się na Zalmanie 600-HP.

    +3.3V = 3.38
    +5V = 4.99
    +12V = 12.32

    Średnia temp. we wnętrzu ok 30°C.

    BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy
    BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy
    BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy BSODy, restarty - prawdopodobny problem sprzętowy
  • #20
    lolozor
    Level 10  
    Klastry w HDD. Nie pamiętam jakim programem możesz to zrobić ale spróbuj przeskanować klastry systemu.

    Dlaczego dysk? Bo piszesz, że głównie "giną" ci pliki systemowe. Raz są - raz nie, czego powodem może być jakaś ustarka elektroniczna czy mechaniczna dysku.
  • #21
    wlw_wl
    Level 38  
    wlw_wl wrote:
    Dyski też sprawdzałem (MHDD, HDTune, chkdsk) i najgorsze co było, to kilka zielonych sektorów (<150ms) na jednym z nich.
    Żadne pliki nie giną, zawodzi weryfikacja ich obrazów po załadowaniu. Z resztą ten błąd akurat przestał występować, został już tylko F4 i zamarzanie systemu, z tym, że nie zapisuje się zrzut pamięci.
  • #22
    skynet_2
    Level 26  
    BSODy, restarty - prawdopodobny problem sprzętowy
    Na 90% sterowniki od karty lub przegrzany chipset, albo ale to bardzo mało prawdopodobne zły kontakt grafiki z płytą główną.

    _edit: ewentualnie przegrzewanie się pamięci RAM grafiki, ale te karty mają dobre chłodzenie.
  • #23
    adamadi33
    Level 43  
    Wentylator obudowy jest?Ile dysków twardych masz podłączonych?
  • #25
    wlw_wl
    Level 38  
    Driver, zmierzasz do czegoś?

    BSODy, restarty - prawdopodobny problem sprzętowy
  • #26
    DriverMSG
    Admin of Computers group
    wlw_wl wrote:
    Driver, zmierzasz do czegoś?


    Tak.
    W raporcie z Everst miałeś wykorzystanie jednego rdzenia na 100%, a drugi na 0%.
    To może świadczyć o złym sterowniku procesora, lub o innej przyczynie takiego zachowania.

    Wykonaj kilka testów monitorując wykorzystanie rdzeni i sprawdź koligację aplikacji.
  • #27
    wlw_wl
    Level 38  
    Zrobiłem raport ponownie, znów napisał to samo (0/100%), ale patrzyłem w trakcie generowania raportu na wykorzystanie CPU i system przerzucał go między rdzeniami, więc krótko mówiąc, pisze pierdoły a nie stan faktyczny.
  • #29
    wlw_wl
    Level 38  
    Są takie jak były - jedno bez sensu a na drugie była już odpowiedź zanim je zadałeś.
  • #30
    adamadi33
    Level 43  
    Takimi odpowiedziami nie uzyskasz pomocy ale zniechęcisz użytkowników.Kiedy kupiłeś tą płytę?Kości ram w jakich modułach zainstalowane?