Elektroda.pl
Elektroda.pl
X

Search our partners

Find the latest content on electronic components. Datasheets.com
Please add exception to AdBlock for elektroda.pl.
If you watch the ads, you support portal and users.

Restarty PC podczas grania - Losowe i nieregularne

Vikey 29 Nov 2021 11:33 696 26
Optex
  • #1
    Vikey
    Level 3  
    Dzień dobry
    Mniej więcej od roku męczę się z pewnym problemem, którego w żaden możliwy sposób nie mogę rozwiązać. Otóż podczas grania w całkowicie losowych momentach pojawia się czarny ekran z "zawieszonym/zaciętym" dźwiękiem, po czym następuje restart. Dzieje się to losowo - czasem kilka razy na dzień, czasem ani razu w ciągu półtora miesiąca - i tylko przy bardziej zaawansowanych grach jak np. Snowrunner. Przy mniej wymagających jak np Dying Light wszystko jest w porządku. Specyfikacja techniczna to:

    AMD Ryzen 5 3600X 6-Core Processor (12 CPUs), ~3.8GHz
    AMD Radeon RX 5700 8GB
    Gigabyte Technology Co., Ltd. X570 UD
    be quiet! Pure Power 11 600W
    2x GOODRAM 16GB (1x16GB) 3600MHz CL17 IRDM PRO

    VOLT POLSKA UPS Micro 1000 600W LCD (PRZ101) (jesli to ma znaczenie)


    1. Jakoś w marcu tego roku komputer trafił do serwisu i wtedy wskazano na winę procesora. O ile dobrze pamiętam, przy full stresie i temperaturze 85 stopni (najwyższa wartość) radiator nie był wcale ciepły, więc to teoretycznie wygląda jak uszkodzony czujnik czy jakiś rdzeń. Problem tylko, że podczas tych testów ani razu nie wywaliło, a przy graniu, gdzie wykorzystanie podzespołów, temperatury itd są nieporównywalnie mniejsze (60-63 procesor, 70-kilka gpu) a jednak coś takiego się dzieje. Z tego samego powodu nie uznano gwarancji u producenta - bo "działa" i dzielnie znosi oprogramowanie służące do testowania sprzętu

    2. Znalazłem w dzienniku zdarzeń błędy, które są z tym związane

    I - uporałem się z nim poprzez usunięcie tego klucza z rejestru i zostawienie tylko nowszego, "AMDRyzenMasterDriverV19", bo takie znalazłem rozwiązanie w sieci. Nie pomogło
    Spoiler:
    Nie można uruchomić usługi AMDRyzenMasterDriverV17 z powodu następującego błędu:
    Nie można odnaleźć określonego pliku.


    II - jedyny który się notorycznie powtarza. Identyfikator kontrolera APIC wskazuje na różne liczby, nie tylko 4
    Spoiler:
    Wystąpił krytyczny błąd sprzętowy.

    Zgłoszone przez składnik: rdzeń procesora
    Źródło błędu: Machine Check Exception
    Typ błędu: Cache Hierarchy Error
    Identyfikator kontrolera APIC procesora: 4

    Widok szczegółów tego wpisu zawiera dodatkowe informacje.


    III - o ile pierwszy z tych jest dla mnie logiczny, to nie rozumiem o co chodzi w drugim
    Spoiler:
    Poprzednie zamknięcie systemu przy 10:42:32 na ‎29.‎11.‎2021 było nieoczekiwane.

    Spoiler:
    Zdarzenia inspekcji zostały porzucone w trakcie transportu. 0


    3. Sprawdzałem wszystkie potencjalne rozwiązania z sieci. Wyłączyłem "szybkie uruchamianie", zaktualizowałem wszystkie sterowniki, w tym chipset (przez AMD Chipset Software), GPU, a nawet wgrałem najnowszy BIOS. Bez rezultatu. Zrobiłem wszystko co mogłem zrobić... i nic. Absolutnie żadna rzecz nie działa i skończyły mi się jakiekolwiek pomysły. Chyba przez to zwariuję. Błagam o pomoc, bo jesteście moją ostatnią nadzieją. Chętnie udzielę wszystkich dodatkowych informacji o jakie zostanę poproszony
    Pozdrawiam serdecznie
  • Optex
  • #2
    piotrkol7
    Level 39  
    OCCT, test CPU na AVX2, zostawiasz na te 15-20 minut i patrzysz, czy nie wypluje błędów.
    To samo z grafiką, test 3D, choć tutaj wątpię, żeby to było to.
  • #3
    Vikey
    Level 3  
    Zrobione obydwa, efekt taki sam jak przy stress testach z innymi programami - zero crashów, zero błędów
  • Optex
  • #6
    dd10
    Level 10  
    Próbowałeś zmienić zasilacz na inny i wtedy sprawdzic?
  • #7
    Vikey
    Level 3  
    Nie próbowałem i niestety nie mam takiej możliwości, no chyba że wrzuciłbym "chińczyka" z czarnej listy ze starego komputera - ale nie sądzę, żeby w ogóle coś takiego miało jakikolwiek sens
  • #8
    Włodi
    Level 19  
    Uruchom OCCT w teście "PSU" i obserwuj w programie poszczególne napięcia czy nie spadają poniżej norm. Oto one:

    Restarty PC podczas grania - Losowe i nieregularne

    Obserwuj też czy taktowanie na CPU i GPU nie spada po pewnym czasie, szczególnie po rozgrzaniu się tych komponentów.

    Napięcia najdokładniej zmierzysz za pomocą miernika.

    W tym teście jest też bardziej prawdopodobne, że komputer się zresetuje co mogło by być potencjalną podstawą reklamacji, choć w takim wypadku najpierw wypadałoby podmienić zasilacz.
  • #9
    marcin878787
    Level 22  
    Czy w tym serwisie wstawili inny procesor w celu sprawdzenia czy powoduje problem?
  • #10
    Vikey
    Level 3  
    Włodi W wolnym czasie pobiorę OCCT i zrobię o co prosisz

    marcin878787 Nie, nie wstawiali, ale problem w tym, że te błędy to ogromna losowość, a na dodatek komputer bezproblemowo przechodzi testy i obciążanie różnymi programami do maksimum. GPU i CPU ciśnięte "na maxa" przez pół godziny czy godzinę, ile by ten test trwał, dobrze sobie radzą i nie wywalają w ogóle. A z tego co słyszałem, to właśnie takie sprawdzanie podzespołów jest podstawą do udzielenia gwarancji od producenta :( Gdyby to nie było tak bardzo losowe, na pewno szybciej udałoby się znaleźć źródło problemu.

    Dodam, że otworzyłem .dmp które stworzył WHEA-logger (czyli to, co pokazuje się po crashu w dzienniku zdarzeń) i winny zdaje sie być proces smss.exe. Myślałem, że może mam coś nie teges z plikami systemowymi i spróbowałem naprawić uszkodzone przez sfc /scannow, ale komenda nie wykryła żadnych nieścisłości
  • #11
    Vikey
    Level 3  
    Dzień dobry
    Odłożyłem temat na pewien czas przez życiowe problemy i teraz chcę do niego wrócić i się wreszcie z nim uporać. Włodi, uruchomiłem OCCT, mam nadzieję że tak jak doradzałeś i niczego nie pomyliłem

    Jak na razie przy 100% wykorzystaniu CPU i GPU wartości są chyba w porządku.
    +12V 12.168 do 12.240
    +3,3V 3.324 do 3.384
    +5V 5.010 do 5.070


    Restarty PC podczas grania - Losowe i nieregularne
  • #12
    marcin878787
    Level 22  
    Najlepiej będzie sprawdzić na innym zasilaczu / procesorze / gpu. Bez tego stoisz w miejscu.
    Ewentualnie możesz przeinstalować system.
  • #13
    młody14
    Level 37  
    Spróbuj zrzucić taktowanie pamięci karty graficznej tak o 200MHz. Dla rdzenia obniż chociaż 100MHz i powtórz testy. Możesz to zrobić za pomocą narzędzia wbudowanego w sterowniki AMD Software: Adrenalin Edition albo poprzez MSI Afterburner.
  • #14
    Vikey
    Level 3  
    Pobrałem Afterburner i, mam nadzieję, zrobiłem to co mi poradziłeś poprawnie. "Core clock" to rdzeń, tak? Jeżeli tak, to obniżyłem o te 100MHz, ale "memory clock" jest już możliwie najniżej i nie da się zejść o te 200MHz

    Restarty PC podczas grania - Losowe i nieregularne
  • #15
    Włodi
    Level 19  
    Zrób to samo co w poście nr.11 ale tym razem w zakładce "frequency" obserwuj czy taktowanie CPU bądź GPU spada po czasie. Możesz też uruchomić odrębne testy dla samego CPU (linpack) lub GPU. Zrób to na domyślnych taktowaniach.
  • #16
    Vikey
    Level 3  
    Przez większość czasu jest jak na obrazku 1, pojawiają się tylko sporadycznie takie spadki jak na 2. Nie umiem tego niestety zinterpretować, więc mam nadzieję, że pomożecie. Taktowanie znów zmieniłem na domyślne, jak powiedziałeś Włodi.

    Największy i najdziwniejszy problem z moim komputerem jest taki, że wszystkie testy wieloma programami, i u mnie i w serwisie swego czasu, znosi bardzo dobrze i nawet po godzinie do dwóch "ciśnięcia" GPU, CPU i pamięci RAM się nie wywala i po prostu współpracuje, nawet jak procesor i karta graficzna zagrzeją się do ponad 90 stopni. Ani takich temperatur ani 100% zużycia te podzespoły nie osiągają w jakiejkolwiek grze - więc o przegrzewaniu nie ma mowy - a jednak ten nieszczęsny WHEA Logger (18) się pojawia. Jak wspominałem na początku, im nowsza/bardziej wymagająca gra tym częściej, a teraz przy Dirt Rally 2.0 osiągam apogeum w postaci co najmniej jednego crasha dziennie, choć np. Forza Horizon 4 przez kilka godzin działa tak jak należy. Forumowicz marcin878787 wspominał o podmianie podzespołów, ale niestety w ogóle nie mam takiej możliwości i kupowanie nowych części stawiam za całkowitą ostateczność, zwłaszcza przy ostatnim wzroście cen wszystkiego... Też nie wydaje mi się aby komputer się wywalał bo ma "dość", skoro stress testy znosi dobrze, dlatego to co się z nim wyprawia to dla mnie ogromna zagadka praktycznie nie do rozwiązania :(

    Jeśli w systemie są gdzieś jakieś logi, dumpy i inne rzeczy mogące naprowadzić na potencjalne źródło tego problemu to bardzo chętnie je udostępnię. Od tego losowego crashowania można osiwieć :(

    Restarty PC podczas grania - Losowe i nieregularne
    Restarty PC podczas grania - Losowe i nieregularne
  • #17
    młody14
    Level 37  
    A masz może jakiś zapasowy dysk? Jeśli tak to proponuję na nim zainstalować na czysto system i sprawdzić te gry jeszcze raz, nawet Win 11 możesz spróbować.
  • #18
    marcin878787
    Level 22  
    Ja bym zainstalował ponownie system na osobnej partycji, a najlepiej na drugim dysku. Wtedy będziesz wiedział, czy problem leży po stronie systemu
  • #19
    Vikey
    Level 3  
    Niestety nie mam żadnego innego dysku, a reinstalacja systemu nie wchodzi w grę, bo komputer jest też moim narzędziem do pracy i na studia i teraz jest mi najbardziej potrzebny. Czy macie jakieś inne pomysły? :(

    Dodam, że sam również na bieżąco poszukuję rozwiązania i ponoć jedną z potencjalnych przyczyn błędów może być obniżanie napięcia przez zasilacz/CPU w trakcie grania, kiedy chwilowo dzieje się "mniej" obliczeń, gdzie zaraz potem te obliczenia wzrastają, zasilanie jest za słabe i następuje reset. To może też tłumaczyć fakt, że stress testy ani razu nie wywaliły komputera, bo tam wszystko leci na maxa. Jak to wygląda według Was?
    Rozwiązaniem miało być poprzestawianie różnych opcji w BIOS,a konkretnie:
    - PSS support/AMD Cool n Quiet -> disabled
    - global c-state control -> disabled
    - power supply iddle control -> typical current idle
    - power down (DRAM) -> disabled
    - gear down mode (DRAM) -> disabled
    - core performance boost -> off

    Jaki efekt? Procesor jest kilka stopni chłodniejszy, a komputer jak wywalał, tak wywala dalej...
  • #20
    Vikey
    Level 3  
    Podbijam temat :( Oczywiście kolejny sposób który spróbowałem, powyższy, także nie pomógł. Odinstalowanie sterowników od karty graficznej przez DDU i wgranie najnowszych również nie dało kompletnie nic..
  • #21
    młody14
    Level 37  
    Temat nie jest prosty, odpowiedzi dużo już padło więc pomysły też się pokończyły.

    Vikey wrote:
    reinstalacja systemu nie wchodzi w grę, bo komputer jest też moim narzędziem do pracy i na studia i teraz jest mi najbardziej potrzebny.

    Kup najtańszy ssd i najwyżej zwróć w ciągu 14 dni. Jeśli chcesz się dowiedzieć co jest przyczyną to musisz niestety sprawdzać wszystko po kolei, łącznie z systemem 🙄

    W dalszym ciągu podejrzewam również kartę graficzną którą przydałoby się podmienić lub/i przetestować w innym komputerze.
  • #22
    Vikey
    Level 3  
    Witam ponownie, nie miałem czasu się tym za bardzo zajmować, no ale wreszcie trochę mam i mogę próbować to naprawić. Sprawdziłem chyba wszystkie możliwości i ustawienia, które ludzie podawali w pewnym anglojęzycznym forum i nic nie pomogło. Wszystkie, poza jedną - poprzestawianiem różnych opcji, napięć itd na procesorze w BIOS. Chodzi mi o coś takiego:

    https://community.amd.com/t5/processors/whea-18-black-screen-reboots-ryzen-5-3600/td-p/484109

    Nie do końca sam wiem jak to zrobić i nie chcę niczego uszkodzić, czy moglibyście powiedzieć mi o tym cos więcej i pomóc mi w tym?
  • #23
    krzysiozak
    Level 39  
    Zajął bym się wszelkiego rodzaju wentylatorami, czy pracują wydajnie i czy w ogóle pracują, może zebrało się gdzieś kurzu, przeczyścił bym. W pastę że zawiodła nie wierzył bym; chyba że była wymieniana, przed samą awarią.
  • #24
    Abdonay
    Level 2  
    Nie mam dostępu do swojego komputera, żeby podać ci specki, ani doświadczenia jak koledzy wyżej, ale opowiem swoją historię. Miałem podobnie jak ty, szczególnie pod jakimś obciążeniem jak gry. Podejrzewałem leciwy HDD chociaż siedziały na nim tylko gry, a system na SSD. Wymieniłem SSD na większy, bo i tak potrzebowałem oraz wymieniłem dysk HDD, bo podejrzewałem, że lada dzień umrze z racji wieku i wszystko się uspokoiło. Jak masz możliwość to radzę zamrozić sobie pieniądze i zamówić najtańszy, najmniejszy dysk i sprawdź jak będzie funkcjonował.
  • #25
    Vikey
    Level 3  
    Wentylatory pracują wydajnie, temperatury mam niskie (50-54 na procesorze w trakcie grania w to całkiem dobry wynik) a że mam komputer ze szklanym panelem, to widzę że kurz tam nie zalega i niczego nie blokuje. Przegrzewanie się na 100% nie jest przyczyną, bo komputer męczony stress-testami nie wywalił się ani razu, a zuzycie i temperatury podzespołów były znacznie wyższe niż normalnie.

    Mam SSD na system + podstawowe pliki i HDD na całą resztę, badałem HDD na obecność bad sectorów i innych błędów i nie wykryło żadnych uchybień. Nie sądzę, by to dysk był winny bo w podglądzie zdarzeń wyświetla się "rdzeń procesora"
  • #26
    Abdonay
    Level 2  
    Ja też nie miałem bad sectorów, ale pisałem wtedy inżynierkę i bałem się każdego dnia, że mi dysk umrze i panicznie robiłem backupy :P
    Tak sobie będę teoretyzować i na tym skończę pewnie swój wkład w ten problem. Jeśli benchmarki nie stress-testują dysków o zapis i odczyt, a cpu, gpu, ram i nie wywalają systemu to strzelałbym, że to nie jednak wina żadnego z nich. Niech komunikaty niech sobie będą jakie są, ja ci tylko mówię, że miałem kropka w kropkę przypadek jak twój i to na 99.99% HDD robił problemy. Pomimo, że jak wspomniałem wcześniej system był na SSD.

    edit: możemy sobie tak gdybać co i jak, moja sytuacja była podobna do twojej. ostatecznie nie pozostało ci nic innego jak testować różne konfiguracje i zobaczyć kiedy nie wywala - wtedy winowajca się znajdzie. Pozdrawiam
  • #27
    krzysiozak
    Level 39  
    Vikey wrote:
    Wentylatory pracują wydajnie, temperatury mam niskie (50-54 na procesorze w trakcie grania w to całkiem dobry wynik) a że mam komputer ze szklanym panelem, to widzę że kurz tam nie zalega i niczego nie blokuje. Przegrzewanie się na 100% nie jest przyczyną, bo komputer męczony stress-testami nie wywalił się ani razu, a zuzycie i temperatury podzespołów były znacznie wyższe niż normalnie.


    Chodzi mi o wentylator zasilacza, Jak napięcia się mają podczas za wiechy.