logo elektroda
logo elektroda
X
logo elektroda
REKLAMA
REKLAMA
Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Wystąpił skorygowany błąd sprzętowy - o tyle o ile...

wlw_wl 01 Lut 2011 21:53 7703 11
REKLAMA
  • #1 9089718
    wlw_wl
    Poziom 38  
    Posty: 4327
    Pomógł: 208
    Ocena: 148
    Witam,

    takie rzeczy poznajdowałem:
    Cytat:
    Nazwa dziennika:System
    Źródło: Microsoft-Windows-WHEA-Logger
    Data: 2011-02-01 21:23:20
    Identyfikator zdarzenia:19
    Kategoria zadania:Brak
    Poziom: Ostrzeżenia
    Słowa kluczowe:
    Użytkownik: USŁUGA LOKALNA
    Komputer: Kośmita-PC
    Opis:
    Wystąpił skorygowany błąd sprzętowy.

    Zgłoszone przez składnik: rdzeń procesora

    Źródło błędu: Skorygowane sprawdzenie komputera
    Typ błędu: Błąd buforu translacji równoległej
    Identyfikator procesora: 3


    Widok szczegółów tego wpisu zawiera dodatkowe informacje.
    Kod XML zdarzenia:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-WHEA-Logger" Guid="blablabla" />
        <EventID>19</EventID>
        <Version>0</Version>
        <Level>3</Level>
        <Task>0</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2011-02-01T20:23:20.814269100Z" />
        <EventRecordID>315490</EventRecordID>
        <Correlation ActivityID="blebleble" />
        <Execution ProcessID="1332" ThreadID="2900" />
        <Channel>System</Channel>
        <Computer>Kośmita-PC</Computer>
        <Security UserID="S-1-5-19" />
      </System>
      <EventData>
        <Data Name="ErrorSource">1</Data>
        <Data Name="ApicId">3</Data>
        <Data Name="MCABank">1</Data>
        <Data Name="MciStat">0x9400000000000012</Data>
        <Data Name="MciAddr">0xf8800705fce0</Data>
        <Data Name="MciMisc">0x0</Data>
        <Data Name="ErrorType">8</Data>
        <Data Name="TransactionType">0</Data>
        <Data Name="Participation">256</Data>
        <Data Name="RequestType">256</Data>
        <Data Name="MemorIO">256</Data>
        <Data Name="MemHierarchyLvl">2</Data>
        <Data Name="Timeout">256</Data>
        <Data Name="OperationType">256</Data>
        <Data Name="Channel">256</Data>
        <Data Name="Length">928</Data>
        <Data Name="RawData">mnóstwo cyferek i literek</Data>
      </EventData>
    </Event>

    Jest takich ostrzeżeń dużo. Jedno co minutę (co do sekundy).
    Z tego co ja zrozumiałem, czwarty rdzeń (trzeci?) procesora sypie błędami, ale są one od razu korygowane.
    Męczyłem procesor OCCT dopóki się nie zagotował (20 minut), błędów nie pokazał.

    Pytania:
    - czy się przejmować?
    - zastosować inne testy procesora?
    - błąd nie zostanie skorygowany = BSOD?
  • REKLAMA
  • REKLAMA
  • #3 9090384
    wlw_wl
    Poziom 38  
    Posty: 4327
    Pomógł: 208
    Ocena: 148
    Jestem zapoznany, ale nie wiem - jakie dane mam uzupełnić?
    Sprzęt jaki jest to napisane.
    System Windows 7 x64 Pro, ale to raczej "nic nie wnosi".
    Jeśli chodzi o zawarcie w tytule informacji to, poza opisem błędu, już się nic czytelnego nie zmieści.
  • #4 9090447
    DriverMSG
    VIP Zasłużony dla elektroda
    Posty: 44094
    Pomógł: 3984
    Ocena: 4833
    wlw_wl napisał:
    System Windows 7 x64 Pro, ale to raczej "nic nie wnosi"


    Owszem, to dość ważne, gdyż nie znam systemu który generuje logi:

    Cytat:
    <Provider Name="Microsoft-Windows-WHEA-Logger" Guid="blablabla" />
    Correlation ActivityID="blebleble" />
    <Data Name="RawData">mnóstwo cyferek i literek</Data>


    Więc, mając powyższe informacje, trudno będzie pomóc.

    Warto też napisać, że całość znajduje się na sprzęcie opisanym w podpisie.
    Mamy zgadywać, gdzie i w czym robisz testy?
  • Pomocny post
    #5 9090577
    WojtasJD
    Poziom 43  
    Posty: 13764
    Pomógł: 2908
    Ocena: 1573
    Cytat:
    Typ błędu: Błąd buforu translacji równoległej

    czyli sławny niegdyś :wink: http://en.wikipedia.org/wiki/Translation_lookaside_buffer

    http://www.overclock.net/amd-cpus/656841-phenom-ii-x2-555-a-15.html

    Jeśli chodzi o odblokowany CPU z podpisu to od razu się nasuwa pytanie czy przed, też sypał błędami. (ew. sprawdź teraz)
  • REKLAMA
  • #6 9091735
    wlw_wl
    Poziom 38  
    Posty: 4327
    Pomógł: 208
    Ocena: 148
    Tak, tyczy się to sprzętu podanego w podpisie, czyli konkretnie Phenom II x2 550 BE odblokowany na Phenom II x4 B50, nie podkręcony aktualnie.

    Na dwóch rdzeniach i to podkręconych na granicę stabilności, nie ma żadnych błędów. Spróbuję odblokować na 4 rdzenie i wyłączyć ten, z którego pochodzą błędy. Tylko czy to jest trzeci czy czwarty (indeksowanie od 0)...?

    Sławny owszem niegdyś bug w TLB dotyczył Phenoma "jedynki", była jakaś aplikacja pisząca po rejestrach i w swoim czasie ją testowałem, ale mój procesor miał ustawione wszystko jak trzeba i nie wymagał poprawek.

    Zgłębiłem swoją wiedzę na temat TLB i obsługi błędów, z tego co rozumiem, jedynym skutkiem ubocznym jest tzw. overhead, związany z poprawianiem tego błędu przez system operacyjny. Ciekawe jaki to niesie ze sobą spadek wydajności, czy w ogóle mierzalny...

    Proszę bardzo, świeżutki pełny log:
    Nazwa dziennika:System
    Źródło:        Microsoft-Windows-WHEA-Logger
    Data:          2011-02-02 12:37:04
    Identyfikator zdarzenia:19
    Kategoria zadania:Brak
    Poziom:        Ostrzeżenia
    Słowa kluczowe:
    Użytkownik:    USŁUGA LOKALNA
    Komputer:      Kośmita-PC
    Opis:
    Wystąpił skorygowany błąd sprzętowy.
    
    Zgłoszone przez składnik: rdzeń procesora
    Źródło błędu: Skorygowane sprawdzenie komputera
    Typ błędu: Błąd buforu translacji równoległej
    Identyfikator procesora: 3
    
    Widok szczegółów tego wpisu zawiera dodatkowe informacje.
    Kod XML zdarzenia:
    <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
      <System>
        <Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{C26C4F3C-3F66-4E99-8F8A-39405CFED220}" />
        <EventID>19</EventID>
        <Version>0</Version>
        <Level>3</Level>
        <Task>0</Task>
        <Opcode>0</Opcode>
        <Keywords>0x8000000000000000</Keywords>
        <TimeCreated SystemTime="2011-02-02T11:37:04.188981200Z" />
        <EventRecordID>316312</EventRecordID>
        <Correlation ActivityID="{C66ACBF6-1317-4CF8-98D5-3DCDC4A73D5B}" />
        <Execution ProcessID="1336" ThreadID="1820" />
        <Channel>System</Channel>
        <Computer>Kośmita-PC</Computer>
        <Security UserID="S-1-5-19" />
      </System>
      <EventData>
        <Data Name="ErrorSource">1</Data>
        <Data Name="ApicId">3</Data>
        <Data Name="MCABank">1</Data>
        <Data Name="MciStat">0x9400000000000012</Data>
        <Data Name="MciAddr">0x70edf7b0</Data>
        <Data Name="MciMisc">0x0</Data>
        <Data Name="ErrorType">8</Data>
        <Data Name="TransactionType">0</Data>
        <Data Name="Participation">256</Data>
        <Data Name="RequestType">256</Data>
        <Data Name="MemorIO">256</Data>
        <Data Name="MemHierarchyLvl">2</Data>
        <Data Name="Timeout">256</Data>
        <Data Name="OperationType">256</Data>
        <Data Name="Channel">256</Data>
        <Data Name="Length">928</Data>
        <Data Name="RawData">
    435045521002FFFFFFFF03000200000002000000A00300000
    3250B0002020B140000000000000000000000000000000000
    000000000000000000000000000000BDC407CF89B7184EB3C
    41F732CB57131B18BCE2DD7BD0E45B9AD9CF4EBD4F8900EE
    992D2CBC2CB01000000000000000000000000000000000000
    00000000000058010000C00000000102000001000000ADCC7
    698B447DB4BB65E16F193C4F3DB0000000000000000000000
    0000000000020000000000000000000000000000000000000
    00000000018020000800000000102000000000000B0A03EDC
    44A19747B95B53FA242B6E1D0000000000000000000000000
    0000000020000000000000000000000000000000000000000
    00000098020000080100000102000000000000011D1E8AF94
    257459C33565E5CC3F7E80000000000000000000000000000
    0000020000000000000000000000000000000000000000000
    00077010000000000000002020000020000420F1000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000030000000000000000000000000000000000
    0000000000000000000000000000000000000000000007000
    000000000000300000000000000420F100000080403092080
    00FFFB8B17000000000000000000000000000000000000000
    000000000000000000000000035B506FC1F5E62459F250A3B
    9ADB63C303000000000000009D00800000000000B0F7ED70
    0000000000000000000000000000000000000000000000000
    00000000100000002000000CB341383CDC2CB01030000000
    0000000000000000000000000000000010000001200000000
    000094B0F7ED7000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000000
    0000000000000000000000000000000000000000000000
    </Data>
      </EventData>
    </Event>

    Poprzednio usunąłem żeby nie zostawić nic wrażliwego, ale skoro potrzebne to proszę. PINu tam nie widzę ;)
  • #7 9091789
    intels
    Poziom 19  
    Posty: 446
    Pomógł: 21
    Ocena: 51
    Zapewne rdzeń który odblokowaleś jest po prostu uszkodzony.Tak już jest raz się uda a raz nie:)
  • #8 9091903
    wlw_wl
    Poziom 38  
    Posty: 4327
    Pomógł: 208
    Ocena: 148
    Zagadka właśnie w tym, że nie ma z nim żadnych problemów.
    Puszczałem OCCT, SuperPI (chociaż b. słabo obciąża u mnie CPU), 3dSmarki i inne wynalazki, 0 problemów. Tylko system krzyczy to co wyżej.

    ED:
    Zgodnie z przypuszczeniami rdzenie są numerowane od 0
    Po wyłączeniu czwartego rdzenia komunikatów o błędach TLB brak.

    Dodatkowe info o ustawieniach BIOSu:
    Spread Spectrum [Auto]
    CnQ [Enabled]
    C1E [Disabled]
    L3 Allocation [Auto]

    Niby błędy nie wydają się poważne, ale ich ilość - 2850 w ciągu kilku dni (co minutę błąd) - trochę mnie martwi. Tak więc pytanie jest takie jak wcześniej: czy się tymi błędami przejmować, czy można je spokojnie zignorować?
  • #9 9094694
    intels
    Poziom 19  
    Posty: 446
    Pomógł: 21
    Ocena: 51
    Spróbuj ustawić koligacje procka na rdzeń który powoduje problemy i wtedy go katować a zrobisz to wchodząc w menadżera zadań i tam na procesie np.OCCT ustawiasz koligacje odznacz wszystkie rdzenie prócz tego który powoduje problemy jeżeli wszystko będzie Ok to raczej nie powinno być więcej problemów.A jeżeli chodzi o sam system to próbowałeś innego może to on sprawia te problemy.
  • REKLAMA
  • #10 9094734
    wlw_wl
    Poziom 38  
    Posty: 4327
    Pomógł: 208
    Ocena: 148
    OCCT obciąża wszystkie rdzenie na 100%, więc bardziej się go obciążyć już nie da, koligacja jedynie spowoduje odciążenie pozostałych rdzeni.
    Próbowałem zostawiać ten "wadliwy" rdzeń włączony a wyłączać pozostałe, żeby zmniejszyć temperaturę (na trzech rdzeniach nie przekracza 56°, na czterech przerywałem test przy 64°) - błędów brak.
    Jedyna wskazówka, że coś może być nie tak, to powyższe ostrzeżenia TLB miss.

    Systemu innego nie posiadam - miałem XP ale nie przetrwał zmiany płyty głównej - ale obawiam się, że starszy radziłby sobie z tym co najwyżej na równi. Prawdopodobnie gorzej.
  • #11 9094771
    intels
    Poziom 19  
    Posty: 446
    Pomógł: 21
    Ocena: 51
    O ile nie przeszkadzają Ci te błędy i nie destabilizuje to systemu to powinno być wszystko Ok no ale jednak coś ten rdzeń robi nie tak i oby to kiedyś czegoś nie pogorszyło.
  • #12 9464406
    wlw_wl
    Poziom 38  
    Posty: 4327
    Pomógł: 208
    Ocena: 148
    Sprawa wyjaśniła się po czasie i sam sobie odpowiem na swoje pytanie:

    Dopóki błędy zostają skorygowane - wszystko jest w porządku.

    Jeśli jednak błąd nie zostanie skorygowany - BSOD 0x124 WHEA_UNCORRECTABLE_ERROR (w moim przypadku konkretnie jest to DCACHEL1_DRD_ERR - błąd pamięci podręcznej pierwszego poziomu - Cache L1).

    Rdzeń z takim uszkodzeniem pamięci podręcznej nie nadaje się niestety do użytku.

    Dziękujemy, zamykamy.

Podsumowanie tematu

✨ Użytkownik zgłosił problem z błędami sprzętowymi związanymi z procesorem Phenom II x2 550 BE, który został odblokowany na Phenom II x4 B50. Błędy dotyczące TLB (Translation Lookaside Buffer) były generowane przez system Windows 7 x64 Pro, a użytkownik zauważył, że po wyłączeniu jednego z rdzeni, błędy przestały się pojawiać. W dyskusji poruszono również kwestie związane z obciążeniem rdzeni, stabilnością systemu oraz wpływem błędów na wydajność. Użytkownik ostatecznie stwierdził, że dopóki błędy są skorygowane, system działa poprawnie, jednak uszkodzony rdzeń z błędami pamięci podręcznej L1 może prowadzić do BSOD 0x124 WHEA_UNCORRECTABLE_ERROR.
Wygenerowane przez model językowy.
REKLAMA