REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji

kaleron 22 Paź 2023 20:59 7671 57

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

Autor tematu Pozytywne oceny Pomocny post? (+29)

Post #1
20781145 22 Paź 2023 20:59

Ten artykuł powstał w odpowiedzi na propozycję kolegi @TechEkspert i jest rozwinięciem mojej prezentacji przedstawionej na konferencji The H@ck Summit w dniu 20 października 2023 r. Samą prezentację możesz pobrać stąd:
Wyrzucamy algorytm Gutmanna do kosza

Podstawowe informacje o niszczeniu danych

Poprawne usuwanie danych jest ważnym, aczkolwiek często zaniedbywanym i słabo rozumianym aspektem bezpieczeństwa informacji. Konieczność bezpiecznego, nieodwracalnego usuwania danych w taki sposób, aby nie mogły one zostać odzyskane przez inne osoby może wynikać z wielu przyczyn. Często jest ona regulowana przez przepisy prawne, takie, jak RODO, czy przepisy o ochronie tajemnicy państwowej lub zobowiązujące do ochrony pewnych kategorii informacji także podmioty prywatne. Może też wynikać z umów i porozumień regulujących warunki współpracy i określających zakres tajemnic handlowych. A czasem bez żadnego obowiązku chcemy chronić nasze interesy oraz prywatność i nie życzymy sobie, by ktoś postronny wiedział o nas wszystko. Usuwanie danych ma też swoją ciemną stronę w postaci ukrywania i niszczenia cyfrowych dowodów przestępstw, co również można robić mądrze i skutecznie lub głupio i nieudolnie.

W artykule tym odnoszę się do publikacji Petera Gutmanna „Secure Deletion of Data from Magnetic and Solid-State Memory” zaprezentowanej na konferencji “USENIX” w lipcu 1996 r. Publikację tę uzupełnioną o późniejsze epilogi możesz znaleźć tutaj:
Secure Deletion of Data from Magnetic and Solid-State Memory

Jest to najczęściej cytowana publikacja w kontekście nadpisywania danych i podstawa jednego z najpopularniejszych algorytmów niszczenia informacji. W niektórych środowiskach praca Petera Gutmanna urosła do rangi dogmatu religijnego, a on sam jest postrzegany, jako niekwestionowalny autorytet. Tym niemniej publikacja ta zawiera szereg tez i założeń budzących wątpliwości, czy jej Autor na pewno dobrze rozumie działanie dysków twardych oraz fizykę przechowywania informacji. I właśnie na tych fragmentach skupimy się dalej.

Rodzaje nośników danych

Nośniki danych możemy klasyfikować na wiele sposobów. W szczególności możemy je podzielić na analogowe i cyfrowe. Cyfrowym nośnikiem danych jest taki nośnik, który przechowuje informację w sposób możliwy do zrozumienia przez maszyny, jako ciąg stanów logicznych interpretowanych jako zera i jedynki. Pozostałe nośniki danych nazywamy nośnikami analogowymi. Jednak i w przypadku nośników cyfrowych podstawą określania stanów logicznych są pewne analogowe stany fizyczne digitalizowane w procesach kodowania i dekodowania. Sam proces interpretacji stanów fizycznych jako określone stany logiczne wynika z przyjętej konwencji.

Najczęściej przyjmowanym kryterium klasyfikacji nośników danych są właśnie zjawiska fizyczne leżące u podstawy interpretacji ich jako stanów logicznych. Ze względu na technologię przechowywania danych możemy wyróżnić nośniki:

magnetyczne:
– dyski twarde,
– dyskietki,
– taśmy magnetyczne,

optyczne:
– CD,
– DVD,
– Blu-Ray,
– HD-DVD,

półprzewodnikowe:
– SSD,
– pendrivy,
– karty pamięci,
– pamięci wbudowane (eMMC, MCP...),

rezystywne:
– PCRAM,
– MRAM,
– ReRAM.
– NanoRAM,

papierowe:
– karty perforowane.
– taśmy perforowane.

Z punktu widzenia niszczenia informacji istotna jest klasyfikacja nośników danych na nieulotne (energoniezależne, zdolne do długotrwałego, wieloletniego przechowywania danych także bez podłączenia do źródła zasilania) i ulotne (wymagające dla podtrzymania stanów logicznych ciągłego podawania zasilania). Do tych ostatnich należą pamięci typu DRAM i SRAM. W przypadku nośników ulotnych dla nieodwracalnego usunięcia danych wystarczy na chwilę odłączyć zasilanie. Wówczas tracą one stany logiczne i dlatego dalej nie będziemy się nimi zajmować.

Nośniki danych można podzielić także na nośniki jednokrotnego i wielokrotnego zapisu. Nośniki jednokrotnego zapisu można zapisać tylko raz. Później nie można zmieniać ich zawartości. Najbardziej typowym przykładem nośników jednokrotnego zapisu są płyty CD-ROM i DVD-ROM. W przypadku tej kategorii nośników nie jest możliwe zniszczenie ich zawartości przez zastąpienie jej inną zawartością i dla usunięcia informacji konieczne jest fizyczne zniszczenie nośnika. Natomiast w przypadku nośników wielokrotnego zapisu ich zawartość może być zmieniana jeśli nawet nie dowolną, to bardzo dużą liczbę razy, co pozwala na wykorzystanie nadpisywania danych jako metody niszczenia informacji.

Standardy regulujące niszczenie danych

Niszczenie danych jest regulowanie różnymi standardami opracowywanymi przez różne instytucje rządowe, wojskowe i naukowe. Standardy te opisują różne metody i w różny sposób klasyfikują informacje, które powinny być zniszczone, często nakazując stosowanie różnych metod niszczenia danych w zależności od zawartości nośników. Jeśli jednak uświadomimy sobie, że interpretacja danych odbywa się na poziomie struktur logicznych systemów plików i oprogramowania, z łatwością zrozumiemy, że treść danych nie ma żadnego wpływu na proces ich niszczenia. Z punktu widzenia nośnika danych i fizyki zapisu nie ma żadnej istotnej różnicy pomiędzy różnymi strumieniami zer i jedynek, niezależnie od tego, jak je interpretujemy na poziomie logicznym i jakie subiektywne znaczenie im przypisujemy.

Standardy opisujące niszczenie danych zawierają wiele rozbieżności w różny sposób oceniając skuteczność różnych metod niszczenia danych. W niektórych przypadkach zalecane są procedury obejmujące kilkuetapowe niszczenie danych z użyciem różnych metod. Takie podejście jest też popularne w wielu procedurach wewnętrznych opartych na różnych standardach, co niekiedy podyktowane jest koniecznością zapewnienia zgodności z wieloma regulacjami. Szczegółowa lektura standardów pozwala zauważyć wiele momentów, w których można mieć wątpliwości, co do poziomu zrozumienia przez ich autorów działania nośników danych, a niektóre zalecenia wręcz wyglądają na przepisane wprost z przepisów regulujących niszczenie dokumentów papierowych, jednak taka analiza zaleceń zawartych w poniższych standardach wykracza poza ramy tego artykułu. Poniżej znajdziesz listę najpopularniejszych i najczęściej wykorzystywanych standardów opisujących niszczenie danych:

1. AFSSI-5020 (Air Force System Security Instruction 5020),
2. CSEC ITSG-06 (Communication Security Establishment Canada, Information Technology Security Guide - 06)
3. HMG-IS5 (Her/His Majesty Government Infosec Standard 5)
4. IEEE 2883-2022 (Institute of Electrical and Electronics Engineers, Standard for Sanitizing Storage),
5. NAVSO P-5239-26 (Navy Staff Office Publication 5239-26, Information Systems Security Program Guidelines),
6. NISPOM DoD 5220.22-M (National Industrial Security Program Operating Manual, Departament of Defence 5220.22-M),
7. NIST SP 800-88 (National Institute of Standards and Technology, Guidelines for Media Sanitization),
8. NSCS-TG-025 (National Computer Security Center, Technical Guidelines 025, A Guide to Understanding Data Remanence in Automated Information Systems),
9. RCMP TSSIT OST-II (Royal Canadian Mounted Police, Media Sanitation of the Technical Security Standards for Information Technology),
10. VSITR (Verschlusssachen IT Richtlinien),
11. ГОСТ Р50739—95 (Средства вычислительной техники. Защита от несанкционированного доступа к информации. Общие технические требования),

Metody niszczenia danych

Wskazane wyżej standardy w różny sposób klasyfikują metody niszczenia danych, jednak z technicznego punktu widzenia oraz przyświecającego nam celu istotny jest podział tych metod na skuteczne i nieskuteczne. Metodę niszczenia danych możemy uważać za skuteczną, jeśli po jej zastosowaniu odzyskanie danych jest niemożliwe zarówno przy użyciu znanych i dostępnych metod odzyskiwania danych, jak i metod, jakie potencjalnie mogłyby być opracowane w przyszłości. Pozostałe metody, pozostawiające choćby tylko teoretyczne możliwości odzyskania danych, są metodami nieskutecznymi.

Przyjmując taką definicję skuteczności metod niszczenia danych możemy wyciągnąć dwa praktyczne wnioski pozwalające zoptymalizować procedury niszczenia danych. Po pierwsze możemy odrzucić jako zbędny wysiłek i koszt wszystkie nieskuteczne metody niszczenia danych, gdyż nie przyczyniają się one do osiągnięcia celu. Po drugie, możemy ograniczyć procedurę do jednej wybranej metody skutecznej, ponieważ jest ona wystarczająca dla zniszczenia danych. Przy takim podejściu możemy się skupić na identyfikacji skutecznych metod niszczenia informacji dla danych kategorii nośników. Musimy pamiętać o tym, że skuteczność metod niszczenia danych może się różnić w zależności od technologii wykorzystanej do przechowywania informacji. Np. demagnetyzacja może być skuteczna w stosunku do nośników magnetycznych, ale nie zadziała w stosunku do nośników półprzewodnikowych lub optycznych.

Metody niszczenia danych dzieli się też na sprzętowe (fizyczne) i programowe (logiczne). Metody sprzętowe polegają na takim oddziaływaniu na nośniki, by uniemożliwić odczytanie ich zawartości. Jednak musimy zwrócić uwagę na to, że niszczenie, czy uszkadzanie nośnika nie jest tożsame z niszczeniem informacji i dlatego nie każde uszkodzenie dysku uniemożliwia odzyskanie danych. Wręcz przeciwnie, firmy specjalizujące się w odzyskiwaniu danych często odzyskują informacje z nośników uszkodzonych sprzętowo, także celowo z zamiarem zniszczenia ich zawartości, a w wielu przypadkach, dla których nie opracowano praktycznych metod odzyskiwania danych, istnieją podstawy teoretyczne pozwalające na stworzenie takich metod w przyszłości.

Z kolei programowe metody ukierunkowane są na zniszczenie samej informacji bez konieczności uszkadzania nośnika. W odróżnieniu od metod fizycznych, pozwalają na selektywne niszczenie wybranych danych bez konieczności zniszczenia całej zawartości nośnika. Metody te sprowadzają się do destrukcji danych przez ich zastąpienie inną zawartością, a więc do nadpisania. Jeśli nie dojdzie do nadpisania danych, a jedynie do usunięcia metadanych opisujących te dane w strukturach logicznych systemu plików, sama informacja jest odzyskiwalna.

Wciąż jednak podnoszone są wątpliwości co do możliwości odzyskania nadpisanych danych. Kontrowersje najczęściej dotyczą wymaganej liczby przebiegów nadpisywania niezbędnych do prawidłowego zniszczenia danych. Niekiedy zwraca się też uwagę na używane wzorce nadpisujące. Wątpliwości te często są podsycane przez materiały marketingowe mające na celu skłonienie użytkowników do wyboru konkretnej metody lub narzędzia niszczenia danych, zazwyczaj przez zdyskredytowanie rozwiązań alternatywnych.

Koncepcje metod mających na celu umożliwienie odzyskiwania nadpisanych danych pojawiły się na przełomie lat '80 i '90 ubiegłego wieku. Wówczas podjęto szereg badań ukierunkowanych przede wszystkim na odtwarzanie poprzedniego stanu namagnesowania warstwy magnetycznej z wykorzystaniem mikroskopii sił magnetycznych, wśród których na szczególną uwagę zasługują prace zespołu kierowanego przez Romla Gomeza. Mniejszą popularnością cieszyły się oscyloskopowe badania sygnału przechwytywanego z bloku głowic magnetycznych. Artykuł Petera Gutmanna jest swego rodzaju podsumowaniem prac przeprowadzonych pod koniec lat '80 i w pierwszej połowie lat '90 XX wieku oraz propozycją rozwiązania pozwalającego rozwiać wątpliwości co do skuteczności nadpisywania danych.

Do fizycznych metod niszczenia danych należą metody:
– mechaniczne (od uderzania młotkiem i rozwiercania po rozdrabnianie nośników specjalnymi zmielarkami),
– termiczne (od wrzucania do ogniska i wygrzewania w piekarniku po przetapianie w piecach hutniczych),
– chemiczne (oddziaływanie na nośnik różnymi środkami chemicznymi),
– demagnetyzacja (oddziaływanie na nośnik polem magnetycznym),
– indukcyjne (wykorzystują różnego rodzaju promieniowanie, np. UV, jonizujące, mikrofalowe),
– pirotechniczne (wykorzystują materiały pirotechniczne i wybuchowe).

Metody programowe, to:
– wyrzucanie plików do kosza systemowego (czyli przeniesienie do specjalnego katalogu, metoda w oczywisty sposób nieskuteczna),
– kasowanie na poziomie metadanych systemu plików (możliwości odzyskania danych zależą od wielu czynników, np. od rodzaju nośnika i działania funkcji TRIM),
– formatowanie partycji (skuteczność zależy od sposobu formatowania, a także od rodzaju nośnika, rozwiązań oprogramowania układowego, obsługi TRIM itd.),
– nadpisywanie (jedno- lub wieloprzebiegowe z zastosowaniem różnego rodzaju wzorców nadpisujących – o tym jest ten artykuł),
– Secure Erase (procedura oczyszczania nośnika implementowana na poziomie oprogramowania układowego),
– Block Erase (procedura kasowania fizycznych bloków implementowana w oprogramowaniu układowym nośników półprzewodnikowych).

W dalszej części skupimy się na skuteczności nadpisywania danych jako metody niszczenia informacji zapisanej na dyskach twardych, gdyż właśnie to zagadnienie stanowi zasadniczą część rozważań zawartych w artykule Petera Gutmanna. Odniosę się do wybranych fragmentów tego artykułu wskazujących na niedostatecznie zrozumienie przez Autora pewnych zagadnień i prowadzących do wyciągnięcia błędnych wniosków. Zwrócę też uwagę na pewne mocno naciągane tezy wykorzystane jako uzasadnienie konieczności wielokrotnego nadpisywania danych dla zapewnienia skuteczności tej metody.

Co Peter Gutmann napisał o...

Bit w zapisie magnetycznym

„... when a one is written to disk the media records a one, and when a zero is written the media records a zero. However the actual effect is closer to obtaining a 0.95 when a zero is overwritten with a one, and a 1.05 when a one is overwritten with a one.”

„... gdy na dysk zapisana jest jedynka, nośnik rejestruje jedynkę, a gdy zapisywane jest zero, nośnik rejestruje zero. Jednakże rzeczywisty efekt jest bliższy uzyskaniu 0,95 w przypadku nadpisania zera jedynką i 1,05 w przypadku nadpisania jedynki jedynką.”

Żeby się odnieść do tego założenia, musimy wiedzieć, co fizycznie jest bitem w zapisie magnetycznym. Jaki stan fizyczny oznacza logiczne zero, a jaki – jedynkę. Aby to zrozumieć, przyjrzyjmy się najpierw sposobowi odczytu z nośników magnetycznych.

Dane z nośników magnetycznych odczytywane są przez głowice unoszące się nad namagnesowaną powierzchnią (w przypadku dysków twardych) lub przesuwające się po niej (w przypadku taśm magnetycznych, dyskietek i niektórych modeli najstarszych, zabytkowych dysków twardych z początkowego okresu funkcjonowania konstrukcji tego typu). Przemieszczająca się pod głowicą namagnesowana powierzchnia indukuje przebieg elektryczny. Impulsy w tym przebiegu indukowane są przez zmienne pole magnetyczne. I to właśnie te impulsy są interpretowane jako logiczne jedynki. Natomiast logicznym zerem jest brak takiego impulsu.

Cóż więc jest obszarem o stałym i zmiennym polu magnetycznym? W każdym ciele wykazującym właściwości magnetyczne możemy wyodrębnić obszary o jednorodnym namagnesowaniu – domeny magnetyczne. Domeny te są od siebie odseparowane ścianami domenowymi – obszarami, w których odwraca się wektor polaryzacji namagnesowania. I to właśnie te ściany są obszarami o zmiennym namagnesowaniu indukującymi impulsy oznaczające logiczne jedynki, a same domeny – obszarami o stałym namagnesowaniu.

Zapis magnetyczny polega na nadawaniu nośnikowi określonego pożądanego uporządkowania namagnesowania powierzchni. W tym procesie domeny mogą odwracać swoją polaryzację, ale także zmieniać swoje rozmiary. Ściany domenowe mogą się przesuwać, zanikać lub mogą powstawać nowe ściany domenowe skutkując wyodrębnieniem nowych domen. Żeby mówić o nadpisaniu logicznej jedynki inną jedynką, po przemagnesowaniu powierzchni ściana domenowa musiałaby się znaleźć dokładnie w tym samym miejscu, w którym w poprzednim namagnesowaniu była inna ściana domenowa. Dlatego w praktyce nie ma możliwości jednoznacznego stwierdzenia, że logiczną jedynką została nadpisana jedynka lub zero.

Poprzednia polaryzacja namagnesowania może mieć wpływ na kształt i szerokość ścian domenowych, a tym samym i na kształt indukowanych przez nie impulsów. Zagadnienie to zostało szczegółowo opisane przez Serhija Kożenewskiego w książce „Перезапись Информации”. Jednak gdybyśmy chcieli odzyskiwać w ten sposób nadpisane dane, to nie poprzednia polaryzacja namagnesowania domen powinna nas interesować, a poprzednie rozmieszczenie ścian domenowych. Wyniki opisanych badań oscyloskopowych nie wskazują, by ustalenie z dostateczną dokładnością rozmieszczenia ścian domenowych w/g stanu sprzed nadpisania było możliwe.

Ponadto nie możemy zapominać i o innych czynnikach wpływających na wysokość amplitud impulsów. W dużym stopniu zależy ona od odległości między ścianami domenowymi. Im bliżej siebie się one znajdują, tym niższe będą indukowane przez nie amplitudy sygnału. Odchylenia zależą też od lokalnych właściwości powierzchni magnetycznej i stanu struktury krystalicznej. Na stan namagnesowania powierzchni oraz parametry odczytywanego sygnału wpływają także zewnętrzne pola magnetyczne oraz wahania temperatury i napięć zasilających dysk twardy.

W przypadku zapisu prostopadłego bardzo istotnym źródłem zakłóceń jest warstwa miękka magnetycznie (SUL – Soft Underlayer) służąca zamknięciu linii pola indukowanego przez głowicę zapisującą. Wprawdzie w czasach, kiedy powstawał artykuł Gutmanna w dyskach twardych wykorzystywano wyłącznie zapis równoległy, jednak współcześnie wszystkie dyski twarde wykorzystują zapis prostopadły Odfiltrowanie wpływu wskazanych wyżej czynników na przebieg sygnału w celu wyizolowania zakłóceń wynikających wyłącznie z poprzedniego stanu namagnesowania jest tym trudniejsze, że część z tych czynników zależy od niemożliwych do wiernego odtworzenia warunków zewnętrznych.

Kodowanie danych w dyskach twardych

Powyższy, ale też i kolejne cytaty z artykułu Petera Gutmanna, wskazują, że może on nie rozumieć procesu kodowania danych w dyskach twardych. W zasadzie z całej jego publikacji można odnieść wrażenie, że dane są zapisywane na dysku w surowej, nieprzetworzonej sekwencji zer i jedynek podawanej na interfejs dysku przez komputer. Jest to o tyle dziwne, że równocześnie sam wspomina o różnych metodach kodowania danych, a nawet stara się dopasować do nich wzorce nadpisujące swojego algorytmu.

W rzeczywistości dane zapisywane na dysku są danymi zakodowanymi, które w ogóle nie przypominają strumienia danych wejściowych. Ponieważ dane na każdym etapie przetwarzania i przechowywania są podatne na błędy i przekłamania, powszechnie stosowane są różnorodne zabezpieczenia w postaci sum kontrolnych i kodów korekcji (ECC – Error Correction Code). Także i w przypadku danych zapisywanych na dysku są one zabezpieczane odpowiednimi kodami korekcji. Szczegółowe rozwiązania ewoluowały w czasie, a także różnią się dla dysków poszczególnych producentów, jednak na nasze potrzeby wystarczająca jest świadomość tego, że takie kody występują oraz że przy zapisie dla zabezpieczenia zawartości są wyliczane i dołączane do każdego sektora dysku.

Dane zapisywane na dysku są także randomizowane. Celem randomizacji jest rozbijanie długich ciągów powtarzalnych symboli. Długie sekwencje takich samych symboli lub powtarzające się sekwencje symboli mogą przyczyniać się do występowania niekorzystnych zjawisk falowych w kanale zapisu i odczytu, jak fale stojące, odbicia fal, czy harmoniczne pasożytnicze. Mogą też powodować interferencje międzysymbolowe (ISI – Inter Symbol Interference) – przesunięcia pomiędzy poszczególnymi symbolami w strumieniu danych. A ponieważ ścieżki zapisywane na powierzchni talerza sąsiadują z innymi ścieżkami, występują pomiędzy nimi zakłócenia indukcyjne zwane interferencjami międzyścieżkowymi (ITI – Inter Track Interference). Randomizacja pozwala na ograniczenie wpływu tych zakłóceń.

Najważniejszym z naszego punktu widzenia etapem kodowania danych jest przygotowanie ich do zapisu na talerzu. Pierwszą metodą kodowania informacji stosowaną w dyskach twardych była metoda FM (od Frequency Modulation – modulacja częstotliwości). Polegała ona na zapisie impulsów sygnału zegarowego i umieszczaniu pomiędzy nimi bitów danych. Jeśli bit miał wartość „1”, pomiędzy impulsami zegarowymi pojawiał się dodatkowy impuls, a jeśli było to logiczne „0” - nie.

Była to metoda mało efektywna, w której bit o wartości „0” był kodowany jedną dłuższą domeną magnetyczną, a „1” - dwiema krótszymi. Z czasem podjęto próbę jej optymalizacji poprzez wprowadzenie metody MFM (Modified Frequency Modulation – modyfikowana modulacja częstotliwości), w której poprawiono gęstość zapisu poprzez ograniczenie liczby impulsów składowej zegarowej. Jednak prawdziwą rewolucję przyniosło kodowanie RLL (Run Lenght Limited), które pozwoliło na całkowitą eliminację składowej zegarowej oraz zwiększenie gęstości upakowania danych do kilku bitów na domenę magnetyczną.

Kodowanie RLL jest kodowaniem samotaktującym. Polega ono na tym, że pomiędzy poszczególnymi impulsami umieszcza się określoną liczbę zer wyliczaną przez układ dekodera na podstawie odległości pomiędzy tymi impulsami. Oznacza to, że jedna domena może kodować kilka bitów, przy czym liczba zer pomiędzy jedynkami zależy od długości domeny. Minimalną i maksymalną liczbę zer, jakie mogą wystąpić pomiędzy jedynkami określa się z uwzględnieniem czynników wpływających na częstotliwość sygnału (możliwe do uzyskania rozmiary stabilnych domen magnetycznych, prędkość obrotowa talerzy itd.), czułości głowic odczytujących oraz możliwości przetwarzania sygnału przez układ dekodera i korekcji błędów przez kody ECC tak, aby zminimalizować wystąpienie błędów odczytu lub rozsynchronizowania sygnału.

Jednocześnie ponieważ między dwoma ścianami domenowymi musi wystąpić domena magnetyczna, przy kodowaniu RLL nie mogą wystąpić kolejno dwie logiczne jedynki – zawsze muszą być one rozdzielone co najmniej jednym zerem. Ponieważ rzeczywiste dane rzadko spełniają ten warunek, muszą one być przeliczone z wykorzystaniem odpowiednich tablic. Dlatego też próba odzyskiwania dosłownie pojedynczych bitów jest niemożliwa, a próby odzyskiwania innych niewielkich porcji danych są utrudnione koniecznością odpowiedniego zaadresowania i zdekodowania tych fragmentów.

Więcej o kodowaniu danych możesz się dowiedzieć z książki twórcy kodu RLL Corneliusa (Keesa) Antoina Schouhammera Imminka „Codes for Mass Data Storage Systems”, a także Bane Vasicia i Erozana M. Kurtasa „Coding and signal processing for magnetic recording systems”. Jeśli chcesz się dowiedzieć więcej o procesie kodowania danych możesz też zainteresować się pracami Charlesa Sobeya w zakresie odzyskiwania danych niezależnie od dysku. Proces badań talerzy magnetycznych i dekodowania danych niezależnie od dysku opisuje również książka Izaaka Mayergoyza i Chuna Tse „Spin-stand Microscopy of Hard Disk Data”.

Minimalna jednostka adresacji

„...when data is written to the medium, the write head sets the polarity of most, but not all, of the magnetic domains. This is partially due to the inability of the writing device to write in exactly the same location each time, and partially due to the variations in media sensitivity and field strength over time and among devices.”

„...kiedy dane są zapisywane na nośniku, głowica zapisująca ustawia polaryzację większości, ale nie wszystkich, domen magnetycznych. Dzieje się tak częściowo ze względu na brak możliwości zachowania precyzji zapisu za każdym razem dokładnie w tym samym miejscu, a częściowo ze zmian w czułości nośnika i natężeniu pola w czasie i pomiędzy urządzeniami.”

Na podstawie tego, co już wiemy na temat kodowania danych, możemy wyciągnąć wniosek, że głowice w czasie pracy nie zapisują poszczególnych domen magnetycznych indywidualnie. Nie byłoby to spójne z systemem kodowania RLL, w którym liczba logicznych zer pomiędzy jedynkami determinowana jest przez odległość między kolejnymi ścianami domenowymi (długość domeny), a więc przy zapisie innych danych długości domen muszą ulegać zmianie.

Poza tym nie ma technicznej możliwości adresowania poszczególnych domen magnetycznych. Część powierzchni talerza jest przeznaczona na informacje niezbędne dla zapewnienia poprawnej pracy dysku. Do tej kategorii należą m. in. sektory serwo pozwalające na prawidłową identyfikację ścieżki oraz kontrolę trajektorii lotu głowicy nad jej środkiem, a także nagłówki sektorów umożliwiających ich poprawne zaadresowanie.

I to właśnie sektory (dawniej liczące 512 B, we współczesnym wariancie „Advanced Format” - 4 kB danych użytkownika) są minimalną jednostką adresowania. Aby się o tym przekonać, możesz zapoznać się ze standardami ATA i SCSI, które zostały opracowane w połowie lat '80 i od tego czasu są podstawowymi dokumentami opisującymi pracę dysków twardych oraz zapewniającymi ich kompatybilność. Wprawdzie standardy te przez dziesięciolecia ulegały ewolucji, ale nigdy nie przewidywały adresowania innych jednostek, niż sektory.

I tak właśnie pracują dyski. Nawet, jeśli chcemy zmienić pojedynczy bit danego sektora, wymaga to odpowiedniego zakodowania całego sektora i sformowania odpowiedniego przebiegu sygnału elektromagnetycznego, który następnie jest zapisywany w odpowiedniej fizycznej lokalizacji. Jeśli chcesz się o tym przekonać w praktyce, utwórz mały plik tekstowy. Odszukaj go i sprawdź w hex-edytorze, jak wygląda jego zawartość. Możesz zera na końcu pliku zmienić na inną zawartość, by sprawdzić, czy zostanie ona zachowana przy edycji pliku. Następnie zmień ten plik w notatniku i sprawdź zawartość sektora w hex-edytorze. Zobaczysz, że pozostałość starej zawartości pliku wykraczająca poza jego nowy rozmiar zostanie zastąpiona zerami. Dlatego twierdzenia o zapisywaniu, odczytywaniu, odzyskiwaniu, czy w ogóle adresowaniu pojedynczych bitów są bzdurą.

Śledzenie ścieżki

„Deviations in the position of the drive head from the original track may leave significant portions of the previous data along the track edge relatively untouched.”

„Odchylenia położenia głowicy dysku od pierwotnej ścieżki mogą pozostawić znaczne części poprzednich danych wzdłuż krawędzi ścieżki stosunkowo nietknięte.”

Stwierdzenie to miało sens w czasach, gdy w dyskach twardych do pozycjonowania bloku głowic magnetycznych jeszcze wykorzystywano silniki krokowe. Silnik krokowy, jak sama nazwa wskazuje, obraca się zawsze o zadany krok lub jego wielokrotność. Nie ma możliwości ustawienia go w położeniach pośrednich. I ta właściwość silników krokowych skutkowała ryzykiem zapisu ścieżki ze stałym przesunięciem względem poprzedniego położenia, chociażby przez brak możliwości kompensacji różnic rozszerzalności temperaturowej poszczególnych podzespołów dysku. To właśnie z tego powodu zalecano przed wykonywaniem formatowania niskopoziomowego uruchomienie dysku na co najmniej pół godziny w celu uzyskania równomiernego nagrzania wszystkich podzespołów.

Proces zastępowania silników krokowych liniowymi rozpoczął się mniej więcej w połowie lat '80 i do czasu opublikowania przez Petera Gutmanna jego artykułu zdążył się zakończyć. Kalok – ostatnia firma produkująca dyski twarde z silnikami krokowymi zbankrutowała w 1994 r. Dwa lata, to wystarczająco dużo, by w publikacji chociaż zauważyć obecność na rynku dysków z pozwalającymi na bezstopniową regulację położenia bloku głowic magnetycznych silnikami liniowymi lub co najmniej wyraźnie zaznaczyć, że cytowane wyżej stwierdzenie odnosi się do dysków z silnikami krokowymi.

Silniki liniowe zbudowane są z cewki umieszczonej pomiędzy dwoma magnesami stałymi. Zmienne pole elektryczne indukowane przez prąd przepływający przez umieszczoną w stałym polu magnetycznym cewkę wywołuje ruch tej cewki względem magnesów. Typowym rozwiązaniem są pozycjonery obracające się wokół osi i przemieszczające głowice nad powierzchnią talerzy po łuku, ale w przeszłości stosowano też rozwiązania oparte o ruch posuwisto – zwrotny cewki. Jednak rozwiązane to było bardziej skomplikowane i zajmowało więcej miejsca wewnątrz obudowy i z tych względów zostało szybko zarzucone.

Zastąpienie silników krokowych liniowymi wymusiło zmiany w podsystemie pozycjonowania głowic i śledzenia ścieżki. Bezstopniowa regulacja położenia głowic otwiera możliwości precyzyjnego prowadzenia głowicy nad środkiem ścieżki, ale też wymaga informacji zwrotnej pozwalającej na kontrolę jej położenia nad talerzem. Służą temu rozmieszczone w równych odstępach na powierzchniach talerzy sektory serwo. Liczba sektorów serwo jest różna w różnych modelach dysków. W wielu przypadkach możesz ją sprawdzić w Wiktorii. Jeśli program wyświetla w paszporcie dysku parametr „Wedges”, to jest właśnie liczba sektorów serwo.

Sektory serwo zawierają szereg informacji pozwalających na zidentyfikowanie numeru odczytywanej ścieżki, kontrolę prędkości obrotowej talerzy, poprawną synchronizację sygnału oraz utrzymywanie trajektorii lotu głowicy nad środkiem ścieżki. Z uwagi na cel artykułu skupimy się na tym ostatnim zagadnieniu. Każdy sektor serwo zawiera pola serwodanych generujących sygnał błędu pozycjonowania (PES – Positioning Error Signal, СОП — Сигнал Ошибки Позиционирования). Sygnał ten pozwala na stwierdzenie, w którą stronę i jak bardzo głowica odchyla się od środka ścieżki.

Procesor sygnałowy na podstawie sygnału błędu pozycjonowania może wydać sterownikowi silnika polecenie doregulowania położenia głowicy. Ponieważ typowo w dyskach twardych liczba sektorów serwo przekracza 100 na ścieżkę, w praktyce nie ma możliwości stabilnego utrzymania lotu głowicy wzdłuż krawędzi ścieżki. Jeżeli dojdzie do odchylenia głowicy od środka ścieżki, mechanizm pozycjonowania będzie dążył do jak najszybszego skorygowania jej położenia. Nawet, jeśli kompensacja napotka jakieś trudności, o wiele prawdopodobniejsza jest sytuacja, kiedy głowica będzie oscylowała w pobliżu środka ścieżki, aniżeli, że będzie leciała wzdłuż jednej z jej krawędzi.

Oczywiście możliwe są sytuacje dokonania zapisu z przesunięciem względem środka ścieżki w taki sposób, że kolejny zapis pozostawi nieuszkodzone fragmenty poprzedniego namagnesowania, ale wraz z rosnącą gęstością zapisu taka sytuacja jest coraz mniej prawdopodobna. Jest też skrajnie nieprawdopodobne, że takie odchylenia doprowadzą do pozostawienia nienaruszonych „znacznych części poprzednich danych”. Jeśli już, będą to co najwyżej niewielkie fragmenty, trudne do zaadresowania i zdekodowania, a także do określenia czasu powstania tych zapisów. Bazując na wskazanych wcześniej w tym artykule informacjach wiemy już, że aby móc w praktyce odkodować dane odzyskiwane z krawędzi ścieżki, musielibyśmy dysponować co najmniej całym spójnym sektorem.

We współczesnych dyskach twardych o bardzo wysokiej gęstości zapisu ryzyko pozostawienia fragmentów starych danych wzdłuż krawędzi ścieżki jest znikome. W dodatku taki sygnał byłby silnie zakłócony oddziaływaniem zapisów na sąsiednich ścieżkach. W przypadku dysków wykorzystujących zapis dachówkowy (SMR – Shingled Magnetic Recording) ryzyko to jest całkowicie eliminowane przez częściowe nadpisywanie poprzednich ścieżek przy zapisie kolejnych. Ponadto stosuje się znacznie bardziej zaawansowane rozwiązania w zakresie pozycjonowania i kontroli położenia głowic, np. wielostopniowe pozycjonery. Tym niemniej nawet w przypadku dysków z pierwszej połowy lat '90 nikomu nie udało się zademonstrować praktycznego przykładu odzyskania nadpisanych danych odczytanych z krawędzi ścieżki.

Zagadnienie serwomechaniki dysków twardych, wyszukiwania i śledzenia ścieżek oraz kontroli prędkości obrotowej silnika jest zbyt obszerne, by je dokładniej tu omówić. Zostało ono opisane w kilku książkach, spośród których warto wskazać:
– „Механика и сервосистема” Serhija Kożenewskiego,
– „Hard Disk Drive Mechatronics and Control” Abdullaha al-Mamuna, Guoxiao Guo i Chao Bi,
– „Hard Disk Drive Servo Systems” Bena M. Chena, Tonga H. Lee, Kemao Penga i Venkatakrishnana Venkataramanana.

Przemagnesowanie warstwy magnetycznej

„When all the above factors are combined it turns out that each track contains an image of everything ever written to it, but that the contribution from each «layer» gets progressively smaller the further back it was made.”

„Kiedy wszystkie powyższe czynniki zostaną połączone, okaże się, że każda ścieżka zawiera obraz wszystkiego, co kiedykolwiek zostało na niej zapisane, ale wkład każdej «warstwy» staje się coraz mniejszy w miarę nadpisywania kolejnych.”

Chyba każdy spotkał się z analogiami nadpisywania danych do zamazywania ołówkiem napisów na kartce. Tak, pierwotne zapisy na kartce papieru są bardzo długo widoczne i nawet jeżeli zostaną dość dokładnie zamazane, wciąż można próbować odczytywać ich fragmenty, czy odgadywać pojedyncze symbole. I zdaje się, że i Peter Gutmann uległ magii tej analogii. Ale czy ona w ogóle ma sens w odniesieniu do zapisu magnetycznego?

Głowice podczas zapisu nie nanoszą żadnych nowych warstw, ale zmieniają uporządkowanie namagnesowania jednej warstwy magnetycznej. Przemagnesowanie nie nakłada nowego zapisu na poprzedni, ale niszczy go ustawiając w inny sposób sekwencję ścian domenowych. A więc jest to działanie znacznie bardziej podobne do chociażby zmiany symboli ułożonych z zapałek przez ich przestawianie, zaś analogia do zamalowywania kredkami zapisów na papierze jest co najmniej nieadekwatna.

Czy jednak faktycznie głowice są w stanie nieodwracalnie zniszczyć poprzedni zapis magnetyczny? Tu musimy zwrócić uwagę na relację wartości pola indukowanego przez głowice do koercji warstwy magnetycznej, czyli wartości pola niezbędnego do jej przemagnesowania. Koercja stopów kobaltowych typowo wykorzystywanych w dyskach twardych wynosi ok. 0,5 T. Natomiast głowice magnetyczne są w stanie indukować pola o wartości powyżej 2 T. Poza tym warstwy magnetyczne są zbyt cienkie (ich grubość jest liczona w dziesiątkach nm), by mogły w nich stabilnie funkcjonować dwie lub więcej warstw domen o różnych polaryzacjach namagnesowania. Dla porównania do zniszczenia danych w procesie demagnetyzacji wystarczające są demagnetyzery (degaussery) indukujące pola o wartości ok. 1 T, pomimo że talerze są ekranowane przez metalowe elementy obudowy.

Warto przy tej okazji zwrócić uwagę na dopiero pojawiające się na rynku dyski z zapisem wspomaganym energetycznie – HAMR (Heat-Assisted Magnetic Recording) i MAMR (Microvave-Assisted Magnetic Recording). Są to dyski wykorzystujące jako warstwę magnetyczną stopy żelazowo – platynowe, których koercja wynosi ok. 6 T. W ich przypadku pole indukowane przez głowice jest wyraźnie za słabe, by przemagnesować warstwę magnetyczną, dlatego zapis musi być wspomagany dodatkowym źródłem energii pozwalającym lokalnie rozgrzać powierzchnię talerzy do temperatury zbliżonej do punktu Curie. Punkt Curie, jest to charakterystyczna dla danego materiału magnetycznego temperatura, w której traci on swoje namagnesowanie, a więc jest dużo łatwiejszy do przemagnesowania. Informacja ta jest istotna dla niszczenia danych przez demagnetyzację, gdyż dyski z zapisem wspomaganym energetycznie będą odporne na działanie popularnych współcześnie demagnetyzerów i do ich niszczenia konieczne jest opracowanie nowych urządzeń.

O jeden most za daleko...

„The general concept behind an overwriting scheme is to flip each magnetic domain on the disk back and forth as much as possible (this is the basic idea behind degaussing) without writing the same pattern twice in a row.”

„Ogólna koncepcja schematu nadpisywania polega na odwracaniu każdej domeny magnetycznej na dysku w tę i z powrotem tak bardzo, jak to możliwe (jest to podstawowa idea demagnetyzacji) bez zapisywania tego samego wzoru dwa razy pod rząd.”

Dlaczego Gutmann miesza tu nadpisywanie danych z demagnetyzacją? Namagnesowanie substancji magnetycznej możemy rozpatrywać w dwóch aspektach. W skali makro ciało będziemy uważać za namagnesowane, jeśli samo będzie indukowało pole magnetyczne. Będzie miało niezerowe namagnesowanie będące wypadkową namagnesowania jego domen magnetycznych. W tym sensie talerze magnetyczne nie są namagnesowane. Można to łatwo sprawdzić obserwując, w jaki sposób talerze zdemontowane z dysku twardego oddziałują z metalami, które powinny reagować na zewnętrzne namagnesowanie.

W skali nano każde ciało magnetyczne jest w jakiś sposób namagnesowane. Jeśli namagnesowanie nie zostanie nadane przez zewnętrzne pole magnetyczne, domeny magnetyczne powstają samorzutnie, a indukowane przez nie pola wzajemnie się znoszą. Zapis magnetyczny polega na takim uporządkowaniu domen magnetycznych, żeby reprezentowały one pożądane przez nas stany logiczne, które możemy interpretować jako określoną informację. Sprawny dysk twardy zawsze ma uporządkowane namagnesowanie, zawsze zawiera jakąś informację i nawet, jeśli na poziomie struktur logicznych uważamy go za pusty, zawsze w hex-edytorze możemy zobaczyć jakieś wartości.

Demagnetyzacja polega na takim oddziaływaniu impulsem elektromagnetycznym, by zniszczyć to uporządkowanie, w konsekwencji czego domeny na talerzu pozostają w stanie namagnesowania chaotycznego. Takie namagnesowanie nie jest możliwe do interpretacji, dlatego z talerzy nie można niczego odczytać, głowice nie mogą odnaleźć sygnału serwo i dysk zostaje zniszczony. Natomiast nadpisywanie polega na zastąpieniu istniejącego uporządkowania namagnesowania innym, wciąż interpretowalnym logicznie, ale reprezentującym bezwartościową informację. Przy czym dla zniszczenia danych nie jest konieczna zmiana polaryzacji każdej domeny magnetycznej. Wystarczy, że domeny magnetyczne zostaną ustawione w inny sposób, niż pierwotnie.

Demagnetyzacja i nadpisywanie, to dwie różne metody niszczenia danych, w których cel jest osiągany innymi środkami. W przypadku demagnetyzacji jest to zewnętrzne urządzenie całkowicie niszczące uporządkowanie namagnesowania, a tym samym niszczące dysk, jako urządzenie. Natomiast nadpisywanie zmienia jedynie uporządkowanie namagnesowania nadpisywanych sektorów pozostawiając nienaruszoną informację strefy serwisowej, sektorów serwo i nagłówków sektorów, a także umożliwiając selektywne niszczenie danych, np. usuwanie wybranych plików.

O drugi most za daleko...

„To erase magnetic media, we need to overwrite it many times with alternating patterns in order to expose it to a magnetic field oscillating fast enough that it does the desired flipping of the magnetic domains in a reasonable amount of time. (…) The best we can do is to use the lowest frequency possible for overwrites, to penetrate as deeply as possible into the recording medium.”

„Żeby wymazać nośnik magnetyczny, musimy go wielokrotnie nadpisywać naprzemiennymi wzorami, aby wystawić go na działanie pola magnetycznego oscylującego na tyle szybko, aby w rozsądnym czasie spowodowało to pożądane odwrócenie domen magnetycznych. (…) Najlepsze, co możemy zrobić, to użyć najniższej możliwej częstotliwości do nadpisywania, aby wniknąć najgłębiej, jak to możliwe w nośnik.”

Jak już wiemy, dla zniszczenia danych w zapisie magnetycznym istotne jest nie tyle odwracanie polaryzacji poszczególnych domen magnetycznych, co przemieszczenie ścian domenowych. Poza tym częstotliwość pola magnetycznego używanego do zapisu danych zależy przede wszystkim od częstotliwości zapisywanego sygnału. Biorąc pod uwagę proces kodowania danych, uzyskanie sygnału o możliwie najniższej lub najwyższej częstotliwości (zawierającego jak najmniejszą lub największą liczbę logicznych jedynek w stosunku do zer) wymagałoby zrozumienia i uwzględnienia wszystkich etapów kodowania.

Sam pomysł najprawdopodobniej pochodzi od metody rozmagnesowywania ciał namagnesowanych w skali makro. Ponieważ bardzo trudno jest oddziaływać na takie ciało polem dokładnie odpowiadającym jego koercji tak, by doprowadzić do jego rozmagnesowania i o wiele bardziej prawdopodobne jest odwrócenie polaryzacji namagnesowania, rozmagnesowanie przeprowadza się operując polem o wysokiej częstotliwości i malejącym natężeniu. W ten sposób przy każdym odwróceniu polaryzacji ciało jest namagnesowane coraz słabiej (remanencja spada od stanu nasycenia do stanu bliskiego zeru). Przy czym w przypadku dysku twardego głowice zapisujące indukują pole magnetyczne na powierzchnię obracającego się pod nimi talerza i czas, w jakim dany obszar może być poddany przemagnesowaniu zależy przede wszystkim od prędkości obrotowej talerza.

Gutmann w swoim artykule z jednej strony często odwołuje się do pewnych elementów kodowania danych, ale z drugiej traktuje to zagadnienie bardzo pobieżnie i wyrywkowo, często naciągając je pod założoną tezę o konieczności wielokrotnego nadpisywania danych dla ich bezpiecznego zniszczenia. W zasadzie ignoruje kluczowe dla kodowania RLL procesy zmian rozmiarów, łączenia i podziałów domen magnetycznych. Za to nadmiernie skupia się na samym procesie odwracania ich polaryzacji. W jego rozważaniach brakuje spójności, co zdążyliśmy już zauważyć i jeszcze zobaczymy w dalszej części. Poza tym, jak już wspomniałem wyżej, warstwa magnetyczna jest zbyt cienka, by nie została przemagnesowana do nasycenia już przy pierwszym przebiegu. Dotyczy to zwłaszcza zapisu prostopadłego, w którym wektor polaryzacji namagnesowania jest prostopadły do powierzchni talerza, a więc same domeny są ustawione w warstwie magnetycznej pionowo.

Kody korekcji ECC

„Therefore even if some data is reliably erased, it may be possible to recover it using the built-in error-correction capabilities of the drive. ”

„Dlatego nawet jeśli niektóre dane zostaną niezawodnie usunięte, możliwe będzie ich odzyskanie przy użyciu wbudowanych funkcji korekcji błędów dysku.”

Oto i kolejny przykład nadmiernie swobodnego podejścia Petera Gutmanna do zagadnienia kodowania danych. Powyższe zdanie sugeruje możliwość usunięcia zawartości sektora przy jednoczesnym pozostawieniu związanych z nim kodów korekcji. Nie jest to możliwe, gdyż kody korekcji są wyliczane na etapie kodowania danych i dodawane do sektora jeszcze przed sformowaniem przebiegu sygnału, jaki zostanie zaindukowany przez głowicę zapisującą i zapisany na talerzu. Nadpisując sektor inną zawartością nadpiszemy i kody korekcji związane z pierwotnymi danymi.

W starszych modelach dysków istniała możliwość celowego wygenerowania błędnych sum kontrolnych i zapisania sektora z kodami korekcji niezgodnymi z danymi użytkownika. Wprawdzie takie sektory nie dają się poprawnie odczytać i przy próbie ich odczytu dysk zwraca błąd UNC, ale same kody korekcji związane z poprzednią zawartością sektora są niszczone i zastępowane nowymi. Możliwość ta jest realizowana np. w programie MHDD przez polecenia „MAKEBAD” - tworzące „uszkodzony” sektor we wskazanym adresie LBA lub „RANDOMBAD” - tworzące „uszkodzone” sektory w losowych lokalizacjach.

Ponadto Gutmann ewidentnie przecenia możliwości korekcyjne kodów ECC. Wprawdzie kody korekcji pozwalają na lokalizację i korekcję błędów bitowych, ale dotyczy to ograniczonej liczby błędów występujących w istniejących i odczytywalnych sektorach. Typowo kody korekcji pozwalają na skorygowanie ok. 200 błędów bitowych na sektor, a jeśli liczba błędów przekracza możliwości kodu, dysk wystawia błąd UNC. To stanowczo za mało, żeby podjąć próbę rekonstrukcji zawartości nieistniejącego sektora wyłącznie na podstawie jego kodów korekcji. Przy tym musimy pamiętać, że błędy bitowe mogą wystąpić i w samym kodzie korekcji.

Konkluzja

„Data which is overwritten an arbitrarily large number of times can still be recovered provided that the new data isn't written to the same location as the original data...”

„Dane, które zostały nadpisane dowolną liczbę razy, można nadal odzyskać, pod warunkiem, że nowe dane nie zostaną zapisane w tej samej lokalizacji, co dane oryginalne...”

W tym zdaniu Gutmann ewidentnie sam sobie zaprzecza. Zakłada, że dane nadpisane dowolną liczbę razy wciąż można odzyskać, pod warunkiem, że w tej samej lokalizacji nie zostaną zapisane nowe dane. Ale przecież istotą nadpisywania jest zapisywanie nowych danych w miejscu tych, które chcemy zniszczyć. Nawet, jeśli tymi nowymi danymi jest wybrany nieinterpretowalny na poziomie logicznym wzorzec nadpisujący. Bo dla dysku jest to taki sam strumień danych, jak każdy inny. I byłoby bardzo dziwne, gdyby Peter Gutmann tego nie rozumiał. Z drugiej strony to zdanie wprost podważa sens wielokrotnego nadpisywania i potwierdza, że już pierwszy przebieg nadpisywania niszczy dane.

PRML – Partial Response – Maximum Likelihood

„The article states that «The encoding of hard disks is provided using PRML and EPRML», but at the time the Usenix article was written MFM and RLL was the standard hard drive encoding technique…”

„W artykule stwierdza się, że «Kodowanie dysków twardych odbywa się przy użyciu PRML i EPRML», ale w czasie, gdy pisano artykuł Usenix, standardową techniką kodowania dysków twardych były MFM i RLL...”

W epilogu Peter Gutmann odnosi się do artykułu Craigha Wrighta, Dave Kleimana i Ramajadama Srinivasana Shyaama Sundhara „Overwriting Hard Drive Data: The Great Wiping Controversy" z 2008 r. Autorzy tej publikacji zweryfikowali praktycznie założenia przedstawione przez Gutmanna i wykazali brak możliwości odzyskiwania nadpisanych danych w drodze analizy mikromagnetycznej powierzchni talerza w celu poszukiwania śladów poprzedniego namagnesowania. Wprawdzie i autorzy tej publikacji dość luźno podeszli do zagadnienia kodowania danych, ale w tym miejscu zajmujemy się przede wszystkim algorytmem Gutmanna i opisującym go artykułem.

Peter Gutmann wskazuje, że badania Wrighta, Kleimana i Shyaama Sundhara są nieadekwatne i nie powinny kwestionować jego ustaleń, gdyż w dyskach, które badali, wykorzystano PRML, podczas gdy w czasach, kiedy on pisał swój artykuł standardowymi metodami kodowania danych były MFM i RLL. Jest to zarzut o tyle nietrafiony, że PRML nie jest techniką kodowania danych i nie zastępuje ani MFM ani RLL, ale jest wykorzystywany w detekcji i dekodowaniu sygnału zastępując starszą metodę wykrywania szczytów impulsów peak-detection. Jest to metoda stosowana od początku lat '90 i w związku z tym nie powinna być Gutmannowi obca w 1996 r. Natomiast metoda kodowania MFM była wypierana z dysków twardych już w połowie lat '80 i w połowie lat '90 była stosowana wyłącznie w dyskietkach.

W pierwszych dekadach dysków twardych gęstość zapisu była niewielka, domeny były dość dużych rozmiarów, a więc ściany domenowe leżały w relatywnie dużych odstępach Wówczas dawały one w odczytywanym przez głowice sygnale wyraźne impulsy o wysokich amplitudach i łatwych do wykrycia szczytach. Rosnąca gęstość zapisu powodowała pogorszenie stosunku sygnału do szumu, natomiast wprowadzenie kodowania RLL wyeliminowało składową zegarową, co zwiększyło ryzyko rozsynchronizowania sygnału oraz obliczenia przez układ dekodera niewłaściwej liczby zer pomiędzy kolejnymi jedynkami. Wówczas metoda detekcji szczytów okazała się niewystarczająca i zastąpiono ją metodą PRML.

PRML (Partial Response – Maximum Likelihood) jest metodą pozwalającą na określenie maksymalnego prawdopodobieństwa przebiegu odczytywanego sygnału przy częściowej odpowiedzi. Metoda ta nie skupia się na wychwytywaniu kolejnych szczytów impulsów, ale analizuje cały przebieg sygnału i dąży do określenia najbardziej prawdopodobnego rozmieszczenia impulsów. PRML, w odróżnieniu od detekcji szczytów, nie posługuje się progowymi wartościami odniesienia, ale analizuje kształt i wysokość amplitud wszystkich impulsów i na tej podstawie określa, które z nich pochodzą od zapisanego sygnału, a które od zakłóceń tła. Wykorzystywana jest przy tym znajomość metody kodowania danych przy zapisie, co pozwala na odrzucenie niezgodnych z nią wariantów przebiegu sygnału, np. zawierających mniejszą lub większą liczbę zer pomiędzy dwiema jedynkami od dopuszczalnej dla danej wersji kodu RLL.

Kwestionowanie przez Gutmanna na tej podstawie wyników Wrighta, Kleimana i Shyaama Sundhara dowodzi jedynie, że i po roku 2008 był on na bakier z rozwiązaniami w zakresie kodowania danych i przetwarzania sygnałów w dyskach twardych. Sugestia, że PRML zastępuje kodowanie RLL jest takim samym błędem, jak np. twierdzenie, że zapis SMR zastąpił zapis prostopadły. Po opublikowaniu artykułu Wrighta, Kleimana i Shyaama Sundhara zainteresowanie badaniami w kierunku odzyskiwania nadpisanych danych z wykorzystaniem mikroskopii sił magnetycznych w zasadzie zanikło. Podobnie w przypadku badań oscyloskopowych przebiegu sygnału przechwytywanego bezpośrednio z głowic prace Kożenewskiego nie dały dostatecznych podstaw, by dawać uzasadnione nadzieje na możliwość wykorzystania ich w praktycznym odzyskiwaniu nadpisanych danych.

Nie znaczy to jednak, że nadpisywanie danych jest wolne od ryzyk i zagrożeń. Zawsze możliwe są błędy użytkownika, niekontrolowane przerwy w przebiegu procesu, awarie urządzeń i oprogramowania, czy celowe działania mające na celu udaremnienie skutecznego zniszczenia danych. Istnieją także ryzyka związane z możliwością przypadkowego znalezienia się danych lub ich celowego ukrycia poza adresacją LBA.

Dane mogą się znaleźć w obszarach ukrytych poza adresacją LBA za pomocą funkcji HPA lub DCO. W przypadku dysków SMR poza adresacją LBA w niekontrolowany sposób mogą przetrwać zdezaktualizowane dane, a ich lokalizacja i niezawodne nadpisanie wymaga analizy i zrozumienia podsystemu translacji adresacji LBA na fizyczną. W każdym dysku występują też sektory, które nie dostały adresu LBA. Są to np. sektory rezerwowe, albo sektory fizyczne pod koniec dysku, których jest więcej, niż potrzeba do uzyskania jego nominalnej pojemności. Takie sektory mogą być wykorzystane do celowego ukrycia danych, ale zarówno ich ukrycie, jak i późniejsze odczytanie wymaga odpowiedniej znajomości oprogramowania układowego dysku i umiejętności pracy w adresacji fizycznej.

Jednak przed żadnym z powyższych ryzyk nie chroni wielokrotne nadpisywanie. Poprawa bezpieczeństwa procesu nadpisywania danych powinna zmierzać przede wszystkim w kierunku analizy podsystemu translacji adresów logicznych (LBA) na adresy fizyczne oraz dążyć do nadpisywania danych w adresacji fizycznej. Dlatego jeśli nie zależy nam na selektywnym usunięciu wybranych plików, a chcemy zniszczyć całą zawartość dysku, lepiej wybrać procedurę Secure Erase, która pracuje bliżej sprzętu niż programy operujące w adresacji LBA. Dane są bezpowrotnie niszczone już w pierwszym przebiegu nadpisywania. Każdy kolejny jest jedynie zbędnym kosztem i stratą czasu, a to chyba wystarczający powód, by w końcu wyrzucić algorytm Gutmanna do kosza.

Literatura uzupełniająca:

1. C. Wright, D. Kleiman, R. S. Shyaam Sundhar: Overwriting Hard Drive Data: The Great Wiping Controversy.

2. R. Gomez, A. Adly, I. Mayergoyz, E. Burke: Magnetic Force Scanning Tunnelling Microscope Imaging of Overwritten Data,

3. R. Gomez, E. Burke, A. Adly, I. Mayergoyz, J. Gorczyca: Microscopic Investigations of Overwritten Data,

4. I. D. Mayergoyz, C. Tse: Spin-stand Microscopy of Hard Disk Data,

5. С. Р. Коженевський: Перезапись информации.

6. B. M. Chen, T. H. Lee, K. Peng, V. Venkataramanan: Hard Disk Drive Servo Systems,

7. A. al-Mamun, G. X. Guo, Ch. Bi: Hard Disk Drive Mechatronics and Control,

8. С. Р. Коженевський: Механика и сервосистема,

9. K. A. Schouhamer Immink: Codes for Mass Data Storage Systems,

10. B. Vasić, E. M. Kurtas: Coding and signal processing for magnetic recording systems.

Throwing Gutmanns algorithm into the trash - english version

Выкілванм альгарытм Ґутманна ў сьметніцу - па беларуску

Vyhodíme Gutmannův algoritmus do koše češtinou

Tirar el algoritmo de Gutmann a la basura - en español.

Het algoritme van Gutmann in de prullenbak gooien - in het Nederlands.

Llençar l'algorisme de Gutmann a les escombraries - en català.

Gutmann'ın Algoritması Çöpe Atılıyor - Türkçe versiyon.

Викидиваємо алгоритм Ґутманна в кошик - українська версія.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Fajne? Ranking DIY
O autorze
kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych
Offline

Dołączył: 04 Lut 2010

Posty: 7028

Pomógł: 957

Ocena postów: 2312

Punkty: 33093
Zajmuję się odzyskiwaniem danych oraz naprawami sprzętu komputerowego.
Serwis komputerowy Kaleron
Szkolenia z odzyskiwania danych
Specjalizuje się w: komputery - serwis, odzyskiwanie danych
kaleron napisał 7028 postów o ocenie 2312, pomógł 957 razy. Mieszka w mieście Jelcz-Laskowice. Jest z nami od 2010 roku.

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
REKLAMA
#2 20781258 22 Paź 2023 22:07

TechEkspert TechEkspert

Redaktor

Posty: 7045

Pomógł: 16

Ocena: 5455
Pomocny post? (+1)

Post #2
20781258 22 Paź 2023 22:07

Dzięki za ciekawy materiał!
Czy wspomniany Secure Erase można zrealizować poleceniem erase w MHDD?
Jak wrażenia z The H@ck Summit?

Promuję tematy:
07.04.2026 Wnętrze nowego plafonu LED 230V
30.03.2026 Obserwacja na żywo zmian częstotliwości 50 Hz w Krajowym Systemie Elektroenergetycznym
29.03.2026 Wnętrze i usterka oraz prowizoryczna naprawa plafonu LED
28.03.2026 Eksperyment - rejestracja THD napięcia sieciowego
27.03.2026 AVEVA InTouch HMI więcej niż SCADA rozmowa z ASTOR - podcast #32
#3 20781297 22 Paź 2023 22:30

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+3)

Post #3
20781297 22 Paź 2023 22:30

ERASE w MHDD jest zwykłym nadpisywaniem (zerowaniem) przeprowadzanym w adresacji LBA. Od Secure Erase masz osobne polecenie. I jest jeszcze polecenie FASTERASE, które nie niszczy danych, a jedynie wywala informację o partycjonowaniu. I na to ostatnie trzeba uważać.

A sama konferencja - fajnie było. Było całkiem sporo ciekawych prezentacji, a ponieważ były realizowane w aż 13 równoległych ścieżkach, nieraz trudno było zdecydować, co wybrać. Poza tym to świetna okazja, by spotkać się na żywo z ciekawymi ludźmi, z którymi często znamy się głównie przez internet Dla mnie najciekawsza była ścieżka e-Detektywów, ale to kwestia osobistych preferencji. Jak kogoś interesują inne tematy związane z bezpieczeństwem, naprawdę było z czego wybierać.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#4 20781372 22 Paź 2023 23:18

LEDówki LEDówki

Poziom 43

Posty: 9345

Pomógł: 1304

Ocena: 2524
Pomocny post? (0)

Post #4
20781372 22 Paź 2023 23:18

shred mordujący dyski dowolną ilością zapisów. Strach ma wielkie oczy i trzeba dużo płacić, żeby się nie bać.
Ktoś już pisał, że wyzerowanie dysków powinno wystarczyć. Co innego dyskietki, których już nikt nie używa, więc nie ma problemu.
#5 20781413 23 Paź 2023 00:19

gulson gulson

Administrator Systemowy

Posty: 29234

Pomógł: 148

Ocena: 5984
Pomocny post? (+5)

Post #5
20781413 23 Paź 2023 00:19

Bardzo na czasie ten materiał. Niszczarki, niszczenie informacji! Odezwij się do mnie z paczkomatem po zestaw gadżetów

Promuję tematy:
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
03.02.2026 Gdzie rynek pracy IT naprawdę potrzebuje ludzi w 2026 roku? Analiza ofert pracy z Hacker News
#6 20781636 23 Paź 2023 09:40

rafels rafels

Poziom 25

Posty: 717

Pomógł: 69

Ocena: 166
Pomocny post? (+2)

Post #6
20781636 23 Paź 2023 09:40

Ciekawe jak wygląda niszczenie informacji na nośnikach SSD. Zdaje się, że już wyparły HDD z większością komputerów osobistych.
#7 20781725 23 Paź 2023 10:29

LEDówki LEDówki

Poziom 43

Posty: 9345

Pomógł: 1304

Ocena: 2524
Pomocny post? (+1)

Post #7
20781725 23 Paź 2023 10:29

Funkcja TRIM załawia je dokumentnie.
#8 20781736 23 Paź 2023 10:38

rafels rafels

Poziom 25

Posty: 717

Pomógł: 69

Ocena: 166
Pomocny post? (0)

Post #8
20781736 23 Paź 2023 10:38

Czyli to jest ta funkcja zerująca komórki pamięci po usunięciu plików, co pozwala na ponowny zapis w danym obszarze?

Ciekawi mnie czy nie ma jakiś profesjonalnych sprzętowych metod odzyskiwania danych pozwalajacych odczytywanie jakiś ładunków resztkowych, czy coś w tym stylu. Nie znam tematu.
#9 20781786 23 Paź 2023 11:07

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+4)

Post #9
20781786 23 Paź 2023 11:07

LEDówki napisał:
dyskietki, których już nikt nie używa,
A ZUS? Przechowuje na nich nasze emerytury, dlatego one będą takie, jakie będą
rafels napisał:
jak wygląda niszczenie informacji na nośnikach SSD
Tak,
LEDówki napisał:
TRIM załawia je dokumentnie.
. Poza tym mamy do dyspozycji funkcje Secure Erase (w wielu modelach jest ona ograniczona do tzw. cryptoerase, co sprowadza się do zniszczenia starego klucza szyfrującego oraz tablic translatora i wygenerowania nowych.) i Block Erase, która kasuje wszystkie fizyczne bloki.
Taka uwaga - TRIM sam w sobie nie kasuje bloków, ale informuje kontroler o tym, że mogą one zostać skasowane, co następuje w ciągu kilku minut od skasowania danych na poziomie struktur logicznych. I żeby TRIM zadziałał, musi być obsługiwany zarówno przez system operacyjny, jak i przez samego SSDka. Współcześnie bardzo trudno znaleźć i system i SSDka, które by TRIMu nie obsługiwały, ale TRIM może być wyłączony programowo.
I druga uwaga - TRIM występuje też w wielu modelach dysków twardych z SMR. Ale dyski twarde nie wykonują kasowania. Dane leżą na dysku, dopóki nie zostaną nadpisane innymi. Dlatego dane na dysku SMR mogą przetrwać dłużej w adresacji fizycznej. Z drugiej strony pod kątem odzyskiwania danych nie za bardzo jest to powód, by liczyć na jakieś duże sukcesy. W przypadku dysków SMR zmiana zawartości nawet pojedynczego sektora wiąże się z koniecznością przepisania całej strefy SMR. Ale jeśli chcemy zniszczyć dane, ryzyko jest i dlatego zamiast nadpisywać w adresacji LBA lepiej użyć Secure Erase, które wyczyści i wszystkie strefy SMR i Media Cache.

rafels napisał:
czy nie ma jakiś profesjonalnych sprzętowych metod odzyskiwania danych pozwalajacych odczytywanie jakiś ładunków resztkowych,
- układ NANDowy można zeszlifować i obrazować ładunki przy pomocy mikroskopu sił atomowych (tzw. mikroskop elektronowy). Metoda nie jest wykorzystywana w praktyce, bo jest kosztowna, czasochłonna i wymaga bardzo wysokich kompetencji, by później można było z uzyskanych w ten sposób plików graficznych zdekodować (czasem odszyfrować) zawartość i poprawnie ją zaadresować, by można było odzyskać dane. Całego procesu nikt nigdy nie przeprowadził od początku do końca, były tylko przeprowadzone badania, które wykazały taką możliwość. Ale obrazować możesz to, co jest teraz, a nie to, co było kiedyś. Dlatego jeśli skasujesz bloki, możesz w bramkach pływających znaleźć jedynie jakieś pojedyncze nie do końca wyrzucone elektrony. To za mało, żeby dać podstawę do ustalenia poprzedniego poziomu naładowania tranzystora. A gdyby nawet Ci się to w pojedynczych przypadkach udało, to dane w nośnikach półprzewodnikowych też są kodowane, więc stanąłbyś przed bardzo podobnymi problemami, jakie występują przy próbie odzyskiwania nadpisanych danych z nośników magnetycznych przez analizę namagnesowania powierzchni w celu poszukiwania śladów poprzedniego namagnesowania.

Zagrożeniem dla procesu kasowania bloków w nośnikach półprzewodnikowych może być uszkodzenie wewnętrznego generatora napięć niezbędnych dla tunelowania elektronów. Od czasu do czasu na Elektrodzie trafiają się tematy, w których uszkodzenie polega na tym, że jakiegoś nośnika nie można sformatować, niczego nie można na nim zapisać ani usunąć, zmiany niby są dokonywane, ale w rzeczywistości zawartość sienie zmienia. Podobny problem prawdopodobnie będzie się zdarzał w przypadku dysków twardych z zapisem wspomaganym energetycznie, jeśli uszkodzeniu będą ulegały elementy odpowiedzialne za podgrzanie talerza.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
REKLAMA
#10 20781825 23 Paź 2023 11:31

rafels rafels

Poziom 25

Posty: 717

Pomógł: 69

Ocena: 166
Pomocny post? (0)

Post #10
20781825 23 Paź 2023 11:31

Dziękuję Panowie za naświetlenie tematu.
REKLAMA
#11 20781875 23 Paź 2023 12:02

a_jablon a_jablon

Poziom 35

Posty: 3008

Pomógł: 338

Ocena: 832
Pomocny post? (+1)

Post #11
20781875 23 Paź 2023 12:02

Koledzy, koleżanki,

dla całych nośników: Secure Erase / Enhanced Secure Erase i tyle w temacie

https://www.thomas-krenn.com/pl/wiki/Secure_Erase_na_dysku_SSD
#12 20782023 23 Paź 2023 14:13

OPservator OPservator

Poziom 39

Posty: 6683

Pomógł: 554

Ocena: 1218
Pomocny post? (0)

Post #12
20782023 23 Paź 2023 14:13

Nie podjąłbyś się rozwinięcia pojęcia VPN dla opornych? Studentom nie tylko informatyki często trzeba wałkować absolutne podstawy...
#13 20782117 23 Paź 2023 15:02

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+1)

Post #13
20782117 23 Paź 2023 15:02

Nie...poszukaj kogoś, kto jest w tym lepszy, bo jeśli chodzi o VPN, to ja jestem skromnym użytkownikiem, a chociażby na THS było sporo ludzi, którzy w sieciach są znacznie mocniejsi ode mnie.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#14 20782610 23 Paź 2023 20:21

LEDówki LEDówki

Poziom 43

Posty: 9345

Pomógł: 1304

Ocena: 2524
Pomocny post? (0)

Post #14
20782610 23 Paź 2023 20:21

A bitlocker w roli niszczyciela danych? Twócy zachwalają, ale do końca nie ma pewności, że ktoś tego nie odszyfruje, bo dostanie odpowiednie klucze, albo sobie takie stworzy.
#15 20782664 23 Paź 2023 20:51

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+1)

Post #15
20782664 23 Paź 2023 20:51

LEDówki napisał:
nie ma pewności, że ktoś tego nie odszyfruje,
- jak i z każdym innym systemem szyfrującym, takie ryzyko jest.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#16 20782992 24 Paź 2023 07:48

jack63 jack63

Poziom 43

Posty: 11696

Pomógł: 847

Ocena: 2766
Pomocny post? (+5)

Post #16
20782992 24 Paź 2023 07:48

Baaardzo ciekawy artykuł. Sama przyjemność czytania. Dziękuję
Kolega kaleron prezentuje najwyższą klasę fachowca. Trzeba mu serdecznie podziękować, że stara się pomóc użytkownikom Elektrody w ich codziennych problemach z nośnikami danych.
Swoją drogą aż "rzuca się na oczy" różnica między tym artykułem, a bełkotliwymi wypocinami marketingowców. Chapeau bas !!!

Promuję tematy:
23.12.2017 Czy TLP2345 nadaje się do izolacji USART1 STM32f1 i FTDI232 przy 115200 bits/s?
22.07.2016 Re: Zasilacz warsztatowy 0-30V 0-7A z zasilacza ATX
03.03.2004 Pompa ciepła - działanie, eksploatacja - połączenia z innym
#17 20783561 24 Paź 2023 14:52

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+1)

Post #17
20783561 24 Paź 2023 14:52

Dziękuję

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#18 20783610 24 Paź 2023 15:33

siewcu siewcu

Poziom 35

Posty: 3804

Pomógł: 133

Ocena: 456
Pomocny post? (0)

Post #18
20783610 24 Paź 2023 15:33

Chyba jednak nie ma skuteczniejszej metody niż mechaniczna. Z SSD będzie łatwiej, bo kości zeszlifujesz papierem ściernym dość łatwo, ale HDD już trochę trudniejsze.

A z metod wskazanych przez instytucje - która jest najpewniejsza? Teoretycznie co wojskowe to pewne, ale biorąc poprawkę na to, że po zawaleniu WTC z wykopanych dysków udało się odtworzyć sporo danych jednak moment zawahania jest... O ile ktoś na dane wymagające takiego traktowania, ale w takim przypadku prościej chyba oddać sprzęt firmie, która się tym zajmuje i ktoś podpisze cyrograf, że dane nie zostaną odzyskane. Nie żeby to jakoś szczególnie trudne było, ale drogie i dosyć upierdliwe(takie powiedzmy stopienie talerza nie jest zabawą dla każdego, czy zeszlifowanie go na szlifierce do zera).
#19 20783632 24 Paź 2023 15:58

TechEkspert TechEkspert

Redaktor

Posty: 7045

Pomógł: 16

Ocena: 5455
Pomocny post? (0)

Post #19
20783632 24 Paź 2023 15:58

Niszczenie nośników często jest odbierane jako pewniejsze niż nadpisywanie informacji,
są firmy które oferują wiele urządzeń przeznaczonych do niszczenia mechanicznego np. mielarki do dysków:
https://www.pro-device.com/pl/produkt/oms500/

albo dziurkacze do nośników:
https://www.pro-device.com/pl/produkt/mmd360/

Natomiast dla HDD degausery:
https://www.pro-device.com/pl/produkt/asm240/

Czytając materiał doszedłem do wniosku, że dobrze zrealizowane usuwanie danych z nośnika poprzez nadpisywanie danych lub stosowanie wbudowanych procedur w dysku może być równie skuteczne i niszczy dane a nie nośnik...

Promuję tematy:
07.04.2026 Wnętrze nowego plafonu LED 230V
30.03.2026 Obserwacja na żywo zmian częstotliwości 50 Hz w Krajowym Systemie Elektroenergetycznym
29.03.2026 Wnętrze i usterka oraz prowizoryczna naprawa plafonu LED
28.03.2026 Eksperyment - rejestracja THD napięcia sieciowego
27.03.2026 AVEVA InTouch HMI więcej niż SCADA rozmowa z ASTOR - podcast #32
#20 20783647 24 Paź 2023 16:11

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+1)

Post #20
20783647 24 Paź 2023 16:11

siewcu napisał:
nie ma skuteczniejszej metody niż mechaniczna.
Nie widzę sensu szeregowania metod na skuteczniejsze i mniej skuteczne. Jeśli metoda jest skuteczna, żadna inna nie może być skuteczniejsza, bo jeśli dane są zniszczone, to nie można tego efektu osiągnąć bardziej. Można osiągnąć go innymi środkami szybciej, taniej...ale nie można danych zniszczyć skuteczniej. Z kolei jeśli metoda nie jest skuteczna = pozostawia możliwość odzyskania danych, to nie powinniśmy jej brać pod uwagę. A większość metod mechanicznych pozostawia materiał, który potencjalnie może być poddany analizie....
Jeśli uważasz, że metody niszczenia danych można uszeregować w/g pewności/skuteczności, wrzuć tu propozycję, byśmy mogli ją przedyskutować w szerszym gronie.

Owszem,
siewcu napisał:
stopienie talerza nie jest zabawą dla każdego, czy zeszlifowanie go na szlifierce do zera
- jest skuteczne, ale okładanie dysku młotkiem, czy włożenie do piekarnika nie jest metodą skuteczną, nawet jeśli w konkretnych praktycznych przypadkach odzyskanie danych się nie powiedzie. Ale czy na tym przykładzie jesteś w stanie określić, czy stopnienie talerza jest bardziej, czy mniej skuteczne od zeszlifowania talerza w pył? Na pewno obie metody są skuteczniejsze od zmielarki, która pozostawia ścinki pozwalające na odzyskanie (zależnie od gęstości zapisu i rozmiaru ścinków) od kilku do kilkunastu sektorów wzdłuż każdego ścinka x kilkaset do kilku tysięcy ścieżek na szerokość. I choć prawdopodobieństwo realnego odzyskiwania danych ze zmielonego dysku jest znikome, to wciąż nie jest ono zerowe, a więc nie możemy zmielenia dysku uważać za metodę skuteczną.

siewcu napisał:
A z metod wskazanych przez instytucje - która jest najpewniejsza?
- jeśli instytucja wskazuje na metodę skuteczną, to jest ok, jeśli nie - to nie. Różne instytucje wskazują różne metody, ale regulacje i zalecenia często tworzą nietechniczni urzędnicy, więc nie dziw się, kiedy spotkasz w takich dokumentach jakieś bzdury.
siewcu napisał:
Teoretycznie co wojskowe to pewne
- teoretycznie tak, praktycznie, różnie bywa. Wojsko, to taki sam zbiór ludzi o zróżnicowanych kompetencjach, predyspozycjach i zaangażowaniu, jak i każdy inny. W dodatki silnie zhierarchizowane struktury nie służą krytycznemu myśleniu, zwracaniu uwagi na błędy przełożonych i swobodnej wymianie argumentów, co rodzi ryzyko utrwalania pewnych patologii.

siewcu napisał:
po zawaleniu WTC z wykopanych dysków udało się odtworzyć sporo danych
- uszkodzenia były dość trywialne, w większości przypadków były to typowe uszkodzenia mechaniczne, ale ponieważ chodziło o "Dwie Wieże", firma, która to robiła potężnie eksploatowała ten temat marketingowo posuwając się do rozpowszechniania bzdur nie trzymających się kupy, jeśli na nie spojrzeć z punktu widzenia fizyki. Bredzili m. in. o optycznym obrazowaniu namagnesowania okopconych talerzy i przenoszeniu go na inne talerze, gdzie sam fakt zanieczyszczenia powierzchni magnetycznej uniemożliwiłby efektywne wykorzystanie mikroskopii Kerra, a gdyby chcieli faktycznie wiernie odtworzyć w ten sposób namagnesowanie na innych talerzach, pewnie do tej pory by nie skończyli. O ile w ogóle by im się to udało, bo np. każdy talerz ma swoje własne rozmieszczenie wad wykonawczych i defektów struktury krystalicznej.
Dużym problemem jest to, że kiedy brakuje nam wiedzy w jakiejś dziedzinie, zbyt łatwo dajemy się ponieść sztucznie nakręcanym emocjom, jeśli opowiedziana przez marketingowców historia dotyczy jakiegoś ważnego wydarzenia, znanych osobistości, spektakularnych okoliczności itp. Odzyskiwanie danych po zamachu na WTC nie różniło się aż tak bardzo od innych przypadków, jak to było przedstawiane publicznie.

siewcu napisał:
ktoś podpisze cyrograf
- ludzie podpisują różne cyrografy, ale:
- czasami w dobrej wierze podpisują się pod czymś nieprawdziwym, bo brakuje im wiedzy i zrozumienia tego, pod czym się podpisują,
- a czasami po prostu nie szanują swojego słowa i dla doraźnej korzyści są gotowi podpisać się pod czymkolwiek.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#21 20783893 24 Paź 2023 19:31

avatar avatar

Poziom 36

Posty: 4138

Pomógł: 159

Ocena: 406
Pomocny post? (0)

Post #21
20783893 24 Paź 2023 19:31

No tak władza się zmieniła... to instrukcje do niszczarek trzeba dostarczyć?

Promuję tematy:
31.12.2017 W miarę uniwersalny skrypt do obsługi DMM - logowanie zapadów napięcia
#22 20784005 24 Paź 2023 20:23

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+1)

Post #22
20784005 24 Paź 2023 20:23

A myślisz, że przyszli na Hack Summit? Znowu będą laptopy topić w wannie i rozjeżdżać samochodami, jak niektórzy z nich już to kiedyś zrobili...

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
REKLAMA
#23 20784296 24 Paź 2023 23:31

a_jablon a_jablon

Poziom 35

Posty: 3008

Pomógł: 338

Ocena: 832
Pomocny post? (0)

Post #23
20784296 24 Paź 2023 23:31

Weź takim podpowiedz, że wystarczy "zapomnieć" hasła do bitlockera i już są "w miarę bezpieczni" Ile laptopów to uratuje przed niechybną śmiercią....

BTW: w obecnych czasach fizyczne niszczenie nośników jest z lekka na wyrost. Operacja wywoływana z poziomu kontrolera nośnika, nieco czasu, dane nie do odzyskania. Zmiana kluczy szyfrowania w nośnikach self-encrypting i już dane są "śmietnikiem".

Postawić potem system na świeżo i "dane były, danych nima". Cuda, Panie, cuda... Może ABW się uda
#24 20784589 25 Paź 2023 10:26

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+2)

Post #24
20784589 25 Paź 2023 10:26

Tym, to oni się akurat mało przejmują. Przecież nie kupili tych laptopów za swoje, tylko za nasze. A jeśli ABW uda się odzyskać poprawnie zniszczone dane, to będzie dowód na to, że w nieautoryzowany sposób zrobili kopię wcześniej. Bo to też jest istotny problem - możemy sobie niszczyć dane w dowolny sposób, ale jeśli stracimy kontrolę nad kopiami, może to nic nie dać.

Tak na marginesie, znana sprawa wypadku z udziałem Secento, gdzie uszkodzeniu uległy zawierające nagrania stanowiące dowód w sprawie płyty CD. Czy ktoś z Was zna jakieś videorejestratory zapisujące obraz na płytach CD? Bo coś mi się zdaje, że te płyty zawierały kopię, a oryginały nie zostały zabezpieczone lub zostały zabezpieczone tak, żeby nikt nigdy ich nie znalazł.

@a_jablon , a może Ty
OPservator napisał:
podjąłbyś się rozwinięcia pojęcia VPN dla opornych?

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#25 20784667 25 Paź 2023 11:21

a_jablon a_jablon

Poziom 35

Posty: 3008

Pomógł: 338

Ocena: 832
Pomocny post? (0)

Post #25
20784667 25 Paź 2023 11:21

Temat w sumie fajny, można by opisać kilka ciekawych technologii, pokazać dlaczego PPTP odchodzi do lamusa... Kurde, gdybym nie pracował teraz nad dwoma innymi projektami, z miła chęcią. Teraz czasowo słabo będzie, tzn: nie pociągnę trzeciego tematu ;(
#26 20787106 26 Paź 2023 21:48

Sofeicz Sofeicz

Poziom 20

Posty: 401

Pomógł: 12

Ocena: 122
Pomocny post? (+3)

Post #26
20787106 26 Paź 2023 21:48

Mnie tylko smuci ile sprawnych dysków zostało zniszczonych fizycznie z powodu irracjonalnego strachu prze przejęciem przez wraże służby tajnych zdjęć cioci na imieninach.
Czyste marnotrawstwo i zaśmiecanie planety.
#27 20787152 26 Paź 2023 22:10

kaleron kaleron

Konto firmowe
Specjalista - HDD i odzyskiwanie danych

Posty: 7028

Pomógł: 957

Ocena: 2312
Autor tematu Pomocny post? (+2)

Post #27
20787152 26 Paź 2023 22:10

To już kwestia psychologii. Kiedy wiesz, że istnieje coś takiego, jak odzyskiwanie danych, a nie masz wiedzy technicznej i nie rozumiesz fizyki, może Ci się wydawać, że jeśli dysk jest sprawny, odzyskanie nadpisanych danych jest banalnie łatwe, a z kupki wiórów niemożliwe, podczas gdy w rzeczywistości to z kupki wiórów potencjalnie coś jeszcze można wyciągnąć. Nie wspominając o amatorskim okładaniu dysku młotkiem po obudowie. Parę razy widziałem dyski przewiercone, gdzie ktoś nawet nie trafił w talerz. Ot, profesjonalizm w niszczeniu danych, w dodatku często pozbawiony chęci zrozumienia, jak to naprawdę działa.

Ale tak, szkoda sprawnych urządzeń, które są zupełnie bez sensu niszczone generując zbędne koszty i niepotrzebnie obciążając środowisko.

Konto firmowe:
Kaleron sp. z o. o.
Hirszfelda 4/18, Jelcz-Laskowice, 55-231 | Tel.: 713XXXXXX (Pokaż) | Strona WWW: https://kaleron.pl

Promuję tematy:
06.05.2024 Niszczenie, odzyskiwanie i przechowywanie danych - podcast #26
22.10.2023 Wyrzucamy algorytm Gutmanna do kosza - czyli o skuteczności niszczenia informacji
#28 20787321 27 Paź 2023 04:28

PRL PRL

Poziom 41

Posty: 6868

Pomógł: 953

Ocena: 888
Pomocny post? (0)

Post #28
20787321 27 Paź 2023 04:28

A jak się ma odzyskanie danych z dysku szyfrowanego BitLockerem i wyzerowanym? Oczywiście odzyskanie danych pierwotnych, a nie zaszyfrowanych.

Pomogłem? Kup mi kawę.
#29 20787385 27 Paź 2023 07:56

LEDówki LEDówki

Poziom 43

Posty: 9345

Pomógł: 1304

Ocena: 2524
Pomocny post? (+1)

Post #29
20787385 27 Paź 2023 07:56

Artykuł z początku działu odzyskiwanie i danych mówi, że po zerowaniu nie odzyskasz już nic. Do tego dane szyfrowane, więc nie odzyskasz, bo nie będziesz miał do czego szukać kluczy. Oczywiście dla zarządu bajka o trzykrotnym napdisaniu anych, żeby je zamazać brzmi wspaniale. Tutaj jednak rolę odgrywa wspomniana psychologia.
Jeśli na zerowanym i szyfrowanym dysku puścisz instalację systemu, to przecież nadpiszesz poprzednie dane, a w takiej sytuacji problemem jest ich odzyskanie z nieszyfrowanego dysku (jakieś fragmenty można odzyskać i to niekiedy całkiem sporo, ale wiele wysiłku trzeba włożyć w ich przejrzenie i uporządkowanie).
#30 20787404 27 Paź 2023 08:10

PRL PRL

Poziom 41

Posty: 6868

Pomógł: 953

Ocena: 888
Pomocny post? (0)

Post #30
20787404 27 Paź 2023 08:10

Dzięki.

Pomogłem? Kup mi kawę.
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

Zgłoś naruszenie prawa

Podsumowanie tematu

✨ Dyskusja dotyczy skuteczności niszczenia danych, w tym krytyki algorytmu Gutmanna oraz metod usuwania informacji z nośników, takich jak HDD i SSD. Uczestnicy wymieniają różne techniki, takie jak Secure Erase, TRIM, oraz mechaniczne niszczenie nośników. Podkreślają znaczenie odpowiedniego usuwania danych w kontekście przepisów prawnych, takich jak RODO. Wskazują na różnice w skuteczności nadpisywania danych oraz mechanicznego niszczenia, a także na psychologiczne aspekty związane z obawami przed odzyskaniem danych. Wspomniane są również urządzenia do niszczenia danych, takie jak mielarki i degausery.
Wygenerowane przez model językowy.

Wnętrze wielkiego telewizora UE55MU6452U, analiza, dekodowanie i symulacja flash za środka
05 Maj 2026 11:02 (2)
Zastanawialiście się kiedyś, co siedzi w pamięci Flash ze współczesnego telewizora? Zapraszam na krótką prezentację wnętrza telewizora Samsung UE55MU6452U 55” 4K UHD Smart TV połączoną z inżynierią wsteczną i emulacją firmware kontrolera T-Con. Pokażę tutaj, jak zbudowany jest taki telewizor, jak zrealizowane jest jego podświetlenie i jakie elementy można odzyskać ze środka. Na koniec spróbuję też... [Czytaj dalej]
Mostek, kondensator, moc bierna.
03 Maj 2026 21:11 (13)
W związku z tym tematem Eksperyment - rejestracja THD napięcia sieciowego zbudowałem układ składający się z mostka, kondensatora 220uF, żarówki 150W i bocznika do pomiaru prądu. Watomierz wtykany do gniazdka, pokazał napięcie 237V, prąd 1.74Arms, moc pozorną 414VA, moc czynną 234W i Power Faktor 0.57. Niestety nie mierzy mocy biernej. Wykres na oscyloskopie wyglądał tak. Żółty napięcie, niebieski prąd.... [Czytaj dalej]
Usprawnienie odbiornika Unitra Diora Śnieżka R-206
03 Maj 2026 13:41 (20)
Geneza pomysłu Pewnego dnia uratowałem ze śmietnika radioodbiornik Unitra Śnieżka R 206. O dziwo, po podłączeniu do sieci od razu zagrał, a dodatkowo okazał się być przestrojony! Choć nie mam wielkiego sentymentu do Unitry, ten klasyk spodobał się mojej narzeczonej, więc został w salonie na stałe. Mieszkam w Krakowie, gdzie stacje są rozmieszczone dość gęsto. Moje ulubione stacje nadają blisko siebie... [Czytaj dalej]
Dwa malutkie UPS dla routera, kamery lub Raspberry Pi - test pojemności
02 Maj 2026 10:53 (2)
Dziś testuję dwa małe urządzenia zdolne do tymczasowego podtrzymania zasilania odbiornika 5 lub 12 V w obliczu niespodziewanego zaniku energii. Pierwsze z nich to charakterystyczne czarne pudełeczko wpinane w przewód USB, operujące siłą rzeczy tylko na napięciu 5 V. Drugie jest nieco większe, rozmiarem przypomina sam router, pracuje na napięciu 12 V i ma wyjścia 5, 9 i 12 V. Zacznijmy od pierwszego... [Czytaj dalej]
Jedna ładowarka dla wszystkich. Od 28 kwietnia USB-C obowiązkowe także w laptopach w UE
30 Kwi 2026 15:41 (66)
28 kwietnia 2026 r. zaczyna obowiązywać kolejny etap unijnych przepisów dotyczących wspólnej ładowarki do urządzeń elektronicznych. Wynika to z dyrektywy Dyrektywa (UE) 2022/2380, która zmienia regulacje dotyczące urządzeń radiowych sprzedawanych w Unii Europejskiej. Od tej daty wszystkie nowe laptopy wprowadzane na rynek UE muszą obsługiwać ładowanie przez port USB-C. W praktyce oznacza to, że producenci... [Czytaj dalej]

REKLAMA