Dane legacy – balast czy skarbnica wiedzy?
W każdej firmie, która istnieje dłużej niż kilka lat, gromadzą się dane w starych, często już nieużywanych formatach. Dyski twarde pełne plików z lat 90., bazy danych na przestarzałych serwerach, dokumenty zapisane w formatach, których nikt już nie otwiera. Pierwszym odruchem może być chęć pozbycia się tego balastu – w końcu zajmuje miejsce i generuje koszty. Ale czy na pewno to dobry pomysł?
Przykład z życia: pewna firma farmaceutyczna przez przypadek odkryła w swoich archiwach wyniki badań klinicznych sprzed 20 lat, zapisane na nośnikach magnetooptycznych. Okazało się, że zawierają one cenne dane o skutkach ubocznych leku, które właśnie wróciły do łask w nowej terapii. Koszt odzyskania tych informacji był znacznie niższy niż przeprowadzenie nowych badań od zera.
Z drugiej strony, bank który przez lata przechowywał dane klientów z zamkniętych oddziałów, musiał wydać miliony na ich migrację i zabezpieczenie zgodne z RODO. Czy było to konieczne? To zależy od tego, jak spojrzymy na problem – jako na koszt czy inwestycję.
Rachunek ekonomiczny archiwizacji
Koszty przechowywania danych legacy rosną wykładniczo wraz z ich objętością. Serwerownie zużywają energię, nośniki się psują i wymagają wymiany, a specjalistyczne oprogramowanie do odczytu starych formatów bywa horrendalnie drogie. Firmy często nie zdają sobie sprawy, że koszty utrzymania archiwum przez 10 lat mogą przekroczyć wartość zawartych w nim informacji.
Ale jest druga strona medalu. Wiele organizacji dopiero po latach odkrywa, że stare dane zawierają:
- Wzorce zachowań klientów, których nie da się odtworzyć z nowszych danych
- Historyczne dane przydatne w sporach sądowych
- Unikalną wiedzę pracowników, którzy już nie pracują w firmie
- Dokumentację patentową mogącą stanowić o przewadze konkurencyjnej
Kluczem jest podejście selektywne. Zamiast archiwizować wszystko, warto przeprowadzić audyt i określić, które dane mają potencjalną wartość biznesową lub prawną. W przypadku dokumentów finansowych czy medycznych okres przechowywania często wynika z przepisów – tutaj nie ma dyskusji. Ale już np. całe kopie systemów ERP sprzed migracji rzadko kiedy warto trzymać w całości.
Ciekawym rozwiązaniem są też usługi hybrydowe – część danych można przenieść do tańszej chmury w formie skompresowanej, zachowując możliwość ich odtworzenia w razie potrzeby. Koszt przechowywania 1TB danych w chmurze zimnej spadł ostatnio poniżej 20 dolarów rocznie, co zmienia ekonomikę decyzji archiwizacyjnych.
Decyzja o archiwizacji to zawsze zakład na przyszłość. W przypadku niektórych branż, jak energetyka czy ubezpieczenia, gdzie cykle danych liczą się w dziesięcioleciach, inwestycja w porządne archiwum zawsze się zwraca. Ale startup technologiczny raczej nie potrzebuje trzymać kodów źródłowych swoich pierwszych, dawno porzuconych wersji oprogramowania. Chyba że – jak pokazuje przykład Instagrama – stare funkcje nagle nie staną się modne ponownie.
Największym błędem nie jest ani archiwizowanie, ani usuwanie danych legacy, ale robienie tego bez przemyślanej strategii. Warto poświęcić czas na analizę, które informacje mogą być kiedyś cenne, a które to tylko elektroniczny śmieć. Bo w erze big data nawet najstarsze dane mogą okazać się złotem – pod warunkiem, że wiemy, gdzie ich szukać i jak je wykorzystać.
