• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Dostępność danych cyfrowych w przyszłości

    22.09.2010. 16:37
    opublikowane przez: Redakcja Naukowy.pl

    Europejski zespół badaczy stworzył oprogramowanie, które umożliwi w przyszłości zachowanie, dostęp i odczyt danych przechowywanych cyfrowo. Narzędzie jest ogólnie dostępne do bezpłatnego pobrania. Prace były prowadzone w ramach finansowanego ze środków UE projektu CASPAR ("Utrwalanie wiedzy kulturowej, artystycznej oraz naukowej w celu zwiększenia jej dostępności"), wspartego kwotą 8,8 mln euro w ramach obszaru tematycznego "Technologie społeczeństwa informacyjnego" (Information society technologies, IST) Szóstego Programu Ramowego UE (6PR).

    Obszerne zbiory danych elektronicznych, takich jak dane urzędowe, archiwa muzealne oraz wyniki badań naukowych, były dotychczas niedostępne lub narażone na ryzyko utraty. Wynikało to z braku możliwości ich odczytania za pomocą nowszych technologii lub zrozumienia przez obecnych użytkowników. Dzięki opracowaniu nowego oprogramowania, dostępnego na zasadach licencji otwartej, problem ten przeszedł do przeszłości.

    "Informacje cyfrowe są wyjątkowo podatne na uszkodzenia i zarazem mają wyjątkowo dużą wartość" - powiedziała Neelie Kroes, wiceprzewodnicząca Komisji Europejskiej ds. Agendy Cyfrowej. "Osoby, które utraciły dostęp do zdjęć rodzinnych lub starych dokumentów, znają uczucie frustracji towarzyszące korzystaniu z niekompatybilnych ze sobą technologii". Komisarz nie kryła także swojej ekscytacji "potencjałem narzędzi i technik projektu CASPAR w zakresie zapewnienia w przyszłości długotrwałej jakości cennych danych oraz umożliwienia dostępu do nich".

    Jak wiadomo, technologia cyfrowa zrewolucjonizowała nasze podejście do wiedzy i informacji. Niektóre dziedziny nauki, takie jak astronomia czy klimatologia, w szczególnym stopniu opierają się na długookresowej analizie ilościowej dużych zbiorów danych.

    Na przykład dowody wpływu działalności człowieka na globalne ocieplenie są gromadzone od kilku dziesięcioleci. Pomimo postępu w dziedzinie technologii rejestracji danych, począwszy od kart perforowanych i taśm magnetycznych, a skończywszy na przetwarzaniu rozproszonym z wykorzystaniem olbrzymich serwerów, w dalszym ciągu kluczowym elementem postępu naukowego jest dostęp do informacji i możliwość ich zrozumienia w kontekście rozwoju technologicznego. Na przykład w przyszłości ludzie zechcą może wydrukować i zrozumieć dane liczbowe zgromadzone dzięki ziemskim satelitom obserwacyjnym.

    Mając na uwadze te i podobne problemy, w ramach projektu CASPAR zajęto się wieloma aspektami przechowywania wszelkich typów informacji w postaci cyfrowej oraz możliwościami wykorzystania ich w przyszłości. Za pomocą opracowanego przez badaczy narzędzia można opisać wszystkie rodzaje danych w sposób powalający na ich przyszłe wykorzystanie, co stanowi proces równoważny wydrukowi tych danych w czasach obecnych. Projekt CASPAR zapewnił możliwość zrozumienia i łatwego wykorzystania danych liczbowych i związków między nimi za pomocą dowolnego oprogramowania w ramach dowolnych badań prowadzonych przez naukowców.

    Partnerzy projektu CASPAR pochodzili z Czech, Francji, Grecji, Izraela, Wielkiej Brytanii i Włoch. Według nich opisane metody zastosowano na szeroką skalę oraz pomyślnie przetestowano z wykorzystaniem różnych rodzajów danych z dziedziny badań naukowych, dziedzictwa kulturowego i współczesnej sztuki performatywnej. W odniesieniu do dziedziny badań naukowych badacze przetestowali dane pochodzące z nauk o Ziemi, natomiast w odniesieniu do obszaru dziedzictwa kulturowego skoncentrowali się na utrwaleniu wszystkich danych niezbędnych do sporządzenia jego dokumentacji, wizualizacji i modeli. W zakresie sztuki współczesnej zespół zbadał szereg dziedzin, począwszy od muzyki współczesnej, poprzez sztuki performatywne, skończywszy na innych formach sztuki wykorzystujących technologię, takich jak gry wideo.

    Za: CORDIS

    Czy wiesz ĹĽe...? (beta)
    Big data – termin odnoszący się do dużych zbiorów danych, których przetwarzanie wymaga zastosowania specjalistycznego oprogramowania. W praktyce pojęcie dużego zbioru danych oznacza rozmiar wyrażany przy pomocy co najmniej dziesiątek terabajtów, a często nawet petabajtów. Big data ma zastosowanie wszędzie tam, gdzie dużej ilości cyfrowych danych towarzyszy potrzeba zdobywania nowych informacji lub wiedzy. Szczególne znaczenie odgrywa wzrost dostępności Internetu oraz usług świadczonych drogą elektroniczną, które w naturalny sposób są przystosowane do wykorzystywania baz danych. EuroFIR (European Food Information Resorce - Europejskie Źródło Informacji o Składzie Żywności) jest międzynarodowym stowarzyszeniem non-profit, które wspiera wykorzystanie istniejących oraz przyszłych źródeł danych dotyczących składu żywności poprzez współpracę i harmonizację jakości danych, ich funkcjonalności oraz spełnianie światowych standardów. Pamięć podręczna (ang. cache) – mechanizm, w którym część spośród danych zgromadzonych w źródłach o długim czasie dostępu i niższej przepustowości jest dodatkowo przechowywana w pamięci o lepszych parametrach. Ma to na celu poprawę szybkości dostępu do tych informacji, które przypuszczalnie będą potrzebne w najbliższej przyszłości.

    Dostępność transportowa – stopień łatwości z jakim można dostać się do danego miejsca, dzięki istnieniu sieci infrastruktury i usług transportowych. Dany punkt obszaru jest tym dostępniejszy transportowo, im więcej jest innych punktów, do których można dotrzeć zadowalająco szybko, tanio i sprawnie. Zostało stworzonych i zdefiniowanych szereg specyficznych pojęć tej dostępności, takich jak: dostępność czasowa, dostępność gałęziowa, dostępność wielogałęziowa (multimodalna), dostępność transportu publicznego, dostępność do węzłów transportowych, dostępność potencjałowa (ang. potential accessibility) i inne. Pojęcie składu informatycznych nośników danych
    Zgodnie z rozporządzeniem Prezesa Rady Ministrów z dnia 18 stycznia 2011 r. w sprawie instrukcji kancelaryjnej, jednolitych rzeczowych wykazów akt oraz instrukcji w sprawie organizacji i zakresu działania archiwów zakładowych pod pojęciem składu informatycznych nośników danych rozumiany jest uporządkowany zbiór informatycznych nośników danych zawierających dokumentację w postaci elektronicznej. Przez informatyczny nośnik danych rozumie się materiał lub urządzenie służące do zapisywania, przechowywania i odczytywania danych w postaci cyfrowej. Podmiot publiczny, który organizuje przetwarzanie danych w systemie teleinformatycznym, musi stworzyć możliwość przekazywania danych także w postaci elektronicznej z wykorzystaniem informatycznych nośników danych lub środków komunikacji elektronicznej.

    Przesyłki przekazywane na informatycznym nośniku danych w systemie EZD (Elektroniczne Zarządzanie Dokumentacją)
    Przesyłki przekazywane na informatycznych nośnikach danych dzieli się na:

    MVCC (ang. "Multiversion Concurrency Control"), mechanizm kontroli współbieżności. Ogólna koncepcja wykorzystywana w różnej formie przez wiele współczesnych systemów baz danych, sprowadzająca się do umożliwienia jednoczesnego dostępu oraz wykonywania operacji na tych samych danych wielu odbiorcom. Portal Badań Estońskich (est. Eesti Teadusportaal, ETIS; ang. Estonian Research Portal) – system informacyjny utworzony przez Estońskie Ministerstwo Szkolnictwa i Nauki, którego zadaniem jest ułatwienie szybkiego dostępu do aktualnych i kompleksowych informacji o nauce estońskiej w różnych jej dziedzinach. Na portalu można zasięgnąć informacji dotyczących instytutów i projektów naukowo-badawczych oraz estońskich badaczy i ich publikacji. System zawiera kilka działów i baz danych, m.in.: aktualności naukowe, forum, polityka badań naukowych i rozwoju, współpraca międzynarodowa i itd.

    Eksploracja danych (spotyka się również określenie drążenie danych, pozyskiwanie wiedzy, wydobywanie danych, ekstrakcja danych) (ang. data mining) - jeden z etapów procesu odkrywania wiedzy z baz danych (ang. Knowledge Discovery in Databases, KDD). Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych.

    Dodano: 22.09.2010. 16:37  


    Najnowsze