• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Przechowywanie i indeksowanie masowych danych, Buckinghamshire, Wlk. Brytania

    31.01.2013. 16:37
    opublikowane przez: Redakcja Naukowy.pl

    Dnia 7 lutego 2013 r. w Buckinghamshire, Wlk. Brytania, odbędzie się sympozjum pt. "Przechowywanie i indeksowanie masowych danych" (Storage and Indexing of Massive Data).

    Świat tonie w danych. W świecie biznesu każdy menedżer na Ziemi jest oblężony przez dane. Napływają przez elektroniczne drzwi za pośrednictwem poczty e-mail, są generowane przez pracowników przygotowujących biznesplany i zamówienia zakupowe, mnożąc się w postępie niemal geometrycznym. Fakt, że większość danych jest skomputeryzowana powinien, przynajmniej w teorii, znacznie uprościć zarządzanie danymi. W rzeczywistości jednak trudno jest nawet wyobrazić sobie, ile danych wytwarza przedsiębiorstwo każdego dnia, nie mówiąc już o dekadach. Obecne i stale rosnące tempo, w jakim dane powstają szybko zaczyna przewyższać naszą zdolność do ich przetwarzania i wykorzystywania.

    Wydarzenie poświęcone będzie analizie skutecznych metod obliczeniowych, które opracowano dotychczas w celu obsługi masowych danych oraz spojrzeniu w przyszłość i nakreśleniu strategii radzenia sobie z wyzwaniami w kolejnych dekadach.

    Za: CORDIS

    Czy wiesz ĹĽe...? (beta)
    Usługa metakatalogu służy przepływowi danych między jednym lub więcej serwerem usług katalogowych i baz danych w celu zapewnienia synchronizacji danych. Jest ważną częścią systemów zarządzania tożsamością. Synchronizowane dane to zwykle profile użytkowników i informacje o polisach i autoryzacji. Większość implementacji metakatalogu synchronizuje dane do minimum jednego serwera usług katalogowych by zapewnić aplikacjom działającym w oparciu o katalogi, takim jak pojedyncze logowanie, dostęp do bieżących danych nawet jeśli źródłowe dane nie znajdują się w katalogu. Strumieniowa baza danych to baza danych, w której dane są przedstawione w postaci zbioru strumieni danych. System zarządzania taką bazą nazywany jest strumieniowym systemem zarządzania danymi (DSMS - ang. Data Stream Management System). Data Vault – technika modelowania danych (w hurtowniach danych) zaprojektowana tak, aby zapewnić przechowywanie danych historycznych z wielorakich systemów operacyjnych (źródłowych). Data Vault oznacza również, obok aspektu modelowania, sposób patrzenia na dane historyczne, który zapewnia audytowalność, śledzenie danych, szybkość ładowania oraz odporność na zmiany biznesowe.

    Amazon Simple Storage Service (Amazon S3) - internetowy nośnik danych firmy Amazon, ma prosty w obsłudze interfejs WWW, który umożliwia dostęp do przechowywanych danych i zarządzanie nimi. Ilość przechowywanych danych jest praktycznie nielimitowana. Jakość i skalowalność infrastruktury Amazon S3 jest taka sama jak ta używana przez firmę Amazon do udostępniania i zarządzania własną, globalną siecią stron internetowych. Administrator danych (AD) – termin prawniczy, który w prawie polskim został zdefiniowany w ustawie z dnia 29 sierpnia 1997 roku o ochronie danych osobowych. W praktyce często stosowane jest określenie administrator danych osobowych (ADO). Oznacza organ, jednostkę organizacyjną, podmiot lub osobę decydujące (samodzielnie) o celach i środkach przetwarzania danych osobowych (art. 7 pkt 4). Jest to podmiot praw i obowiązków, który sprawuje władztwo nad przetwarzaniem danych osobowych przez zaciąganie zobowiązań i rozporządzanie prawami. Nie ma przy tym znaczenia fakt, czy podmiot ten jest w posiadaniu przetwarzanych danych lub sam je przetwarza.

    Analiza danych – proces przetwarzania danych w celu uzyskania na ich podstawie użytecznych informacji i wniosków. W zależności od rodzaju danych i stawianych problemów, może to oznaczać użycie metod statystycznych, eksploracyjnych i innych. Pojęcie składu informatycznych nośników danych
    Zgodnie z rozporządzeniem Prezesa Rady Ministrów z dnia 18 stycznia 2011 r. w sprawie instrukcji kancelaryjnej, jednolitych rzeczowych wykazów akt oraz instrukcji w sprawie organizacji i zakresu działania archiwów zakładowych pod pojęciem składu informatycznych nośników danych rozumiany jest uporządkowany zbiór informatycznych nośników danych zawierających dokumentację w postaci elektronicznej. Przez informatyczny nośnik danych rozumie się materiał lub urządzenie służące do zapisywania, przechowywania i odczytywania danych w postaci cyfrowej. Podmiot publiczny, który organizuje przetwarzanie danych w systemie teleinformatycznym, musi stworzyć możliwość przekazywania danych także w postaci elektronicznej z wykorzystaniem informatycznych nośników danych lub środków komunikacji elektronicznej.

    Przesyłki przekazywane na informatycznym nośniku danych w systemie EZD (Elektroniczne Zarządzanie Dokumentacją)
    Przesyłki przekazywane na informatycznych nośnikach danych dzieli się na:

    DMP (Data Management Platform) jest to platforma do zarządzania danymi z różnych źródeł, w celu przetworzenia ich i udostępnienia dla platform zakupowych (DSP) i sprzedażowych (SSP). Daje centralną kontrolę nad procesami przetwarzania i analizy danych oraz realizacji kampanii, umożliwiając optymalizację działań marketingowych ukierunkowaną na dotarcie do większej liczby pożądanych klientów. Dane z platformy zawierają informacje, które reklamodawcy mogą wykorzystać do podjęcia decyzji czy chcą emitować reklamę właśnie temu użytnikowi. Baza danych – zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego programu komputerowego specjalizowanego do gromadzenia i przetwarzania tych danych. Program taki (często pakiet programów) nazywany jest „systemem zarządzania bazą danych” (ang. database management system, DBMS).

    Blob – w systemach zarządzania bazami danych: typ danych, który umożliwia przechowywanie dużych ilości danych binarnych jako pojedynczy obiekt w bazie danych, stosowany w szczególności do przechowywania danych multimedialnych, takich jak grafika, muzyka czy filmy.

    Migracja danych (ang. data migration) – przeniesienie danych z jednego systemu informatycznego, bazy danych, formatu danych do innego.

    Eksploracja danych (spotyka się również określenie drążenie danych, pozyskiwanie wiedzy, wydobywanie danych, ekstrakcja danych) (ang. data mining) - jeden z etapów procesu odkrywania wiedzy z baz danych (ang. Knowledge Discovery in Databases, KDD). Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych.

    Dodano: 31.01.2013. 16:37  


    Najnowsze