System eksploracji danych z wykorzystaniem dokumentów XML Kamil Litman
System eksploracji danych z wykorzystaniem dokumentów XML Kamil Litman
Planowany przebieg prezentacji
Wstęp
Cele i założenia
Eksploracja danych
Opis projektu
Proponowane rozwiązania
Pytania
Planowany przebieg prezentacji
Wstęp
Cele i założenia
Eksploracja danych
Opis projektu
Proponowane rozwiązania
Pytania
Wstęp
Temat pracy:
System eksploracji danych z wykorzystaniem dokumentów XML
Kierujący pracą:
dr inż. Jacek Rumiński
Planowany przebieg prezentacji
Wstęp
Cele i założenia
Eksploracja danych
Opis projektu
Proponowane rozwiązania
Pytania
Cel pracy dyplomowej
Stworzenie systemu wydobywania wiedzy z hurtowni danych opartej o dane historyczne pozyskane z różnorodnych źródeł oraz raporty zawarte w dokumentach XML.
Wykorzystanie omawianych rozwiązań w diagnostyce medycznej.
Cel pracy dyplomowej
Istotnym celem pracy jest również zapoznanie się z funkcjonującymi obecnie metodami budowy hurtowni danych.
Zaproponowanie wykorzystania dokumentów XML do raportowania w medycynie.
Zapoznanie się i wykorzystanie metod wydobywania wiedzy (data mining) z hurtowni danych.
Cel pracy dyplomowej
Stworzony system musi zapewniać bezpieczeństwo danych w nim zawartych (dane osobowe).
Cel pracy - podsumowanie
Ostatecznym celem pracy jest działający system informatyczny wraz z zestawem danych testowych i ich wyjaśnieniem ich znaczenia oraz dokumentacją (w postaci pracy dyplomowej) zgodną z regulacjami CMMI level 2, Project Planning
Założenia
Podstawowym założeniem jest zapewnienie możliwości efektywnego wykorzystania stworzonego systemu w diagnostyce medycznej.
Założenia
System składający się z:
Serwera łączącego funkcję:
Serwera aplikacji (umożliwienie dostępu do aplikacji za pośrednictwem protokołu https),
Serwera bazy danych,
Komputerów klienckich mających dostęp do Internetu,
Aplikacja,
Hurtownia i bazy danych.
Serwer WWW:
System operacyjny: Red Hat Enterprise Linux Version 1.4
Apache HTTP Server Version 2.2
Serwer bazy danych:
PostgreSQL Version 7.4
Założenia
Aplikacja:
Napisana w Javie z wykorzystaniem zdefiniowanych:
JDBC 3.0 Specification – do łączenia się z bazami i hurtownią
The Java Metadata Interface (JMI) Specification – do zarządzania meta danymi
XML Data Binding Specification – do raportów XML
Data Mining (Data Mining 2.0) API
Założenia
Aplikacja:
Umożliwia:
Załadowanie danych początkowych do hurtowni
Oczyszczanie, integrację, redukcje danych
Tworzenie hurtowni tematycznych
Eksplorację danych
Prezentację wiedzy
Uzupełnianie danych
Założenia
Bazy danych:
Rozproszone terytorialnie
Oparte o różnorodne modele i schematy
Zdywersyfikowane pod względem nazewnictwa
Oparte o dowolną technologię
Będące na zewnątrz systemu
Założenia
Hurtownia danych
Oddzielna od baz cząstkowych
Oparta o założony meta – model
Zbudowana na modelu MOLAP
Zawierająca hurtownie tematyczne:
Zmaterializowane
Wirtualne
Planowany przebieg prezentacji
Wstęp
Cele i założenia
Eksploracja danych
Opis projektu
Proponowane rozwiązania
Pytania
Po co eksploracja danych?
We are drowning in data, but starving for knowledge!
Po co eksploracja danych?
Increasing potential
to support
Decisions Doctor DBA Making
Decisions Data Presentation Visualization Techniques Data Mining Information Discovery Data Exploration OLAP, MDA Statistical Analysis, Querying and Reporting Data Warehouses / Data Marts Data Sources Paper, Files, Information Providers, Database Systems, OLTP
Comments