Detecció de dades amb soroll en bases de dades utilitzant eines OLAP

Resum

 

Per realitzar una correcta auditoria de sistemes cal que les dades incloses en les bases de dades tinguin qualitat, per aquest motiu cal analitzar si és possible la detecció de sorolls en una base de dades, utilitzant una eina de visualització OLAP.
Per detectar soroll a través de tècniques de visualització OLAP 1 utilitzem una metodologia Top-Down, intentant anar des del general al particular. D'aquesta manera, a cada etapa anem refinant cada cop més la granularitat del soroll detectat, fins a aconseguir aïllar cada tupla amb soroll.
Durant el procés d'experimentació primerament se selecciona la font de dades, un cop obtinguda aquesta, es genera una matriu de dispersió. Per aconseguir visualitzar com es agrupa els valors de cada atribut de manera clara, s'aplica un desplaçament aleatori sobre els valors en els eixos xiy (Jitter), per identificar els atributs la dispersió representi la probabilitat de soroll. Sobre els atributs en els quals s'observi alguna irregularitat, es genera un gràfic de dispersió (Scatter). Novament per aconseguir una millor visualització de l'agrupació de les dades apliquem un Jitter. Així s'identifiquen el rang de valors en què es presenta el soroll i amb aquest i el de cada atribut es realitza una consulta a la base de dades per aïllar-lo.
A causa de el que s'ha exposat, hem vist que per detectar el soroll d'una manera més ràpida i clara, és necessari aplicar una petita variació aleatòria dels valors de X i Y (Jitter). Això genera una lleu dispersió dels punts en els gràfics i ens permet identificar a simple vista en què rang de valors es concentra cada atribut i en què rang el soroll existent.
A través d'aquesta investigació hem demostrat que utilitzant eines de visualització OLAP és possible identificar el soroll present en una base de dades i fins i tot, si es desitja, és possible aïllar-lo.
D'aquesta manera s'obtenen dos segments de la base de dades, un amb soroll i una altra sense soroll present.
Creiem que això és una aportació molt útil per a investigadors i personal de sistemes en general que necessitin treballar amb bases de dades netes de soroll, així com també, per als auditors de sistemes per a la recerca de dades amb soroll.
 

 Descàrrega el document Detección de datos con ruido en base de datos utilizando herramientas olap