Pentaho Solutions: Reseñas

Bones.
Finalment he acabat de llegir el llibre Pentaho Solutions,que gentilment m'han fet arribar Roland Bouman (co-autor del llibre) i Wiley.

En aquesta ocasió també realitzaré diferents ressenyes des de diferents punts de vista, tal com ho vaig fer amb Pentaho Reporting. A continuació les ressenyes:

 

1) Ressenya general: és un llibre molt fàcil de llegir i maneja molt bé els continguts teòrics i pràctics.

A mesura que van exposant els conceptes més complexos i pesats, s'acompanya sempre amb algun exemple, gràfic o exercici.

És un llibre realment molt útil i d'indispensable lectura, tant per a aquelles persones que recentment comencen a treballar amb Pentaho, com per a les que portem ja temps.

La informació és poder, el Business Intelligence en la Direcció General

"L'objectiu del Business Intelligence és donar la informació que necessiten, en el moment en què la necessiten i de la forma adequada a les persones que han de prendre les decisions."

L'objectiu d'aquest article és defensar que el Business Intelligence o BI hauria de ser, de totes les eines del programari empresarial (incloent CRM, ERP, o el mateix BI), aquella més propera a la funció de la direcció, en concret a la Direcció General.

Des de la revolució de la informàtica i l'explosió d'Internet, la informació té cada vegada més i més importància. Tot està digitalitzat o ho estarà aviat, la quantitat d'informació existent es multiplica cada any i l'activitat de les nostres empreses està informatitzada en la majoria dels seus aspectes.

Els estudis ens diuen que la informació gestionada per les empreses es duplica cada dos anys i que el 80% de les decisions es prenen amb tan sols el 10% de la informació disponible.

I tota aquesta informació és poder! Es necessària, vital, per competir.

SQL08: Com desactivar el autocommit en SQL Server Management Studio

Alguna vegada us heu preguntat com desactivar el autocommit al Management Studio de Sql Server? Doncs la resposta és ràpida. El podeu canviar activant al menú Eines> Opcions> Execució de la consulta> SQL Server> Ansi> SET IMPLICIT_TRANSACTIONS.

 

 

Sembla una mica simple però com m'ho han preguntat un parell de vegades ...

Compactar taules per optimitzar MySQL

Amb MySQL, quan s'eliminen registres d'una taula, l'espai no es reassignació automàticament. Queda com a espai buit que es realitzen noves insercions es va aprofitant.

El problema d'això és que si en una taula es realitzen moltes operacions de DELETE, l'espai físic de la taula va quedant cada vegada més fragmentat i el rendiment es redueix.

En els motors MyISAM i InnoDB de MySQL, disposem de la comanda OPTIMITZAR TABLE per poder realitzar sobre qualsevol taula una optimització que, entre altres coses, fa una defragmentació automàtica de la taula.

És molt recomanable utilitzar aquesta comanda regularment sobretot sobre les taules que reben més sentències d'eliminació de registres.

Com a precaució, tenir en compte que durant la seva execució, com és lògic, la taula queda bloquejada. Cal acordar quan ho anem a utilitzar amb taules grans i amb molt moviment.

La sintaxi és supersimple:

 

SQL08: affinity_mask, io_affinity_mask i com muntar dos entorns en un mateix servidor sense que es "trepitgin"

Ens posem en situació
En el nostre entorn és possible que necessitem disposar de dos rèpliques d'una/s base de dades en entorns diferenciats (el clàssic exemple seria producció i test). Per decidir com ho fem les preguntes més comuns que ens hem de fer són:

- Aquest nou entorn serà temporal? Conté bases de dades gran en quant a volum i / o la càrrega que ha de suportar és elevada (encara que sigui test)?
- Disposo de la versió de desenvolupament de SqlServer2008? Que només està al teu abast si tens una subscripció MSDN ...
- Disposo d'un servidor addicional?

En base a aquestes preguntes i totes les que se li puguin a un ocórrer es pot optar per diferents solucions:
-El més senzill i si la base de dades més la càrrega a suportar són petites podem utilitzar el mateix servidor per a totes les bases de dades (vam crear en el mateix servidor amb noms diferents (_Test) i Santes pasqües ...). Perquè no es molestin entre si podem utilitzar Resource Governor.

Resum de la meva Tesi - Mineria de Dades aplicada a l'anàlisi de la deserció a la Cursa de Analista en Sistemes de Computació

En la present investigació es va realitzar una Mineria de Dades sobre el Cub 04 desgranant, exportat del Sistema de Gestió Acadèmica SIU-Guaraní, proveïts pel Ministeri d'Educació, Ciència i Tecnologia de la Nació.

L'objectiu principal va ser maximitzar la qualitat que els models tenen per classificar i agrupar els estudiants, d'acord a les seves característiques acadèmiques, factors socials i demogràfics, que han desertat de la Carrera Analista en Sistemes de Computació de la Facultat de Ciències Exactes, Químiques i Naturals de la Universitat Nacional de Missions.

Després, aquests models van ser utilitzats per realitzar pronòstics sobre la resta dels alumnes.

El projecte es va desenvolupar sota la metodologia de lliure difusió Crisp-DM i amb l'eina comercial IBM DB2 Warehouse (versió 9.5).

La qualitat dels models obtinguts a través de la classificació amb arbres de decisió va superar a la tècnica d'agrupament a través de la generació de clústers i totes dues han superat àmpliament el plantejat.

 

SQL08: Sincronització de la base de dades de Microsoft Dynamics AX 2009 sobre Sql Server 2008

Per a aquells administradors de bases de dades que hagin de tractar amb un tal Dynamics Ax 2009 i els seus sequaços (desenvolupadors, consultors, etc ) Deixo aquí un parell de cosetes que s'han de saber (o et han de dir) quan unim ax2009 i sql server 2008. De vegades es pot apuntar a la base de dades com a font del problema però no sempre és així. Alguns requeriments a tenir en compte per a la instal lació de Ax2009 són que l'usuari amb el que vulguin accedir per fer la instal lació ha de ser usuari de DOMINI i en SQL Server ha de ser membre de rol dbcreator i securityadmin per poder crear la nova base de dades des l'instal lador de Ax. Un cop instal lat (o durant el procés d'instal lació) els problemes amb la base de dades que ens podem trobar poden ser: 

Cas 1:
Un altre problema conegut a la sincronització de dades es pot produir per la falta de permisos. El missatge diu alguna cosa així:

Bases de Dades Express. Una manera de començar amb les grans.

En una entrada anterior del bloc (Bases de Dades OpenSource. Per què escollim Mysql per al nostre projecte?), parlem de les bases de dades Open Source com a opció interessant i fiable per al desenvolupament de projectes de Business Intelligence. Vam veure diferents productes i algunes comparatives entre ells.

Dimensions Lentament canviants

Les dimensions lentament canviants o SCD (Slowly Changing Dimensions) són dimensions en les quals les seves dades tendeixen a modificar-se a través del temps, ja sigui de forma ocasional o constant, o impliqui a un sol registre o la taula completa. Quan es produeixen aquests canvis, es pot optar per seguir alguna d'aquestes dues grans opcions: