Twitter també migrarà de MySQL a Cassandra DB

Cassandra  és una base de dades open source distribuïda, és un dels projectes destacats de la Apache Software Foundation i sembla que està pegant fort. En ser distribuïda permet oferir alta disponibilitat, tolerància a fallades i, sobretot, una gran escalabilitat sense pèrdua de rendiment.

Ja l'estaven utilitzant empreses que manegen grans quantitats de dades, com Rackspace, Digg, o Facebook, i la llista es va ampliant.

Les últimes notícies, que vénen des d'una   entrevista del blog MyNoSQL a Ryan King són que Twitter s'està plantejant migrar els seus clústers de servidors MySQL a Cassandra DB.

Aquesta és una presentació del producte, que es pot consultar a la mateixa web del projecte Cassandra

Sortegem dues inscripcions gratuïtes al 10è Fòrum de Business Intelligence

Volem premiar la vostra participació en Dataprix i, per això, aprofitant que som Media Partners d'aquest 10 º Forum de Business Intelligence 2.0, que se celebra el 12 de maig, anem a sortejar dues inscripcions a l'esdeveniment entre els usuaris de Dataprix que ho demanin, i hagin participat mínimament en la comunitat.

Acabat el manual de Mineria de Dades aplicada a l'Enquesta Permanent de Llars

Acabem acabar d'editar l'última incorporació als manuals al web de Dataprix. Es tracta de l'interessant treball Minería de dades aplicada a l'enquesta permanent de llars que Alfonso Cutro ens ha enviat per així poder compartir amb tots vosaltres.

També podeu descarregar la versió original en format pdf des  d'aquesta entrada de blog on ell mateix presenta el treball.

Podeu consultar sota la figura l'índex complet de tot el contingut del manual ( el manual està escrit en castellà)

 

Estrenem la Newsletter setmanal de Dataprix

Subscripción a la Newsletter Semanal de DataprixHem modificat el sistema de subscripció per email al contingut de Dataprix.

Fins ara aquesta subscripció utilitzava el sistema de FeedBurner associat al RSS principal de Dataprix per enviar automàticament a cada usuari subscrit un e-mail diari amb les noves publicacions del dia anterior.

Hem decidit canviar aquest sistema per un de propi que permet una subscripció / baixa instantània des de la mateixa pàgina principal. Per als usuaris registrats només serà qüestió de prémer un botó, i per al qual no sigui usuari només haurà d'introduir una adreça d'email i validar després des de el mail que se li enviarà.

Un altre avantatge que obtenim és que anem a crear una Newsletter per cada idioma de Dataprix per que a cada un li arribin els nous continguts de l'idioma que prefereixi.

Oracle10g: Manual standby database (plantejament inicial)

Una base de dades Oracle en Standby és una còpia exacta d'una base de dades operativa en un servidor remot, usada com a backup, com a còpia per a consulta, recuperació de desastres, etc.

Una base de dades en mode Standby és més que un backup normal ja que es pot posar en producció en cas de desastre en un temps menor que si haguessim de restaurar una còpia (ja sigui des de rman o un simple exportació). Restaurar una còpia des de fitxer triga temps, i durant aquest període el sistema no està disponible. Amb una base de dades addicional en mode standby no hi ha res (o gairebé res de restaurar) en cas de desastre. En qüestió de minuts es fa el canvi permetent continuïtat en el servei.No ens ofereix els avantatges de rendiment d'un cluster o la seguretat del mirall però la relació de costos de temps i llicència versus avantatges em sembla correcta.

Des d'un punt de vista global:

-Disposem d'una còpia de la base de dades de forma remota, que podem comptabilitzar com a segon joc de còpies.

-A diferència d'un simple backup, la còpia es manté viva i les dades són actualitzats amb més freqüència.

Espectacular infografia que reuneix les principals xifres de negoci de Google

Per fer-te una idea del volum de negoci que mou Google res millor que la infografia que han preparat en  pingdom,  on recopilen en un mateix gràfic una timeline amb les principals fites de la companyia, impressionants xifres sobre el cercador, evolució dels beneficis , xifres sobre els empleats de la companyia, i les dades més significatives sobre altres productes d'èxit com Android, YouTube, Blogger, Gmail, Chrome, Orkut i Analytics.

Una bona font d'inspiració per a que algú s'animi a crear un quadre de comandament on poguéssim veure dinàmicament com van evolucionant aquests indicadors tan ben escollits.
 
Segur que més d'un ha clica qualsevol indicador del gràfic per veure si surt alguna cosa més;)

 

Infografia sobre Datos de Negocio de Google

 

 

Oracle10g: Canviar el joc de caràcters de la base de dades

Pot passar que després d'instal lar Oracle o configurar una nova base de dades ens adonem que el joc de caràcters escollit durant la instalació no és el correcte. El que se'ns pot passar en casos com aquest és esborrar la base de dades i reconfigurar o coses pitjors ... Però no cal. Podem canviar el joc de caràcters parant la base de dades, aixecant de manera restrictiva, canviant la configuració i reiniciat la base de dades. Howto:

- Primer ens connectem amb la base de dades 

$ sqlplus sys/pwd@prod as sysdba
 

- Aturem la base de dades 

SQL>SHUTDOWN IMMEDIATE;

 

- Aixequem de forma restrictiva * 

SQL>STARTUP MOUNT;
SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION;
SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
SQL>ALTER DATABASE OPEN;

- Canviem el mapa de caràcters 

SQL>ALTER DATABASE CHARACTER SET <nou mapa de caràcters>;

- Reiniciem la base de dades i yata 

SQL>SHUTDOWN IMMEDIATE;

SQL>STARTUP;

jQuery FlexiGrid 2 en Pentaho

Hola Gent
Arran d'una sèrie de necessitats he decidit desenvolupar per al grup eGlu i, per descomptat, per a tots vostès, un plugin que permet utilitzar  jQuery FlexiGrid des de Pentaho-CDF.

No sé si a vosaltres us ha passat, a mi personalment si, que necessiten un llistat amb una sèrie de característiques com: filtrat, selecció, paginat, ordenament, selecció de columnes visibles, redimensionament, etc., Sens dubte, a això ho proveeix jQuery FlexiGrid 2.0. El tema és que fer-ho funcionar en Pentaho és una mica molest, aquest va ser el meu disparador. Sense més preàmbul els adjunt un vídeo que mostra la funcionalitat del connector. En uns dies adjuntaré al plugin, el seu codi font, les demos i la documentació per tal que el puguin provar i donar-me el feedback. 

SQL08: Actualització estadístiques de taula de forma dinàmica en tota una base de dades

Igual que en Oracle hi ha una taula on es llisten totes les taules de la base de dades (dba_tables) i podem utilitzar per realitzar operacions de manteniment de forma dinàmica, en Sql Server podem fer el mateix consultant la taula [basededades].dbo.sysobjects.

En l'exemple inferior (com en altres que he penjat) actualitzo les estadístiques de totes les taules d'una base de dades de Sql Server de forma dinàmica consultant el diccionari de dades. Aquest es podria encapsular en un stored procedure o directament executar en un job l'Agent de Sql Server per mantenir actualitzades les estadístiques de totes les taules d'una base de dades de forma automàtica.