Dataiku és una plataforma de ciència de dades col·laborativa que permet als usuaris preparar, analitzar i modelar dades en un entorn de visualització intuïtiu. Amb Dataiku, els usuaris poden treballar en projectes de ciència de dades de manera col·laborativa, compartir informes i models, i automatitzar el flux de treball de les dades per a accelerar el temps de presa de decisions.
Dataiku combina la potència de la ciència de dades, SQL, Hadoop i Spark. Automatitza tot el cicle de vida de la ciència de dades: des de la preparació de les dades, l'aprenentatge automàtic i l'analítica avançada fins al desplegament de l'analítica de producció.
Entre les funcionalitats de Dataiku es troben:
- Integració de fonts de dades: Dataiku permet integrar i treballar amb una àmplia varietat de fonts de dades, incloent-hi bases de dades relacionals, sistemes d'arxius, APIs web, i sistemes de big data com Hadoop i Spark.
- Neteja i preparació de dades: Dataiku ofereix utilitats per a netejar i preparar les dades, incloent-hi l'eliminació de duplicats, la rellenación de valors que manca, i la normalització de dades.
- Anàlisi estadística i visualització: eines per a analitzar i visualitzar les dades, incloent-hi taules dinàmiques, gràfics i mapes interactius.
- Creació de models de machine learning: el programari proporciona una interfície d'arrossegar i deixar anar per a crear models de machine learning, incloent-hi models de regressió, classificació, i clustering.
- Automatització i escalabilitat: permet automatitzar els fluxos de treball de les dades i escalar els projectes de ciència de dades a través de la integració amb eines d'automatització com a Apatxe Airflow i Kubernetes.
- Col·laboració i gestió de projectes: inclou un sistema de gestió de projectes i col·laboració, permetent als usuaris treballar en projectes de ciència de dades de manera col·laborativa, compartir informes i models, i controlar l'accés a les dades i les tasques dels projectes.
- Suporta diferents entorns de núvol i on-*premise, oferint flexibilitat quant a on s'executa la plataforma.
La plataforma proporciona una forma fàcil i flexible de construir i mantenir un pipeline, utilitzant les millors pràctiques amb tecnologies modernes per a anàlisis de big data, aprenentatge automàtic, intel·ligència artificial i computació en el núvol.
Combina el rendiment d'un entorn de programació similar a MATLAB i la potència del framework Spark per a facilitar l'analítica.
Compta amb una interfície d'usuari intuïtiva que permet als usuaris no tècnics explorar, analitzar, netejar i visualitzar les seves dades, sense necessitat de coneixements tècnics.
Disposa de diferents versions adaptades a la grandària de la companyia, i també d'una edició instal·lable gratuïta
- Log in to post comments