Sei sulla pagina 1di 6

Qu es Pentaho

Es un proyecto iniciado por una comunidad OpenSource, provee una


alternativa de soluciones de BI en distintas reas como en la
Arquitectura, Soporte, Funcionalidad e Implantacin. Estas
componentes, al igual que su ambiente de implantacin, estn
basadas en JAVA, brindando entonces gran flexibilidad.
Gracias a la integracin funcional de diversos proyectos de
OpenSource permite ofrecer soluciones en reas como: anlisis de
informacin, reportes, dashboards, flujos de trabajo y minera de
datos.
Las principales son:

Plataforma BI : provee la arquitectura y la infraestructura a la


vez. Mondrian, forma parte del motor OLAP integrado en el
SUITE BI de PENTHO.

Pentaho Reporting JfreeReport/ Pentaho Reporting: herramienta


de Reportes.

Kettle Pentaho Data Integration (Extraction Transformation


Load): usando una interface grafica SPOON permite disear
jobs de transformacin de datos para ser procesados bajo las
herramientas de Kettle (PAN y KITCHEN)

WEKA : minera de datos.

Instalacin y configuracin de Pentaho

Mi primera aproximacin fue por medio de las versiones comerciales


disponibles. Baj la versin para Windows 7. La instalacin fue
sencilla. Arm un pequeo data warehouse para un trabajo
acadmico, con Oracle como base de datos.
Encontr buena documentacin. Pude acceder bien a los datos, armar
reportes y tableros de control.
Fue una experiencia til para entender la herramienta y plantear
nuevos problemas a resolver. De todas maneras, el desafo fue
configurar la versin Open Source.
En los siguientes prrafos ennumero los pasos seguidos. Hubo mucho
'google' y prueba y error! Hay mucha informacin disponible. Hice un
resumen de todo lo leido, que ahora quiero compartir. Bienvenidos los
comentarios y aportes!

Bajar zips y descomprimirlos en el lugar adecuado


Las herramientas de cdigo abierto se pueden bajar de Pentaho
community y sourceforge.
Baj algunas de las herramientas que componen Pentaho y arm un
cuadro con el detalle. Tom como gua un artculo de la wiki de la
comunidad.

A continuacin la instalacin de los tres primeros componentes.

1. Crear directorio c:\Pentaho

2. Descomprimir en el mismo el servidor BI de Pentaho (biserver-


ce).

3. Crear el directorio c:\Pentaho\design-tools.

4. Dentro del mismo descomprimir las herramientas cliente. (prd-


ce y psw-ce)
La plataforma Pentaho BI necesita una JVM (Java Virtual Machine)
instalada. Podemos bajarlo desde Sun Developer Network download
page.
Pentaho usa las variables de entorno: JAVA_HOME y JRE_HOME.
En mi caso la d de alta, esta es la imagen del setup
Arrancando el Server de Pentaho y la consola de
Administracin
Arranque del Server:
pentaho/biserver-ce> startup.bat

Acceso a Pentaho User Console:


http://localhost:8080/pentaho
(Usuario: joe Password: password)

Arranque de consola de Administracin:


Pentaho/Administration-console/start-pac.bat
Acceso a la consola:
http://localhost:8099
(Usuario: admin Password: admin)
Hasta ac los pasos mnimos de instalacin. Con esto es posible
investigar los ejemplos y crear algn reporte o grfico con las
conexiones disponibles. Para trabajar con datos propios, un par de
pasos ms.

Conectar a una base de datos


Instalar primero el driver adecuado para la base de datos. O archivo
JAR. Este archivo normalmente se puede bajar desde el sitio oficial del
motor a usar. Es importante instalar en cada directorio solamente la
ltima versin del driver.
En mi caso, investigu las conexiones a SQL Server (motor para las
aplicaciones que desarrollamos en Tercer Planeta). Tom los drivers
desde el sitio oficial de Microsoft. Prob tambin con los drivers de
codigo libre. Estoy usando estos ltimos.
Copi el driver jtds-1.3.0.jar en los siguientes directorios
correspondientes al server, a la herramienta de reportes y al schema-
workbench. Esta es la lista de directorios:

1. Pentaho\administration-console\jdbc

2. Pentaho\biserver-ce\tomcat\lib

3. Pentaho\biserver-ce\data\lib

4. Pentaho\design-tools\report-designer\lib\jdbc

5. Pentaho\design-tools\schema-workbench\drivers

Una vez copiado el driver en los diretorios, reiniciar el servicio.


Creacin de una conexin desde la pantalla de administracin:
(referencia Pentaho)
Nombre: es el que se usar desde los distintos componentes de
Pentaho
Driver Class: lista de los drivers default de Pentaho. Debera incluir el
instalado previamente. (net.sourceforge.jtds.jdbc.Driver)
Usuario: un usuario con permiso a la base de datos a acceder.
Password: para la base de datos
Url:jdbc:jtds:sqlserver://NombreServer:1433/BaseDatos;instance=nom
breInstancia

Consideraciones de configuracin

Para publicar reportes creados con el report-designer, o esquemas


generados con schema-workbench:
Ingresar password en el archivo: Pentaho\biserver-ce\pentaho-
solutions\system\publisher_config.xml
<publisher-config>
<publisher-password>password</publisher-password>
</publisher-config>

Para acceder a la consola desde otra mquina, reemplazar localhost


por la IP en:
Pentaho\biserver-ce\tomcat\webapps\pentaho\WEB-INF\web.xml

<!-- FullyQualifiedServerUrl is used only in the case of offline content generation and whenever
something need to talk back to the server -->
<context-param>
<param-name>fully-qualified-server-url</param-name>
<param-value>http://TIERRA:8080/pentaho/</param-value>
</context-param>

Hasta ac la instalacin inicial de Pentaho. Desde la consola es muy


intuitiva la consulta los reportes y los cubos de ejemplo.
En prximos artculos generacin de reportes (report-designer),
herramientas de anlisis (squema-workbench) y dashboards. ( CDF:
community dashboard framework).