Pentaho Data Integration

Pentaho Data Integration (Kettle)
Información sobre la plantilla
LogotipoPDI.jpg
Logotipo de la Herramienta.
Sistemas Operativos compatiblesWindows, Macintosh, Unix y Linux.
IdiomaEspañol
LicenciaGNU Lesser General Public License (Version 2.1)
Sitio web
Sitio oficial

Kettle. Es una herramienta de Pentaho Data Integration que permite implementar los procesos de extracción,transformación y carga de datos. El uso de kettle permite evitar grandes cargas de trabajo manual frecuentemente difícil de mantener y de desplegar.

Introducción al software

Muchas necesidades surgen cuando una organización necesita migrar las aplicaciones o las bases de datos. Puede que sea tan simple como una mejora a una nueva versión del sistema, o puede que implique cambiar a una nueva base de datos o aplicación. Después de una fusión o de una adquisición, a menudo se retiran las aplicaciones redundantes, pero los datos tienen que ser preservados en el sistema de supervivencia. Después de una migración, el viejo sistema y el nuevo sistema tendrán que coexistir.

La necesidad de crear sistemas encaminados a garantizar el funcionamiento de la economía cubana en las nuevas circunstancias y en el marco de las transformaciones organizativas que se están desarrollando en la actualidad, constituye un reto. La informatización como parte del avance tecnológico que precisa nuestro país, demanda una elevada capacidad tecnológica y operativa, lo que trae consigo a gran escala la utilización de modernos medios de procesamiento de la información, entre los que se encuentra el Pentaho Data Integration (Kettle).

Requisitos mínimos para su funcionamiento

superior.

Algunas funciones y consideraciones importantes

Pentaho Data Integration(PDI) es un motor de transformación, y desde el principio se observa que ha sido diseñado para cubrir las necesidades en la integración de datos. La plataforma Open Source Pentaho Business Intelligence cubre amplias necesidades de análisis de los datos y de los informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en este lenguaje. Eso hace que sea una solución muy flexible para cubrir una amplia gama de necesidades empresariales.

Kettle es una herramienta de PDI que permite implementar los procesos extracción, transformación y carga de datos (ETL), la misma es de código abierto compuesta por cuatro componentes fundamentales: SPOON para el diseño gráfico de las transformaciones, PAN para la ejecución de los trabajos y las transformaciones, CHEF para el diseño de la carga de datos y KITCHEN para la ejecución de los trabajos Batch diseñados con CHEF.

Con esta herramienta se construyen las transformaciones (mínimo nivel de diseño) utilizando los pasos (steps). En un nivel superior se encuentran los trabajos (Jobs), que permiten ejecutar las transformaciones y otros componentes, y orquestar los procesos. PDI no es un generador de código, es un motor de transformación, donde los datos y sus transformaciones están separados. Las transformaciones y trabajos son almacenadas en formato XML, donde se especifican las acciones a realizar en los datos. Para construir las transformaciones, se utilizan los pasos o componentes, que se enlazan entre si mediante saltos (steps), que determinan el flujo de datos entre los diferentes componentes. Para los trabajos, existe otro grupo de pasos, en los que se pueden realizar diferentes acciones (o ejecutar transformaciones). Los pasos o saltos en este caso determinan el orden de ejecución o la ejecución condicional.

Este software incluye herramientas para realizar consultas, generación de informes y reportes, análisis interactivo, tableros de mando, extracción, transformación y carga de datos (ETL) / integración de datos, minería de datos (data mining), y un servidor para la plataforma de BI (Business Intelligence) que lo ha convertido en la suite de software libre más popular.

Consejo para el trabajo con el software

El primer paso a la hora de la utilización de la herramienta debe ser la creación de la conexión a las diferentes bases de datos que se utilizarán ya sea para la migración de datos, creación de data warehouse, etc. Posteriormente la construcción de cada una de las transformaciones con sus diferentes particularidades y después los trabajos para ejecutar cada una de estas transformaciones u otras acciones que sean necesarias.

Conclusiones

Kettle es una potente herramienta capaz de manipular y transformar información en todos aquellos proyectos dónde sea necesario trabajar con datos. Su solución para cubrir las necesidades de extracción, manipulación, validación y carga de datos desde múltiples fuentes de origen y en diferentes entornos puede resolver muchos problemas.

Véase también

Fuente