La actualización de Collibra apunta a la calidad de los datos, el linaje y el descubrimiento
HogarHogar > Blog > La actualización de Collibra apunta a la calidad de los datos, el linaje y el descubrimiento

La actualización de Collibra apunta a la calidad de los datos, el linaje y el descubrimiento

Jun 24, 2023

Getty Images/iStockphoto

Collibra actualizó el martes su nube de inteligencia de datos con flujos de trabajo preconstruidos destinados a hacer que los datos sean más visibles en múltiples fuentes y nuevas capacidades diseñadas para mejorar la calidad de los datos.

Además, el proveedor de gestión de datos presentó una serie de integraciones nuevas y mejoradas para aumentar la conectividad con sus socios tecnológicos.

Con sede en Nueva York y Bruselas, Collibra es un proveedor basado en la nube cuya Data Intelligence Cloud permite a los clientes automatizar el proceso de preparación de datos. Entre sus funciones se encuentran la puntuación de datos, que mide la calidad de los datos para mostrar si se puede confiar en los datos y usarlos para el análisis, y las capacidades de gobierno de datos que ayudan a cumplir con las reglamentaciones.

Los competidores incluyen otros proveedores independientes de gestión de datos, como Alation e Informatica.

Las actualizaciones recientes de Collibra incluyen una integración con Snowflake y el lanzamiento de una nueva herramienta para medir la madurez de los datos de una organización en comparación con sus pares.

Además, el proveedor reveló el mes pasado que su Data Intelligence Cloud se convirtió en una aplicación respaldada en SAP Store como parte de la asociación de proveedores que comenzó con el lanzamiento de SAP de su Datasphere en marzo.

La mejora en la calidad de los datos y la observabilidad son ahora áreas de énfasis para Collibra, según Laura Sellers, directora de productos del proveedor.

Como resultado, la última actualización de Data Intelligence Cloud de Collibra incluye nuevas integraciones diseñadas para aumentar la conectividad y permitir que los clientes administren mejor sus datos.

Entre ellos se encuentran nuevas integraciones con lo siguiente:

Además, la actualización incluye nuevas integraciones con las plataformas de análisis MicroStrategy, Power BI y Tableau.

Cada una de las integraciones es importante porque brindan a los usuarios de Collibra una mejor visibilidad de sus diversos sistemas de datos que pueden generar ahorros de costos, según Stephen Catanzano, analista del Grupo de estrategia empresarial de TechTarget.

"La inteligencia para [los usuarios] es la visibilidad para mejorar la eficiencia y reducir los costos", dijo. "Estas nuevas capacidades amplían los sistemas con los que se pueden conectar. La integración con Google Cloud Storage los lleva al tejido de Google, lo cual es significativo. Las integraciones con las herramientas de BI también son emocionantes, ya que requieren un uso intensivo de datos y procesamiento y áreas en las que se pueden ahorrar costos. ser grande".

Mientras tanto, los vendedores señalaron que los consumidores de datos usan herramientas de una miríada de proveedores. Para satisfacer sus necesidades, Collibra, y otros proveedores, desarrollan asociaciones para crear ecosistemas para la gestión y el análisis de datos.

"Las asociaciones son clave para nosotros", dijo Sellers. "No hay una sola empresa que haya visto que tenga sus datos en una sola nube. Están tratando con fuentes híbridas, múltiples nubes y software en las instalaciones. Por lo tanto, este lanzamiento trata sobre todas las asociaciones para nosotros".

Más allá de las nuevas integraciones, las nuevas herramientas destinadas a mejorar la calidad de los datos incluyen la disponibilidad general de Data Quality Pushdown para Snowflake y la prueba beta pública de Data Quality para Databricks.

Con las herramientas, los clientes conjuntos de Collibra y Snowflake o Databricks pueden procesar datos directamente en sus repositorios de almacenamiento de datos en la nube, lo que elimina la necesidad de mover datos de Snowflake o Databricks a Collibra para su preparación y luego volver a Snowflake o Databricks.

Eso ahorra tiempo, esfuerzo y el costo de la salida de datos, además de aumentar la seguridad al reducir el movimiento de datos. Además, las versiones Data Quality Pushdown incluyen capacidades de detección automática de anomalías, lo que mejora aún más la eficiencia.

En última instancia, sin embargo, el beneficio principal de los empujes de calidad de datos es un mayor tiempo de valorización, según Sellers.

"Es poder... procesar datos de forma segura directamente donde están. No hay movimiento de datos, por lo que no es necesario que se egresen", dijo.

Los vendedores agregaron que, si bien Data Quality Pushdown para Snowflake está generalmente disponible y Data Quality Pushdown para Databricks se encuentra en pruebas beta públicas, Collibra planea agregar herramientas similares de Data Quality Pushdown para otros repositorios de almacenamiento de datos en la nube, incluidos Amazon Redshift, Google BigQuery y Microsoft Azure.

"Para esos jugadores de la nube, queremos profundizar tanto como podamos para poder apoyar a cualquiera que esté en esos ecosistemas con toda la funcionalidad que existe dentro de nuestra plataforma", dijo.

También son de importancia potencial para los usuarios de Collibra los nuevos flujos de trabajo preconstruidos que abordan el linaje de datos y el descubrimiento de datos.

Los flujos de trabajo son parte de Workflow Designer, que ahora se encuentra en pruebas beta públicas. Los usuarios pueden simplemente hacer clic en un botón de "implementar flujo de trabajo" para implementar.

La configuración del linaje de datos permite un acceso rápido a la información del linaje de datos e incluye integraciones preconstruidas. Mientras tanto, Collibra Data Marketplace viene con una interfaz de autoservicio que facilita a los usuarios descubrir datos, según el proveedor.

Si bien la última actualización de Collibra agrega visibilidad a través de múltiples fuentes y apunta a la calidad de los datos, no agrega capacidades generativas de IA.

En los siete meses transcurridos desde que OpenAI lanzó ChatGPT, que marcó un salto significativo en las capacidades de los grandes modelos de lenguaje, numerosos proveedores de análisis y gestión de datos han revelado planes para infundir IA generativa en todas sus plataformas.

La esperanza de muchos de los proveedores es que la IA generativa pueda hacer que las herramientas de análisis y gestión de datos sean utilizables por más que solo expertos en datos dentro de las organizaciones. Lo lograría eliminando la necesidad de saber código y reduciendo el nivel de alfabetización de datos que se requiere actualmente para trabajar con datos.

Sin embargo, con las preocupaciones persistentes sobre la seguridad de las plataformas de IA generativa y la precisión de sus datos, incluso aquellos proveedores que han revelado planes para incorporar IA generativa aún no han puesto a disposición general ninguna capacidad impulsada por IA generativa.

Mientras tanto, Collibra tiene planes para integrar la IA generativa una vez que pueda hacerlo de manera segura, según Sellers.

"La IA generativa es un gran disruptor y es realmente emocionante", dijo. "Realmente creo que va a cambiar las experiencias de los usuarios en todo el software. Pero no es un área en la que estuviéramos listos para lanzar nada con esta actualización. Definitivamente estamos investigando cómo aprovecharla en el producto para generar una mejor experiencia y automatización más inteligente".

Más allá de la IA generativa y más empujes de calidad de datos, Sellers agregó que la hoja de ruta de Collibra se enfoca esencialmente en simplificar la administración de datos para los usuarios.

Mientras tanto, Catanzano dijo que le gustaría ver a Collibra y otros proveedores ayudar a las organizaciones a monitorear el costo del procesamiento de IA. La mayor parte del procesamiento de IA se realiza en la nube, y muchas organizaciones luchan por mantener bajo control los costos de computación en la nube.

"Me gustaría centrarme más en la reducción de costos de IA", dijo Catanzano. "El procesamiento de IA está costando una fortuna. Si [Collibra] puede monitorear y administrar los costos allí, sería emocionante".

Eric Avidon es redactor sénior de noticias para TechTarget Editorial y periodista con más de 25 años de experiencia. Cubre el análisis y la gestión de datos.

Esteban Catanzano