Procesamiento inteligente de documentos. Extraer datos a partir de documentos y formularios no estructurados es una de las áreas clave de mejora. El uso de tecnologías de inteligencia artificial, machine learning o low-code permite automatizar este tipo de procesos con un elevado grado de efectividad, ganando en velocidad y seguridad, y evitando los típicos errores asociados a tareas repetitivas.
Uno de los grandes desafíos que están experimentando las empresas es la necesidad de clasificar cantidades ingentes de documentos para poder extraer datos y utilizarlos en su operativa diaria, y como fuente de información para la toma de decisiones estratégicas. Aunque las tecnologías de automatización ayudan a liberar al personal de tareas repetitivas y ganar eficiencia, no hay que olvidar que la para alimentar dichos procesos se requiere información.
Actualmente se generan cerca de 2,5 quintillones de bytes de datos por persona y día, pero, de ellos, solo el 20% son estructurados, lo que dificulta el desafío de aprovechar un activo tan valioso como la información. Durante mucho tiempo, la riqueza oculta en estos datos se perdía o no era aprovechada de forma adecuada. Sin embargo, existen tecnologías que, a través de la inteligencia artificial (IA), facilitan el procesamiento de esta información y la posibilidad de integrarla en los sistemas empresariales.
Las capacidades cognitivas de la solución hacen que, con su uso, se vaya volviendo más inteligente
Según el informe Artificial Intelligence Index Report 2022, aunque los sistemas de IA aún no pueden igualar a las personas en tareas lingüísticas complejas, su rendimiento ha mejorado significativamente en los últimos años. Además, su uso se ha vuelto más asequible puesto que, según este informe, el coste de entrenar un sistema de clasificación de imágenes ha disminuido un 63,6% desde 2018, con una mejora sustancial de un 94,4% en cuanto al tiempo necesario para logarlo.
Problemática transversal
El desafío de alimentar de información a esos procesos automatizados no solo viene de la necesidad de extraer los datos a partir de formatos analógicos y convertirlos a digital. En muchas ocasiones, los datos están disponibles en formato estructurado, pero se encuentran repartidos en silos estancos difícilmente accesibles.
Por ejemplo, en el caso de una entidad financiera, se trata de datos que pueden ir desde las solicitudes de hipotecas, créditos o cuentas corrientes a documentos fiscales o formularios de cambio de domicilio. Otras veces, en cambio, la problemática es indiferente al sector de actividad y afecta más a áreas concretas de cualquier compañía, como es el caso de un departamento de recursos humanos, que ha de manejar documentos como los currículums y perfiles de sus empleados, contratos, nóminas, etc.
En ocasiones, los datos están disponibles, pero se encuentran repartidos en silos difícilmente accesibles
Para poder introducir toda esa información en el sistema, y poder activar los bots de software que agilicen los flujos de trabajo, las compañías venían recurriendo a la entrada manual de los datos por parte personas o, en el mejor de los casos, a software, con frecuencia sujeto a errores de interpretación y eran difíciles de personalizar.
Afortunadamente, también en este campo es posible aplicar la automatización a través del uso de tecnologías como el procesamiento inteligente de documentos (IDP, intelligent document processing) de Appian.
Datos no estructurados
En esencia, esta aplicación aprovecha las tecnologías de machine learning (ML) y de inteligencia artificial para extraer -de un modo automatizado- los datos de formularios y poder explotarlos posteriormente. Su funcionamiento resulta extremadamente sencillo de cara al usuario, ya que es capaz de leer y comprender documentos de manera muy similar a los humanos, haciendo posible esa extracción de los datos no estructurados. De hecho, incluso puede trabajar también con notas escritas a mano, tablas complejas y listas de verificación.
Uno de los casos de uso más habituales en las compañías es el manejo de documentos digitalizados en formato PDF. A efectos del sistema, se trata de datos no estructurados, que no pueden ser interpretados hasta que IDP hace uso de Appian Document Extraction para transformarlos en información válida para los sistemas. Pero no se queda ahí, gracias a sus prestaciones ML, la solución es capaz de realizar una primera clasificación del documento para saber si, por ejemplo, se trata de una factura o una nómina, pudiendo automatizar también el destino del documento según dependa de uno u otro departamento gracias a bots RPA.
Uno de los casos de uso más habituales en las compañías es el manejo de documentos digitalizados en formato PDF
En caso de que IDP no fuera capaz de clasificar el documento con certeza, la aplicación crea automáticamente una tarea para que un usuario lo clasifique manualmente, evitando que se genere cualquier incidencia. Tanto estas intervenciones humanas como alguna corrección que sea necesario realizar –lo que se conoce como conciliación- alimentan al sistema y la inteligencia artificial continúa aprendiendo y mejorando su rendimiento.
Procesamiento inteligente de documentos y aprendizaje continuo
El paso posterior a esta clasificación es la extracción automática de los datos, como puede ser el número o la fecha de factura, el total o el proveedor. La capacidad de la aplicación permite incluso que los formularios no estén estandarizados, basta con que contengan información similar en cada uno de ellos.
Cuanto más se utiliza más mejora su rendimiento, porque sus capacidades cognitivas hacen que se vuelva más inteligente
Una de las grandes ventajas de esta solución es que cuanto más se utiliza más mejora su rendimiento, porque sus capacidades cognitivas hacen que se vuelva más inteligente. IDP de Appian no solo resulta muy rápido de instalar, sino que sus modelos de IA se pueden entrenar en unas pocas horas. Tanto es así que, con menos de diez muestras, la solución ya comienza a clasificar documentos automáticamente. Asimismo, los informes incorporados simplifican el rastreo y la trazabilidad de los KPI, así como de la precisión de clasificación y extracción de datos.
Personalización
Las posibilidades de personalización son muy elevadas ya que, en ocasiones, a las organizaciones no les basta con analizar documentos estándar de facturas, órdenes de compra, reclamaciones o recibos. En este sentido, su flexibilidad y capacidad de personalización le permiten agregar cualquier tipo de documento, o incluso añadir nuevos campos en un documento ya existente. El sistema es capaz de adaptarse dinámicamente a los cambios de formato de entrada y rompe con la tradicional rigidez de las soluciones procesamiento inteligente de documentos.
Su flexibilidad y capacidad de personalización le permiten agregar cualquier tipo de documento
La clave se encuentra en la plataforma de automatización low-code de Appian, que posibilita la creación de aplicaciones, o la evolución de las existentes, hasta 20 veces más rápido que con los procesos de codificación tradicional, reduciendo de forma significativa el time to market para adaptarse lo antes posible a las demandas de Negocio.
Al mismo tiempo, la seguridad de la información se ve reforzada mediante los canales de información, esto es, agrupaciones de tipos de documentos que tienen su propia configuración de seguridad. El área de Finanzas no procesa el mismo tipo de documentos que, por ejemplo, RR.HH., por lo que es posible definir unos perfiles para que no se acceda a documentos que no se precisan para su cometido.
IDP de Appian propone una solución para que las empresas puedan extender el alcance de la automatización de sus procesos comerciales, con la confianza de hacerlo con una tecnología ya madura que acumula buenas prácticas tanto materia de extracción de datos como en su capacidad de procesamiento de diferentes tipos de documentos complejos.