Utilizamos cookies propias y de terceros para mejorar nuestro servicio mediante el análisis de sus hábitos de navegación. Si continúa navegando, consideramos que acepta su uso. Puede obtener más información, o bien conocer cómo cambiar la configuración, en nuestra Política de Cookies.
ocultar banner
mostrar banner
HOME

CAPTURA DE DATOS. PLATAFORMA ECM SGAIM

SGAIM pone a disposición de sus clientes su Plataforma ECM para agilizar los procesos, la toma de decisiones y a través de la cual pueden tener acceso, previa captura de datos, a toda su información digitalizada.

El módulo de captura de datos es el paso siguiente a la llegada de la información. En esta fase se procede a la preparación de la misma para su tratamiento.

Los documentos en formato papel tienen un tratamiento diferente ya que se tiene que realizar una manipulación previa eliminando grapas y otros elementos para su correcta digitalización.

Una vez normalizados los documentos a un formato común, se ejecutan una serie de pre-procesos para optimizar los rendimientos de los motores de reconocimiento óptico de caracteres:

  • Transformaciones geométricas
  • Eliminación de ruido
  • Binarización
  • Reconstrucción de caracteres
  • Eliminación: color, líneas y fondos
  • Inversión de texto

Con las imágenes en estado óptimo se procede a la captura de datos.

Sólo con información electrónica habrá respuesta inmediata

Las tecnologías utilizadas son:

OCR (Optical Character Recognition). Tecnología que permite que imágenes de caracteres sean identificadas por una máquina y convertidas en texto editable con capacidad de ser buscado.

ICR (Intelligent Character Recognition). Tecnología OCR avanzada que incluye capacidades como el auto aprendizaje, usando el contexto para mejorar las probabilidades de reconocimiento, o la captura de textos escritos a mano.

OMR (Optical Mark Recognition). Detecta la presencia o ausencia de marcas en un área definida (ejemplo: un tick en una caja) usado para procesar cuestionarios, test estandarizados, etc.

OWR (Optical Word Recognition). Método de reconocimiento de texto manuscrito que considera las palabras completas en vez de los caracteres individuales para lograr un mayor porcentaje de acierto en la lectura.

ASR. (Automatic Speech Recognition). Consiste en la transformación de grabaciones de voz a texto editable y con capacidad de ser indizado y buscado.

HCR. (Handprint Character Recognition). Es una tecnología que transforma letra de molde manuscrita a texto editable.

Otro de los procesos que se realizan en esta fase de captura de datos es la Categorización que consiste en la asignación de categorías a los documentos en base a características de formato y de contenido.

Para realizar la categorización se utilizan diferentes métodos:

  • Semántico
  • Por formato (IDR)
  • Por características