HOME

CAPTURA DE DATOS. PLATAFORMA ECM SGAIM

SGAIM pone a disposición de sus clientes su Plataforma ECM para agilizar los procesos, la toma de decisiones y a través de la cual pueden tener acceso, previa captura de datos, a toda su información digitalizada.

El módulo de captura de datos es el paso siguiente a la llegada de la información. En esta fase se procede a la preparación de la misma para su tratamiento.

Los documentos en formato papel tienen un tratamiento diferente ya que se tiene que realizar una manipulación previa eliminando grapas y otros elementos para su correcta digitalización.

Una vez normalizados los documentos a un formato común, se ejecutan una serie de pre-procesos para optimizar los rendimientos de los motores de reconocimiento óptico de caracteres:

  • Transformaciones geométricas
  • Eliminación de ruido
  • Binarización
  • Reconstrucción de caracteres
  • Eliminación: color, líneas y fondos
  • inversión de texto

Con las imágenes en estado óptimo se procede a la captura de datos.

Sólo con información electrónica habrá respuesta inmediata

Las tecnologías utilizadas son:

OCR (Optical Character Recognition). Tecnología que permite que imágenes de caracteres sean identificadas por una máquina y convertidas en texto editable y con capacidad de ser buscado

ICR. Tecnología OCR avanzada que incluye capacidades como el auto aprendizaje, usando el contexto para mejorar las probabilidades de reconocimiento o reconociendo textos escritos a mano.

OMR (Optical Mark Recognition). Detecta la presencia o ausencia de marcas en un área definida (ejemplo. Un tick en una caja) usado para procesar cuestionarios, test estandarizados, etc.

OWR (Optical Word Recognition). Método de reconocimiento de texto manuscrito que considera las palabras completas en vez de los caracteres individuales para lograr un mayor porcentaje de acierto en la lectura.

ASR. (Automatic Speech Recognition). Consiste en la transformación de grabaciones de voz a texto editable y con capacidad de ser indizado y buscado.

HCR. (Handprint character recognition). Es una tecnología que transforma letra de molde manuscrita a texto editable.

Otro de los procesos que se realizan en esta fase de captura de datos es la Categorización que consiste en la asignación de categorías a los documentos en base a características de formato y de contenido.

Para realizar la categorización se utilizan diferentes métodos:

  • Semántico
  • Por formato (IDR)
  • Por características
Repositorios:
File Systems
Database
Data Warehouse
Content Management Systems
Cloud storage

Tecnologías:
NAS / SAN
Optical Media
DVD
Magnetic Tape
HDD
RAID
Fiber Optic
Removable Media

Recuperación:
Enterprise Search
Fuzzy Search
Check-in/Check-out
Publicación
Trazabilidad
Control de versiones
Papel
Documentos electrónicos
Grabaciones de voz
Email
Digitalización de documentos papel
Web Scan
Pre-procesos optimización de imágenes
Tecnologías de Captura:
(OCR, ICR, OMR,OWR, ASR, HCR)
Categorización
Gestor documental ( Portal web TTID)
Workflow / BPM
Data mining / BI
Web Content Management
Colaboración
Records Management
Records Retention
Transformación:
XML
XBRL
CSV
Flat File DataBase
PDF
Imagen
PKI

Entrega:
FTP/SFTP/FTPS
E-mail
VPN
Dispositivos móviles
Web Services
Papel (Conservación tecnológica)
Electrónico (Garantía contra obsolescencia /migración de formatos)