En bref

"La satisfaction de nos clients par l'innovation est une priorité et un élément essentiel dans la stratégie du groupe". Nous développons de nombreux outils  d'optimisation et simplifions ainsi l'accès aux technologies pour nos clients.

Témoignages

François Chahuneau

Directeur des technologies

Par une veille rigoureuse et efficace, nous utilisons les meilleures technologies du marché afin d’optimiser sans cesse les procédés de numérisation et de lutter ainsi contre les ravages du temps qui altèrent les supports.

Témoignages

Institut Géographique National

Institution Publique

L'IGN (Institut Géographique National) est chargé par l'Etat de produire des données géographiques sur le territoire national et de les mettre à la disposition du public (sous forme de cartes, de fichiers électroniques ou via son site internet Géoportail).

Afin de créer une base de données géographique rattachant les données cadastrales de la DGI (Direction générale des impôts) aux données géographiques de l'Institut, l’IGN a confié à Numen des tâches complexes de production sur des images numériques. Il s’agit de géo-référencement, transformations, traitement des raccords et assemblage des plans cadastraux scannés.
La saisie vectorielle des limites administratives a nécessité le traitement de 200 000 plans cadastraux, correspondant à 10 millions de points de calage vidéocodés.

Projet Pacte

Comment améliorer sensiblement la qualité du texte issu de la numérisation ?

Le contexte des Investissements d’avenir pose avec acuité cette question en demandant à l’ensemble des détenteurs de documents patrimoniaux, dans une perspective de retour sur investissements, d’imaginer des modèles d’exploitation économique appliqués aux contenus numérisés. La valorisation de ces contenus est directement liée à leur haute qualité et à leur fidélité par rapport aux originaux.


Objectif du projet de R&D
:

Le projet PACTE (Projet d’Amélioration de la Capture TExtuelle) vise l’amélioration de la performance des processus de capture textuelle (OCR, reconnaissance d’écriture manuscrite, saisie manuelle, rédaction) par l’utilisation du traitement de la langue, et plus spécifiquement des méthodes linguistiques statistiques et hybrides. Il concerne le domaine applicatif des projets de numérisation du patrimoine écrit, dans un contexte multilingue.

Un partenariat d'acteurs complémentaires :

Le consortium PACTE réunit trois entreprises (Numen, A2IA, Isako) et deux laboratoires (Alpage, LIUM). Il regroupe ainsi l’ensemble des problématiques métier, les ressources lexicales, l’expertise scientifique et la technologie nécessaires pour traiter le sujet en profondeur.




SmartGed

Le lancement du projet SmartGED a suivi de peu la parution de la version 1.1 du standard sectoriel CMIS . Il est né d’un besoin industriel qui ne pouvait être satisfait par les produits existants sur le marché, pourtant très encombré, des systèmes de GED et de gestion du contenu.

En effet, la gestion de documents issus des chaines éditiques et de numérisation, dont le contenu est figé mais dont les métadonnées qui lui sont associées sont évolutives nécessite un accès client pour les créer ou les modifier, parfois à plusieurs étapes du workflow de production. La GED associée doit de plus disposer de hautes performances en chargement de masse afin de supporter le débit des outils industriels utilisés pour l’alimenter.


Il s’agit donc de la première GED nativement compatible CMIS 1.1.

L’implémentation de SmartGED s’appuie le SGBD relationnel-objet PostgreSQL dont les fonctionnalités avancées et les extensions NoSQL récentes en font un support suffisant pour une implémentation efficace, en utilisant un design novateur basé sur l’utilisation des objets de type clé-valeur (Hstore).


Le respect d’un standard reconnu par les acteurs majeurs du secteur de la Gestion Electronique de Documents, associé à des choix technologiques judicieux nous permet aujourd’hui d’affirmer que SmartGED est un produit abouti capable de répondre aux besoins d’un système de production documentaire industriel :

  • capacités de chargement de masse à hautes performances
  •  couche de services offrant la possibilité de création de batch industriels,
  • souplesse et évolutivité des métadonnées associées au contenu.

Les principes de fonctionnement d’une GED de production nécessitent de spécialiser la norme CMIS en vue d’intégrer des fonctionnalités supplémentaires relatives aux spécificités de ce segment. L’intégration de fonctionnalités spécifiques et indispensables au monde de la production afin de répondre à nos besoins :

  • Structures de données orientées « reporting »,
  • Association de listes de tâches à des Folder, « Corbeille » de workflow,
  • Connexion à un moteur de workflow externe.

Sujets Phares


Numen traite depuis plus de 40 ans des données sensibles, du contenu textuel complexe et multilingue. Numen se positionne aujourd’hui comme un acteur leader dans le domaine du BPO et des services de dématérialisation.

Numen est fier de compter sur une équipe solide développant et industrialisant des procédés à l’état de l’art de la recherche dans les champs d’applications suivants :

  • le traitement d’images de documents
  • l’OCR et les technologies de RAD-LAD
  • les technologies d’apprentissage statistique, appliquées notamment à la correction orthographique contextuelle *
  • le text-mining et l'indexation automatique de documents
  • le data-mining et l'analyse de flux de données métiers
  • la composition dynamique de documents
  • le routage automatique de documents par analyse intelligente des contenus (pattern matching)
  • les technologies liées à la sécurité de la numérisation (gestion d’identités, scellement et signature électronique, impression sécurisée)
  • l’informatique de traitement réparti (cloud, big data, moteurs de workflow)

7 % du CA en R&D

 Cherchant à optimiser la qualité et les coûts des prestations de nos clients tout en ayant la volonté d'augmenter l'efficacité de nos chaînes de production, Numen investit annuellement 7% de son chiffre d'affaires en programme de recherche.

Une équipe

Les équipes de R&D sont rattachées à la Direction des Technologies, dont la mission est d’organiser la capitalisation du savoir-faire technologique à travers la diversité des projets menés pour les clients et la multiplicité des domaines d’application métier. Bénéficiant de fonds propres ainsi que d’un financement partiel de l’État, différents projets de R&D sont conduits en interne. D’autres sont menés en collaboration avec des sociétés partenaires et des laboratoires universitaires.

Numen est fier de compter sur une équipe solide dont les progrès augmentent à mesure que les challenges technologiques se révèlent.

Au travers de son pôle ingénierie et R&D, Numen automatise les processus de ses clients, solutionne les problématiques de productivité grâce à ses innovations en matière de capture mais aussi de traitement des données (text-mining, indexation automatique et statistique), ou encore, développe des systèmes d’information complexes. Numen intègre régulièrement de jeunes ingénieurs, issus des grandes écoles et des formations supérieures.

Solution d’extraction de signature(s) et d’authentification

Numen Europe a développé via ses activités de R&D une solution automatisée de détection et d’authentification des signatures manuscrites sur des documents de tout type. Les documents concernés peuvent être des contrats, des commandes, des ordres de transfert de fonds, des ordres de paiements, etc. Le but étant de vérifier l’authenticité des signatures afin de participer à la sécurisation des transactions.
L’état de l’art concernant la détection de signatures sur des documents est assez pauvre, nous avons développé une solution dédiée à ces documents même de mauvaise qualité.
Après la localisation, l’étape suivante consiste à authentifier la signature par rapport à un set de signatures de référence, le but étant de vérifier si l’auteur de la signature est bien le signataire autorisé.

Les signatures présentes sur les documents sont évidemment variables de par leur taille, l’épaisseur du stylo utilisé, le nombre de composantes connexes dont elles sont composées. De plus les documents peuvent comporter plusieurs signatures. La qualité du document d’origine est un facteur très important dans la détection. En effet, une signature hachée, bruitée, ou accolée à du texte ou des lignes est plus difficile à détecter dans son entièreté (figure 1).

Grâce aux algorithmes développés par Numen Europe, nous obtenons en sortie du logiciel une vignette par signature détectée.

Avec des taux de succès concluants : Figure 2

Solution d’extraction de données transactionnelles pour l’Industrie des Fonds d’Investissements

Suite à de nombreux contacts pris avec l’Industrie des Fonds de la place luxembourgeoise, nous avons évoqué un sujet récurrent en matière de traitement documentaire qui concerne les ordres de transactions reçus par fax avec des problématiques rencontrées relativement similaires, à savoir :
- Des problèmes de qualité des extractions réalisées ;
- Pas d’automatisation, ressaisie complètement manuelle entrainant des risques d’erreurs importants ;
- Des risques opérationnels et financiers dus à un taux d’erreurs générés important lors de la conversion manuelle d’un fax vers des transactions ;
- Un coût trop élevé pour le traitement de ces ordres entrants par fax ;
- Une automatisation STP via messagerie SWIFT qui a atteint ses limites

La plupart des Agents de Transfert nous ont aussi indiqué avoir tenté ces dernières années d’implémenter via leur IT interne une solution à ce problème en utilisant des technologies OCR mais sans aucun succès probants. 

C’est dans ce cadre complexe que Numen Europe au travers de ses activités de R&D ont apportés
En outre, les aspects liés à la diminution des risques opérationnels grâce à une plus grande automatisation assistée, les principaux risques étant liés à des erreurs engendrées par le facteur humain. Ainsi, chacun de ces types d’erreurs a fait l’objet de définition de processus et d’automate pour réduire fortement voire éliminer ces risques ce qui apporte à nos clients des diminutions parfois conséquentes de coûts directs subits (dommage financier).

Plus d'informations en cliquant ici

X
En poursuivant votre navigation, vous acceptez l'utilisation de cookies. Vous pouvez vous y opposer en cliquant sur le bouton refuser.

Accepter     Refuser     Mentions légales