Développeur IA / NLP — POC Chatbot et IA métier

CDI

Paris - 8ème arrondissement

UMANTIC TECHNOLOGIES

Publiée le 16 Octobre 2025

Organisation européenne de référence dans le domaine des normes techniques et de la veille scientifique (secteur réglementaire / phytosanitaire), nous lançons un projet d'exploration IA. L'objectif : concevoir un Proof of Concept (POC) de chatbot conversationnel s'appuyant sur nos ressources internes (bases de données, corpus normatifs, documents techniques, littérature scientifique)
Missions
- Cartographier & préparer les données
o Identifier les sources internes (BDD visibles et non exposées), corpus normatifs internationaux et documents non structurés.
o Définir la stratégie d'ingestion, de normalisation et de gouvernance (qualité, traçabilité, métadonnées, RGPD).
- Concevoir le POC de chatbot conversationnel
o Évaluer des approches LLM (RAG, fine-tuning léger, réécriture de requêtes) adaptées aux cas d'usage.
o Prototyper une interface (CLI/terminal et/ou web minimaliste) avec recherche sémantique, citations et vérifiabilité.
- Proposer l'architecture cible
o Définir l'architecture technique (orchestration, vector store, pipelines ETL/ELT, observabilité, sécurité).
o Établir les prérequis d'industrialisation (coûts, MLOps, monitoring qualité, lifecycles des modèles).
- Développer \"GPT métier\"
o Concevoir un outil en ligne de commande (IAmétier\") pour retrouver rapidement les occurrences historiques d'événements similaires à des phénomènes actuels, en interrogeant directement les données structurées (PostgreSQL et BDD internes) et non structurées (normes internationales, PDF, docs).
- Contrôle qualité assisté par IA
o Mettre en place des vérifications automatiques (cohérence, complétude, détection d'anomalies textuelles ou de champs).
o Génération de résumés factuels et analyses automatiques dans les workflows de recherche.
Livrables attendus
- Cartographie des données + plan de remédiation qualité.
- Prototype fonctionnel (chatbot + CLI \"GPT métier\") avec journal de sources et évaluation.
- Dossier d'architecture (schémas, choix techno, sécurité, coûts) + plan d'industrialisation.
- Kit de présentation (démo, métriques, ROI attendu) pour parties prenantes.

Profil recherché

* 4-6+ ans en développement IA/NLP (ou expérience équivalente démontrable par projets/références).
* À l'aise avec données structurées et non structurées, extraction depuis PDF/normes, indexation & recherche sémantique.
* Maîtrise de Python (FastAPI/Flask, tooling data), conteneurisation Docker, PostgreSQL (SQL avancé).
* Pratique des LLM (hébergés ou API), embeddings, RAG, évaluation et observabilité (logs, traces, métriques).
* Culture MLOps (environnements, reproductibilité, gestion des versions de données et modèles).
* Autonomie, sens produit, pédagogie pour l'accompagnement d'équipes non expertes.

Bonus appréciés

* Expérience secteur réglementaire/scientifique ou open data.
* Sécurité & conformité (contrôle d'accès, PII, RGPD, politiques de rétention).
* Traitement de documents longs (chunking avancé, tables/figures), OCR.
* Mise en place de benchmarks internes (Groundedness, Answer Relevancy, Latency/cost).

Indicateurs de succès du POC

* Pertinence & vérifiabilité : réponses sourcées, taux de grounding élevé.
* Couverture des principales sources (structurées/non structurées) et latence acceptable.
* Transférabilité : architecture claire, coûts maîtrisés, plan d'industrialisation réaliste.
* Adoption : démonstration convaincante pour sponsors et pays membres.
Environnement technique
- OS & Infra : Linux Debian, Docker (containers, compose), CI/CD basique.
- Données : PostgreSQL, formats hétérogènes (CSV/JSON/PDF), index vectoriels.
- Langages : Python, PHP (pour intégrations existantes).
- IA/NLP : pipelines d'ingestion, embeddings, RAG, évaluation de réponses (faithfulness, grounding).

Niveau de diplôme requis : BAC+5

Experience requise : 7-10 ans

Postuler

Candidature - -

ouvrir le formulaire de candidature dans un nouvel onglet.

Mentions légales

Informations générales

Dénomination ou raison sociale : Umantic

Adresse et numéro de téléphone du siège social : 13/15 rue Taitbout 75009 PARIS - FRANCE - Tél.+33 (0)1 71 32 31 78

Inscription RCS ou chambre des métiers : RCS PARIS B 808 804 264

Directeur de la publication : Jean-Philippe COUESPEL DU MESNIL, DP

Hébergement et réalisation du site

Droits de propriété intellectuelle et industrielle

La structure générale, ainsi que les logiciels, textes, images, informations, documents, services et tout autre élément composant ce site sont protégés notamment au titre du droit d'auteur par les dispositions du Code de la Propriété Intellectuelle ou toute autre réglementation relative à la propriété intellectuelle. Toute représentation et/ou reproduction totale ou partielle de ce site (ou de l'un quelconque des éléments qui le composent) par quelque procédé que ce soit, sans l'autorisation expresse préalable de Umantic est interdite et peut constituer un acte de contrefaçon pénalement sanctionné.Tous documents téléchargeables sont également protégés par le droit d'auteur, leur utilisation est limitée à la seule prestation de service assurée par l'éditeur via le site www.umantic.fr Egalement, les marques et/ou logos figurant sur ce site sont des marques déposées et/ou des créations protégées, propriété exclusive de Umantic.Toute reproduction ou représentation totale ou partielle de ces marques et/ou de ces logos, sans l'autorisation expresse préalable de l'éditeur est interdite et peut constituer un acte de contrefaçon pénalement sanctionné.

Protection des informations

Google Analytics utilise des cookies, qui sont des fichiers texte placés sur votre ordinateur, pour aider le site internet à analyser l'utilisation du site par ses utilisateurs.Les données générées par les cookies concernant votre utilisation du site (y compris votre adresse IP) seront transmises et stockées par Google sur des serveurs situés aux Etats-Unis.Google utilisera cette information dans le but d'évaluer votre utilisation du site, de compiler des rapports sur l'activité du site à destination de son éditeur et de fournir d'autres services relatifs à l'activité du site et à l'utilisation d'Internet.Google est susceptible de communiquer ces données à des tiers en cas d'obligation légale ou lorsque ces tiers traitent ces données pour le compte de Google, y compris notamment l'éditeur de ce site.Google ne recoupera pas votre adresse IP avec toute autre donnée détenue par Google.Vous pouvez désactiver l'utilisation de cookies en sélectionnant les paramètres appropriés de votre navigateur. Cependant, une telle désactivation pourrait empêcher l'utilisation de certaines fonctionnalités de ce site.En utilisant ce site internet, vous consentez expressément au traitement de vos données nominatives par Google dans les conditions et pour les finalités décrites ci-dessus.

Informatique et liberté | Données Personnelles

L’utilisateur est informé que les informations qu’il communique par les formulaires présents sur le site d’Umantic sont nécessaires pour répondre à sa demande et sont destinées aux services en charge de répondre à sa demande à des fins de suivi de cette demande. Les informations recueillies font également l’objet d’un traitement destiné à communiquer sur des évènements, des offres promotionnelles, des actualités ou tout autre document de communication. Vos données ne sont pas partagées avec des tiers.
Conformément aux articles 38, 39, 40, 41 et 42 de la loi Informatique et liberté du 6 janvier 1978, chaque utilisateur ayant déposé des informations nominatives le concernant sur le site, dispose des droits d'opposition, d'accès et de rectification de ces données. Ainsi, il peut exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations le concernant qui sont inexactes, incomplètes, équivoques, périmées, ou dont la collecte ou l'utilisation, la communication ou la conservation est interdite. Chaque utilisateur peut exercer ses droits en écrivant à Umantic, 13/15 rue Taitbout, 75009 PARIS - FRANCE.

Nom*
Société*
E-mail*
Message*