DATA ENGINEER H/F

CDDJour
environ 4 heures
Nouveau

Description du poste

Vos missions principales

Qualité et fiabilisation des données

•     Contrôler, nettoyer et normaliser les données multi-sources (DPI, PMSI, biologie, imagerie, registres).

•     Définir et suivre des règles de contrôle qualité (complétude, cohérence, traçabilité) en local et sur la plateforme EDGAR.

•     Mettre à disposition des outils d’évaluation de la qualité pour aider les établissements à cibler leurs axes d’amélioration.

•     Contribuer à la mise en place du label qualité Quantum dans le cadre de l’Espace Européen des Données de Santé (EHDS).

Connecteurs et pipelines d’ingestion

•     Concevoir, développer et maintenir des pipelines ETL/ELT entre les EDS locaux et la plateforme EDGAR.

•     Intégrer des données issues de sources hospitalières et externes (INSEE, Chimio, etc.) selon les standards définis.

•     Développer un pipeline d’OCRisation de documents avant intégration dans l’EDS.

•     Adapter et déployer un catalogue de métadonnées conforme au standard européen Health DCAT- AP.

•     Documenter les flux, modèles et transformations ; contribuer au GitHub mutualisé du consortium.

Interopérabilité et harmonisation

•     Implémenter les standards d’interopérabilité : HL7, FHIR, LOINC, SNOMED-CT, OMOP-CDM.

•     Participer à l’harmonisation des données du socle commun des EDS hospitaliers, en lien avec le prestataire.

•     Suivre les travaux nationaux (ANS) et européens (EHDS) en matière d’interopérabilité.



Vos missions complémentaires

•     Concevoir des architectures Data sur environnements Cloud et être force de proposition pour l’optimisation technique et financière de la plateforme.

•     Produire des tableaux de bord à partir de l’API FHIR de l’EDS (suivi d’activité, retour aux producteurs de données, registre de traitements).

•     Participer aux groupes de travail techniques du consortium et du Conseil du Numérique en Santé.

•     Accompagner la montée en compétences des équipes locales (SI, DIM, data, recherche).

•     Contribuer à la réponse aux appels à projets et aux audits de conformité (OMOP-CDM).


Votre profil

Indispensable

•     Bac +5 en informatique, data engineering ou domaine connexe.

•     Expérience en conception de pipelines de données (ETL/ELT) en environnement de production.

•     Très bon niveau en SQL et maîtrise des bases de données relationnelles (PostgreSQL, Oracle ou équivalent).

•     Pratique de Python pour le traitement et l’industrialisation de données.

•     Maîtrise de Git et des pratiques de développement collaboratif.

Apprécié

•     Connaissance des données hospitalières (DPI, PMSI, biologie, imagerie) et/ou des environnements de santé.

•     Familiarité avec les standards santé : FHIR, HL7, OMOP-CDM, LOINC, SNOMED-CT.

•     Expérience en environnement Cloud data (data warehouse, data lake).

•     Sensibilité aux enjeux réglementaires (RGPD, données de santé) et aux initiatives européennes (EHDS).

•     Expérience ou intérêt pour le NLP, le traitement d’imagerie médicale ou les modèles de langage (LLM) appliqués à la santé.

Qualités personnelles

Rigueur et capacité d’analyse. Autonomie et esprit d’équipe. Goût pour la vulgarisation de sujets techniques auprès d’interlocuteurs variés. Force de proposition.



Ce que nous offrons

Modalités

•     Contrat : CDD 18 mois – Forfait annuel « 208 jours » - Statut cadre

•     Télétravail : partiel, selon les règles de l’établissement d’accueil.

•     Déplacements ponctuels dans les établissements membres (Lille, Paris, Marseille).

•     Rémunération : selon profil et expérience.

•     Temps de travail : Temps plein.

•     Rattachement administratif : à la DRCI de l’établissement coordinateur du projet EDGAR (Hôpital FOCH)

•     Rattachement hiérarchique :

◦      Déléguée de RESPIC

◦      Il rend compte régulièrement au GT opérationnel et au Comité de pilotage de son activité, notamment via les indicateurs d’activités.

•     Liens fonctionnels : le/la Data Engineer travaille en lien étroit :

·         avec chaque Référent local et les unités data, DSI et DRCI des membres du consortium ;

·         Il sera également amené à travailler avec les Partenaires externes (prestataires, sous- traitants, clients)

·         Et avec les Autorités Compétentes en matière de Santé ainsi que de la donnée


Le consortium EDGAR regroupe huit établissements de santé privés d’intérêt collectif (ESPIC) autour d’une stratégie commune sur les données de santé et la recherche portée par l’association RESPIC. Lauréat de l’appel à projets France 2030, RESPIC déploie le projet EDGAR : une plateforme nationale qui fédère des données des Entrepôts de Données de Santé (EDS) de ses membres via une solution technique et des standards communs.

EDGAR s’inscrit dans les travaux nationaux et européens en matière d’interopérabilité, de qualité des données et de préparation de l’Espace Européen des Données de Santé (EHDS). Pour accompagner cette montée en puissance, nous recrutons un·e Data Engineer dédié·e aux flux de données, à la qualité et à l’interopérabilité.

Liste des établissements participant au projet EDGAR – Entrepôts de Données Groupés de l’Association Respic : Hôpital Foch, GH Paris St Joseph, Institut Médico-chirurgical Montsouris, GH de l’institut Catholique de Lille, Hôpital St Joseph Marseille, Hôpital Européen de Marseille, l’Hôpital Fondation Adolphe de Rothschild et le GH des Diaconesses Croix Saint Simon.