logo

JobNob

Your Career. Our Passion.

Stagiaire en Data Science — H/F


Institut de Cancérologie de l'Ouest


Location

Saint Herblain, Loire Atlantique | France


Job description

Stagiaire en Data Science — H/F Début : Entre mars et avril - Durée : de 4 à 6 mois Service Data Factory & Analytics Poste rattaché au Service Data Factory & Analytics (Direction Développement et Innovation). L'objectif principal est de développer une solution permettant d'automatiser le processus d'extraction d'informations pertinentes à partir de documents médicaux non structurés et d’évaluer les performances de cette solution. Tâches principales : • Compréhension des données médicales : familiarisation avec les différents types de comptes rendus médicaux. Analyse des spécificités linguistiques et des structures de ces documents. • Installation et configuration de Mistral AI : mise en place de Mistral AI en environnement local, en assurant la configuration optimale pour l'analyse des documents médicaux. • Développement d'un pipeline d'extraction : conception et mise en œuvre d'un pipeline automatisé utilisant Mistral AI pour extraire les variables d’intérêts à partir des documents médicaux, et permettant d’alimenter une base de données structurée. • Évaluation de la performance de la solution en termes de précision, de rappel et de F1-score en utilisant une base de données manuellement saisie comme Gold Standard. Identification des opportunités d'amélioration et itération du modèle pour une extraction plus efficace. Ce stage offre une opportunité unique d'acquérir des compétences pratiques en data science appliquée à la santé, tout en contribuant au développement d'une solution innovante pour faciliter l'exploitation des données médicales non structurées. Le stagiaire travaillera en étroite collaboration avec une équipe multidisciplinaire composée de spécialistes en biostatistique et en oncologie. Références :

  1. Schiappa R, Contu S, Culie D, Thamphya B, Chateau Y, Gal J, et al. RUBY: Natural Language Processing of French Electronic Medical Records for Breast Cancer Research. JCO Clin Cancer Inform. 2022 Jul;6:e2100199.
  2. Savova GK, Ogren PV, Duffy PH, Buntrock JD, Chute CG. Mayo clinic NLP system for patient smoking status identification. J Am Med Inform Assoc JAMIA. 2008;15(1):25–8.
  3. Holmes B, Chitale D, Loving J, Tran M, Subramanian V, Berry A, et al. Customizable Natural Language Processing Biomarker Extraction Tool. JCO Clin Cancer Inform. 2021 Aug;5:833–41.
  4. Hanauer DA, Barnholtz-Sloan JS, Beno MF, Del Fiol G, Durbin EB, Gologorskaya O, et al. Electronic Medical Record Search Engine (EMERSE): An Information Retrieval Tool for Supporting Cancer Research. JCO Clin Cancer Inform. 2020 May;4:454–63.
  5. Carrell DS, Halgrim S, Tran DT, Buist DSM, Chubak J, Chapman WW, et al. Using natural language processing to improve efficiency of manual chart abstraction in research: the case of breast cancer recurrence. Am J Epidemiol. 2014 Mar 15;179(6):749–58.
  6. Banerjee I, Bozkurt S, Caswell-Jin JL, Kurian AW, Rubin DL. Natural Language Processing Approaches to Detect the Timeline of Metastatic Recurrence of Breast Cancer. JCO Clin Cancer Inform. 2019 Oct;3:1–12.
Profil: Vous êtes issu(e) d’une formation en école d'ingénieur ou type bac+5 spécialisée en data science et vous recherchez un stage de fin d’étude. Vous devrez disposer de bonnes connaissances des modèles de traitement du langage et du machine learning et être force de proposition. Vous devez être à l’aise avec les langages de programmation Python et/ou R et avoir une appétence pour les applications en santé et l’oncologie. De bonnes capacités de communication, orales et écrites, sont souhaitées. Merci d’adresser votre CV et lettre de motivation, par mail, à Florent Le Borgne, Data Analyst - Statisticien

INSTITUT DE CANCÉROLOGIE DE L'OUEST

L’Institut de Cancérologie de l’Ouest (ICO) est un Centre de Lutte contre le Cancer, établissement de santé privé d'intérêt collectif, établi sur deux sites, à Angers et à St Herblain. L’ICO déploie un ambitieux Projet d’Établissement dans lequel la donnée joue un rôle essentiel. Nantes, Saint-Herblain bac+5 spécialisée en data science Débutant (moins de 2 ans), Expérimenté (2 à 5 ans) Stage / Alternance Ingénieur


Job tags

AlternanceStage


Salary

All rights reserved