Prédiction de maladies génétiques à partir des forêts aléatoires et régressions logistiques

Le projet consistera a développer des modèles prédictifs utilisant les données de tests médicaux de patients. Quatre algorithmes en utilisant les méthodes de régression logistique et de forêt aléatoire seront utilisés prédire le diabète, l’hémoglobinopathies, le beta thalassémie, le niveau élevé de LDL-C. Les algorithmes permettront de classer divers résultats et d’en déduire un recommandation textuelle transmise au médecin. En cas de besoin, le patient sera encouragé à passer des tests médicaux supplémentaires pour valider l’hypothèse du modèle.
Le défi de recherche sera centré sur l’analyse exploratoire d’un vaste jeu données afin de sélectionner les variables explicatives pertinentes. De plus, les modèles proposés devront limiter les faux positifs afin de limiter des recommandations inutiles, tout en maximisant la sensitivité afin de justifier leur mise en production. Évidemment, ces outils pourront ultimement donner plus d’information au patient, sans pour autant augmenter leur nombre de tests.

Faculty Supervisor:

Aurélie Labbe

Student:

Samuel Barbeau

Partner:

Biron Groupe Santé Inc

Discipline:

Computer science

Sector:

Health care and social assistance

University:

HEC Montréal

Program:

Accelerate

Current openings

Find the perfect opportunity to put your academic skills and knowledge into practice!

Find Projects