Méthodologie pour l’analyse de données de criblage : application à l'étude de la leucémie myéloïde aiguë
Thèse ou mémoire / Thesis or Dissertation
Date de publication
Autrices et auteurs
Identifiant ORCID de l’auteur
Contributrices et contributeurs
Direction de recherche
Publié dans
Date de la Conférence
Lieu de la Conférence
Éditeur
Cycle d'études
Maîtrise / Master's
Programme
Affiliation
Mots-clés
- Régression non-linaire
- Simulation Monte-Carlo
- Acute myeloid leukemia
- Bioinformatics
- Ré-échantillonnage Bootstrap
- Criblage à haut débit
- Leucémie myéloïde aiguë
- Bio-informatique
- Nonlinear regression
- Monte-Carlo simulation
- Bootstrap resample
- High throughput screen
Organisme subventionnaire
Résumé
Résumé
Les expériences de criblage à haut débit (CHD) permettent d’évaluer l’efficacité de com- posés chimiques pour diverses conditions. L’analyse des données se fait en générant une courbe de type dose-réponse et en interprétant les paramètres de celle-ci. Les outils pré- sentement utilisés pour de telles analyses manquent de flexibilité dans leur protocole et ne proposent aucune approche pour la comparaison d’ajustements. Le but de ce travail est d’établir un processus automatisé capable de générer, analyser et comparer des courbes dose-réponse-réponse, et ce, pour différents protocoles expérimentaux. Les courbes sont obtenues en ajustant le modèle log-logistique à l’aide d’un algorithme de régression non- linéaire. Nous mettons de l’avant le concept de groupe qui permet de faire un ajustement sur les données d’un ensemble d’échantillons. Cette approche semble robuste, même en présence de données aberrantes. Nous proposons aussi une approche statistique utilisant la simulation de données et le ré-échantillonnage pour obtenir des intervalles de confiance et faire la comparaison de deux ajustements. Le processus proposé est appliqué dans un contexte expérimental qui étudie les effets de composés sur des cellules leucémiques. Bien que plusieurs analyses se font en interprétant principalement l’IC50, les résultats obtenus suggèrent que d’autres métriques devraient aussi être analysée pour déterminer l’efficacité d’un composé. Ces différentes métriques aident à bien caractériser et mieux comprendre un composé chimique.
High throughput screens (HTS) allow us to evaluate the efficacy of multiple chemical compounds for various conditions. HTS data is analyzed by fitting a mathematical model to normalized dose-response data and by interpreting the adjusted parameters. The tools currently available to do such analysis lack flexibility in their protocol and are not able to statistically compare two fittings. The aim of this project is to establish an automated pipeline able to generate, analyse and compare fittings for various experimental contexts. The fittings are obtained by adjusting the parameters of the log-logistic model with a non-linear regression algorithm. We are putting forward the concept of a group, which is used to fit the model for a given set of samples. This approach seems to be robust even when the data contains outliers. We also propose a statistical approach based on data simulation and resampling to obtain confidence intervals for the adjusted parameters and to compare two independant fittings. Our proposed pipeline is applied to experimental context where we study the effects of chemical compounds on leukemic cells. While many analysis are done by only interpreting the IC50, our results suggest that other parameters should also be considered when establishing th efficacy of a compound. These parameters help to characterize and better understand a given chemical compound.
High throughput screens (HTS) allow us to evaluate the efficacy of multiple chemical compounds for various conditions. HTS data is analyzed by fitting a mathematical model to normalized dose-response data and by interpreting the adjusted parameters. The tools currently available to do such analysis lack flexibility in their protocol and are not able to statistically compare two fittings. The aim of this project is to establish an automated pipeline able to generate, analyse and compare fittings for various experimental contexts. The fittings are obtained by adjusting the parameters of the log-logistic model with a non-linear regression algorithm. We are putting forward the concept of a group, which is used to fit the model for a given set of samples. This approach seems to be robust even when the data contains outliers. We also propose a statistical approach based on data simulation and resampling to obtain confidence intervals for the adjusted parameters and to compare two independant fittings. Our proposed pipeline is applied to experimental context where we study the effects of chemical compounds on leukemic cells. While many analysis are done by only interpreting the IC50, our results suggest that other parameters should also be considered when establishing th efficacy of a compound. These parameters help to characterize and better understand a given chemical compound.
Table des matières
Notes
Notes
Autre version linguistique
Ensemble de données lié
Licence
Approbation
Évaluation
Complété par
Référencé par
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Sauf si le document est diffusé sous une licence Creative Commons, il ne peut être utilisé que dans le cadre d'une utilisation équitable et non commerciale comme le prévoit la Loi (i.e. à des fins d'étude privée ou de recherche, de critique ou de compte-rendu). Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.