Développement de nouveaux algorithmes en cheminformatique

Objectifs scientifiques

En 2008, j'ai souhaité changé le nom de mon Equipe en l'intitulant "Chémogénomique Structurale". Ce changement témoigne d'une orientation nouvelle de mes activités vers la prédiction à haut débit de matrices d'interaction protéine-ligand. Au lieu de s'intéresser à l'interaction possible de ligands multiples à une cible unique (criblage virtuel classique), nous étendons le problème à la prédiction d'interaction de ligands multiples à des cibles multiples. Ceci est rendu possible par la disponibilité croissante de données expérimentales publiques ainsi que l'utilisation de machines d'apprentissage, ce qui représente une nouvelle orientation thématique pour notre groupe.

Stratégies mise en jeu

Comparaisons de sites de liaisons protéiques

Nous avons développé un nouvel algorithme rapide de détection de cavité (VolSite) à la surface de structure cristallographique de protéines [1]. La méthode permet de prédire la « droguabilité » de la poche (est-elle adaptée à accueillir un candidat médicament ?) et de comparer des milliers de cavités entre elles afin d’inférer des similarités de sites en absence de conservation de repliement des protéines correspondantes (Figure 1). Elle a notamment été appliquée pour expliquer les déterminants moléculaires responsables de la promiscuité de certains ligands capables de reconnaitre des cibles multiples [2].
 

Figure 1 : Détection de cavité par VolSite [9].et représentation sous forme de points pharmacophoriques (droite). Pour chaque poche détectée (gauche), le volume et l’indice de droguablité (0-1) est calculé

Une licence académique de ce logiciel a été concédée à de nombreuses universités (Barcelone, Cambridge, Messina, Mexico, Prague, Rice, Houston, Stanford, Rio, Pékin, Atlanta)

Comparaison d'empreintes protéine-ligand

A partir de complexes protéine-ligand de structure cristallographique connue (sc-PDB), nous avons développé une méthode d’apprentissage à l’aide d’un réseau de neurones (Figure 2), afin de prédire le mode de liaison d’un ligand à sa protéine cible en se basant uniquement sur la structure 2D (graphe) de ce ligand [3].Le mode de liaison est représenté par une empreinte binaire d’interaction enregistrant la liaison ou non avec chacun des acides aminés du site de liaison de la protéine cible. Le réseau de neurones est entraîné, à partir de structures protéine-ligand connues, à relier descripteurs de ligands (entrée) à l’empreinte d’interaction finale (sortie)
 

Figure 2 : Apprentissage du mode de liaison (empreinte d’interaction) par un réseau de neurones, à partir de la structure 2D du ligand.


Nous avons montré que cette nouvelle méthode de prédiction de mode de liaison était très rapide,  fiable, applicable à de nombreuses cibles pharmaceutiques pour lesquels de nombreux ligands et structures cristallographiques sont disponibles [3].  

Une seconde méthode (IChem), développée en collaboration avec le laboratoire pharmaceutique SERVIER, se focalise elle sur les interactions protéine-ligand et les représente soit sous forme d’empreinte, soit sous forme de graphe (Figure 3). A partir de la structure 3D d’un complexe, les interactions protéine-ligand sont détectées à la volé et représentées par des pseudo-atomes (IPA)  à mi-chemin entre chaque paire d’atome en interaction et annotés par le type d’interaction établie (liaison hydrogène, liaison ionique, contact hydrophobe, contact aromatique, complexation de métaux). Tous les triplets d’IPAs sont générés et comptabilisés dans un vecteur de 210 entiers. Le jeu d’IPAs peut également être représenté sous forme d’un graphe sans arêtes afin de superposer deux complexes différents en se basant uniquement sur les interactions protéine-ligand en commun. Des programmes compagnons ont été conçus afin de mesurer la similarité des empreintes (IShape) ou des graphes d’interaction (Grim). La méthode est particulièrement efficace dans de nombreux scenarios : (i) pour aligner des complexes protéine-ligand, (ii) pour prioriser des poses de docking par similarité à des interaction proteine-ligand connue, (iii) pour suggérer des changements bioisostériques avec conservation du mode d’interaction [4]. Cette méthode a été licenciée aux laboratoires SERVIER.

Figure 3 : Représentation d’interactions protéine-ligand par IChem.


Profilage pharmacologique in silico de ligands

Anticiper les effets secondaires d’un candidat médicament est crucial à son développement. Dans la mesure où la plupart des effets indésirables sont dus à l’interaction du ligand avec une protéine cible secondaire, il est très important de déterminer le profil de sélectivité d’un candidat clinique pour de multiples cibles. Cette information peut être obtenue expérimentalement par succession de test de liaisons in vitro, mais requiert la mise au point d’un très grand nombre d’essais. Elle est par conséquent extrêmement coûteuse et uniquement accessible aux multinationales pharmaceutiques.
Etant donné le très grand nombre de données de liaison in vitro disponibles (plus de 12 millions de données d’acticité dans la base ChEMBL), nous avons développé un protocole automatisé (Profiler) de prédiction de cibles protéiques à partir de la structure 2D du ligand [5]. Ce protocole de profilage fait appel à diverses méthodes, basées soit sur la similarité 2D à des ligands de cible connue, soit sur la complémentarité 3D entre ligand et récepteur. Il est rapide (quelques seconde par ligand), prédit environ 20 cibles/ligand et permet donc de restreindre et d’accélérer considérablement la validation expérimentale de cibles secondaires. Appliqué à un panel de 189 médicaments en développement clinique, notre protocole de profilage a pu ainsi retrouver 72% des cibles connues de ces médicaments. Nous avons également pu prédire, puis vérifier expérimentalement la liaison de deux médicaments connus à des cibles nouvelles (Figure 4).

Figure 4 : Identification de cibles secondaires nouvelles pour deux candidats cliniques. La liaison du médicament  à la cible secondaire prédite est vérifiée expérimentalement (données CEREP)

Références

  1. Comparison and druggability prediction of protein-ligand binding pockets from pharmacophore-annotated shapes.
    Desaphy, J., Azdimousa, K., and Rognan, D.
    (2012) J. Chem. Info. Model., 52, 2287-2299

  2. Structural insights into the molecular basis of the ligand promiscuity
    Sturm, N., Desaphy, J., Quinn, R.J., Rognan, D. and Kellenberger, E.
    (2012) , J Chem Info Model, 52, 2410-2421.

  3. Predicting ligand binding modes from neural networks trained on protein-ligand interaction fingerprints.
    Chupakhin, V., Marcou, G., Baskin, I., Varnek, A. and Rognan, D.
    (2013) J. Chem. Inf. Model., 53, 763-772.

  4. Encoding protein-ligand interaction patterns in fingerprints and graphs.
    Desaphy, J., Ducrot, P., Raimbaud, E. and Rognan, D.
    (2013) J. Chem. Inf. Model, 53, 623-637.

  5. Computational profiling of bioactive compounds using a target-dependent composite workflow.
    Meslamani, J., Bhajun, R., Martz, F. and Rognan, D.
    (2013). J. Chem. Inf. Model., 53, 2322-2333.

Collaborations

Collaborations externes

  • Alexandre Varnek (CNRS 7177, Strasbourg) UMR)
  • Pierre Ducrot (Institut de Recherches Servier, Croissy/Seine)
  • A. Stevens (Accelrys, Cambridge)

Financements

Laboratoires Servier, Société Accelrys, Fondation pour la Recherche en Chimie (Strasbourg)