1. Idée centrale : un modèle mathématique n’est pas la réalité
Un modèle biologique est une représentation simplifiée d’un système vivant.
Exemples :
| Système réel | Modèle mathématique possible |
|---|---|
| Croissance bactérienne | fonction exponentielle ou logistique |
| Enzyme + substrat | équation de Michaelis-Menten |
| Propagation infectieuse | modèle SIR |
| Expression génique | vecteurs, matrices, ACP/PCA |
| Réseau métabolique | graphe orienté |
| Diffusion d’une molécule | équation de diffusion |
| Test diagnostique | probabilités conditionnelles, Bayes |
Un bon modèle doit préciser :
1. les variables ;
2. les unités ;
3. les hypothèses ;
4. le domaine de validité ;
5. les paramètres mesurables ;
6. les prédictions vérifiables.
Les modèles mécanistiques biophysiques reposent souvent sur des lois comme l’action de masse, la conservation de la matière, la loi d’Ohm pour les modèles électrophysiologiques ou des équations de transport ; les textes de modélisation insistent aussi sur les hypothèses cachées et les risques de mélanger modèles mécanistiques et modèles “boîte noire”. ([CNIB][2])
---
2. Fonctions, dimensions et ordres de grandeur
2.1 Fonctions biologiques
Une fonction relie une variable d’entrée à une sortie :
$$y=f(x)$$
Exemples :
$$N(t)=N_0 e^{rt}$$
où :
| Symbole | Signification | Unité |
|---|---|---|
| (N(t)) | population au temps (t) | cellules, individus |
| \(N_0\) | population initiale | cellules, individus |
| (r) | taux de croissance spécifique | \(temps^{-1}\) |
| (t) | temps | s, min, h, jour |
La cohérence dimensionnelle impose que l’exposant (rt) soit sans unité. Donc si (t) est en heures, (r) doit être en h(^{-1}).
---
2.2 Exemple étape par étape : croissance bactérienne exponentielle
Une culture passe de :
$$N_0=10^{3}$$
à :
$$N(6h)=8\times10^{3}$$
On suppose une croissance exponentielle :
$$N(t)=N_0 e^{rt}$$
Étape 1 : écrire le rapport
$$\frac{N(t)}{N_0}=e^{rt}$$
$$\frac{8\times10^{3}}{10^{3}}=8=e^{6r}$$
Étape 2 : appliquer le logarithme
$$\ln^{8}=6r$$
$$r=\frac{\ln^{8}}{6}$$
Or :
$$\ln^{8}=\ln(2^{3})=3\ln^{2}\approx 2{,}079$$
Donc :
$$r=\frac{2{,}079}{6}=0{,}347 \ \mathrm{h}^{-1}$$
Étape 3 : calculer le temps de doublement
$$Le temps de doublement (T_d) vérifie :$$
$$2N_0=N_0 e^{rT_d}$$
$$2=e^{rT_d}$$
$$T_d=\frac{\ln 2}{r}$$
$$T_d=\frac{0{,}693}{0{,}347}=2{,}0 \ \mathrm{h}$$
Interprétation biologique : dans ces conditions, la population double toutes les deux heures.
Limite : ce modèle suppose nutriments illimités, absence de déchets toxiques, température constante, pas de mortalité différentielle. Il est valable surtout en phase exponentielle.
---
3. Calcul différentiel : taux, vitesses et sensibilités
Le calcul différentiel sert à décrire les variations instantanées.
$$\frac{dN}{dt}$$
signifie : variation de (N) par unité de temps.
En biologie, on rencontre :
| Domaine | Dérivée |
|---|---|
| Croissance cellulaire | \(\frac{dN}{dt}\) |
| Cinétique enzymatique | \(\frac{d[P]}{dt}\) |
| Pharmacocinétique | \(\frac{dC}{dt}\) |
| Physiologie | \(\frac{dP_{art}}{dt}, \frac{dV}{dt}\) |
| Écologie | \(\frac{dN_i}{dt} pour l’espèce (i)\) |
---
3.1 Croissance logistique
La croissance exponentielle prédit une croissance infinie. En biologie réelle, les ressources deviennent limitantes. On introduit alors une capacité limite (K), appelée capacité de charge.
$$\frac{dN}{dt}=rN\left(1-\frac{N}{K}\right)$$
| Symbole | Signification | Unité |
|---|---|---|
| (N) | population | individus ou cellules |
| (r) | taux maximal de croissance | \(temps^{-1}\) |
| (K) | capacité de charge | individus ou cellules |
| \(\frac{dN}{dt}\) | vitesse de croissance | \(individus\cdot temps^{-1}\) |
OpenStax présente cette équation comme une amélioration du modèle exponentiel pour tenir compte de la capacité de charge environnementale. ([OpenStax][3])
---
3.2 Exemple étape par étape : culture limitée par les ressources
Données :
$$N_0=10^{6} \ \mathrm{cellules}$$
$$K=10^{9} \ \mathrm{cellules}$$
$$r=0{,}8 \ \mathrm{jour}^{-1}$$
Solution de l’équation logistique :
$$N(t)=\frac{K}{1+\left(\frac{K-N_0}{N_0}\right)e^{-rt}}$$
Étape 1 : calcul du facteur initial
$$\frac{K-N_0}{N_0}=\frac{10^{9}-10^{6}}{10^{6}}=999$$
Donc :
$$N(t)=\frac{10^{9}}{1+999e^{-0{,}8t}}$$
Étape 2 : population après 5 jours
$$N^{5}=\frac{10^{9}}{1+999e^{-4}}$$
$$e^{-4}\approx0{,}0183$$
$$999e^{-4}\approx18{,}3$$
$$N^{5}\approx\frac{10^{9}}{19{,}3}=\approx5{,}18\times10^{7}$$
Étape 3 : interprétation
Après 5 jours :
$$N^{5}\approx5{,}2\times10^{7} \ \mathrm{cellules}$$
La croissance est encore forte, car (N\ll K), mais elle ralentira quand (N) s’approchera de (10^{9}).
Point important :
$$\frac{dN}{dt}$$
est maximal lorsque :
$$N=\frac{K}{2}$$
La croissance est donc maximale à mi-capacité.
---
4. Intégrales : quantités cumulées
Une intégrale additionne une quantité variable.
$$\int_a^b f(t),dt$$
En sciences du vivant, les intégrales servent à calculer :
| Situation | Intégrale |
|---|---|
| exposition à un médicament | \(aire sous la courbe (AUC=\int C(t)dt)\) |
| production totale de métabolite | \((\int v(t)dt)\) |
| dose absorbée | \((\int R(t)dt)\) |
| expression cumulée d’un gène | \((\int E(t)dt)\) |
---
Exemple : exposition pharmacocinétique
Si la concentration plasmatique suit :
$$C(t)=C_0 e^{-kt}$$
alors l’exposition totale de (0) à (\infty) vaut :
$$AUC=\int_0^\infty C_0 e^{-kt}dt$$
$$AUC=\frac{C_0}{k}$$
Unités :
$$C_0 : \mathrm{mg\cdot L}^{-1}$$
$$k : \mathrm{h}^{-1}$$
Donc :
$$AUC : \mathrm{mg\cdot h\cdot L}^{-1}$$
La cohérence dimensionnelle est correcte.
---
5. Probabilités : incertitude biologique
Les systèmes vivants sont variables. Deux cellules génétiquement identiques peuvent exprimer des niveaux différents d’un gène. Deux patients exposés au même facteur peuvent avoir des réponses différentes.
Une probabilité est un nombre entre 0 et 1 :
$$0\leq P(A)\leq1$$
---
5.1 Probabilité conditionnelle
$$P(A\mid B)=\frac{P(A\cap B)}{P(B)}$$
Elle signifie : probabilité de (A) sachant que (B) est réalisé.
En médecine :
$$P(\mathrm{maladie}\mid \mathrm{test positif})$$
n’est pas la même chose que :
$$P(\mathrm{test positif}\mid \mathrm{maladie})$$
Cette confusion est très fréquente.
---
5.2 Sensibilité, spécificité et valeurs prédictives
Pour un test diagnostique :
$$\mathrm{Sensibilité}=\frac{VP}{VP+FN}$$
$$\mathrm{Spécificité}=\frac{VN}{VN+FP}$$
$$VPP=\frac{VP}{VP+FP}$$
$$VPN=\frac{VN}{VN+FN}$$
où :
| Symbole | Signification |
|---|---|
| VP | vrai positif |
| VN | vrai négatif |
| FP | faux positif |
| FN | faux négatif |
Les rapports de vraisemblance sont :
$$LR^+=\frac{\mathrm{sensibilité}}{1-\mathrm{spécificité}}$$
$$LR^-=\frac{1-\mathrm{sensibilité}}{\mathrm{spécificité}}$$
Ces formules sont celles utilisées classiquement dans l’évaluation de la performance diagnostique. ([CNIB][4])
---
5.3 Exemple étape par étape : test diagnostique
Données :
$$\mathrm{prévalence}=2\%=0{,}02$$
$$\mathrm{sensibilité}=95\%=0{,}95$$
$$\mathrm{spécificité}=98\%=0{,}98$$
Question : quelle est la probabilité d’être malade si le test est positif ?
On cherche :
$$P(M\mid T+)$$
Formule de Bayes :
$$P(M\mid T+)=\frac{P(T+\mid M)P(M)}{P(T+\mid M)P(M)+P(T+\mid \neg M)P(\neg M)}$$
Étape 1 : identifier les termes
$$P(T+\mid M)=0{,}95$$
$$P(M)=0{,}02$$
$$P(\neg M)=0{,}98$$
$$P(T+\mid \neg M)=1-\mathrm{spécificité}=0{,}02$$
Étape 2 : calcul
$$P(M\mid T+)=\frac{0{,}95\times0{,}02}{0{,}95\times0{,}02+0{,}02\times0{,}98}$$
$$P(M\mid T+)=\frac{0{,}019}{0{,}019+0{,}0196}$$
$$P(M\mid T+)=\frac{0{,}019}{0{,}0386}\approx 0{,}492$$
Donc :
$$P(M\mid T+)\approx49{,}2\%$$
Interprétation : malgré un test apparemment très performant, la valeur prédictive positive est seulement d’environ 49 % lorsque la prévalence est faible.
Conclusion pédagogique : un bon test ne suffit pas ; la prévalence influence fortement l’interprétation clinique.
---
6. Statistiques : apprendre à partir de données
Les probabilités vont du modèle vers les données.
Les statistiques vont des données vers le modèle.
Exemple :
* Probabilité : “si la vraie moyenne est (\mu), quelle distribution des mesures attend-on ?”
* Statistique : “à partir des mesures observées, que peut-on dire de (\mu) ?”
---
6.1 Moyenne, variance, écart-type
Pour des mesures :
$$x_1,x_2,\dots,x_n$$
la moyenne est :
$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$
La variance empirique est :
$$s^{2}=\frac{1}{n^{-1}}\sum_{i=1}^{n}(x_i-\bar{x})^{2}$$
L’écart-type :
$$s=\sqrt{s^{2}}$$
---
6.2 Erreur standard
L’erreur standard de la moyenne vaut :
$$SEM=\frac{s}{\sqrt{n}}$$
Elle diminue comme (\sqrt{n}), pas comme (n).
Conséquence : multiplier l’effectif par 4 divise l’erreur standard par 2.
---
6.3 Intervalle de confiance approximatif
Pour une moyenne normalement distribuée :
$$\mathrm{IC}_{95}\approx \bar{x}\pm1{,}96\frac{s}{\sqrt{n}}$$
Attention : un intervalle de confiance ne signifie pas que la probabilité que le vrai paramètre soit dans cet intervalle est 95 % dans l’interprétation fréquentiste stricte. Il signifie que la procédure produirait des intervalles contenant le vrai paramètre dans 95 % des répétitions idéalisées.
---
6.4 p-valeur
Une p-valeur est :
$$p=P(\mathrm{données aussi extrêmes ou plus extrêmes}\mid H_0)$$
Elle n’est pas :
$$P(H_0\mid \mathrm{données})$$
Erreur fréquente : croire que (p=0{,}03) signifie “il y a 3 % de chances que l’hypothèse nulle soit vraie”. Ce n’est pas ce que calcule une p-valeur.
---
7. Algèbre linéaire : vecteurs, matrices et données omiques
L’algèbre linéaire est centrale pour :
* transcriptomique ;
* protéomique ;
* métabolomique ;
* imagerie ;
* génétique des populations ;
* modèles de transition ;
* apprentissage automatique.
Un individu, une cellule ou un échantillon peut être représenté par un vecteur :
$$\mathbf{x}= \begin{pmatrix} x_1\\ x_2\\ x_3 \end{pmatrix}$$
Exemple :
$$\mathbf{x}= \begin{pmatrix} \mathrm{expression gène A}\\ \mathrm{expression gène B}\\ \mathrm{expression gène C} \end{pmatrix}$$
Une matrice de données omiques contient souvent :
$$X_{ij}$$
où (i) désigne l’échantillon et (j) le gène.
---
7.1 Matrice de transition
Exemple simple : cellules pouvant être dans deux états :
* état 1 : prolifératif ;
* état 2 : différencié.
On écrit :
$$\mathbf{x}_{t+1}=A\mathbf{x}_t$$
avec :
$$A= \begin{pmatrix} 0{,}9 & 0{,}2\\ 0{,}1 & 0{,}8 \end{pmatrix}$$
Si :
$$\mathbf{x}_0= \begin{pmatrix} 0{,}7\\ 0{,}3 \end{pmatrix}$$
alors :
$$\mathbf{x}_1= \begin{pmatrix} 0{,}9 & 0{,}2\\ 0{,}1 & 0{,}8 \end{pmatrix} \begin{pmatrix} 0{,}7\\ 0{,}3 \end{pmatrix}$$
Calcul
Première composante :
$$0{,}9\times0{,}7+0{,}2\times0{,}3=0{,}63+0{,}06=0{,}69$$
Deuxième composante :
$$0{,}1\times0{,}7+0{,}8\times0{,}3=0{,}07+0{,}24=0{,}31$$
Donc :
$$\mathbf{x}_1= \begin{pmatrix} 0{,}69\\ 0{,}31 \end{pmatrix}$$
Interprétation : après une étape, 69 % des cellules sont prolifératives et 31 % différenciées.
---
7.2 Valeurs propres et stabilité
Une valeur propre (\lambda) d’une matrice (A) vérifie :
$$A\mathbf{v}=\lambda\mathbf{v}$$
En biologie :
| Valeur propre | Interprétation |
|---|---|
| \(\lambda <1\) | décroissance ou amortissement |
| \(\lambda =1\) | équilibre neutre |
| \(\lambda >1\) | croissance ou amplification |
Exemple : dans une matrice de Leslie, la plus grande valeur propre donne le taux asymptotique de croissance d’une population structurée par âge.
---
7.3 ACP/PCA : réduire la dimension
L’analyse en composantes principales transforme des variables corrélées en nouvelles variables orthogonales appelées composantes principales. En bioinformatique, la PCA est un outil classique de réduction de dimension, notamment pour les données d’expression génique de haute dimension. ([PubMed][5])
Idée
On part d’une matrice :
$$X= \begin{pmatrix} \mathrm{échantillons} \times \mathrm{gènes} \end{pmatrix}$$
La PCA cherche des axes qui maximisent la variance :
$$PC_1 = a_1x_1+a_2x_2+\dots+a_px_p$$
$$où les coefficients (a_i) forment un vecteur propre de la matrice de covariance.$$
Interprétation biologique
Si deux groupes de cellules se séparent sur (PC_1), cela peut correspondre à :
* un type cellulaire différent ;
* un état d’activation ;
* un effet batch ;
* une différence de cycle cellulaire ;
* une différence pathologique.
Limite majeure : la PCA maximise la variance, pas nécessairement la pertinence biologique.
---
8. Équations différentielles : dynamique des systèmes vivants
Une équation différentielle relie une grandeur à sa vitesse de variation.
$$\frac{dx}{dt}=f(x,t)$$
Elle permet de modéliser :
| Domaine | Exemple |
|---|---|
| écologie | croissance de population |
| immunologie | expansion clonale |
| épidémiologie | modèles SIR |
| biochimie | cinétique enzymatique |
| physiologie | régulation glycémique |
| pharmacologie | élimination d’un médicament |
---
8.1 Modèle SIR
On divise une population en trois compartiments :
$$S(t): \mathrm{susceptibles}$$
$$I(t): \mathrm{infectés}$$
$$R(t): \mathrm{retirés ou guéris}$$
Le modèle classique :
$$\frac{dS}{dt}=-\beta$$
SI
$$\frac{dI}{dt}=\beta$$
$$SI-\gamma I$$
$$\frac{dR}{dt}=\gamma$$
I
]
| Paramètre | Signification | Unité |
|---|---|---|
| \(\beta\) | taux de transmission | \(individu^{-1}\cdot temps^{-1}\) |
| \(\gamma\) | taux de guérison/retrait | \(temps^{-1}\) |
| \(1/\gamma\) | durée infectieuse moyenne | temps |
Dans une formulation normalisée, on utilise souvent :
$$R_0=\frac{\beta}{\gamma}$$
si (S) est exprimé comme fraction initiale proche de 1.
Exemple
$$\beta=0{,}30 \ \mathrm{jour}^{-1}$$
$$\gamma=0{,}20 \ \mathrm{jour}^{-1}$$
Donc :
$$R_0=\frac{0{,}30}{0{,}20}=1{,}5$$
Interprétation : au début de l’épidémie, un infecté génère en moyenne 1,5 nouveau cas dans une population entièrement susceptible, selon les hypothèses du modèle.
Limites : homogénéité des contacts, population fermée, absence de structure d’âge, absence de spatialisation, paramètres constants.
---
9. Cinétique enzymatique : Michaelis-Menten
La biochimie utilise intensivement les fonctions rationnelles, les équations différentielles et les ajustements non linéaires.
Le schéma minimal est :
$$E+S \rightleftharpoons ES \rightarrow E+P$$
L’équation de Michaelis-Menten est :
$$v=\frac{V_{\max}[S]}{K_m+[S]}$$
où :
| Symbole | Signification | Unité |
|---|---|---|
| (v) | vitesse initiale | \(\mathrm{\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\cdot s^{-1}} ou \mathrm{\mathrm{\mathrm{\mu mol\cdot min^{-1}}}}\) |
| \(V_{\max}\) | vitesse maximale | même unité que (v) |
| ([S]) | concentration en substrat | \(\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\) |
| \(K_m\) | \(concentration donnant v=V_{\max}/2\) | \(\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\) |
Le Assay Guidance Manual de NCBI présente (K_m) et (V_{\max}) comme paramètres intrinsèques majeurs de la cinétique enzymatique, utiles notamment dans le développement de tests enzymatiques et la recherche d’inhibiteurs. ([CNIB][6])
---
9.1 Exemple étape par étape
Données :
$$V_{\max}=100 \ \mathrm{\mu mol\cdot min^{-1}}$$
$$K_m=2 \ \mathrm{mmol\cdot L^{-1}}$$
Calculer (v) pour :
$$[S]=0{,}5,\ 2,\ 10 \ \mathrm{mmol\cdot L^{-1}}$$
Cas 1 : ([S]=0{,}5)
$$v=\frac{100\times0{,}5}{2+0{,}5}$$
$$v=\frac{50}{2{,}5}=20 \ \mathrm{\mu mol\cdot min^{-1}}$$
Cas 2 : ([S]=2)
$$v=\frac{100\times2}{2+2}$$
$$v=\frac{200}{4}=50 \ \mathrm{\mu mol\cdot min^{-1}}$$
Ici :
$$[S]=K_m$$
donc :
$$v=\frac{V_{\max}}{2}$$
Cas 3 : ([S]=10)
$$v=\frac{100\times10}{2+10}$$
$$v=\frac{1000}{12}=83{,}3 \ \mathrm{\mu mol\cdot min^{-1}}$$
Interprétation biologique
$$Quand ([S]\ll K_m), la vitesse dépend presque linéairement du substrat :$$
$$v\approx \frac{V_{\max}}{K_m}[S]$$
$$Quand ([S]\gg K_m), l’enzyme est saturée :$$
$$v\approx V_{\max}$$
Limites : Michaelis-Menten suppose une vitesse initiale, un substrat unique ou une simplification, une enzyme stable, pas d’inhibition par le produit, pas d’allostérie forte, et des conditions expérimentales contrôlées.
---
10. Optimisation et estimation de paramètres
Les modèles biologiques contiennent des paramètres inconnus :
$$r,\ K,\ V_{\max},\ K_m,\ \beta,\ \gamma$$
On les estime à partir de données.
---
10.1 Moindres carrés
On choisit les paramètres qui minimisent :
$$S(\theta)=\sum_{i=1}^{n}(y_i-\hat{y}_i(\theta))^{2}$$
où :
| Symbole | Signification |
|---|---|
| \(y_i\) | donnée observée |
| \(\hat{y}_i\) | prédiction du modèle |
| \(\theta\) | paramètres à estimer |
Exemple : ajuster une courbe logistique sur une croissance cellulaire.
---
10.2 Maximum de vraisemblance
Si les données suivent une loi de probabilité (P(y_i|\theta)), la vraisemblance est :
$$L(\theta)=\prod_{i=1}^{n}P(y_i\mid \theta)$$
On maximise souvent le logarithme :
$$\ell(\theta)=\sum_{i=1}^{n}\ln$$
$$P(y_i\mid \theta)$$
]
Avantage : cette approche permet d’adapter le modèle d’erreur :
| Données | Loi plausible |
|---|---|
| comptages cellulaires | Poisson ou binomiale négative |
| proportions | binomiale |
| concentrations continues | normale ou log-normale |
| temps avant événement | exponentielle, Weibull, Cox |
---
11. Graphes et réseaux biologiques
Un graphe est défini par :
$$G=(V,E)$$
où :
| Symbole | Signification |
|---|---|
| (V) | ensemble des nœuds |
| (E) | ensemble des arêtes |
En biologie :
| Réseau | Nœuds | Arêtes |
|---|---|---|
| protéines | protéines | interactions physiques |
| métabolisme | métabolites | réactions |
| régulation génique | gènes/facteurs | activation/inhibition |
| connectome | neurones/régions | connexions |
| épidémiologie | individus | contacts |
La théorie des graphes est largement utilisée pour analyser les réseaux biologiques, extraire des propriétés cachées et relier structure du réseau et fonction biologique. ([PubMed][7])
---
11.1 Mesures classiques
Degré
Nombre de connexions d’un nœud :
$$k_i$$
Un nœud de degré élevé peut représenter une protéine hub.
Centralité d’intermédiarité
Mesure combien de plus courts chemins passent par un nœud.
$$C_B(v)=\sum_{s\neq v\neq t}\frac{\sigma_{st}(v)}{\sigma_{st}}$$
où :
| Symbole | Signification |
|---|---|
| \(\sigma_{st}\) | nombre de plus courts chemins entre (s) et (t) |
| \((\sigma_{st}(v))\) | nombre de ces chemins passant par (v) |
Clustering
Mesure la tendance des voisins d’un nœud à être connectés entre eux.
Biologiquement, un fort clustering peut correspondre à un module fonctionnel.
---
12. Information, entropie et séquences biologiques
L’information intervient en génomique, transcriptomique, phylogénie, neurosciences et apprentissage automatique.
12.1 Entropie de Shannon
$$H(X)=-\sum_i p_i\log_2(p_i)$$
Unité : bit.
Exemple : pour une position d’ADN où les quatre bases sont équiprobables :
$$p_A=p_T=p_G=p_C=\frac14$$
$$H=-4\times\frac14\log_2\left(\frac14\right)$$
$$H=2 \ \mathrm{bits}$$
Si une position est toujours A :
$$p_A=1$$
$$H=0$$
Interprétation biologique :
* entropie élevée : position variable ;
* entropie faible : position conservée ;
* conservation forte : contrainte fonctionnelle possible.
---
13. Processus stochastiques et diffusion
Les phénomènes cellulaires sont souvent bruités :
* expression génique en bursts ;
* diffusion moléculaire ;
* ouverture/fermeture de canaux ioniques ;
* mutations ;
* dérive génétique.
---
13.1 Marche aléatoire et diffusion
Pour une diffusion en une dimension :
$$\langle x^{2}\rangle=2Dt$$
où :
| Symbole | Signification | Unité |
|---|---|---|
| \(\langle x^{2}\rangle\) | déplacement quadratique moyen | \(m^{2}\) |
| (D) | coefficient de diffusion | \(\mathrm{\mathrm{\mathrm{m^2\cdot s^{-1}}}}\) |
| (t) | temps | s |
Donc :
$$t\approx\frac{L^{2}}{2D}$$
Exemple
Molécule avec :
$$D=10 \ \mathrm{\mu m^2\cdot s^{-1}}$$
Distance :
$$L=10 \ \mu m$$
Alors :
$$t\approx\frac{10^{2}}{2\times10}$$
$$t=\frac{100}{20}=5 \ s$$
Interprétation : une petite molécule peut explorer une cellule de 10 \mum en quelques secondes par diffusion, mais une distance 10 fois plus grande prend 100 fois plus de temps car (t\propto L^{2}).
---
14. Couplages entre mathématiques et disciplines biologiques
Biochimie
Les équations différentielles décrivent les vitesses de réaction.
La thermodynamique indique si une réaction est favorable :
$$\Delta G=\Delta$$
$$G^{\circ'}+RT\ln Q$$
]
La cinétique indique si elle est rapide.
Erreur fréquente : confondre réaction thermodynamiquement favorable et réaction rapide.
---
Physiologie
Les systèmes physiologiques utilisent des rétrocontrôles :
$$\mathrm{stimulus} \rightarrow \mathrm{capteur} \rightarrow \mathrm{intégrateur} \rightarrow \mathrm{effecteur}$$
Exemples :
* glycémie ;
* pression artérielle ;
* température corporelle ;
* ventilation ;
* osmolarité.
Les modèles utilisent souvent des équations différentielles couplées et des boucles de rétroaction négative.
---
Écologie
Les modèles de population utilisent :
* croissance exponentielle ;
* croissance logistique ;
* compétition ;
* prédation ;
* matrices de transition ;
* stochasticité environnementale.
---
Médecine
Les outils mathématiques servent à :
* interpréter un test ;
* estimer un risque ;
* ajuster un traitement ;
* modéliser une épidémie ;
* analyser un essai clinique ;
* stratifier des patients.
---
Omique et biologie des systèmes
Les données de haute dimension nécessitent :
* matrices ;
* distances ;
* PCA ;
* clustering ;
* graphes ;
* modèles probabilistes ;
* correction des tests multiples ;
* apprentissage statistique.
---
15. Applications concrètes
Application fondamentale
Comprendre pourquoi une population cellulaire ne croît pas indéfiniment : passage d’un modèle exponentiel à un modèle logistique.
Application expérimentale
Estimer (K_m) et (V_{\max}) à partir de vitesses initiales mesurées à différentes concentrations de substrat.
Application clinique
Convertir sensibilité, spécificité et prévalence en probabilité post-test par le théorème de Bayes.
Application technologique
Utiliser PCA, clustering et graphes pour explorer des données de transcriptomique unicellulaire.
---
16. Limites, incertitudes et pièges
16.1 Limites générales
Un modèle peut être mathématiquement correct mais biologiquement faux si ses hypothèses sont invalides.
Exemples :
| Modèle | Hypothèse fragile |
|---|---|
| croissance exponentielle | ressources infinies |
| Michaelis-Menten | enzyme non allostérique, vitesse initiale |
| SIR | contacts homogènes |
| PCA | \(variance = signal biologique\) |
| test statistique | indépendance des observations |
| graphe biologique | interactions connues et complètes |
---
16.2 Incertitudes
Les paramètres biologiques varient avec :
* température ;
* pH ;
* tissu ;
* type cellulaire ;
* espèce ;
* méthode de mesure ;
* bruit expérimental ;
* état physiologique ou pathologique.
Une valeur de (K_m), de (r), de (D) ou de (\beta) doit toujours être rattachée à ses conditions expérimentales.
---
17. Synthèse pédagogique
10 idées essentielles
1. Les mathématiques servent à relier données, mécanismes et prédictions.
2. Toute équation biologique doit être accompagnée d’unités.
3. Une dérivée représente une vitesse instantanée.
4. Une intégrale représente une quantité cumulée.
5. Une probabilité conditionnelle n’est pas symétrique.
6. La prévalence influence fortement les valeurs prédictives d’un test.
7. Les matrices permettent de représenter états, transitions et données omiques.
8. Les équations différentielles décrivent les dynamiques biologiques.
9. Les graphes modélisent interactions et réseaux.
10. Un modèle doit toujours être interprété à travers ses hypothèses.
---
3 erreurs fréquentes
1. Confondre corrélation et causalité.
Une corrélation statistique ne prouve pas un mécanisme causal.
$$2. **Confondre (P(A\mid B)) et (P(B\mid A)).**$$
Exemple : sensibilité et probabilité d’être malade si le test est positif.
3. Utiliser un modèle hors de son domaine de validité.
Exemple : appliquer Michaelis-Menten à une enzyme fortement allostérique sans justification.
---
3 questions d’auto-évaluation
Question 1
Une population double toutes les 3 h. Quel est son taux de croissance exponentielle (r) ?
Réponse :
$$T_d=\frac{\ln2}{r}$$
$$r=\frac{\ln2}{T_d}=\frac{0{,}693}{3}=0{,}231 \ h^{-1}$$
---
Question 2
Un test a une sensibilité de 90 % et une spécificité de 95 %. Quel est son (LR^+) ?
$$LR^+=\frac{0{,}90}{1-0{,}95}$$
$$LR^+=\frac{0{,}90}{0{,}05}=18$$
---
Question 3
Dans Michaelis-Menten, que vaut (v) lorsque ([S]=K_m) ?
$$v=\frac{V_{\max}[S]}{K_m+[S]}$$
Si :
$$[S]=K_m$$
alors :
$$v=\frac{V_{\max}K_m}{K_m+K_m}=\frac{V_{\max}}{2}$$
---
Bibliographie commentée
1. *National Research Council. 2003. BIO2010: Transforming Undergraduate Education for Future Research Biologists. National Academies Press. Rapport institutionnel, langue originale : anglais. DOI : 10.17226/10497. Indice de reprise communautaire : 95/100*. ([Académies des sciences][8])
2. *Forger DB. 2017. Biological Clocks, Rhythms, and Oscillations: The Theory of Biological Timekeeping. MIT Press / NCBI Bookshelf. Manuel universitaire, langue originale : anglais. ISBN-13 : 9780262036771. Indice : 85/100*. ([CNIB][2])
3. *OpenStax. 2016. Calculus Volume 2, section “The Logistic Equation”. Manuel libre, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 85/100*. ([OpenStax][3])
4. *Brooks HB et al. 2012. “Basics of Enzymatic Assays for HTS”. Assay Guidance Manual, NCBI Bookshelf. Chapitre méthodologique, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 85/100*. ([CNIB][6])
5. Shreffler J, Huecker MR. 2023. “Diagnostic Testing Accuracy: Sensitivity, Specificity, Predictive Values and Likelihood Ratios”. StatPearls / NCBI Bookshelf. Synthèse clinique, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 80/100. ([CNIB][4])
6. *Ma S, Dai Y. 2011. “Principal component analysis based methods in bioinformatics studies”. Briefings in Bioinformatics, 12(6):714-722. Revue, langue originale : anglais. DOI : 10.1093/bib/bbq090. Indice : 85/100*. ([OUP Academic][9])
7. *Pavlopoulos GA et al. 2011. “Using graph theory to analyze biological networks”. BioData Mining, 4:10. Revue méthodologique, langue originale : anglais. DOI : 10.1186/1756-0381-4-10. Indice : 85/100*. ([PubMed][7])
8. *Koutrouli M et al. 2020. “A Guide to Conquer the Biological Network Era Using Graph Theory”. Frontiers in Bioengineering and Biotechnology, 8:34. Revue méthodologique, langue originale : anglais. DOI : 10.3389/fbioe.2020.00034. Indice : 82/100*. ([PubMed][10])
[1]: https://www.ncbi.nlm.nih.gov/books/NBK43508/ "A New Biology Curriculum - Bio2010 - NCBI Bookshelf"
[2]: https://www.ncbi.nlm.nih.gov/books/NBK544602/ "Biophysical Mechanistic Modeling: Choosing the Right Model Equations - Biological Clocks, Rhythms, and Oscillations - NCBI Bookshelf"
[3]: https://openstax.org/books/calculus-volume-2/pages/4-4-the-logistic-equation "4.4 The Logistic Equation - Calculus Volume 2 | OpenStax"
[4]: https://www.ncbi.nlm.nih.gov/books/NBK557491/ "Diagnostic Testing Accuracy: Sensitivity, Specificity, Predictive Values and Likelihood Ratios - StatPearls - NCBI Bookshelf"
[5]: https://pubmed.ncbi.nlm.nih.gov/21242203 "component analysis based methods in bioinformatics studies"
[6]: https://www.ncbi.nlm.nih.gov/books/NBK92007/ "Basics of Enzymatic Assays for HTS - Assay Guidance Manual - NCBI Bookshelf"
[7]: https://pubmed.ncbi.nlm.nih.gov/21527005 "Using graph theory to analyze biological networks"
[8]: https://nap.nationalacademies.org/catalog/10497/bio2010-transforming-undergraduate-education-for-future-research-biologists?utm_source=chatgpt.com "BIO2010: Transforming Undergraduate Education for Future ..."
[9]: https://academic.oup.com/bib/article/12/6/714/221174?utm_source=chatgpt.com "component analysis based methods in bioinformatics studies"
[10]: https://pubmed.ncbi.nlm.nih.gov/32083072 "A Guide to Conquer the Biological Network Era Using ..."