Outils mathématiques employés dans les sciences du vivant

Par MisterJeanP · 2026-05-01 18:18:59 · public

Niveau visé : L3 \(\rightarrow\) M2, enseignants, préparation aux modèles biologiques, biomédicaux et biochimiques.
Problématique : Les sciences du vivant utilisent les mathématiques pour quantifier, comparer, prédire, inférer et relier des mécanismes biologiques à des données expérimentales. Un rapport de référence de la National Academies, BIO2010, recommande explicitement que les biologistes maîtrisent fonctions, dérivées, intégrales, probabilités, statistiques, modèles discrets, algèbre linéaire, équations différentielles, modélisation, programmation et information. ([CNIB][1])

1. Idée centrale : un modèle mathématique n’est pas la réalité

Un modèle biologique est une représentation simplifiée d’un système vivant.

Exemples :

Système réelModèle mathématique possible
Croissance bactériennefonction exponentielle ou logistique
Enzyme + substratéquation de Michaelis-Menten
Propagation infectieusemodèle SIR
Expression géniquevecteurs, matrices, ACP/PCA
Réseau métaboliquegraphe orienté
Diffusion d’une moléculeéquation de diffusion
Test diagnostiqueprobabilités conditionnelles, Bayes

Un bon modèle doit préciser :

1. les variables ;
2. les unités ;
3. les hypothèses ;
4. le domaine de validité ;
5. les paramètres mesurables ;
6. les prédictions vérifiables.

Les modèles mécanistiques biophysiques reposent souvent sur des lois comme l’action de masse, la conservation de la matière, la loi d’Ohm pour les modèles électrophysiologiques ou des équations de transport ; les textes de modélisation insistent aussi sur les hypothèses cachées et les risques de mélanger modèles mécanistiques et modèles “boîte noire”. ([CNIB][2])

---

2. Fonctions, dimensions et ordres de grandeur

2.1 Fonctions biologiques

Une fonction relie une variable d’entrée à une sortie :

$$y=f(x)$$

Exemples :

$$N(t)=N_0 e^{rt}$$

où :

SymboleSignificationUnité
(N(t))population au temps (t)cellules, individus
\(N_0\)population initialecellules, individus
(r)taux de croissance spécifique\(temps^{-1}\)
(t)tempss, min, h, jour

La cohérence dimensionnelle impose que l’exposant (rt) soit sans unité. Donc si (t) est en heures, (r) doit être en h(^{-1}).

---

2.2 Exemple étape par étape : croissance bactérienne exponentielle

Une culture passe de :

$$N_0=10^{3}$$

à :

$$N(6h)=8\times10^{3}$$

On suppose une croissance exponentielle :

$$N(t)=N_0 e^{rt}$$

Étape 1 : écrire le rapport

$$\frac{N(t)}{N_0}=e^{rt}$$

$$\frac{8\times10^{3}}{10^{3}}=8=e^{6r}$$

Étape 2 : appliquer le logarithme

$$\ln^{8}=6r$$

$$r=\frac{\ln^{8}}{6}$$

Or :

$$\ln^{8}=\ln(2^{3})=3\ln^{2}\approx 2{,}079$$

Donc :

$$r=\frac{2{,}079}{6}=0{,}347 \ \mathrm{h}^{-1}$$

Étape 3 : calculer le temps de doublement

$$Le temps de doublement (T_d) vérifie :$$

$$2N_0=N_0 e^{rT_d}$$

$$2=e^{rT_d}$$

$$T_d=\frac{\ln 2}{r}$$

$$T_d=\frac{0{,}693}{0{,}347}=2{,}0 \ \mathrm{h}$$

Interprétation biologique : dans ces conditions, la population double toutes les deux heures.

Limite : ce modèle suppose nutriments illimités, absence de déchets toxiques, température constante, pas de mortalité différentielle. Il est valable surtout en phase exponentielle.

---

3. Calcul différentiel : taux, vitesses et sensibilités

Le calcul différentiel sert à décrire les variations instantanées.

$$\frac{dN}{dt}$$

signifie : variation de (N) par unité de temps.

En biologie, on rencontre :

DomaineDérivée
Croissance cellulaire\(\frac{dN}{dt}\)
Cinétique enzymatique\(\frac{d[P]}{dt}\)
Pharmacocinétique\(\frac{dC}{dt}\)
Physiologie\(\frac{dP_{art}}{dt}, \frac{dV}{dt}\)
Écologie\(\frac{dN_i}{dt} pour l’espèce (i)\)

---

3.1 Croissance logistique

La croissance exponentielle prédit une croissance infinie. En biologie réelle, les ressources deviennent limitantes. On introduit alors une capacité limite (K), appelée capacité de charge.

$$\frac{dN}{dt}=rN\left(1-\frac{N}{K}\right)$$

SymboleSignificationUnité
(N)populationindividus ou cellules
(r)taux maximal de croissance\(temps^{-1}\)
(K)capacité de chargeindividus ou cellules
\(\frac{dN}{dt}\)vitesse de croissance\(individus\cdot temps^{-1}\)

OpenStax présente cette équation comme une amélioration du modèle exponentiel pour tenir compte de la capacité de charge environnementale. ([OpenStax][3])

---

3.2 Exemple étape par étape : culture limitée par les ressources

Données :

$$N_0=10^{6} \ \mathrm{cellules}$$

$$K=10^{9} \ \mathrm{cellules}$$

$$r=0{,}8 \ \mathrm{jour}^{-1}$$

Solution de l’équation logistique :

$$N(t)=\frac{K}{1+\left(\frac{K-N_0}{N_0}\right)e^{-rt}}$$

Étape 1 : calcul du facteur initial

$$\frac{K-N_0}{N_0}=\frac{10^{9}-10^{6}}{10^{6}}=999$$

Donc :

$$N(t)=\frac{10^{9}}{1+999e^{-0{,}8t}}$$

Étape 2 : population après 5 jours

$$N^{5}=\frac{10^{9}}{1+999e^{-4}}$$

$$e^{-4}\approx0{,}0183$$

$$999e^{-4}\approx18{,}3$$

$$N^{5}\approx\frac{10^{9}}{19{,}3}=\approx5{,}18\times10^{7}$$

Étape 3 : interprétation

Après 5 jours :

$$N^{5}\approx5{,}2\times10^{7} \ \mathrm{cellules}$$

La croissance est encore forte, car (N\ll K), mais elle ralentira quand (N) s’approchera de (10^{9}).

Point important :

$$\frac{dN}{dt}$$

est maximal lorsque :

$$N=\frac{K}{2}$$

La croissance est donc maximale à mi-capacité.

---

4. Intégrales : quantités cumulées

Une intégrale additionne une quantité variable.

$$\int_a^b f(t),dt$$

En sciences du vivant, les intégrales servent à calculer :

SituationIntégrale
exposition à un médicament\(aire sous la courbe (AUC=\int C(t)dt)\)
production totale de métabolite\((\int v(t)dt)\)
dose absorbée\((\int R(t)dt)\)
expression cumulée d’un gène\((\int E(t)dt)\)

---

Exemple : exposition pharmacocinétique

Si la concentration plasmatique suit :

$$C(t)=C_0 e^{-kt}$$

alors l’exposition totale de (0) à (\infty) vaut :

$$AUC=\int_0^\infty C_0 e^{-kt}dt$$

$$AUC=\frac{C_0}{k}$$

Unités :

$$C_0 : \mathrm{mg\cdot L}^{-1}$$

$$k : \mathrm{h}^{-1}$$

Donc :

$$AUC : \mathrm{mg\cdot h\cdot L}^{-1}$$

La cohérence dimensionnelle est correcte.

---

5. Probabilités : incertitude biologique

Les systèmes vivants sont variables. Deux cellules génétiquement identiques peuvent exprimer des niveaux différents d’un gène. Deux patients exposés au même facteur peuvent avoir des réponses différentes.

Une probabilité est un nombre entre 0 et 1 :

$$0\leq P(A)\leq1$$

---

5.1 Probabilité conditionnelle

$$P(A\mid B)=\frac{P(A\cap B)}{P(B)}$$

Elle signifie : probabilité de (A) sachant que (B) est réalisé.

En médecine :

$$P(\mathrm{maladie}\mid \mathrm{test positif})$$

n’est pas la même chose que :

$$P(\mathrm{test positif}\mid \mathrm{maladie})$$

Cette confusion est très fréquente.

---

5.2 Sensibilité, spécificité et valeurs prédictives

Pour un test diagnostique :

$$\mathrm{Sensibilité}=\frac{VP}{VP+FN}$$

$$\mathrm{Spécificité}=\frac{VN}{VN+FP}$$

$$VPP=\frac{VP}{VP+FP}$$

$$VPN=\frac{VN}{VN+FN}$$

où :

SymboleSignification
VPvrai positif
VNvrai négatif
FPfaux positif
FNfaux négatif

Les rapports de vraisemblance sont :

$$LR^+=\frac{\mathrm{sensibilité}}{1-\mathrm{spécificité}}$$

$$LR^-=\frac{1-\mathrm{sensibilité}}{\mathrm{spécificité}}$$

Ces formules sont celles utilisées classiquement dans l’évaluation de la performance diagnostique. ([CNIB][4])

---

5.3 Exemple étape par étape : test diagnostique

Données :

$$\mathrm{prévalence}=2\%=0{,}02$$

$$\mathrm{sensibilité}=95\%=0{,}95$$

$$\mathrm{spécificité}=98\%=0{,}98$$

Question : quelle est la probabilité d’être malade si le test est positif ?

On cherche :

$$P(M\mid T+)$$

Formule de Bayes :

$$P(M\mid T+)=\frac{P(T+\mid M)P(M)}{P(T+\mid M)P(M)+P(T+\mid \neg M)P(\neg M)}$$

Étape 1 : identifier les termes

$$P(T+\mid M)=0{,}95$$

$$P(M)=0{,}02$$

$$P(\neg M)=0{,}98$$

$$P(T+\mid \neg M)=1-\mathrm{spécificité}=0{,}02$$

Étape 2 : calcul

$$P(M\mid T+)=\frac{0{,}95\times0{,}02}{0{,}95\times0{,}02+0{,}02\times0{,}98}$$

$$P(M\mid T+)=\frac{0{,}019}{0{,}019+0{,}0196}$$

$$P(M\mid T+)=\frac{0{,}019}{0{,}0386}\approx 0{,}492$$

Donc :

$$P(M\mid T+)\approx49{,}2\%$$

Interprétation : malgré un test apparemment très performant, la valeur prédictive positive est seulement d’environ 49 % lorsque la prévalence est faible.

Conclusion pédagogique : un bon test ne suffit pas ; la prévalence influence fortement l’interprétation clinique.

---

6. Statistiques : apprendre à partir de données

Les probabilités vont du modèle vers les données.
Les statistiques vont des données vers le modèle.

Exemple :

* Probabilité : “si la vraie moyenne est (\mu), quelle distribution des mesures attend-on ?”
* Statistique : “à partir des mesures observées, que peut-on dire de (\mu) ?”

---

6.1 Moyenne, variance, écart-type

Pour des mesures :

$$x_1,x_2,\dots,x_n$$

la moyenne est :

$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$

La variance empirique est :

$$s^{2}=\frac{1}{n^{-1}}\sum_{i=1}^{n}(x_i-\bar{x})^{2}$$

L’écart-type :

$$s=\sqrt{s^{2}}$$

---

6.2 Erreur standard

L’erreur standard de la moyenne vaut :

$$SEM=\frac{s}{\sqrt{n}}$$

Elle diminue comme (\sqrt{n}), pas comme (n).

Conséquence : multiplier l’effectif par 4 divise l’erreur standard par 2.

---

6.3 Intervalle de confiance approximatif

Pour une moyenne normalement distribuée :

$$\mathrm{IC}_{95}\approx \bar{x}\pm1{,}96\frac{s}{\sqrt{n}}$$

Attention : un intervalle de confiance ne signifie pas que la probabilité que le vrai paramètre soit dans cet intervalle est 95 % dans l’interprétation fréquentiste stricte. Il signifie que la procédure produirait des intervalles contenant le vrai paramètre dans 95 % des répétitions idéalisées.

---

6.4 p-valeur

Une p-valeur est :

$$p=P(\mathrm{données aussi extrêmes ou plus extrêmes}\mid H_0)$$

Elle n’est pas :

$$P(H_0\mid \mathrm{données})$$

Erreur fréquente : croire que (p=0{,}03) signifie “il y a 3 % de chances que l’hypothèse nulle soit vraie”. Ce n’est pas ce que calcule une p-valeur.

---

7. Algèbre linéaire : vecteurs, matrices et données omiques

L’algèbre linéaire est centrale pour :

* transcriptomique ;
* protéomique ;
* métabolomique ;
* imagerie ;
* génétique des populations ;
* modèles de transition ;
* apprentissage automatique.

Un individu, une cellule ou un échantillon peut être représenté par un vecteur :

$$\mathbf{x}= \begin{pmatrix} x_1\\ x_2\\ x_3 \end{pmatrix}$$

Exemple :

$$\mathbf{x}= \begin{pmatrix} \mathrm{expression gène A}\\ \mathrm{expression gène B}\\ \mathrm{expression gène C} \end{pmatrix}$$

Une matrice de données omiques contient souvent :

$$X_{ij}$$

où (i) désigne l’échantillon et (j) le gène.

---

7.1 Matrice de transition

Exemple simple : cellules pouvant être dans deux états :

* état 1 : prolifératif ;
* état 2 : différencié.

On écrit :

$$\mathbf{x}_{t+1}=A\mathbf{x}_t$$

avec :

$$A= \begin{pmatrix} 0{,}9 & 0{,}2\\ 0{,}1 & 0{,}8 \end{pmatrix}$$

Si :

$$\mathbf{x}_0= \begin{pmatrix} 0{,}7\\ 0{,}3 \end{pmatrix}$$

alors :

$$\mathbf{x}_1= \begin{pmatrix} 0{,}9 & 0{,}2\\ 0{,}1 & 0{,}8 \end{pmatrix} \begin{pmatrix} 0{,}7\\ 0{,}3 \end{pmatrix}$$

Calcul

Première composante :

$$0{,}9\times0{,}7+0{,}2\times0{,}3=0{,}63+0{,}06=0{,}69$$

Deuxième composante :

$$0{,}1\times0{,}7+0{,}8\times0{,}3=0{,}07+0{,}24=0{,}31$$

Donc :

$$\mathbf{x}_1= \begin{pmatrix} 0{,}69\\ 0{,}31 \end{pmatrix}$$

Interprétation : après une étape, 69 % des cellules sont prolifératives et 31 % différenciées.

---

7.2 Valeurs propres et stabilité

Une valeur propre (\lambda) d’une matrice (A) vérifie :

$$A\mathbf{v}=\lambda\mathbf{v}$$

En biologie :

Valeur propreInterprétation
\(\lambda <1\)décroissance ou amortissement
\(\lambda =1\)équilibre neutre
\(\lambda >1\)croissance ou amplification

Exemple : dans une matrice de Leslie, la plus grande valeur propre donne le taux asymptotique de croissance d’une population structurée par âge.

---

7.3 ACP/PCA : réduire la dimension

L’analyse en composantes principales transforme des variables corrélées en nouvelles variables orthogonales appelées composantes principales. En bioinformatique, la PCA est un outil classique de réduction de dimension, notamment pour les données d’expression génique de haute dimension. ([PubMed][5])

Idée

On part d’une matrice :

$$X= \begin{pmatrix} \mathrm{échantillons} \times \mathrm{gènes} \end{pmatrix}$$

La PCA cherche des axes qui maximisent la variance :

$$PC_1 = a_1x_1+a_2x_2+\dots+a_px_p$$

$$où les coefficients (a_i) forment un vecteur propre de la matrice de covariance.$$

Interprétation biologique

Si deux groupes de cellules se séparent sur (PC_1), cela peut correspondre à :

* un type cellulaire différent ;
* un état d’activation ;
* un effet batch ;
* une différence de cycle cellulaire ;
* une différence pathologique.

Limite majeure : la PCA maximise la variance, pas nécessairement la pertinence biologique.

---

8. Équations différentielles : dynamique des systèmes vivants

Une équation différentielle relie une grandeur à sa vitesse de variation.

$$\frac{dx}{dt}=f(x,t)$$

Elle permet de modéliser :

DomaineExemple
écologiecroissance de population
immunologieexpansion clonale
épidémiologiemodèles SIR
biochimiecinétique enzymatique
physiologierégulation glycémique
pharmacologieélimination d’un médicament

---

8.1 Modèle SIR

On divise une population en trois compartiments :

$$S(t): \mathrm{susceptibles}$$

$$I(t): \mathrm{infectés}$$

$$R(t): \mathrm{retirés ou guéris}$$

Le modèle classique :

$$\frac{dS}{dt}=-\beta$$

SI

$$\frac{dI}{dt}=\beta$$

$$SI-\gamma I$$

$$\frac{dR}{dt}=\gamma$$

I
]

ParamètreSignificationUnité
\(\beta\)taux de transmission\(individu^{-1}\cdot temps^{-1}\)
\(\gamma\)taux de guérison/retrait\(temps^{-1}\)
\(1/\gamma\)durée infectieuse moyennetemps

Dans une formulation normalisée, on utilise souvent :

$$R_0=\frac{\beta}{\gamma}$$

si (S) est exprimé comme fraction initiale proche de 1.

Exemple

$$\beta=0{,}30 \ \mathrm{jour}^{-1}$$

$$\gamma=0{,}20 \ \mathrm{jour}^{-1}$$

Donc :

$$R_0=\frac{0{,}30}{0{,}20}=1{,}5$$

Interprétation : au début de l’épidémie, un infecté génère en moyenne 1,5 nouveau cas dans une population entièrement susceptible, selon les hypothèses du modèle.

Limites : homogénéité des contacts, population fermée, absence de structure d’âge, absence de spatialisation, paramètres constants.

---

9. Cinétique enzymatique : Michaelis-Menten

La biochimie utilise intensivement les fonctions rationnelles, les équations différentielles et les ajustements non linéaires.

Le schéma minimal est :

$$E+S \rightleftharpoons ES \rightarrow E+P$$

L’équation de Michaelis-Menten est :

$$v=\frac{V_{\max}[S]}{K_m+[S]}$$

où :

SymboleSignificationUnité
(v)vitesse initiale\(\mathrm{\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\cdot s^{-1}} ou \mathrm{\mathrm{\mathrm{\mu mol\cdot min^{-1}}}}\)
\(V_{\max}\)vitesse maximalemême unité que (v)
([S])concentration en substrat\(\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\)
\(K_m\)\(concentration donnant v=V_{\max}/2\)\(\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\)

Le Assay Guidance Manual de NCBI présente (K_m) et (V_{\max}) comme paramètres intrinsèques majeurs de la cinétique enzymatique, utiles notamment dans le développement de tests enzymatiques et la recherche d’inhibiteurs. ([CNIB][6])

---

9.1 Exemple étape par étape

Données :

$$V_{\max}=100 \ \mathrm{\mu mol\cdot min^{-1}}$$

$$K_m=2 \ \mathrm{mmol\cdot L^{-1}}$$

Calculer (v) pour :

$$[S]=0{,}5,\ 2,\ 10 \ \mathrm{mmol\cdot L^{-1}}$$

Cas 1 : ([S]=0{,}5)

$$v=\frac{100\times0{,}5}{2+0{,}5}$$

$$v=\frac{50}{2{,}5}=20 \ \mathrm{\mu mol\cdot min^{-1}}$$

Cas 2 : ([S]=2)

$$v=\frac{100\times2}{2+2}$$

$$v=\frac{200}{4}=50 \ \mathrm{\mu mol\cdot min^{-1}}$$

Ici :

$$[S]=K_m$$

donc :

$$v=\frac{V_{\max}}{2}$$

Cas 3 : ([S]=10)

$$v=\frac{100\times10}{2+10}$$

$$v=\frac{1000}{12}=83{,}3 \ \mathrm{\mu mol\cdot min^{-1}}$$

Interprétation biologique

$$Quand ([S]\ll K_m), la vitesse dépend presque linéairement du substrat :$$

$$v\approx \frac{V_{\max}}{K_m}[S]$$

$$Quand ([S]\gg K_m), l’enzyme est saturée :$$

$$v\approx V_{\max}$$

Limites : Michaelis-Menten suppose une vitesse initiale, un substrat unique ou une simplification, une enzyme stable, pas d’inhibition par le produit, pas d’allostérie forte, et des conditions expérimentales contrôlées.

---

10. Optimisation et estimation de paramètres

Les modèles biologiques contiennent des paramètres inconnus :

$$r,\ K,\ V_{\max},\ K_m,\ \beta,\ \gamma$$

On les estime à partir de données.

---

10.1 Moindres carrés

On choisit les paramètres qui minimisent :

$$S(\theta)=\sum_{i=1}^{n}(y_i-\hat{y}_i(\theta))^{2}$$

où :

SymboleSignification
\(y_i\)donnée observée
\(\hat{y}_i\)prédiction du modèle
\(\theta\)paramètres à estimer

Exemple : ajuster une courbe logistique sur une croissance cellulaire.

---

10.2 Maximum de vraisemblance

Si les données suivent une loi de probabilité (P(y_i|\theta)), la vraisemblance est :

$$L(\theta)=\prod_{i=1}^{n}P(y_i\mid \theta)$$

On maximise souvent le logarithme :

$$\ell(\theta)=\sum_{i=1}^{n}\ln$$

$$P(y_i\mid \theta)$$

]

Avantage : cette approche permet d’adapter le modèle d’erreur :

DonnéesLoi plausible
comptages cellulairesPoisson ou binomiale négative
proportionsbinomiale
concentrations continuesnormale ou log-normale
temps avant événementexponentielle, Weibull, Cox

---

11. Graphes et réseaux biologiques

Un graphe est défini par :

$$G=(V,E)$$

où :

SymboleSignification
(V)ensemble des nœuds
(E)ensemble des arêtes

En biologie :

RéseauNœudsArêtes
protéinesprotéinesinteractions physiques
métabolismemétabolitesréactions
régulation géniquegènes/facteursactivation/inhibition
connectomeneurones/régionsconnexions
épidémiologieindividuscontacts

La théorie des graphes est largement utilisée pour analyser les réseaux biologiques, extraire des propriétés cachées et relier structure du réseau et fonction biologique. ([PubMed][7])

---

11.1 Mesures classiques

Degré

Nombre de connexions d’un nœud :

$$k_i$$

Un nœud de degré élevé peut représenter une protéine hub.

Centralité d’intermédiarité

Mesure combien de plus courts chemins passent par un nœud.

$$C_B(v)=\sum_{s\neq v\neq t}\frac{\sigma_{st}(v)}{\sigma_{st}}$$

où :

SymboleSignification
\(\sigma_{st}\)nombre de plus courts chemins entre (s) et (t)
\((\sigma_{st}(v))\)nombre de ces chemins passant par (v)

Clustering

Mesure la tendance des voisins d’un nœud à être connectés entre eux.

Biologiquement, un fort clustering peut correspondre à un module fonctionnel.

---

12. Information, entropie et séquences biologiques

L’information intervient en génomique, transcriptomique, phylogénie, neurosciences et apprentissage automatique.

12.1 Entropie de Shannon

$$H(X)=-\sum_i p_i\log_2(p_i)$$

Unité : bit.

Exemple : pour une position d’ADN où les quatre bases sont équiprobables :

$$p_A=p_T=p_G=p_C=\frac14$$

$$H=-4\times\frac14\log_2\left(\frac14\right)$$

$$H=2 \ \mathrm{bits}$$

Si une position est toujours A :

$$p_A=1$$

$$H=0$$

Interprétation biologique :

* entropie élevée : position variable ;
* entropie faible : position conservée ;
* conservation forte : contrainte fonctionnelle possible.

---

13. Processus stochastiques et diffusion

Les phénomènes cellulaires sont souvent bruités :

* expression génique en bursts ;
* diffusion moléculaire ;
* ouverture/fermeture de canaux ioniques ;
* mutations ;
* dérive génétique.

---

13.1 Marche aléatoire et diffusion

Pour une diffusion en une dimension :

$$\langle x^{2}\rangle=2Dt$$

où :

SymboleSignificationUnité
\(\langle x^{2}\rangle\)déplacement quadratique moyen\(m^{2}\)
(D)coefficient de diffusion\(\mathrm{\mathrm{\mathrm{m^2\cdot s^{-1}}}}\)
(t)tempss

Donc :

$$t\approx\frac{L^{2}}{2D}$$

Exemple

Molécule avec :

$$D=10 \ \mathrm{\mu m^2\cdot s^{-1}}$$

Distance :

$$L=10 \ \mu m$$

Alors :

$$t\approx\frac{10^{2}}{2\times10}$$

$$t=\frac{100}{20}=5 \ s$$

Interprétation : une petite molécule peut explorer une cellule de 10 \mum en quelques secondes par diffusion, mais une distance 10 fois plus grande prend 100 fois plus de temps car (t\propto L^{2}).

---

14. Couplages entre mathématiques et disciplines biologiques

Biochimie

Les équations différentielles décrivent les vitesses de réaction.
La thermodynamique indique si une réaction est favorable :

$$\Delta G=\Delta$$

$$G^{\circ'}+RT\ln Q$$

]

La cinétique indique si elle est rapide.

Erreur fréquente : confondre réaction thermodynamiquement favorable et réaction rapide.

---

Physiologie

Les systèmes physiologiques utilisent des rétrocontrôles :

$$\mathrm{stimulus} \rightarrow \mathrm{capteur} \rightarrow \mathrm{intégrateur} \rightarrow \mathrm{effecteur}$$

Exemples :

* glycémie ;
* pression artérielle ;
* température corporelle ;
* ventilation ;
* osmolarité.

Les modèles utilisent souvent des équations différentielles couplées et des boucles de rétroaction négative.

---

Écologie

Les modèles de population utilisent :

* croissance exponentielle ;
* croissance logistique ;
* compétition ;
* prédation ;
* matrices de transition ;
* stochasticité environnementale.

---

Médecine

Les outils mathématiques servent à :

* interpréter un test ;
* estimer un risque ;
* ajuster un traitement ;
* modéliser une épidémie ;
* analyser un essai clinique ;
* stratifier des patients.

---

Omique et biologie des systèmes

Les données de haute dimension nécessitent :

* matrices ;
* distances ;
* PCA ;
* clustering ;
* graphes ;
* modèles probabilistes ;
* correction des tests multiples ;
* apprentissage statistique.

---

15. Applications concrètes

Application fondamentale

Comprendre pourquoi une population cellulaire ne croît pas indéfiniment : passage d’un modèle exponentiel à un modèle logistique.

Application expérimentale

Estimer (K_m) et (V_{\max}) à partir de vitesses initiales mesurées à différentes concentrations de substrat.

Application clinique

Convertir sensibilité, spécificité et prévalence en probabilité post-test par le théorème de Bayes.

Application technologique

Utiliser PCA, clustering et graphes pour explorer des données de transcriptomique unicellulaire.

---

16. Limites, incertitudes et pièges

16.1 Limites générales

Un modèle peut être mathématiquement correct mais biologiquement faux si ses hypothèses sont invalides.

Exemples :

ModèleHypothèse fragile
croissance exponentielleressources infinies
Michaelis-Mentenenzyme non allostérique, vitesse initiale
SIRcontacts homogènes
PCA\(variance = signal biologique\)
test statistiqueindépendance des observations
graphe biologiqueinteractions connues et complètes

---

16.2 Incertitudes

Les paramètres biologiques varient avec :

* température ;
* pH ;
* tissu ;
* type cellulaire ;
* espèce ;
* méthode de mesure ;
* bruit expérimental ;
* état physiologique ou pathologique.

Une valeur de (K_m), de (r), de (D) ou de (\beta) doit toujours être rattachée à ses conditions expérimentales.

---

17. Synthèse pédagogique

10 idées essentielles

1. Les mathématiques servent à relier données, mécanismes et prédictions.
2. Toute équation biologique doit être accompagnée d’unités.
3. Une dérivée représente une vitesse instantanée.
4. Une intégrale représente une quantité cumulée.
5. Une probabilité conditionnelle n’est pas symétrique.
6. La prévalence influence fortement les valeurs prédictives d’un test.
7. Les matrices permettent de représenter états, transitions et données omiques.
8. Les équations différentielles décrivent les dynamiques biologiques.
9. Les graphes modélisent interactions et réseaux.
10. Un modèle doit toujours être interprété à travers ses hypothèses.

---

3 erreurs fréquentes

1. Confondre corrélation et causalité.
Une corrélation statistique ne prouve pas un mécanisme causal.

$$2. **Confondre (P(A\mid B)) et (P(B\mid A)).**$$

Exemple : sensibilité et probabilité d’être malade si le test est positif.

3. Utiliser un modèle hors de son domaine de validité.
Exemple : appliquer Michaelis-Menten à une enzyme fortement allostérique sans justification.

---

3 questions d’auto-évaluation

Question 1

Une population double toutes les 3 h. Quel est son taux de croissance exponentielle (r) ?

Réponse :

$$T_d=\frac{\ln2}{r}$$

$$r=\frac{\ln2}{T_d}=\frac{0{,}693}{3}=0{,}231 \ h^{-1}$$

---

Question 2

Un test a une sensibilité de 90 % et une spécificité de 95 %. Quel est son (LR^+) ?

$$LR^+=\frac{0{,}90}{1-0{,}95}$$

$$LR^+=\frac{0{,}90}{0{,}05}=18$$

---

Question 3

Dans Michaelis-Menten, que vaut (v) lorsque ([S]=K_m) ?

$$v=\frac{V_{\max}[S]}{K_m+[S]}$$

Si :

$$[S]=K_m$$

alors :

$$v=\frac{V_{\max}K_m}{K_m+K_m}=\frac{V_{\max}}{2}$$

---

Bibliographie commentée

1. *National Research Council. 2003. BIO2010: Transforming Undergraduate Education for Future Research Biologists. National Academies Press. Rapport institutionnel, langue originale : anglais. DOI : 10.17226/10497. Indice de reprise communautaire : 95/100*. ([Académies des sciences][8])

2. *Forger DB. 2017. Biological Clocks, Rhythms, and Oscillations: The Theory of Biological Timekeeping. MIT Press / NCBI Bookshelf. Manuel universitaire, langue originale : anglais. ISBN-13 : 9780262036771. Indice : 85/100*. ([CNIB][2])

3. *OpenStax. 2016. Calculus Volume 2, section “The Logistic Equation”. Manuel libre, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 85/100*. ([OpenStax][3])

4. *Brooks HB et al. 2012. “Basics of Enzymatic Assays for HTS”. Assay Guidance Manual, NCBI Bookshelf. Chapitre méthodologique, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 85/100*. ([CNIB][6])

5. Shreffler J, Huecker MR. 2023. “Diagnostic Testing Accuracy: Sensitivity, Specificity, Predictive Values and Likelihood Ratios”. StatPearls / NCBI Bookshelf. Synthèse clinique, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 80/100. ([CNIB][4])

6. *Ma S, Dai Y. 2011. “Principal component analysis based methods in bioinformatics studies”. Briefings in Bioinformatics, 12(6):714-722. Revue, langue originale : anglais. DOI : 10.1093/bib/bbq090. Indice : 85/100*. ([OUP Academic][9])

7. *Pavlopoulos GA et al. 2011. “Using graph theory to analyze biological networks”. BioData Mining, 4:10. Revue méthodologique, langue originale : anglais. DOI : 10.1186/1756-0381-4-10. Indice : 85/100*. ([PubMed][7])

8. *Koutrouli M et al. 2020. “A Guide to Conquer the Biological Network Era Using Graph Theory”. Frontiers in Bioengineering and Biotechnology, 8:34. Revue méthodologique, langue originale : anglais. DOI : 10.3389/fbioe.2020.00034. Indice : 82/100*. ([PubMed][10])

[1]: https://www.ncbi.nlm.nih.gov/books/NBK43508/ "A New Biology Curriculum - Bio2010 - NCBI Bookshelf"
[2]: https://www.ncbi.nlm.nih.gov/books/NBK544602/ "Biophysical Mechanistic Modeling: Choosing the Right Model Equations - Biological Clocks, Rhythms, and Oscillations - NCBI Bookshelf"
[3]: https://openstax.org/books/calculus-volume-2/pages/4-4-the-logistic-equation "4.4 The Logistic Equation - Calculus Volume 2 | OpenStax"
[4]: https://www.ncbi.nlm.nih.gov/books/NBK557491/ "Diagnostic Testing Accuracy: Sensitivity, Specificity, Predictive Values and Likelihood Ratios - StatPearls - NCBI Bookshelf"
[5]: https://pubmed.ncbi.nlm.nih.gov/21242203 "component analysis based methods in bioinformatics studies"
[6]: https://www.ncbi.nlm.nih.gov/books/NBK92007/ "Basics of Enzymatic Assays for HTS - Assay Guidance Manual - NCBI Bookshelf"
[7]: https://pubmed.ncbi.nlm.nih.gov/21527005 "Using graph theory to analyze biological networks"
[8]: https://nap.nationalacademies.org/catalog/10497/bio2010-transforming-undergraduate-education-for-future-research-biologists?utm_source=chatgpt.com "BIO2010: Transforming Undergraduate Education for Future ..."
[9]: https://academic.oup.com/bib/article/12/6/714/221174?utm_source=chatgpt.com "component analysis based methods in bioinformatics studies"
[10]: https://pubmed.ncbi.nlm.nih.gov/32083072 "A Guide to Conquer the Biological Network Era Using ..."

Commentaires

Aucun commentaire pour l’instant.

Connectez-vous pour ajouter un commentaire.