1. Idée centrale : un modèle mathématique n’est pas la réalité

Un modèle biologique est une représentation simplifiée d’un système vivant.

Exemples :

Système réel	Modèle mathématique possible
Croissance bactérienne	fonction exponentielle ou logistique
Enzyme + substrat	équation de Michaelis-Menten
Propagation infectieuse	modèle SIR
Expression génique	vecteurs, matrices, ACP/PCA
Réseau métabolique	graphe orienté
Diffusion d’une molécule	équation de diffusion
Test diagnostique	probabilités conditionnelles, Bayes

Un bon modèle doit préciser :

1. les variables ;
2. les unités ;
3. les hypothèses ;
4. le domaine de validité ;
5. les paramètres mesurables ;
6. les prédictions vérifiables.

Les modèles mécanistiques biophysiques reposent souvent sur des lois comme l’action de masse, la conservation de la matière, la loi d’Ohm pour les modèles électrophysiologiques ou des équations de transport ; les textes de modélisation insistent aussi sur les hypothèses cachées et les risques de mélanger modèles mécanistiques et modèles “boîte noire”. ([CNIB][2])

---

2. Fonctions, dimensions et ordres de grandeur

2.1 Fonctions biologiques

Une fonction relie une variable d’entrée à une sortie :

$$y=f(x)$$

Exemples :

$$N(t)=N_0 e^{rt}$$

où :

Symbole	Signification	Unité
(N(t))	population au temps (t)	cellules, individus
$N_0$	population initiale	cellules, individus
(r)	taux de croissance spécifique	$temps^{-1}$
(t)	temps	s, min, h, jour

La cohérence dimensionnelle impose que l’exposant (rt) soit sans unité. Donc si (t) est en heures, (r) doit être en h(^{-1}).

---

2.2 Exemple étape par étape : croissance bactérienne exponentielle

Une culture passe de :

$$N_0=10^{3}$$

à :

$$N(6h)=8\times10^{3}$$

On suppose une croissance exponentielle :

$$N(t)=N_0 e^{rt}$$

Étape 1 : écrire le rapport

$$\frac{N(t)}{N_0}=e^{rt}$$

$$\frac{8\times10^{3}}{10^{3}}=8=e^{6r}$$

Étape 2 : appliquer le logarithme

$$\ln^{8}=6r$$

$$r=\frac{\ln^{8}}{6}$$

Or :

$$\ln^{8}=\ln(2^{3})=3\ln^{2}\approx 2{,}079$$

Donc :

$$r=\frac{2{,}079}{6}=0{,}347 \ \mathrm{h}^{-1}$$

Étape 3 : calculer le temps de doublement

$$Le temps de doublement (T_d) vérifie :$$

$$2N_0=N_0 e^{rT_d}$$

$$2=e^{rT_d}$$

$$T_d=\frac{\ln 2}{r}$$

$$T_d=\frac{0{,}693}{0{,}347}=2{,}0 \ \mathrm{h}$$

Interprétation biologique : dans ces conditions, la population double toutes les deux heures.

Limite : ce modèle suppose nutriments illimités, absence de déchets toxiques, température constante, pas de mortalité différentielle. Il est valable surtout en phase exponentielle.

---

3. Calcul différentiel : taux, vitesses et sensibilités

Le calcul différentiel sert à décrire les variations instantanées.

$$\frac{dN}{dt}$$

signifie : variation de (N) par unité de temps.

En biologie, on rencontre :

Domaine	Dérivée
Croissance cellulaire	$\frac{dN}{dt}$
Cinétique enzymatique	$\frac{d[P]}{dt}$
Pharmacocinétique	$\frac{dC}{dt}$
Physiologie	$\frac{dP_{art}}{dt}, \frac{dV}{dt}$
Écologie	$\frac{dN_i}{dt} pour l’espèce (i)$

---

3.1 Croissance logistique

La croissance exponentielle prédit une croissance infinie. En biologie réelle, les ressources deviennent limitantes. On introduit alors une capacité limite (K), appelée capacité de charge.

$$\frac{dN}{dt}=rN\left(1-\frac{N}{K}\right)$$

Symbole	Signification	Unité
(N)	population	individus ou cellules
(r)	taux maximal de croissance	$temps^{-1}$
(K)	capacité de charge	individus ou cellules
$\frac{dN}{dt}$	vitesse de croissance	$individus\cdot temps^{-1}$

OpenStax présente cette équation comme une amélioration du modèle exponentiel pour tenir compte de la capacité de charge environnementale. ([OpenStax][3])

---

3.2 Exemple étape par étape : culture limitée par les ressources

Données :

$$N_0=10^{6} \ \mathrm{cellules}$$

$$K=10^{9} \ \mathrm{cellules}$$

$$r=0{,}8 \ \mathrm{jour}^{-1}$$

Solution de l’équation logistique :

$$N(t)=\frac{K}{1+\left(\frac{K-N_0}{N_0}\right)e^{-rt}}$$

Étape 1 : calcul du facteur initial

$$\frac{K-N_0}{N_0}=\frac{10^{9}-10^{6}}{10^{6}}=999$$

Donc :

$$N(t)=\frac{10^{9}}{1+999e^{-0{,}8t}}$$

Étape 2 : population après 5 jours

$$N^{5}=\frac{10^{9}}{1+999e^{-4}}$$

$$e^{-4}\approx0{,}0183$$

$$999e^{-4}\approx18{,}3$$

$$N^{5}\approx\frac{10^{9}}{19{,}3}=\approx5{,}18\times10^{7}$$

Étape 3 : interprétation

Après 5 jours :

$$N^{5}\approx5{,}2\times10^{7} \ \mathrm{cellules}$$

La croissance est encore forte, car (N\ll K), mais elle ralentira quand (N) s’approchera de (10^{9}).

Point important :

$$\frac{dN}{dt}$$

est maximal lorsque :

$$N=\frac{K}{2}$$

La croissance est donc maximale à mi-capacité.

---

4. Intégrales : quantités cumulées

Une intégrale additionne une quantité variable.

$$\int_a^b f(t),dt$$

En sciences du vivant, les intégrales servent à calculer :

Situation	Intégrale
exposition à un médicament	$aire sous la courbe (AUC=\int C(t)dt)$
production totale de métabolite	$(\int v(t)dt)$
dose absorbée	$(\int R(t)dt)$
expression cumulée d’un gène	$(\int E(t)dt)$

---

Exemple : exposition pharmacocinétique

Si la concentration plasmatique suit :

$$C(t)=C_0 e^{-kt}$$

alors l’exposition totale de (0) à (\infty) vaut :

$$AUC=\int_0^\infty C_0 e^{-kt}dt$$

$$AUC=\frac{C_0}{k}$$

Unités :

$$C_0 : \mathrm{mg\cdot L}^{-1}$$

$$k : \mathrm{h}^{-1}$$

Donc :

$$AUC : \mathrm{mg\cdot h\cdot L}^{-1}$$

La cohérence dimensionnelle est correcte.

---

5. Probabilités : incertitude biologique

Les systèmes vivants sont variables. Deux cellules génétiquement identiques peuvent exprimer des niveaux différents d’un gène. Deux patients exposés au même facteur peuvent avoir des réponses différentes.

Une probabilité est un nombre entre 0 et 1 :

$$0\leq P(A)\leq1$$

---

5.1 Probabilité conditionnelle

$$P(A\mid B)=\frac{P(A\cap B)}{P(B)}$$

Elle signifie : probabilité de (A) sachant que (B) est réalisé.

En médecine :

$$P(\mathrm{maladie}\mid \mathrm{test positif})$$

n’est pas la même chose que :

$$P(\mathrm{test positif}\mid \mathrm{maladie})$$

Cette confusion est très fréquente.

---

5.2 Sensibilité, spécificité et valeurs prédictives

Pour un test diagnostique :

$$\mathrm{Sensibilité}=\frac{VP}{VP+FN}$$

$$\mathrm{Spécificité}=\frac{VN}{VN+FP}$$

$$VPP=\frac{VP}{VP+FP}$$

$$VPN=\frac{VN}{VN+FN}$$

où :

Symbole	Signification
VP	vrai positif
VN	vrai négatif
FP	faux positif
FN	faux négatif

Les rapports de vraisemblance sont :

$$LR^+=\frac{\mathrm{sensibilité}}{1-\mathrm{spécificité}}$$

$$LR^-=\frac{1-\mathrm{sensibilité}}{\mathrm{spécificité}}$$

Ces formules sont celles utilisées classiquement dans l’évaluation de la performance diagnostique. ([CNIB][4])

---

5.3 Exemple étape par étape : test diagnostique

Données :

$$\mathrm{prévalence}=2\%=0{,}02$$

$$\mathrm{sensibilité}=95\%=0{,}95$$

$$\mathrm{spécificité}=98\%=0{,}98$$

Question : quelle est la probabilité d’être malade si le test est positif ?

On cherche :

$$P(M\mid T+)$$

Formule de Bayes :

$$P(M\mid T+)=\frac{P(T+\mid M)P(M)}{P(T+\mid M)P(M)+P(T+\mid \neg M)P(\neg M)}$$

Étape 1 : identifier les termes

$$P(T+\mid M)=0{,}95$$

$$P(M)=0{,}02$$

$$P(\neg M)=0{,}98$$

$$P(T+\mid \neg M)=1-\mathrm{spécificité}=0{,}02$$

Étape 2 : calcul

$$P(M\mid T+)=\frac{0{,}95\times0{,}02}{0{,}95\times0{,}02+0{,}02\times0{,}98}$$

$$P(M\mid T+)=\frac{0{,}019}{0{,}019+0{,}0196}$$

$$P(M\mid T+)=\frac{0{,}019}{0{,}0386}\approx 0{,}492$$

Donc :

$$P(M\mid T+)\approx49{,}2\%$$

Interprétation : malgré un test apparemment très performant, la valeur prédictive positive est seulement d’environ 49 % lorsque la prévalence est faible.

Conclusion pédagogique : un bon test ne suffit pas ; la prévalence influence fortement l’interprétation clinique.

---

6. Statistiques : apprendre à partir de données

Les probabilités vont du modèle vers les données.
Les statistiques vont des données vers le modèle.

Exemple :

* Probabilité : “si la vraie moyenne est (\mu), quelle distribution des mesures attend-on ?”
* Statistique : “à partir des mesures observées, que peut-on dire de (\mu) ?”

---

6.1 Moyenne, variance, écart-type

Pour des mesures :

$$x_1,x_2,\dots,x_n$$

la moyenne est :

$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$

La variance empirique est :

$$s^{2}=\frac{1}{n^{-1}}\sum_{i=1}^{n}(x_i-\bar{x})^{2}$$

L’écart-type :

$$s=\sqrt{s^{2}}$$

---

6.2 Erreur standard

L’erreur standard de la moyenne vaut :

$$SEM=\frac{s}{\sqrt{n}}$$

Elle diminue comme (\sqrt{n}), pas comme (n).

Conséquence : multiplier l’effectif par 4 divise l’erreur standard par 2.

---

6.3 Intervalle de confiance approximatif

Pour une moyenne normalement distribuée :

$$\mathrm{IC}_{95}\approx \bar{x}\pm1{,}96\frac{s}{\sqrt{n}}$$

Attention : un intervalle de confiance ne signifie pas que la probabilité que le vrai paramètre soit dans cet intervalle est 95 % dans l’interprétation fréquentiste stricte. Il signifie que la procédure produirait des intervalles contenant le vrai paramètre dans 95 % des répétitions idéalisées.

---

6.4 p-valeur

Une p-valeur est :

$$p=P(\mathrm{données aussi extrêmes ou plus extrêmes}\mid H_0)$$

Elle n’est pas :

$$P(H_0\mid \mathrm{données})$$

Erreur fréquente : croire que (p=0{,}03) signifie “il y a 3 % de chances que l’hypothèse nulle soit vraie”. Ce n’est pas ce que calcule une p-valeur.

---

7. Algèbre linéaire : vecteurs, matrices et données omiques

L’algèbre linéaire est centrale pour :

* transcriptomique ;
* protéomique ;
* métabolomique ;
* imagerie ;
* génétique des populations ;
* modèles de transition ;
* apprentissage automatique.

Un individu, une cellule ou un échantillon peut être représenté par un vecteur :

$$\mathbf{x}= \begin{pmatrix} x_1\\ x_2\\ x_3 \end{pmatrix}$$

Exemple :

$$\mathbf{x}= \begin{pmatrix} \mathrm{expression gène A}\\ \mathrm{expression gène B}\\ \mathrm{expression gène C} \end{pmatrix}$$

Une matrice de données omiques contient souvent :

$$X_{ij}$$

où (i) désigne l’échantillon et (j) le gène.

---

7.1 Matrice de transition

Exemple simple : cellules pouvant être dans deux états :

* état 1 : prolifératif ;
* état 2 : différencié.

On écrit :

$$\mathbf{x}_{t+1}=A\mathbf{x}_t$$

avec :

$$A= \begin{pmatrix} 0{,}9 & 0{,}2\\ 0{,}1 & 0{,}8 \end{pmatrix}$$

Si :

$$\mathbf{x}_0= \begin{pmatrix} 0{,}7\\ 0{,}3 \end{pmatrix}$$

alors :

$$\mathbf{x}_1= \begin{pmatrix} 0{,}9 & 0{,}2\\ 0{,}1 & 0{,}8 \end{pmatrix} \begin{pmatrix} 0{,}7\\ 0{,}3 \end{pmatrix}$$

Calcul

Première composante :

$$0{,}9\times0{,}7+0{,}2\times0{,}3=0{,}63+0{,}06=0{,}69$$

Deuxième composante :

$$0{,}1\times0{,}7+0{,}8\times0{,}3=0{,}07+0{,}24=0{,}31$$

Donc :

$$\mathbf{x}_1= \begin{pmatrix} 0{,}69\\ 0{,}31 \end{pmatrix}$$

Interprétation : après une étape, 69 % des cellules sont prolifératives et 31 % différenciées.

---

7.2 Valeurs propres et stabilité

Une valeur propre (\lambda) d’une matrice (A) vérifie :

$$A\mathbf{v}=\lambda\mathbf{v}$$

En biologie :

Valeur propre	Interprétation
$\lambda <1$	décroissance ou amortissement
$\lambda =1$	équilibre neutre
$\lambda >1$	croissance ou amplification

Exemple : dans une matrice de Leslie, la plus grande valeur propre donne le taux asymptotique de croissance d’une population structurée par âge.

---

7.3 ACP/PCA : réduire la dimension

L’analyse en composantes principales transforme des variables corrélées en nouvelles variables orthogonales appelées composantes principales. En bioinformatique, la PCA est un outil classique de réduction de dimension, notamment pour les données d’expression génique de haute dimension. ([PubMed][5])

Idée

On part d’une matrice :

$$X= \begin{pmatrix} \mathrm{échantillons} \times \mathrm{gènes} \end{pmatrix}$$

La PCA cherche des axes qui maximisent la variance :

$$PC_1 = a_1x_1+a_2x_2+\dots+a_px_p$$

$$où les coefficients (a_i) forment un vecteur propre de la matrice de covariance.$$

Interprétation biologique

Si deux groupes de cellules se séparent sur (PC_1), cela peut correspondre à :

* un type cellulaire différent ;
* un état d’activation ;
* un effet batch ;
* une différence de cycle cellulaire ;
* une différence pathologique.

Limite majeure : la PCA maximise la variance, pas nécessairement la pertinence biologique.

---

8. Équations différentielles : dynamique des systèmes vivants

Une équation différentielle relie une grandeur à sa vitesse de variation.

$$\frac{dx}{dt}=f(x,t)$$

Elle permet de modéliser :

Domaine	Exemple
écologie	croissance de population
immunologie	expansion clonale
épidémiologie	modèles SIR
biochimie	cinétique enzymatique
physiologie	régulation glycémique
pharmacologie	élimination d’un médicament

---

8.1 Modèle SIR

On divise une population en trois compartiments :

$$S(t): \mathrm{susceptibles}$$

$$I(t): \mathrm{infectés}$$

$$R(t): \mathrm{retirés ou guéris}$$

Le modèle classique :

$$\frac{dS}{dt}=-\beta$$

$$\frac{dI}{dt}=\beta$$

$$SI-\gamma I$$

$$\frac{dR}{dt}=\gamma$$

I
]

Paramètre	Signification	Unité
$\beta$	taux de transmission	$individu^{-1}\cdot temps^{-1}$
$\gamma$	taux de guérison/retrait	$temps^{-1}$
$1/\gamma$	durée infectieuse moyenne	temps

Dans une formulation normalisée, on utilise souvent :

$$R_0=\frac{\beta}{\gamma}$$

si (S) est exprimé comme fraction initiale proche de 1.

Exemple

$$\beta=0{,}30 \ \mathrm{jour}^{-1}$$

$$\gamma=0{,}20 \ \mathrm{jour}^{-1}$$

Donc :

$$R_0=\frac{0{,}30}{0{,}20}=1{,}5$$

Interprétation : au début de l’épidémie, un infecté génère en moyenne 1,5 nouveau cas dans une population entièrement susceptible, selon les hypothèses du modèle.

Limites : homogénéité des contacts, population fermée, absence de structure d’âge, absence de spatialisation, paramètres constants.

---

9. Cinétique enzymatique : Michaelis-Menten

La biochimie utilise intensivement les fonctions rationnelles, les équations différentielles et les ajustements non linéaires.

Le schéma minimal est :

$$E+S \rightleftharpoons ES \rightarrow E+P$$

L’équation de Michaelis-Menten est :

$$v=\frac{V_{\max}[S]}{K_m+[S]}$$

où :

Symbole	Signification	Unité
(v)	vitesse initiale	$\mathrm{\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\cdot s^{-1}} ou \mathrm{\mathrm{\mathrm{\mu mol\cdot min^{-1}}}}$
$V_{\max}$	vitesse maximale	même unité que (v)
([S])	concentration en substrat	$\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}$
$K_m$	$concentration donnant v=V_{\max}/2$	$\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}$

Le Assay Guidance Manual de NCBI présente (K_m) et (V_{\max}) comme paramètres intrinsèques majeurs de la cinétique enzymatique, utiles notamment dans le développement de tests enzymatiques et la recherche d’inhibiteurs. ([CNIB][6])

---

9.1 Exemple étape par étape

Données :

$$V_{\max}=100 \ \mathrm{\mu mol\cdot min^{-1}}$$

$$K_m=2 \ \mathrm{mmol\cdot L^{-1}}$$

Calculer (v) pour :

$$[S]=0{,}5,\ 2,\ 10 \ \mathrm{mmol\cdot L^{-1}}$$

Cas 1 : ([S]=0{,}5)

$$v=\frac{100\times0{,}5}{2+0{,}5}$$

$$v=\frac{50}{2{,}5}=20 \ \mathrm{\mu mol\cdot min^{-1}}$$

Cas 2 : ([S]=2)

$$v=\frac{100\times2}{2+2}$$

$$v=\frac{200}{4}=50 \ \mathrm{\mu mol\cdot min^{-1}}$$

Ici :

$$[S]=K_m$$

donc :

$$v=\frac{V_{\max}}{2}$$

Cas 3 : ([S]=10)

$$v=\frac{100\times10}{2+10}$$

$$v=\frac{1000}{12}=83{,}3 \ \mathrm{\mu mol\cdot min^{-1}}$$

Interprétation biologique

$$Quand ([S]\ll K_m), la vitesse dépend presque linéairement du substrat :$$

$$v\approx \frac{V_{\max}}{K_m}[S]$$

$$Quand ([S]\gg K_m), l’enzyme est saturée :$$

$$v\approx V_{\max}$$

Limites : Michaelis-Menten suppose une vitesse initiale, un substrat unique ou une simplification, une enzyme stable, pas d’inhibition par le produit, pas d’allostérie forte, et des conditions expérimentales contrôlées.

---

10. Optimisation et estimation de paramètres

Les modèles biologiques contiennent des paramètres inconnus :

$$r,\ K,\ V_{\max},\ K_m,\ \beta,\ \gamma$$

On les estime à partir de données.

---

10.1 Moindres carrés

On choisit les paramètres qui minimisent :

$$S(\theta)=\sum_{i=1}^{n}(y_i-\hat{y}_i(\theta))^{2}$$

où :

Symbole	Signification
$y_i$	donnée observée
$\hat{y}_i$	prédiction du modèle
$\theta$	paramètres à estimer

Exemple : ajuster une courbe logistique sur une croissance cellulaire.

---

10.2 Maximum de vraisemblance

Si les données suivent une loi de probabilité (P(y_i|\theta)), la vraisemblance est :

$$L(\theta)=\prod_{i=1}^{n}P(y_i\mid \theta)$$

On maximise souvent le logarithme :

$$\ell(\theta)=\sum_{i=1}^{n}\ln$$

$$P(y_i\mid \theta)$$

]

Avantage : cette approche permet d’adapter le modèle d’erreur :

Données	Loi plausible
comptages cellulaires	Poisson ou binomiale négative
proportions	binomiale
concentrations continues	normale ou log-normale
temps avant événement	exponentielle, Weibull, Cox

---

11. Graphes et réseaux biologiques

Un graphe est défini par :

$$G=(V,E)$$

où :

Symbole	Signification
(V)	ensemble des nœuds
(E)	ensemble des arêtes

En biologie :

Réseau	Nœuds	Arêtes
protéines	protéines	interactions physiques
métabolisme	métabolites	réactions
régulation génique	gènes/facteurs	activation/inhibition
connectome	neurones/régions	connexions
épidémiologie	individus	contacts

La théorie des graphes est largement utilisée pour analyser les réseaux biologiques, extraire des propriétés cachées et relier structure du réseau et fonction biologique. ([PubMed][7])

---

11.1 Mesures classiques

Degré

Nombre de connexions d’un nœud :

$$k_i$$

Un nœud de degré élevé peut représenter une protéine hub.

Centralité d’intermédiarité

Mesure combien de plus courts chemins passent par un nœud.

$$C_B(v)=\sum_{s\neq v\neq t}\frac{\sigma_{st}(v)}{\sigma_{st}}$$

où :

Symbole	Signification
$\sigma_{st}$	nombre de plus courts chemins entre (s) et (t)
$(\sigma_{st}(v))$	nombre de ces chemins passant par (v)

Clustering

Mesure la tendance des voisins d’un nœud à être connectés entre eux.

Biologiquement, un fort clustering peut correspondre à un module fonctionnel.

---

12. Information, entropie et séquences biologiques

L’information intervient en génomique, transcriptomique, phylogénie, neurosciences et apprentissage automatique.

12.1 Entropie de Shannon

$$H(X)=-\sum_i p_i\log_2(p_i)$$

Unité : bit.

Exemple : pour une position d’ADN où les quatre bases sont équiprobables :

$$p_A=p_T=p_G=p_C=\frac14$$

$$H=-4\times\frac14\log_2\left(\frac14\right)$$

$$H=2 \ \mathrm{bits}$$

Si une position est toujours A :

$$p_A=1$$

$$H=0$$

Interprétation biologique :

* entropie élevée : position variable ;
* entropie faible : position conservée ;
* conservation forte : contrainte fonctionnelle possible.

---

13. Processus stochastiques et diffusion

Les phénomènes cellulaires sont souvent bruités :

* expression génique en bursts ;
* diffusion moléculaire ;
* ouverture/fermeture de canaux ioniques ;
* mutations ;
* dérive génétique.

---

13.1 Marche aléatoire et diffusion

Pour une diffusion en une dimension :

$$\langle x^{2}\rangle=2Dt$$

où :

Symbole	Signification	Unité
$\langle x^{2}\rangle$	déplacement quadratique moyen	$m^{2}$
(D)	coefficient de diffusion	$\mathrm{\mathrm{\mathrm{m^2\cdot s^{-1}}}}$
(t)	temps	s

Donc :

$$t\approx\frac{L^{2}}{2D}$$

Exemple

Molécule avec :

$$D=10 \ \mathrm{\mu m^2\cdot s^{-1}}$$

Distance :

$$L=10 \ \mu m$$

Alors :

$$t\approx\frac{10^{2}}{2\times10}$$

$$t=\frac{100}{20}=5 \ s$$

Interprétation : une petite molécule peut explorer une cellule de 10 \mum en quelques secondes par diffusion, mais une distance 10 fois plus grande prend 100 fois plus de temps car (t\propto L^{2}).

---

14. Couplages entre mathématiques et disciplines biologiques

Biochimie

Les équations différentielles décrivent les vitesses de réaction.
La thermodynamique indique si une réaction est favorable :

$$\Delta G=\Delta$$

$$G^{\circ'}+RT\ln Q$$

]

La cinétique indique si elle est rapide.

Erreur fréquente : confondre réaction thermodynamiquement favorable et réaction rapide.

---

Physiologie

Les systèmes physiologiques utilisent des rétrocontrôles :

$$\mathrm{stimulus} \rightarrow \mathrm{capteur} \rightarrow \mathrm{intégrateur} \rightarrow \mathrm{effecteur}$$

Exemples :

* glycémie ;
* pression artérielle ;
* température corporelle ;
* ventilation ;
* osmolarité.

Les modèles utilisent souvent des équations différentielles couplées et des boucles de rétroaction négative.

---

Écologie

Les modèles de population utilisent :

* croissance exponentielle ;
* croissance logistique ;
* compétition ;
* prédation ;
* matrices de transition ;
* stochasticité environnementale.

---

Médecine

Les outils mathématiques servent à :

* interpréter un test ;
* estimer un risque ;
* ajuster un traitement ;
* modéliser une épidémie ;
* analyser un essai clinique ;
* stratifier des patients.

---

Omique et biologie des systèmes

Les données de haute dimension nécessitent :

* matrices ;
* distances ;
* PCA ;
* clustering ;
* graphes ;
* modèles probabilistes ;
* correction des tests multiples ;
* apprentissage statistique.

---

15. Applications concrètes

Application fondamentale

Comprendre pourquoi une population cellulaire ne croît pas indéfiniment : passage d’un modèle exponentiel à un modèle logistique.

Application expérimentale

Estimer (K_m) et (V_{\max}) à partir de vitesses initiales mesurées à différentes concentrations de substrat.

Application clinique

Convertir sensibilité, spécificité et prévalence en probabilité post-test par le théorème de Bayes.

Application technologique

Utiliser PCA, clustering et graphes pour explorer des données de transcriptomique unicellulaire.

---

16. Limites, incertitudes et pièges

16.1 Limites générales

Un modèle peut être mathématiquement correct mais biologiquement faux si ses hypothèses sont invalides.

Exemples :

Modèle	Hypothèse fragile
croissance exponentielle	ressources infinies
Michaelis-Menten	enzyme non allostérique, vitesse initiale
SIR	contacts homogènes
PCA	$variance = signal biologique$
test statistique	indépendance des observations
graphe biologique	interactions connues et complètes

---

16.2 Incertitudes

Les paramètres biologiques varient avec :

* température ;
* pH ;
* tissu ;
* type cellulaire ;
* espèce ;
* méthode de mesure ;
* bruit expérimental ;
* état physiologique ou pathologique.

Une valeur de (K_m), de (r), de (D) ou de (\beta) doit toujours être rattachée à ses conditions expérimentales.

---

17. Synthèse pédagogique

10 idées essentielles

1. Les mathématiques servent à relier données, mécanismes et prédictions.
2. Toute équation biologique doit être accompagnée d’unités.
3. Une dérivée représente une vitesse instantanée.
4. Une intégrale représente une quantité cumulée.
5. Une probabilité conditionnelle n’est pas symétrique.
6. La prévalence influence fortement les valeurs prédictives d’un test.
7. Les matrices permettent de représenter états, transitions et données omiques.
8. Les équations différentielles décrivent les dynamiques biologiques.
9. Les graphes modélisent interactions et réseaux.
10. Un modèle doit toujours être interprété à travers ses hypothèses.

---

3 erreurs fréquentes

1. Confondre corrélation et causalité.
Une corrélation statistique ne prouve pas un mécanisme causal.

$$2. **Confondre (P(A\mid B)) et (P(B\mid A)).**$$

Exemple : sensibilité et probabilité d’être malade si le test est positif.

3. Utiliser un modèle hors de son domaine de validité.
Exemple : appliquer Michaelis-Menten à une enzyme fortement allostérique sans justification.

---

3 questions d’auto-évaluation

Question 1

Une population double toutes les 3 h. Quel est son taux de croissance exponentielle (r) ?

Réponse :

$$T_d=\frac{\ln2}{r}$$

$$r=\frac{\ln2}{T_d}=\frac{0{,}693}{3}=0{,}231 \ h^{-1}$$

---

Question 2

Un test a une sensibilité de 90 % et une spécificité de 95 %. Quel est son (LR^+) ?

$$LR^+=\frac{0{,}90}{1-0{,}95}$$

$$LR^+=\frac{0{,}90}{0{,}05}=18$$

---

Question 3

Dans Michaelis-Menten, que vaut (v) lorsque ([S]=K_m) ?

$$v=\frac{V_{\max}[S]}{K_m+[S]}$$

Si :

$$[S]=K_m$$

alors :

$$v=\frac{V_{\max}K_m}{K_m+K_m}=\frac{V_{\max}}{2}$$

---

Bibliographie commentée

1. *National Research Council. 2003. BIO2010: Transforming Undergraduate Education for Future Research Biologists. National Academies Press. Rapport institutionnel, langue originale : anglais. DOI : 10.17226/10497. Indice de reprise communautaire : 95/100*. ([Académies des sciences][8])

2. *Forger DB. 2017. Biological Clocks, Rhythms, and Oscillations: The Theory of Biological Timekeeping. MIT Press / NCBI Bookshelf. Manuel universitaire, langue originale : anglais. ISBN-13 : 9780262036771. Indice : 85/100*. ([CNIB][2])

3. *OpenStax. 2016. Calculus Volume 2, section “The Logistic Equation”. Manuel libre, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 85/100*. ([OpenStax][3])

4. *Brooks HB et al. 2012. “Basics of Enzymatic Assays for HTS”. Assay Guidance Manual, NCBI Bookshelf. Chapitre méthodologique, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 85/100*. ([CNIB][6])

5. Shreffler J, Huecker MR. 2023. “Diagnostic Testing Accuracy: Sensitivity, Specificity, Predictive Values and Likelihood Ratios”. StatPearls / NCBI Bookshelf. Synthèse clinique, langue originale : anglais. DOI non indiqué sur la page consultée. Indice : 80/100. ([CNIB][4])

6. *Ma S, Dai Y. 2011. “Principal component analysis based methods in bioinformatics studies”. Briefings in Bioinformatics, 12(6):714-722. Revue, langue originale : anglais. DOI : 10.1093/bib/bbq090. Indice : 85/100*. ([OUP Academic][9])

7. *Pavlopoulos GA et al. 2011. “Using graph theory to analyze biological networks”. BioData Mining, 4:10. Revue méthodologique, langue originale : anglais. DOI : 10.1186/1756-0381-4-10. Indice : 85/100*. ([PubMed][7])

8. *Koutrouli M et al. 2020. “A Guide to Conquer the Biological Network Era Using Graph Theory”. Frontiers in Bioengineering and Biotechnology, 8:34. Revue méthodologique, langue originale : anglais. DOI : 10.3389/fbioe.2020.00034. Indice : 82/100*. ([PubMed][10])

[1]: https://www.ncbi.nlm.nih.gov/books/NBK43508/ "A New Biology Curriculum - Bio2010 - NCBI Bookshelf"
[2]: https://www.ncbi.nlm.nih.gov/books/NBK544602/ "Biophysical Mechanistic Modeling: Choosing the Right Model Equations - Biological Clocks, Rhythms, and Oscillations - NCBI Bookshelf"
[3]: https://openstax.org/books/calculus-volume-2/pages/4-4-the-logistic-equation "4.4 The Logistic Equation - Calculus Volume 2 | OpenStax"
[4]: https://www.ncbi.nlm.nih.gov/books/NBK557491/ "Diagnostic Testing Accuracy: Sensitivity, Specificity, Predictive Values and Likelihood Ratios - StatPearls - NCBI Bookshelf"
[5]: https://pubmed.ncbi.nlm.nih.gov/21242203 "component analysis based methods in bioinformatics studies"
[6]: https://www.ncbi.nlm.nih.gov/books/NBK92007/ "Basics of Enzymatic Assays for HTS - Assay Guidance Manual - NCBI Bookshelf"
[7]: https://pubmed.ncbi.nlm.nih.gov/21527005 "Using graph theory to analyze biological networks"
[8]: https://nap.nationalacademies.org/catalog/10497/bio2010-transforming-undergraduate-education-for-future-research-biologists?utm_source=chatgpt.com "BIO2010: Transforming Undergraduate Education for Future ..."
[9]: https://academic.oup.com/bib/article/12/6/714/221174?utm_source=chatgpt.com "component analysis based methods in bioinformatics studies"
[10]: https://pubmed.ncbi.nlm.nih.gov/32083072 "A Guide to Conquer the Biological Network Era Using ..."

Domaine	Dérivée
Croissance cellulaire	\(\frac{dN}{dt}\)
Cinétique enzymatique	\(\frac{d[P]}{dt}\)
Pharmacocinétique	\(\frac{dC}{dt}\)
Physiologie	\(\frac{dP_{art}}{dt}, \frac{dV}{dt}\)
Écologie	\(\frac{dN_i}{dt} pour l’espèce (i)\)

Situation	Intégrale
exposition à un médicament	\(aire sous la courbe (AUC=\int C(t)dt)\)
production totale de métabolite	\((\int v(t)dt)\)
dose absorbée	\((\int R(t)dt)\)
expression cumulée d’un gène	\((\int E(t)dt)\)

Valeur propre	Interprétation
\(\lambda <1\)	décroissance ou amortissement
\(\lambda =1\)	équilibre neutre
\(\lambda >1\)	croissance ou amplification

Paramètre	Signification	Unité
\(\beta\)	taux de transmission	\(individu^{-1}\cdot temps^{-1}\)
\(\gamma\)	taux de guérison/retrait	\(temps^{-1}\)
\(1/\gamma\)	durée infectieuse moyenne	temps

Symbole	Signification	Unité
(v)	vitesse initiale	\(\mathrm{\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\cdot s^{-1}} ou \mathrm{\mathrm{\mathrm{\mu mol\cdot min^{-1}}}}\)
\(V_{\max}\)	vitesse maximale	même unité que (v)
([S])	concentration en substrat	\(\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\)
\(K_m\)	\(concentration donnant v=V_{\max}/2\)	\(\mathrm{\mathrm{\mathrm{mol\cdot L^{-1}}}}\)

Symbole	Signification
\(y_i\)	donnée observée
\(\hat{y}_i\)	prédiction du modèle
\(\theta\)	paramètres à estimer

Symbole	Signification
\(\sigma_{st}\)	nombre de plus courts chemins entre (s) et (t)
\((\sigma_{st}(v))\)	nombre de ces chemins passant par (v)

Symbole	Signification	Unité
\(\langle x^{2}\rangle\)	déplacement quadratique moyen	\(m^{2}\)
(D)	coefficient de diffusion	\(\mathrm{\mathrm{\mathrm{m^2\cdot s^{-1}}}}\)
(t)	temps	s

1. Idée centrale : un modèle mathématique n’est pas la réalité

2. Fonctions, dimensions et ordres de grandeur

2.1 Fonctions biologiques

2.2 Exemple étape par étape : croissance bactérienne exponentielle

Étape 1 : écrire le rapport

Étape 2 : appliquer le logarithme

Étape 3 : calculer le temps de doublement

3. Calcul différentiel : taux, vitesses et sensibilités

3.1 Croissance logistique

3.2 Exemple étape par étape : culture limitée par les ressources

Étape 1 : calcul du facteur initial

Étape 2 : population après 5 jours

Étape 3 : interprétation

4. Intégrales : quantités cumulées

Exemple : exposition pharmacocinétique

5. Probabilités : incertitude biologique

5.1 Probabilité conditionnelle

5.2 Sensibilité, spécificité et valeurs prédictives

5.3 Exemple étape par étape : test diagnostique

Étape 1 : identifier les termes

Étape 2 : calcul

6. Statistiques : apprendre à partir de données

6.1 Moyenne, variance, écart-type

6.2 Erreur standard

6.3 Intervalle de confiance approximatif

6.4 p-valeur

7. Algèbre linéaire : vecteurs, matrices et données omiques

7.1 Matrice de transition

Calcul

7.2 Valeurs propres et stabilité

7.3 ACP/PCA : réduire la dimension

Idée

Interprétation biologique

8. Équations différentielles : dynamique des systèmes vivants

8.1 Modèle SIR

Exemple

9. Cinétique enzymatique : Michaelis-Menten

9.1 Exemple étape par étape

Cas 1 : ([S]=0{,}5)

Cas 2 : ([S]=2)

Cas 3 : ([S]=10)

Interprétation biologique

10. Optimisation et estimation de paramètres

10.1 Moindres carrés

10.2 Maximum de vraisemblance

11. Graphes et réseaux biologiques

11.1 Mesures classiques

Degré

Centralité d’intermédiarité

Clustering

12. Information, entropie et séquences biologiques

12.1 Entropie de Shannon

13. Processus stochastiques et diffusion

13.1 Marche aléatoire et diffusion

Exemple

14. Couplages entre mathématiques et disciplines biologiques

Biochimie

Physiologie

Écologie

Médecine

Omique et biologie des systèmes

15. Applications concrètes

Application fondamentale

Application expérimentale

Application clinique

Application technologique

16. Limites, incertitudes et pièges

16.1 Limites générales

16.2 Incertitudes

17. Synthèse pédagogique

10 idées essentielles

3 erreurs fréquentes

3 questions d’auto-évaluation

Question 1

Question 2

Question 3

Bibliographie commentée

Commentaires