Enquêtes en cours · 2026

Le code derrière les enquêtes.

Deux projets long format, écrits en R et publiés en accès ouvert. Méthode, données et scripts reproductibles sur GitHub.

Enquête 01 · phase B en cours

Le mot « génocide »

Lire l'enquête → Code source

Asymétries de couverture médiatique dans la presse française : Gaza et Soudan, octobre 2023 – mars 2026.

La presse française couvre Gaza et le Soudan avec une asymétrie de volume, de cadrage et de vocabulaire qui n'est pas attribuable au seul écart de notoriété. Cette enquête mesure cette asymétrie sur un sondage Europresse de 172 articles et la situe dans la lignée de sept études quantitatives existantes — Hallin 1986, Bennett 1990, Liebes 1997, Philo & Berry 2011, entre autres.

Dix visualisations livrées en phase A (avril 2026), dont quatre sur données réelles parsées d'Europresse et six sur sources publiques sourcées : Lancet, ACLED, OHCHR, ministère de la Santé de Gaza.

Articles mensuels, octobre 2023 – février 2026

Aperçu. Données indicatives — extraction Europresse exhaustive en cours d'achèvement.

Source — Europresse, échantillon 172 articles · enquête S. Zaouati

Les dix visualisations

Titre Source Statut
G1Bilan humain comparé des conflits contemporainsLancet · ACLED · OHCHRsourcé
G2Couverture quotidienne pendant les moments-pivotsEuropresse, 172 art.données réelles
G3Chronologie des événements-pivots (42 événements)tableur Pilotagesourcé
G4Asymétries déjà mesurées par la recherche7 études académiquessourcé
G5Double bilan Gaza : direct / indirectKhatib et al., Lancet 2024sourcé
G6Volume mensuel sur 30 mois : Gaza / Soudan / Ukrainesimulation indicativeprovisoire
G7Frise interactive (G3 + G6)Plotly combinédémonstrateur
G8Densité du mot « génocide » dans le corpusEuropresse, 127 479 motsdonnées réelles
G9Présence du mot « génocide » dans les titresEuropresse, 172 titresdonnées réelles
G10Florilège juxtaposé de titresEuropressedonnées réelles

État d'avancement — Phase A (preview) livrée en avril 2026. Phase B (extraction Europresse exhaustive) en cours : remplacement des chiffres provisoires de volume mensuel et extension du ratio articles/jour sur 30 mois. Phase C : article long Substack à quatre mains avec Marine.

Enquête 02 · série Substack

L'illusion des petits nombres

Lire l'enquête → Code source

Une série de dix enquêtes publiées sur Substack, écrites entre le 2 et le 11 mai 2026.

La loi des petits nombres — et la manière dont la presse française la néglige systématiquement quand elle publie des classements de territoires, d'écoles, d'hôpitaux ou d'institutions.

Quand on calcule un taux à partir d'un petit échantillon, le hasard parle plus fort que la sociologie. Une commune de 200 habitants peut se retrouver en tête d'un classement de la dangerosité avec quatre cambriolages dans l'année. Une commune de 200 000 habitants n'y arrivera jamais. Cette mécanique, identifiée dès 1971 par Daniel Kahneman et Amos Tversky, structure une bonne partie des palmarès qui font la une des journaux. Cette série en démonte dix.

Les dix épisodes

  1. 01 Cambriolages publié
  2. 02 Lycées à venir
  3. 03 Élections, bureau par bureau à venir
  4. 04 Tribunaux laxistes à venir
  5. 05 Maternités et mortalité néonatale à venir
  6. 06 Ehpad à venir
  7. 07 Notations Google des médecins à venir
  8. 08 Saisies de drogue par poste de douane à venir
  9. 09 Centres de PMA à venir
  10. 10 Comment lire un chiffre à venir

Méthode

Chaque épisode part d'une source publique et passe par les mêmes étapes : extraction des données via DuckDB en R, visualisation taux contre taille en échelle logarithmique, comparaison entre un classement brut (méthode médiatique habituelle) et un classement corrigé — avec seuil de population minimal, ou lissage bayésien.

Tous les fichiers .qmd sont reproductibles : il suffit d'ouvrir Quarto dans RStudio et de cliquer sur Render. Sources : SSMSI, DREES, ATIH, ministère de la Justice, INSEE, Agence de la biomédecine.

Discuter d'une de ces enquêtes ?

Écrire un mot.

sacha.zaouati@gmail.com