Enquêtes en cours · 2026

Le code derrière les enquêtes.

Deux projets long format, écrits en R et publiés en accès ouvert. Méthode, données et scripts reproductibles sur GitHub.

Asymétries de couverture médiatique dans la presse française : Gaza et Soudan, octobre 2023 – mars 2026.

La presse française couvre Gaza et le Soudan avec une asymétrie de volume, de cadrage et de vocabulaire qui n'est pas attribuable au seul écart de notoriété. Cette enquête mesure cette asymétrie sur un sondage Europresse de 172 articles et la situe dans la lignée de sept études quantitatives existantes — Hallin 1986, Bennett 1990, Liebes 1997, Philo & Berry 2011, entre autres.

Dix visualisations livrées en phase A (avril 2026), dont quatre sur données réelles parsées d'Europresse et six sur sources publiques sourcées : Lancet, ACLED, OHCHR, ministère de la Santé de Gaza.

Articles mensuels, octobre 2023 – février 2026

Aperçu. Données indicatives — extraction Europresse exhaustive en cours d'achèvement.

Source — Europresse, échantillon 172 articles · enquête S. Zaouati

Les dix visualisations

№	Titre	Source	Statut
G1	Bilan humain comparé des conflits contemporains	Lancet · ACLED · OHCHR	sourcé
G2	Couverture quotidienne pendant les moments-pivots	Europresse, 172 art.	données réelles
G3	Chronologie des événements-pivots (42 événements)	tableur Pilotage	sourcé
G4	Asymétries déjà mesurées par la recherche	7 études académiques	sourcé
G5	Double bilan Gaza : direct / indirect	Khatib et al., Lancet 2024	sourcé
G6	Volume mensuel sur 30 mois : Gaza / Soudan / Ukraine	simulation indicative	provisoire
G7	Frise interactive (G3 + G6)	Plotly combiné	démonstrateur
G8	Densité du mot « génocide » dans le corpus	Europresse, 127 479 mots	données réelles
G9	Présence du mot « génocide » dans les titres	Europresse, 172 titres	données réelles
G10	Florilège juxtaposé de titres	Europresse	données réelles

État d'avancement — Phase A (preview) livrée en avril 2026. Phase B (extraction Europresse exhaustive) en cours : remplacement des chiffres provisoires de volume mensuel et extension du ratio articles/jour sur 30 mois. Phase C : article long Substack à quatre mains avec Marine.

Une série de dix enquêtes publiées sur Substack, écrites entre le 2 et le 11 mai 2026.

La loi des petits nombres — et la manière dont la presse française la néglige systématiquement quand elle publie des classements de territoires, d'écoles, d'hôpitaux ou d'institutions.

Quand on calcule un taux à partir d'un petit échantillon, le hasard parle plus fort que la sociologie. Une commune de 200 habitants peut se retrouver en tête d'un classement de la dangerosité avec quatre cambriolages dans l'année. Une commune de 200 000 habitants n'y arrivera jamais. Cette mécanique, identifiée dès 1971 par Daniel Kahneman et Amos Tversky, structure une bonne partie des palmarès qui font la une des journaux. Cette série en démonte dix.

Les dix épisodes

01 Cambriolages publié
02 Lycées à venir
03 Élections, bureau par bureau à venir
04 Tribunaux laxistes à venir
05 Maternités et mortalité néonatale à venir
06 Ehpad à venir
07 Notations Google des médecins à venir
08 Saisies de drogue par poste de douane à venir
09 Centres de PMA à venir
10 Comment lire un chiffre à venir

Méthode

Chaque épisode part d'une source publique et passe par les mêmes étapes : extraction des données via DuckDB en R, visualisation taux contre taille en échelle logarithmique, comparaison entre un classement brut (méthode médiatique habituelle) et un classement corrigé — avec seuil de population minimal, ou lissage bayésien.

Tous les fichiers .qmd sont reproductibles : il suffit d'ouvrir Quarto dans RStudio et de cliquer sur Render. Sources : SSMSI, DREES, ATIH, ministère de la Justice, INSEE, Agence de la biomédecine.

Discuter d'une de ces enquêtes ?

Écrire un mot.

sacha.zaouati@gmail.com