Incidents associés

Copyright © 2015 : Auteur s. !
21
annexe
Sous-déclaration
La sous-déclaration dans la collecte de données est un problème assez courant dans les sciences sociales, la santé publique, la criminologie et
microéconomie. Cela se produit lorsque le comptage d'un événement d'intérêt est pour une raison quelconque incomplet ou s'il est
erreurs dans l'enregistrement des sorties. Des exemples sont les données sur le chômage, les données sur les maladies infectieuses ou chroniques (par exemple, le VIH ou
diabète), crimes avec un aspect honteux (ex. sexualité et violence domestique), erreur ou compte dans une production
procédés ou soft war e engineering ring et accidents de la circulation avec dommages mineurs [1]. Préval ence estimative des événements
sur la base des comptages incomplets est susceptible d'être inférieur à la véritable proportion d'événements dans la population. Plusieurs
des techniques d'inférence basées sur des modèles binomiaux, bêta-binomiaux et de régression ont été proposées pour estimer
les valeurs de comptage réelles [2]. Cependant, dans toutes ces techniques, la probabilité de déclaration (taux de sous-déclaration) est
supposé être un paramètre constant dans le temps qui est estimé sur la base des comptages d'échantillons.
Un problème très similaire existe dans les enquê tes préli minaires ou cl ini ques pilotes, les enquê tes épidémio logiques et les études à long terme.
études dont l'objectif est d'estimer tout effet clinique possible d'un traitement ou la prévalence d'un
maladie dans une population de patients, mais la prévalence des événements ne peut être estimée qu'en sélectionnant un échantillon de
patients de la population [3].
Dans toutes ces situations, la prévalence des événements est estimée sur la base d'un échantillon aléatoire d'événements
population, sous l'hypothèse que l'ensemble d'échantillons contient les mêmes caractéristiques et distributions de la population réelle
population, y compris ceux des cas sous-déclarés et manquants.
En outre, il est souvent nécessaire d'effectuer un calcul de la taille de l'échantillon basé sur des intervalles de confiance afin de
fournir une estimation précise avec une grande marge de certitude et s'assurer que la proportion estimée est proche de
la proportion réelle avec une forte probabilité [3]. Intervalles de confiance pour les proportions estimées sur la base de
les échantillons de grandes populations et de populations finies peuvent être calculés en utilisant l'approximation normale de la
distribution binomiale comme suit :
Pour les grandes populations :
𝑝 ± 𝑧
! ! ! / !
𝑝 ( 1 − 𝑝 )
𝑁
Pour les populations finies :
𝑝 ± 𝑧
! ! ! / !
𝑝 ( 1 − 𝑝 )
𝑁
.
𝑁
!"#$% !"#$% ! !
𝑁
!"#$%&'(")
où N est la taille de l'échantillon, 𝑝 =
!
!
est l'estimation de la proportion d'événements d'intérêt dans l'échantillon et
𝑁
!"#$%&'(")
est la taille de la population dans le cas de populations finies [3 ].
Dans cette étude, nous avons estimé la prévalence des événements indésirables en nous assurant que nous disposions d'un
suffisamment d'échantillons pour fournir des estimations fiables. Nos estimations sont obtenues sous l'hypothèse que
les caractéristiques et les distributions des événements observés ne sont pas significativement différentes de celles de la réalité
population et ne changerait pas de manière significative après avoir inclus les cas sous-déclarés. Nous sommes actuellement
étudier l'extension des techniques d'inférence proposées dans [1][2] pour estimer le nombre réel de
événements en tenant compte d'une probabilité de signalement variable dans le temps.
!
[1] Neubauer, G. et Fri edl, H. , « Model l ing sample sizes of frequency », Actes de la 2 1
St
International
Work hop on Stat ist ica l Mo dell ing , 3 - 7 juillet 2006, Galway, Irlande.
[2] Neubauer, G., Dj uras G., Frie dl H. , « Models for under reporting: A Be rnoul li samp ng ap proac h for reported
counts », Austri an Journal of S tatistics , Vol. 40 (2011), n° 1 & 2, 85 – 92