Type de document
Rapports de recherche scientifique
Année de publication
2020
Langue
Français
Résumé
Une grande partie de l'activité des hygiénistes du travail consiste à mesurer les niveaux d'exposition professionnelle des travailleurs. La plupart des rapports d'évaluation de l'exposition font état d'une importante variabilité spatiale et temporelle quant à l'intensité de l'exposition, laquelle fluctue souvent du simple au décuple en dépit de conditions apparemment similaires. Il en résulte depuis toujours un défi de taille en ce qui concerne l'interprétation des niveaux mesurés par rapport aux valeurs limites d’exposition professionnelle (VLEP). Il existe désormais un cadre consensuel – issu d'une élaboration progressive au cours des deux dernières décennies – concernant l'analyse des niveaux d’exposition par rapport aux limites d'exposition. Ce cadre repose sur la présomption que les niveaux d’exposition présentent une distribution lognormale, à tout le moins approximativement. Plusieurs paramètres de la distribution sous-jacente tenus pour être indicatifs d'un risque pour la santé sont estimés à partir d'un certain nombre de mesures et comparés à la VLEP.
Bien que ces méthodes permettent une meilleure évaluation du risque que les approches traditionnelles, elles n'ont pas été largement adoptées par les intervenants en hygiène du travail, et elles font appel à des notions statistiques généralement non abordées dans les programmes de formation habituels. Elles requièrent en outre des calculs difficilement réalisables avec des outils courants tels que calculatrices et chiffriers. Bien que des outils aient été développés en ce sens au fil des années – généralement à l'initiative de bénévoles – la plupart restent déficients à plusieurs égards, que ce soit en termes d'accessibilité, de fonctionnalité, de convivialité ou de complexité. Par ailleurs, l'incertitude relative aux estimations a surtout été prise en compte par voie de tests d'hypothèses formels ou de calculs d'intervalles de confiance, dont les résultats ne sont pas faciles à présenter aux décideurs, ce qui entrave la capacité des intervenants à communiquer efficacement les risques. Enfin, les outils disponibles sont des logiciels autonomes difficiles à intégrer à un système de gestion de données préexistant.
Le projet WebExpo visait à améliorer les pratiques actuelles en matière d'interprétation des niveaux d'exposition professionnelle grâce à la création d'une bibliothèque de solutions algorithmiques aux questions les plus fréquentes concernant l'évaluation du risque en hygiène du travail. La plupart de ces questions nécessitent l'estimation des paramètres d'une ou plusieurs distributions statistiques, et WebExpo a eu recours aux statistiques bayésiennes pour effectuer les tâches requises à cette fin. Les méthodes bayésiennes ont été retenues du fait qu'elles présentent deux grands avantages. Premièrement, elles fournissent directement des inférences probabilistes (p. ex., Quelles sont les chances que... ?), ce qui facilite la communication des risques. Deuxièmement, elles permettent d'aborder des questions méthodologiques rarement prises en compte, notamment en ce qui a trait aux valeurs signalées comme étant non détectées (un sujet de préoccupation fréquent). Les trois objectifs spécifiques de WebExpo étaient les suivants : 1) évaluer les besoins actuels en matière de calculs, de documentation et de communication des risques en lien avec l'interprétation des données d'exposition professionnelle, 2) créer une bibliothèque de codes de programmation informatique s'appuyant sur les statistiques bayésiennes pour répondre à une série de questions formulées dans le cadre du premier objectif spécifique, et 3) créer, à partir des codes de programmation élaborés dans le cadre du deuxième objectif spécifique, des prototypes d'outils répondant aux besoins définis dans le cadre du premier objectif spécifique.
Le premier objectif spécifique a été atteint en réalisant une revue des lignes directrices en vigueur à l'échelle internationale ainsi que des publications pertinentes les plus récentes, complétées par des rencontres avec des comités d'experts et d'intervenants. Le deuxième objectif spécifique a été atteint en développant des solutions bayésiennes applicables à la liste de calculs établie à la première étape, en convertissant ces algorithmes en code statistique et en traduisant ce code en langage de programmation. Finalement, les algorithmes de programmation ont été utilisés pour créer des prototypes d'analyse de données fonctionnels illustrant les calculs possibles et pouvant servir de point de départ à la création d'outils complets d'analyse de données.
La liste de calculs pertinents issue du premier objectif spécifique et ayant par la suite servi de base à l'élaboration de formules mathématiques, d'algorithmes et de prototypes comportait deux grands volets. Le premier concernait l'estimation des paramètres d'une seule distribution, soit l'approche conventionnelle axée sur l’évaluation d’un groupe dit « d'exposition similaire ». Les mesures sont alors présumées provenir d'une distribution d'expositions partagées par un groupe de travailleurs accomplissant des tâches similaires. En guise d'illustration, ce modèle permet de répondre à la question : « Quelle est la probabilité que les expositions non mesurées au sein de ce groupe dépassent la VLEP plus de 5 % du temps ? » Le second volet étendait la portée du premier modèle de manière à pouvoir estimer la mesure dans laquelle un groupe de travailleurs partage ou non des expositions similaires. La variabilité globale de l'exposition est alors divisée en variabilité intra-travailleur et en variabilité inter-travailleur. Cela permet non seulement d'évaluer le risque de groupe, mais aussi de déterminer si certains travailleurs individuels sont plus à risque que le groupe. En guise d'illustration, ce modèle permet de répondre à la question : « Bien que l'exposition de groupe semble acceptable, quelle est la probabilité qu'un travailleur au hasard subisse une exposition supérieure à la VLEP plus de 5 % du temps ? » Tous les modèles incluent le traitement des valeurs non détectées et tiennent compte des erreurs de mesure associées au prélèvement et à l’analyse.
Les algorithmes issus de l'exercice sont disponibles en R pour les chercheurs, en C# pour les applications autonomes hors ligne ou sur serveur, et en JavaScript pour les applications Web. Ils couvrent la saisie de données, l'estimation bayésienne, des modules d'interprétation numérique et une interface utilisateur limitée aux prototypes en C# et en JavaScript. Le code est publiquement accessible aux termes de la licence libre Apache 2.0 pour permettre aux utilisateurs de créer leurs propres applications.
Le projet WebExpo devrait générer une trousse d'outils complète à la disposition de la communauté de l'hygiène du travail aux fins d'interprétation des niveaux d'exposition professionnelle, tout en offrant aux utilisateurs la souplesse de créer ou d'adapter leur propre logiciel plutôt que d'en utiliser un nouveau.
Abstract
A significant part of industrial hygiene activities is the measurement of workers’ occupational exposure levels. Considerable spatial and temporal variability is usually observed in most exposure assessment surveys, frequently with up to 10-fold variations in exposure intensity, despite apparently similar conditions. This has historically represented an important challenge to the interpretation of measured levels with regard to comparison with occupational exposure limits (OELs). There now exists a consensus framework, progressively developed during the last two decades, for the analysis of exposure levels related to exposure limits. Within this framework, exposure levels are assumed to follow, at least approximately, a lognormal distribution. Several parameters from the underlying distribution, deemed associated with health risk, are estimated from a number of measurements and are interpreted relative to the OEL.
These developments, although permitting a better assessment of risk compared to historical approaches, have not been widely adopted by industrial hygiene practitioners, and involve notions of statistics not usually taught in traditional education programs. Moreover they require calculations not usually feasible with common tools such as calculators or spreadsheet programs. While some specific tools have been developed over the years, usually through volunteer initiatives, most are lacking in some areas, be it accessibility, functionality, user-friendliness or complexity. In addition, uncertainty in parameter estimates has mostly been taken into account through formal hypothesis tests or the calculation of confidence intervals, the results of which are not easily conveyed to decision makers, hampering the ability of practitioners to efficiently communicate risk. Finally, available tools are standalone, and are not easily integrated within an existing data management structure.
The WebExpo project aimed at improving current practices in the interpretation of occupational exposure levels through the creation of a library of algorithmic solutions to frequently asked risk assessment questions in industrial hygiene. Most of these questions require the estimation of parameters from one or several distributions. WebExpo has utilized Bayesian statistics to perform these tasks. Bayesian methods were chosen due to two main advantages: first, they provide inferences in direct probabilistic terms (e.g. what are the odds that…?), facilitating risk communication. Second, they tackle methodological issues rarely taken into account, such as the data reported as not detected (a frequent concern). The three specific objectives of WebExpo included: 1) to assess current needs in calculation, documentation and risk communication associated with the interpretation of occupational exposure measurement data, 2) to create a library of computer programming codes based on Bayesian statistics that answers a set of data interpretation questions elaborated in specific objective 1, 3) to create prototype tools using the code from specific objective 2 that computes industrial hygiene statistics and answers to needs established in specific objective 1.
Specific objective 1 was achieved through a review of international guidelines and recent relevant literature, complemented by meetings with stakeholder and expert committees. Specific objective 2 was achieved through creating Bayesian solutions to the list of calculations finalised in step 1, implementing these algorithms in statistical code, and translating the code into programming language. Finally, the programming algorithms were used to create functioning data analysis prototypes able to showcase the calculation and useable as a starting point for the creation of practical data analysis tools.
The list of relevant calculations resulting from specific objective 1, and later implemented mathematically as well as in the form of algorithms and prototypes, included two main avenues. The first involved estimating parameters from one distribution, i.e., the traditional “similar exposure group” approach. The measurements are assumed to come from a distribution of exposures shared by a group of workers performing similar tasks. As an illustration, this model permits to answer the question: “What is the probability that unmeasured exposures for this group exceed the OEL more than 5% of the time?” The second model extends the first model by permitting to estimate to what extent a group of workers does or does not share similar exposures. The global exposure variability is split into within- and between-worker variabilities. It is possible to assess the group risk but also whether some individual workers might experience higher risk than the group. As an illustration, this model permits to answer the question: “Although group exposure seems acceptable, what is the probability that a randomly selected worker might experience exposure exceeding the OEL more than 5% of the time?” All models include the seemless treatment of non-detects and take into account measurement errors associated with the observations.
The resulting algorithms are available in R, aimed at academics, C#, for standalone offline or server-based applications, or JavaScript, for web-based applications. They include data entry, core Bayesian estimation, numerical data interpretation modules, as well as a limited user interface for the C# and JavaScript prototypes. The code is publicly available under the open source licence Apache 2.0 to allow users to build their own applications.
The WebExpo project should result in a comprehensive toolbox, available to the industrial hygiene community for the interpretation of occupational exposure levels, with the added flexibility for users to build or adapt their own software instead of using a new one.
ISBN
9782897970840
Mots-clés
Risque chimique, Chemical hazard, Limitation de l'exposition, Limitation of exposure, Valeur-seuil, Threshold limit value, Produit chimique, Chemical product, Évaluation de l'exposition, Exposure evaluation, Évaluation hygiène du travail, Occupational hygiene evaluation, Modèle mathématique, Mathematical model, Langage de programmation, Program language, Conditions d'exposition, Conditions of exposure, Hygiéniste du travail, Industrial hygienist, Statistique, Statistical mathematics, Analyse des données, Data analysis, WebExpo, Approche bayésienne, Bayesian approach
Numéro de projet IRSST
2014-0073
Numéro de publication IRSST
R-1066
Citation recommandée
Lavoué, J., Joseph, L., Kirkham, T. L., Labrèche, F., Mater, G. et Clerc, F. (2020). WebExpo : vers une meilleure interprétation des mesures d'exposition professionnelle aux substances chimiques sur les lieux de travail (Rapport n° R-1066). IRSST.