La description des données administratives
Il existe plusieurs définitions disciplinaires de ce que sont les données. Luciano Floridi, théoricien de la philosophie de l’information et éthique de l’informatique à l’Université d’Oxford, situe la formulation d’une définition des données dans les travaux de Claude Shannon et de Warren Weaver sur la théorie de l’information. Floridi résume les travaux de Shannon et de Weaver au sujet des « problèmes techniques de leurs transmissions et quantifications », « des problèmes sémantiques relatifs à la signification et à la vérité », « et de problèmes de liens entre l’impact et l’efficacité de l’information sur le comportement humain » (Floridi, 2010, p. 6, traduction libre). Selon Floridi, cette approche de la théorie de l’information est caractérisée par trois éléments. Le premier est le manque d’uniformité dans l’application des données, tel que le manque de données par la signification, le sujet ou l’observation. Le deuxième est le manque d’uniformité entre deux états de signaux, tel que l’alphabet morse, qui permet de transmettre un texte à l’aide de signes de ponctuation courts et longs. Troisièmement, et finalement, il y a aussi le manque d’uniformité entre deux symboles, tel que la différence entre deux lettres de l’alphabet (Floridi, 2010, p. 24-25). Ce sont ces caractéristiques qui nous permettent de nous rapprocher d’une définition opérationnelle de ce que sont les données. Cette définition se situe en amont de leurs usages ou d’une approche taxonomique ou descriptive1 (Hempel, 1972). Sachant que les données changent en fonction de l’interprétation du sujet et de variables distinctes, nous leur attribuons une signification technique dans le contexte de l’administration publique selon une définition stipulative2, où les données sont des variables liées à des faits, à des sujets ou à des éléments d’information, pour appuyer la prise de décision, le traitement, la communication ou la réinterprétation (Le grand dictionnaire terminologique, 2002 ; Secrétariat du Conseil du trésor, 2019).
Il existe alors une dépendance entre les données et l’information. L’information consiste en des données présentées sous une forme facilement compréhensible et auxquelles on a attribué une signification dans le contexte de leur utilisation. Plus concrètement, l’information administrative est générée ou reçue par les organisations, elle sert à prendre des décisions et permet de réutiliser et de transmettre les connaissances dans les systèmes informatiques de façon officielle ou non, structurée ou non (Bergeron et al., 2009). À la base de cette approche, l’information est ancrée dans le contexte dans lequel la connaissance a été comprise et évaluée à la lumière de l’expérience et de la compréhension intellectuelle du connaissant. Mais alors, que sont les données administratives ?
Les données administratives sont celles qui sont recueillies systématiquement lors de l’enregistrement de personnes, la réalisation de transactions ou encore qui sont créées lors des activités de tenue de documents liées à la prestation d’un service. Il s’agit de données dont le but primaire est de servir à des fins administratives plutôt que d’être utilisées par des organismes statistiques pour faire des prévisions et développer des tendances à propos d’un phénomène. Toutefois, ces données administratives peuvent également servir à créer, à compléter ou à mettre à jour des enquêtes statistiques. Par exemple, les données des transactions sécurisées pour les services de paiement lors de l’achat de produits et de services par les individus sont des données administratives créées et gérées par le secteur bancaire. Lorsqu’elles sont acquises par les organisations statistiques, elles deviennent alors des données secondaires.
Au niveau fédéral, la question des données administratives a été abordée par la commission Glassco de 1962, du nom de son président, John G. Glassco, désigné pour se pencher sur l’organisation du gouvernement. Cette commission a étudié le fonctionnement des institutions fédérales quant à la conception et à l’utilisation de formulaires, connus à l’époque sous le nom de « formules ». La commission considérait que dans « toute administration commerciale ou gouvernementale, les formules sont des outils indispensables à la consignation, l’analyse, la transmission et la conservation de renseignements » (Glassco, 1962, p. 568). Ce sont ces formulaires qui, depuis l’arrivée et la mise en œuvre progressive des systèmes informatisés vers la fin des années 1950, servent, dans la majorité des cas, à la collecte et au partage des informations et des données administratives.
Or, la conception et le contrôle de ces formulaires, ainsi que les méthodes d’analyse de leur contenu, n’ont pas été développés avant un bon nombre d’années. Dès l’époque de la commission Glassco, la valeur des données administratives était connue, mais elle était incluse dans la masse documentaire de l’État au point de s’y perdre. Depuis, les méthodes de classification, de stockage et de repérage de l’information et des données se sont perfectionnées et de plus en plus automatisées. À la fin des années 1950, l’arrivée de l’automatisation, marquée par l’introduction des ordinateurs centraux, permet le traitement électronique de grandes quantités d’informations. Ce contexte ouvre la voie à de nouvelles préoccupations concernant l’exploitation des données administratives, en plus d’introduire de nouveaux défis comme le contrôle de leur qualité, l’inférence ou la valorisation afin de déterminer les données manquantes, ou encore la publication de données administratives sous un régime de gouvernement ouvert. La pénétration de ces nouveaux processus administratifs introduits par l’automatisation, et de pair avec le régime de gouvernement ouvert, incite les citoyens à se prononcer sur les décisions prises et sur les jugements rendus par l’administration publique. Par sa nature, l’automatisation soutient des discours sur les défis de l’utilisation des données administratives « comme un actif stratégique dans l’élaboration de politiques, la conception de programmes ou la prestation de services, ou pour créer de la valeur destinée aux secteurs public, privé, sans but lucratif et de la recherche » (Bureau du Conseil privé, 2018, p. 6).
1 Les défis de l’utilisation des données administratives
Les données administratives proviennent des processus administratifs, tels que les programmes et les services. Ces données permettent de mesurer les progrès réalisés en vue d’améliorer les activités menées par les organisations gouvernementales.
L’avènement des technologies numériques a complexifié la donne puisque, désormais, les organisations publiques doivent composer avec un volume considérable de données en provenance de leur clientèle. L’utilisation et le partage accrus de données par les organisations non gouvernementales ainsi que l’aisance avec laquelle se fait...