SDTM

Introduction

Le Study Data Tabulation Model (SDTM) est un modèle conceptuel qui permet la présentation standardisée des données des études cliniques (y compris les études cliniques concernant des dispositifs médicaux) dans le but de les soumettre à des autorités réglementaires telles que la Food and Drug Administration (FDA).

Ce modèle développé par l’équipe CDISC des « Submissions Data Standards » (SDS) définit la structure des bases des données sous forme de tables appelées domaines.

Lors de la soumission des données aux autorités réglementaires, ces tables au format SAS transport ou XML doivent être accompagnées d’un document appelé DEFINE. Ce fichier au format XML contient toutes les informations concernant la structure/le format des données soumises (méta données).

Le modèle SDTM est décrit dans deux documents fondamentaux :

- le Study Data Tabulation Model qui décrit le modèle lui-même

- le SDTM implementation guide qui a pour objectif de guider les utilisateurs dans l’implémentation du modèle et de fournir de nombreuses informations complémentaires ainsi que de nombreux exemples.

Le modèle

Le SDTM est construit autour du concept d’observations qui consiste en une série d’informations recueillies au cours d’une étude clinique. Chaque observation correspond à une ligne dans une table de données et l’ensemble des observations relatives à un thème particulier constitue ce qui est appelé un domaine.

Chaque observation est décrite par le biais de variables. Une variable peut être classifiée d’après son rôle et correspond à une colonne dans une table.

STUDYID	DOMAIN	USUBJID	MHSEQ	MHTERM	MHCAT	MHSTDTC	MHENDTC
EXEMPLE2015	MH	EXEMPLE2015-001	1	MIGRAINE HEADACHE	MEDICAL HISTORY	2012	2012
EXEMPLE2015	MH	EXEMPLE2015-001	2	ANEMIA	MEDICAL HISTORY	2011	2012
EXEMPLE2015	MH	EXEMPLE2015-002	1	THYROIDECTOMY TOTAL	SURGICAL HISTORY	2000	2000

Le rôle d’une variable peut être, par exemple, d’identifier une étude ou un individu (ex. : le numéro du sujet), d’indiquer la teneur de l’observation (ex. : le nom du test de laboratoire), de fournir des informations sur la date ou l’heure ou encore de fournir des informations additionnelles (ex. : les unités de mesure).

Les domaines

La plupart des données récoltées au cours d’une étude appartiennent à l’une des 3 classes d’observations générales que sont les interventions (Interventions), les événements (Events) et les résultats (Findings). Les autres observations trouveront leur place dans des tables de données ayant des contenus spécifiques et particuliers tels que ceux relatifs aux sujets/patients, au design de l’étude ou aux relations entre les données.

Les classes d’observations générales

Dans la classe Interventions sont regroupées toutes les observations relatives aux traitements administrés aux sujets que ce soit ceux spécifiés par le protocole de l’étude (ex. : médicament de l’étude), ceux administrés durant l’étude (ex. : traitements concomitants) ou encore ceux auto-administrés par les sujets (ex. : caféine, tabac, alcool).

La classe Events englobe les événements prévus par le protocole (ex. : randomisation), les événements non planifiés prenant place durant l’étude (ex. : effets indésirables) ou auparavant (ex. : historique médical).

La classe Findings réunit les observations résultant de tests et d’évaluations prévues par le protocole tels que le poids, la taille, les données de laboratoire, les réponses aux questionnaires, etc.

Interventions General Observation Class

Concomitant Medications — CM

Exposure — EX

Exposure as Collected — EC

Procedures —PR

Substance Use — SU

Events General Observation Class

Adverse Events — AE

Medical History — MH

Disposition — DS

Protocol Deviations — DV

Clinical Events — CE

Healthcare Encounters — HO

Findings About

Findings About — FA

Skin Response — SR

Findings General Observation Class

ECG Test Results —EG

Laboratory Test Results —LB

Questionnaires —QS

Vital Signs —VS

Inclusion/Exclusion Criterion Not Met —IE

Physical Examination —PE

Subject Characteristics —SC

Drug Accountability — DA

Microbiology Specimen —MB

Microbiology Susceptibility Test — MS

PK Concentrations —PC

PK Parameters —PP

Death Details —DD

Immunogenicity Specimen Assessment — IS

Microscopic Findings — MI

Morphology — MO

Reproductive System Findings — RP

Subject Status — SS

Tumor Identifier — TU

Tumor Results — TR

Disease Response — RS

Les domaines spécifiques

Une partie de ces domaines particuliers regroupe les données relatives aux sujets de l’étude qui ne sont pas collectées dans les 3 classes d’observations générales (ex. : Demographics, Comments, Subject Elements & Subject Visits). D’autres contiennent quant à eux les informations concernant le design de l’étude (ex. : Trial Arms, Trials Visits). A ces domaines s’ajoutent les domaines ayant pour objectif de regrouper les relations entre les données (ex. : Related Records, Supplemental Qualifiers).

Special-Purpose Domains

Demographics — DM

Comments — CO

Subject Elements — SE

Subject Visits — SV

Relationship Datasets

Supplemental Qualifiers — SUPPQUAL or multiple SUPP-- datasets

Related Records — RELREC

Trial Design Domains

Trial Arms — TA

Trial Visits — TV

Trial Summary — TS

Trial Elements — TE

Trial Inclusion/Exclusion Criteria — TI

Trial Disease Assessment— TD

De nouveaux domaines sont régulièrement créés/développés.

Si le domaine n’existe pas encore, il est possible pour tout utilisateur de créer lui-même ce domaine et de le soumettre au groupe de travail CDISC-SDTM.

Attention, ce processus doit suivre des modalités précises tant au niveau de la création du domaine (définition et attribution des variables) que du nom qui lui est donné.

Les variables

Toutes les tables de données ont donc une structure plate dans laquelle chaque ligne représente une observation et chaque colonne, une variable.

Pour chaque table, il existe une série d’informations concernant les variables utilisées. Ces informations appelées métadonnées sont décrites dans un document appelé « Define ». Dans ce document, qui sera soumis aux autorités réglementaires en même temps que les données, 7 attributs permettent de décrire chaque donnée SDTM :

1. Le nom de la variable (limité à 8 caractères)

2. Le label décrivant la variable (maximum 40 caractères)

3. Le type de données (texte ou numérique)

4. Une terminologie contrôlée relative valeurs de la variable ou son format de présentation

5. L’origine de la variable (CRF, Protocol, Derived, Assigned, eDT)

6. Le rôle de la variable (Identifier, Topic, Timing, Qualifier)

7. Des commentaires ou informations additionnelles concernant la variable.

Les variables du STDM sont nommées selon un certain nombre de conventions. Ainsi, la plupart des variables ont pour préfixe les deux lettres servant à identifier le domaine auquel elles appartiennent (ex. :AETERM, MHTERM, LBTEST). Certaines variables peuvent appartenir à plusieurs domaines différents (ex. : STUDYID, USUBJID, VISIT/VISITNUM) et ne comportent donc pas ce type de préfixe.

Quel que soit le domaine, les variables peuvent être requises (Required), attendues (Expected) ou permissives (Permissible).

Une variable est requise si elle est nécessaire à l’identification d’une série de données (ex. : STUDYID, DOMAIN) ou à la compréhension de ces données (ex. : LBTEST, LBTESTCD). Ces variables doivent obligatoirement être présentes dans la table et leur contenu ne peut être vide.

Une variable attendue est une variable utile mais qui peut être vide pour un certain nombre d’observations. Une variable de ce type devra être présente dans la table même si elle ne contient aucunes données (ex. : EGDTC, VSORRES).

Une variable permissive est présente quand cela est approprié (ex. : LBCAT, VSLOC). Si aucune donnée n’est disponible pour cette variable, elle peut être supprimée. Cependant, si des données sont disponibles, cette variable doit obligatoirement être présente.

Un exemple : DM (Demographics) – Annotation du CRF vs le domaine DM

Conclusion

Le standard CDISC SDTM sera la nouvelle norme obligatoire pour soumettre des données auprès de la FDA (à partir de 2017).

Au départ, certains laboratoires pharmaceutiques ont commencé à intégrer cette norme dans les activités de collecte, de traitement et d’analyse des données. Cependant, SDTM est une norme de soumission et non une norme opérationnelle.

SDTM est la base de référence pour construire l'analyse et doit donc être complet. L’ensemble des données d'analyse est créé à partir de l’ensemble des données SDTM, qui garantit ainsi la traçabilité à 100%.

Space shortcuts

Page tree