10 KiB
Conditions générales d'utilisation (dernière mise à jour : 05/02/2024)
Présentation / Fonctionnalités
Le datalab du Genes est un service (ci-après désigné par "le datalab") mis en oeuvre par le département du système d'information et télécommunication (DSIT) du Groupe des Écoles Nationales d'Économie et Statistique (GENES) à destination des utilisateurs des entités du GENES (ENSAE, CREST, ENSAI, ENSAE-ENSAI-Formation Continue).
le datalab est une implémentation du logiciel libre Onyxia créé et maintenu par la division innovation et instruction technique de l'Insee (direction du système d'information/unité innovation et stratégie du système d'information). L'hébergement et la maintenance du datalab est assuré par le DSIT.
Le datalab est une plateforme proposant un laboratoire de traitement de données destiné aux expérimentations de data science sur données ouvertes dans lequel les utilisateurs peuvent orchestrer des services dédiés à la pratique de la data science (environnements de développement, bases de données...). Cette offre de services vise ainsi à familiariser les utilisateurs avec de nouvelles méthodes de travail collaboratif mobilisant des langages statistiques open source (R, python, Julia...), des technologies de type cloud computing ainsi qu'à permettre d'expérimenter des traitements statistiques innovants. Les services proposés sont standards.
Le datalab s'adresse aux chercheurs ainsi qu'aux enseignants et étudiants du Groupe des écoles nationales d'économie et de statistique, permettant une collaboration interservices et la coopération avec leur écosystème. Des accès peuvent également être accordés sur demande et après validation par le responsable du DSIT à des collaborateurs extérieurs et impliqués dans la réalisation de projets expérimentaux du système statistique public.
Le datalab permet :
- l'orchestration de formations de data science
- l'accès à des services de data science
- le stockage sécurisé de données
- la gestion de secrets, tels que des clés de chiffrement
- l'accès à un service de gestion de code
- l'orchestration de flux de traitement de données
Modalités d'utilisation du Service
Le datalab est accessible depuis n'importe quel navigateur connecté à Internet. L'utilisation d'un ordinateur est recommandée. L'utilisation des services du datalab est gratuite.
Limites d'utilisation du Service
Peuvent être traitées sur le datalab les données publiques et données usuelles (données de travail sans sensibilité particulière).
Le dépôt de toute donnée directement identifiante (noms, prénoms, etc.), même déjà disponible publiquement, est proscrit.
En l'absence d'autorisation spécifique pour un projet d'expérimentation donné, ne peuvent être traitées sur le datalab les données "protégées" ou "sensibles", avec ou sans marque de confidentialité destinée à restreindre la diffusion à un domaine spécifique (secret statistique, commercial, industriel...).
Le caractère "protégé" ou "sensible" des informations stockées ou traitées sur le datalab est soumis à l'appréciation de l'utilisateur sous la responsabilité de sa hiérarchie.
La réalisation de traitements à des fins de contrôle fiscal ou de répression économique est proscrite.
Les limitations de ressource par utilisateur sont de :
- 5 Services
- 50 Go de RAM
- 20 CPU
- 1 GPU
Suppression automatique des services
En raison de ressources limitées et pour permettre une utilisation optimale pour tous, un nettoyage automatique des services du catalogue intéractif est effectué toutes les semaines. L'ensemble des services de ce catalogue lancé il y a plus de 15 jours seront supprimés ainsi que les volumes de données associés. Il est recommandé d'utiliser l'espace de stockage personnel (S3) ainsi que les dépots de code pour éviter toutes perte de données.
De même, les ressources GPU étant en nombre contraints, toute utilisation abusive (réservation sans allocations) conduit à une suppression du service sans préavis.
Les rôles, engagements et responsabilités associées
Le datalab est mis à disposition par le DSIT sans autres garanties expresses ou tacites que celles qui sont prévues par les présentes. Le Service s'appuie sur des technologies open source de référence. Toutefois, il n'est pas garanti qu'il soit exempt d'anomalies ou erreurs. Le Service est donc mis à disposition sans garantie sur sa disponibilité et ses performances. A ce titre, le Genes ne peut être tenu responsable des pertes et/ou préjudices, de quelque nature qu'ils soient, qui pourraient être causés à la suite d'un dysfonctionnement ou une indisponibilité du Service. De telles situations n'ouvriront droit à aucune compensation financière.
Chaque utilisateur dispose d'un espace de stockage personnel. Par défaut, toutes les informations déposées dans un espace de stockage d'un utilisateur ne sont accessibles qu'à lui seul. Chaque utilisateur a la possibilité de rendre publics des fichiers stockés dans son espace de stockage personnel. Chaque utilisateur est responsable de la mise à disposition publique de ses fichiers.
Chaque utilisateur agit sous la responsabilité de sa hiérarchie. Il doit s'assurer auprès de sa hiérarchie qu'en cas de traitement de données à caractère personnel réalisés à l'aide du datalab, celui ci s'effectue dans un cadre légal.
Chaque utilisateur s'engage, lors de l'utilisation qu'il fera de la plateforme, à ne pas contrevenir aux dispositions législatives et réglementaires en vigueur et aux présentes conditions générales d'utilisation. Il est informé que toute violation desdites dispositions est susceptible d'entraîner des poursuites judiciaires et sanctions à son encontre.
Les ressources du datalab étant mutualisées entre utilisateurs, toute utilisation excessive pourra faire l'objet d'une suspension partielle ou totale, sans préavis, de l'accès au datalab. Ces mesures, visant au bon fonctionnement du datalab, sont laissées à la libre appréciation du DSIT.
La création de compte sur Onyxia Genes
L'accès au datalab nécessite de disposer d'un compte informatique GENES (ENSAE, CREST, Ensae-Ensai Formation Continue, ENSAI).
Les projets d'expérimentation sur données non ouvertes
Sur décision du DSIT, des projets d'expérimentation mobilisant des données non ouvertes peuvent être menés sur le datalab. La décision précise les utilisateurs habilités à participer à ces projets.
Les participants à un projet d'expérimentation sur données non ouvertes doivent impérativement se conformer aux règles de sécurité spécifiques à ce projet. Ils devront notamment utiliser exclusivement les espaces collaboratifs dédiés à ce projet et à toute procédure d'habilitation préalable qui serait nécessaire en particulier par le comité du secret statistique.
Obligations relatives aux données que les utilisateurs peuvent déposer sur la plateforme
Le traitement de données à caractère personnel au sens des articles 9 et 10 du règlement général sur la protection des données (origine raciale ou ethnique, opinions politiques, convictions religieuses ou philosophiques, appartenance syndicale, condamnations pénales, état de santé passé, présent ou futur, orientation sexuelle, vie sexuelle...) est proscrit sur ce Service.
Les données à caractère personnel traitées dans le cadre d'une expérimentation réalisée par un utilisateur, quand il y en a, relèvent de la responsabilité de l'entité administrative dont est issu l'utilisateur. Les dispositions relatives à leur traitement doivent être communiquées par l'utilisateur au délégué à la protection des données de son entité administrative de rattachement.
Chaque utilisateur s'engage à souscrire aux obligations résultant d'une part de la loi n° 78-17 du 6 janvier 1978 modifiée relative à l'informatique, aux fichiers et aux libertés et d'autre part du règlement (UE) 2016/679 du 27 avril 2016 (règlement général sur la protection des données).
L'utilisateur s'engage en outre à ne déposer sur la plateforme aucune
donnée directement identifiante.
Ainsi, seul le dépôt de données après au-moins pseudonymisation est
autorisé. Tout utilisateur qui mettrait en œuvre un traitement
non-conforme verra son accès au Service immédiatement supprimé.
Modification et évolution du Service
Le DSIT se réserve la liberté de faire évoluer, de modifier ou de suspendre, sans préavis, le Service pour des raisons de maintenance ou pour tout autre motif jugé nécessaire. L'information est alors communiquée aux utilisateurs via Mail. Les termes des présentes conditions d'utilisation peuvent être modifiés ou complétés à tout moment, sans préavis, en fonction des modifications apportées au Service, de l'évolution de la législation ou pour tout autre motif jugé nécessaire. Ces modifications et mises à jour s'imposent à l'utilisateur qui doit, en conséquence, se référer régulièrement à cette rubrique pour vérifier les conditions générales en vigueur (accessible depuis la page d'accueil).
Loi applicable - Litiges
Le Service et les présentes conditions générales d'utilisation sont soumis à la législation française. En cas de litige, les tribunaux français seront compétents.
Contact
Pour les problèmes techniques et/ou fonctionnels rencontrés sur la plateforme, il est conseillé, dans un premier temps de solliciter les communautés de pairs dans les espaces collaboratifs prévus à cet effet sur Teams disponible Datalab - GENES - Teams. Un support mail est également disponible à l'adresse support@groupe-genes.fr ou en ouvrant un ticket sur assistance.ensae.fr.