forked from DSIT/documentation-dsit
Actualiser docs/Services/Datalab/Onyxia/version.md
ajout mise en garde concernant la gesiton des données sur onyxia
This commit is contained in:
parent
e69444a031
commit
66a9f86c40
|
@ -1,5 +1,37 @@
|
||||||
# Contrôle de version
|
# Contrôle de version
|
||||||
|
|
||||||
|
Sur cette page, vous trouverez des explications sur ce qu'est un contrôleur de version Git, comment créer vos propres dépôts Git sur les plateformes GitHub et GitGenes, ainsi que la manière de les paramétrer pour les associer à vos services datalab Onyxia.
|
||||||
|
|
||||||
|
Cela vous permettra entre autres de cloner, sauvegarder vos données stockées sur vos services, et ainsi garantir une gestion efficace de vos travaux.
|
||||||
|
|
||||||
|
## Mise en garde
|
||||||
|
|
||||||
|
Avant de vous détailler tout sur le contrôleur de version Git, nous voulons vous rappeler via ce paragraphe que quand vous créez un service sur le datalab Onyxia, aucunes des données que vous importer sur les services n'est persistantes, sauf pour les services de bases de données (Postgresql, Mongodb, etc…) qui eux, disposent d'un stockage persistant.
|
||||||
|
|
||||||
|
Les services du Datalab fonctionnent sur le modèle des conteneurs éphémères : dans un usage standard, l'utilisateur lance un service, réalise des traitements de données, sauvegarde le code qui a permis de réaliser ces traitements, et supprime l'instance du service.
|
||||||
|
|
||||||
|
Vous avez donc deux choix, celle que nous préconisons aux utilisateurs est d'automatiser ce processus d'import/export de données en utilisant un contrôleur de version Git qui vous sera entièrement expliqué sur cette page à la suite de ce paragraphe.
|
||||||
|
|
||||||
|
Ou d'importer manuellement vos données à la création de votre service puis de télécharger les données stockées sur vos services avant chaque arrêt d'utilisation.
|
||||||
|
|
||||||
|
Git, la méthode que nous préconisons, est un système de gestion de version qui permet aux utilisateurs de suivre l'évolution de leurs fichiers au fil du temps, le plus connu étant GitHub.
|
||||||
|
Vous trouverez un guide d'introduction à git ici : https://openclassrooms.com/fr/courses/7162856-gerez-du-code-avec-git-et-github
|
||||||
|
|
||||||
|
Dans le cadre de nos services, nous simplifions ce processus : tous les utilisateurs ayant un compte ENSAE se voient automatiquement attribuer un compte GitGenes.
|
||||||
|
|
||||||
|
GitGenes est notre système Git hébergé en interne, utilisant la solution Gitea et offrant des fonctionnalités similaires à celles de GitHub ou GitLab. Il facilite la création, la gestion et la collaboration autour de dépôts Git, celui-ci est disponible ici: https://code.groupe-genes.fr/
|
||||||
|
Sacher que par défaut, le datalab Onyxia est préconfiguré avec votre compte GitGenes (https://code.groupe-genes.fr/).
|
||||||
|
|
||||||
|
Les utilisateurs n'ont plus qu'à créer un dépôt sur leur compte GitGenes, puis, spécifier l'URL de ce dépôt dans nos services datalab Onyxia. Cela permettra qu'à la création d'un service, les données stockées sur votre dépôt seront automatiquement clonées sur votre service datalab Onyxia.
|
||||||
|
|
||||||
|
Liens utiles :
|
||||||
|
Où ajouter l'URL d'un dépôt Git lors de la configuration de vos services du datalab Onyxia:
|
||||||
|
https://documentation-dsit.lab.groupe-genes.fr/Services/Datalab/Onyxia/#git-config
|
||||||
|
|
||||||
|
Comment créer et récupérer l'URL d'un dépôt sur GitGenes ou Github:
|
||||||
|
https://documentation-dsit.lab.groupe-genes.fr/Services/Datalab/Onyxia/version/#creation-recuperation-de-lurl-dun-depot
|
||||||
|
|
||||||
|
|
||||||
## Pourquoi utiliser le contrôle de version ?
|
## Pourquoi utiliser le contrôle de version ?
|
||||||
|
|
||||||
Le Datalab est une plateforme mutualisée : les ressources utilisées par les services sont partagées entre les différents utilisateurs. A ce titre, les services du Datalab fonctionnent sur le modèle des conteneurs éphémères : dans un usage standard, l'utilisateur lance un service, réalise des traitements de données, sauvegarde le code qui a permis de réaliser ces traitements, et supprime l'instance du service. Cette sauvegarde du code est grandement facilitée par l'usage du contrôle de version.
|
Le Datalab est une plateforme mutualisée : les ressources utilisées par les services sont partagées entre les différents utilisateurs. A ce titre, les services du Datalab fonctionnent sur le modèle des conteneurs éphémères : dans un usage standard, l'utilisateur lance un service, réalise des traitements de données, sauvegarde le code qui a permis de réaliser ces traitements, et supprime l'instance du service. Cette sauvegarde du code est grandement facilitée par l'usage du contrôle de version.
|
||||||
|
|
Loading…
Reference in New Issue
Block a user