README.md

# TurnOver
# ReadMe TurnOver 

All processing script required to calculate the kinetic constants for protein degradation (Kd) and synthesis (Ks) using the peptide isotopic distribution combined with 15N metabolic labelling

Ensemble des scripts nécessaires au retraitement des données pour calculer les constantes cinétiques de dégradation (Kd) et de synthèse (Ks) des protéines en utilisant la distribution isotopique des peptides combinée au marquage métabolique 15N.

Avant d'utiliser les scripts, il est necessaire de faire l'acquisition des données par spectrométrie de masse et de faire l'identification des peptides/proteines: Suivre la procédure à la fin de ce document (Procédure pour traiter les données brutes de spectrométrie de masse et calculer les LPF)

## Description des scripts
**Additional_files_extraction.R** : la premiere partie du script permet de creer 3 fichiers necessaire par la suite pour le traitement des données 
    - list_pepID_vs_ProtID.csv
    - pepID_formulae.txt"
    - Export_pepID_ProtID_formulae.csv

Le fichier pepID_formulae.txt permet de calculer les valeurs de ratio isotopiques à differente valeurs de % 15N necessaire dans la seconde partie du script qui permet de les mettre au format utilisable dans le script principal.

**Main-script.R** : Il s'agit du script principal de traitement du signal brut. ce script necessite un fichier auxiliaire contenant l'ensemble des fonctions **Fonctions_associées.R**, il faut appliquer le script sur chacun des échantillons séparément.

**MCQR_15N_template_quantitation.R** permet de faire la quantification label free des echantillon marqués par 15N en utilisant une ancienne version de MCQR (Ver 0.6.5 )

**Agregation_valeur_lpf_et_calcul_Kd-Ks.R** permet de faire le calcul des Kd et Ks en utilisant les valeurs de LPF déterminées par le script principal (Main-script.R) et les valeur de FCP déterminées par (MCQR_15N_template_quantitation.R)

## Procédure pour traiter les données brutes de spectrométrie de masse et calculer les LPF

### Utilisation des données brutes pour l’identification des protéines par X!Tandem
Dans le cas de données acquise sur le Q-Exactive ou le Lumos, il est nécessaire d’effectuer une conversion des fichiers d’acquisition (*.raw) en mzXML avec l’outil MSConvert disponible sur l’ordinateur « raw » accessible à distance. Les données acquises sur le TIMS-ToF ne nécessitent pas de conversion préalable.

### Convertion MSConvert 
Après avoir sélectionné les fichiers *.raw, on peut désélectionner « Write Index » et TPP compatibility » et supprimer « titleMaker ». Il ne doit rester (impérativement) que « peakPicking » dans la fenêtre « Filter ». 

### Caractérisation des protéines par X!tandem
On utilise l’interface i2MassChroq pour la caractérisation des protéines à partir des fichiers convertis en mzXML (Q-exactive et Lumos) ou directement à partir des répertoires de sauvegarde des données (TIMS-ToF).
Choisir la premier option (Run X!Tandem identification). 
Sélectionner un pre-set d’identification basique en fonction de l’instrument.
Sélectionner les banques de données protéiques (format fasta) nécessaire à l’identification en y incluant le banque des « contaminants ».
Sélectionner les fichiers mzXML (Q-Ex et Lumos) par « +Add files » ou les répertoires (TIMS-ToF) par « add Bruker TIMS TOF folders ».
Définir le répertoire de sauvegardes des résultats et le nombre de threads (8) et lancer la recherche

### Agrégation des données
L’agrégation des résultats de la recherche X!Tandem se fait en utilisant la deuxième option de i2MassChroQ (Load identification results).
Sélectionner l’ensemble des fichiers de résultats (*.xml) de X!Tandem (étape précédente) et lancer l’agrégation.
A l’issue de cette étape, une nouvelle fenêtre s‘ouvre (outil de visualisation des données) permettant d’effectuer une sauvegarde du résultat.
Il est possible de vérifier et optimiser certains paramètres : distribution des erreurs de masse sur le précurseur, le FDR, la E value… Penser à appliquer le filtre concernant les « contaminants » (sélectionner la banque de données « contaminants » et applique.
A modifier à volonté les paramètres disponibles et sauvegarder les modifications avant l’étape suivante d’export des données

### Export des données
A partir de l’interface précédente, effectuer les opérations d’export (File > Export files) des données (Spreadsheet). Attention dans le cas de données de grande taille, préférer l’export « write TSV files in a directory ».
Créer également un fichier de paramétrage MassChroQ (File > MassChroQ). Vérifier les options de détections de pic qui doivent être adapté à l’instrument (0/1/1/50/30 pour le TIMS, 1/3/2/5000/3000 pour le Lumos, 2/4/3/50000/30000 pour le Q-Ex ; il est impératif de faire une vérification manuelle pour chaque nouvelle série de donnée à partir de l’interface de visualisation des données). XIC = 20 ppm. Alignement 10/15/0. Sauvegarder ce fichier.
Ouvrir le fichier sauvegardé (avec un éditeur de texte) et vérifier les paramètres de détection de pics. Ajouter une ligne (rendre la ligne exécutable) de commande dans le champ « <quantification_results> » : « <peak_shape output_dir="votre_répertoire"/>
Il est également possible de modifier la valeur de min_abundance pour aller jusqu’à 0.99 au maximum (0.95 est une valeur intermédiaire standard)
Dans le champ « quantify » Sélectionner le fichier de paramétrage précédemment modifié dans l’interface « MassChroQ GUI », modifier le nombre de CPUs(8) et lancer l’export (Start MassChroq).

### Extraction des fichiers supports
Utiliser le script Additional_files_extraction.R

### Formatage des données extraites
Utiliser le script R « Main-script.R » pour procéder à l’extraction et au formatage des données.
Le script requière de définir un certain nombre de paramètres  plus ou moins définit et variable dont la localisation des données brutes.