SeqinR
Seqinr : Sequence Biologiques sous R
Google
AccueilseqinrlistEnseignementsTelechargementsRwebDocumentationGallerieCVS

Accueil seqinr

Le package seqinR pour R est une librairie de fonctions pour retrouver et analyser les séquences biologiques. Elle propose une interface entre :
  1. le langage et l'environement R pour les calculs statistiques et la représentation graphique et
  2. le systême ACNUC (Gouy et al., 1985), un logiciel de requêtes multicritères pour les bases de données de séquences nucléiques et protéiques comme EMBL, GenBank, SWISS-PROT.

ACNUC permet de:
  • sélectionner des séquences à partir de nombreux critères.
  • traduire des gènes codant pour des protéines en protéines.
  • d'extraire des séquences sélectionnées dans des fichiers.

ACNUC permet d'accéder directement aux régions codantes (e.g. les régions codant pour des protéines, des tRNA ou des rRNA ) des séquences d'ADN présentes dans GenBank ou EMBL.

Grace à un langage de requêtes simple, il est donc facile de sélectionner des séquences d'intéret sous R puis d'utiliser toute la puissance de l'environement R pour les analyser. Les bases de données ACNUC peuvent être installées localement mais il est plus simple d'y accéder via un serveur web pour bénéficier des mises à jour quotidiennes.

seqinr est aussi accessible sur R-forge: https://r-forge.r-project.org/projects/seqinr/