Comment lire vos résultats OBS ?

Modifié le Mar, 12 Avr., 2022 à 5:00 H

TABLE DES MATIÈRES

Vérifiez vos résultats et les séquences recherchées
Si aucun résultat n'est trouvé, vérifiez vos paramètres de recherche
Affinez vos résultats avec les filtres d'Identité
Le bon pourcentage (%) d'identité est...
Autres filtres à considérer
En savoir plus sur les colonnes et l'affichage spécifiques à OBS
L'onglet alignement : un affichage puissant des séquences

Vérifiez vos résultats et les séquences recherchées

Lorsque vous lancez une requête OBS, vous devez définir un nombre maximum de séquences uniques. Comme vous ne connaissez jamais combien de résultats vous pourriez avoir, a priori, vous pouvez laisser le nombre par défaut ou le fixer un peu plus haut, par exemple à 500. Une fois les résultats calculés, vous devez vérifier si ce nombre était correct. Pour le vérifier, allez à la dernière page et vérifiez les plus mauvais résultats. Si ceux-ci sont inférieurs à ce que vous considérez comme bon, alors vous devriez avoir les résultats que vous souhaitez. Si les plus mauvais résultats sont encore assez bons, vous devez relancer votre requête OBS et augmenter le nombre maximal de résultats de séquences uniques.
Plus d'infos sur : Comment rechercher une séquence

Si aucun résultat n'est trouvé, vérifiez vos paramètres de recherche

C'est toujours inquiétant, en effet. Ai-je 0 résultat parce que ma séquence ou mes paramètres ne sont pas corrects ou, est-ce qu'il y a vraiment 0 résultat (ce qui est généralement une bonne nouvelle pour vous !). Si vous avez effectué une recherche MOTIF, il y a souvent une réelle possibilité d'obtenir 0 résultat car votre motif est peut-être trop restrictif. Vous pourriez vouloir l'assouplir un peu pour vérifier que vous ne vous trompez pas. Si vous avez effectué une recherche blast avec une séquence très courte, cela peut être dû à la configuration. Pour les séquences d'ADN très courtes (comme une amorce de 10 résidus) ou une CDR particulièrement courte (5 acides aminés par exemple), vous devez sélectionner le drapeau "séquences d'entrée courtes" et augmenter la valeur de E maximale à son maximum (5M). Ce sont des erreurs courantes. En cas de doute, notre merveilleuse équipe de support est toujours là pour vous aider.

Plus d'infos sur : Biosequence : Recherche MOTIF

Affinez vos résultats avec les filtres d'Identité

Définissons d'abord ce que signifient les pourcentages d'identité. Un pourcentage d'identité est toujours calculé par rapport à un item, que cela soit la requête, le sujet ou l'alignement. Ainsi, le pourcentage d'identité de la requête est le pourcentage de résidus de la requête qui correspondent. De même pour le sujet et l'alignement. Notez que cela peut sembler un peu étrange si on considère les gaps. Par exemple, une requête où tous les résidus correspondent, mais où des gaps sont introduits dans la séquence de la requête, donnera toujours une correspondance de 100% des résidus de la requête. Ainsi, une identité de requête de 100% ne signifie pas qu'une séquence parfaitement identique est trouvée.

Alors, lequel utiliser ? Disons que vous voulez trouver des séquences de sujets similaires à votre ou vos requêtes. Dans ce cas, vous pouvez fixer le % d'identité de la requête et du sujet à une valeur élevée, par exemple 80. Cela garantira que tous vos résultats seront très proches, c'est-à-dire que les requêtes et les sujets seront très similaires les uns aux autres. Un autre cas est celui où vous avez une ou plusieurs requêtes courtes et que vous voulez les intégrer dans les séquences du sujet (pensez aux CDR et aux chaînes). Dans ce cas, vous voudrez définir uniquement le % d'identité de la requête.

Le bon pourcentage (%) d'identité est...

Malheureusement, et cette question est souvent posée, il n'y a pas de bonne réponse à cette question. Certains brevets revendiquent des séquences présentant une identité de 70%, d'autres de 90%. Si les séquences sont très courtes, le nombre de mésappariements ou certaines substitutions spécifiques sont mentionnés ou revendiqués. En général, une identité de 80% par rapport à la requête ou au sujet est généralement considérée comme un bon pourcentage d'identité, mais là encore, cela peut varier d'un cas à l'autre.

Autres filtres à considérer

Voici une liste d'autres filtres et de leurs utilisations :

Nombre d'erreurs
- Il s'agit du nombre d'erreurs dans l'alignement, les erreurs étant les non-concordances et les gaps. Il peut être utilisé pour contrôler la qualité de l'alignement avec plus de finesse.
Nombre de gaps
- Lorsque l'on veut séparer les alignements gapped des alignements non-gapped.
Limiter aux revendications
- Seules les séquences revendiquées seront affichées en tant que résultats.
Nom de la query
- Lorsque vous utilisez plusieurs séquences de requêtes, le fait de sélectionner tous les noms de requêtes ou certains d'entre eux ne fera apparaître que les familles pour lesquelles toutes les requêtes sélectionnées ont des occurrences. Ceci est particulièrement utile lorsque l'on veut trouver des familles qui ont des occurrences avec tous ses CDRs.
Subject length and alignment length
- Ces filtres s'appliquent à la longueur du sujet ou de l'alignement. On utilise ces filtres pour contrôler les sujets longs (pensez aux sous-séquences génomiques) ou les alignements très longs qui peuvent se produire avec la recherche MOTIF.
Organisme
- Nous normalisons les noms d'organismes liés aux séquences des brevets jusqu'à un certain point. Bien que ce système ne soit pas parfait, il permet un contrôle plus fin des séquences alignées.

En savoir plus sur les colonnes et l'affichage spécifiques à OBS

Il y a 7 colonnes spécifiques à OBS qui peuvent être affichées à côté des colonnes de FAMPAT (Title, Applicant, ...). Le menu "Afficher" (à côté de l'icône de l'imprimante et au-dessus des lignes de la famille) contrôle quelles colonnes sont affichées. Notez que ces chiffres ne sont calculés qu'une seule fois lorsque vous ouvrez vos résultats. Tout filtrage ultérieur ne modifiera pas ces chiffres statiques.

Best %QID
- Le plus grand pourcentage d'identité par rapport à la requête pour cette famille
Claimed seq.
- Oui ou non : une séquence de sujet hit est-elle revendiquée ?
Uniques seq. hits
- Le nombre de séquences uniques qui constituent un hit
Longest Alignement
Nb queries w/ hits
- Si vous utilisez plusieurs requêtes, le nombre de requêtes qui ont des occurrences dans cette famille, sinon c'est 1.
Nb pubs w/ hits
- Nombre de publications différentes de la famille qui ont des occurrences.
List of queries w/ hits
- Les noms des requêtes qui ont retrouvé dans la famille.
  
  L'onglet alignement : un affichage puissant des séquences
  L'onglet d'alignement de droite est recalculé dynamiquement en fonction des filtres que vous avez utilisés. Il montre les informations d'alignement sur la famille actuellement en surbrillance.
  Il montre d'abord les requêtes avec des résultats positifs, puis les publications de cette famille avec le nombre de résultats positifs par publication et le nombre total de séquences connues dans cette publication.
  Après ces en-têtes, le nom de la requête est visible. Vous pouvez cliquer sur le petit triangle à sa gauche pour ouvrir et fermer tous les alignements suivants relatifs à la requête ; par exemple, pour voir les autres occurrences de la requête.
  La zone d'alignement commence par une "séquence" et une liste de publications et de SEQ ID NO. Cette séquence est commune, dans cette famille, à toutes les combinaisons de publications et de SEQ ID Nos listées. En cliquant sur le mot séquence, une petite fenêtre s'ouvre avec la séquence brute.
  Les alignements sont présentés sous deux formes, une représentation graphique et, en cliquant sur "Détails", l'alignement textuel traditionnel. La représentation graphique montre beaucoup d'informations de la manière la plus agréable possible. Elle inclut la taille des séquences de la requête et du sujet, le début et la fin de l'alignement, les cadres ou les brins (FW pour le complément avant, REV pour le complément arrière, -3 à +3 pour les cadres du complément avant et arrière) ainsi que le nombre d'erreurs et de correspondances, et les scores d'effacement et les valeurs électroniques. Notez que les coordonnées sont toujours les coordonnées de la séquence originale, même lorsque la séquence est utilisée dans un cadre spécifique.
  L'alignement détaillé est plus textuel et est suivi de plus de caractéristiques d'alignement (nombre de gaps, ...) et de quelques détails sur chaque version publiée comme le statut de la demande, l'organisme.
  Plus d'infos sur : Comment lire vos alignements ?
  
  Enfin, n'hésitez pas à demander à notre équipe de support (help@questel.com) en cas de doute.Créer un dossier