配列をモチーフで検索できます。 CDR配列の基、特定のペプチドパターン、またはSNPの検索がこれまでになく簡単になりました。


Motif の書き方ルール

ルールは広範ですが、具体的に次のものがあります:

  • 文字そのものと一致する文字(曖昧文字が展開される)
  • .(ドット)任意の文字

  • ?前のエンティティ 0回または1回

  • * 前のエンティティ 0回またはそれ以上

  • + 前のエンティティ 1回以上

  • [ ] 代替文字のリストを含む

  • [^]は、^の後のどの文字とも一致しないことを意味します

  • ( )エンティティをグループ化する

  • (|)置き換え

  • {n} nには数値を入れてください。 ちょうどn回一致する前のエンティティ 

  • {n、m} nとmには数値を入れてください。 少なくともn回、最大でm回の前のエンティティ。 nまたはmは空でもよく、任意の数にすることができます。 {1,5}:1〜5回。

  • ^ は^に続くもので始まる必要があります:^ ATC:ATCで始まる必要があります

  • $ は$で止まるの意

  • DNAとアミノ酸のあいまいな文字が完全に展開されています。 たとえば、DNAのあいまいコードB(Aを除くすべてを意味する)は[BCGTU]に展開され、TとUは[TU]…に展開されます。

検索例:


代替アミノ酸を使用したシンプルなモチーフ検索:

[EK] FWEVISDEHGIDPS


間にスペースがある3つのCDR検索:

SYWMY.*RIDPNSGSTKYNEKFKN.* DYRKGLYAMDY

注:*は、文字なしを含むすべてのスペースを意味することにご留意ください。


代替3塩基(トリプレット、そのうちの1つはあいまいです)で始まり、1〜4個のHまたはW:

^(DYR | SYW | W.W)EVISDE [HW] {1,4} GID


完全一致の配列(^で始まり、$で終わる)検索:

^ RIDPNSGSTKYNEKFKN $


変異のリスト検索:S24G、S33T、S53G、S78N、S101N、G128AおよびL217Q

> motif_WT

^.{23} S.{8}S.{19} S.{24} S.{22}S.{26}G.{88}L

> motif_MUT

^.{23}G.{8}T.{19}G.{24}N.{22}N.{26}A.{88}Q

> motif_BOTH

^.{23}[SG].{8}[ST].{19}[SG],{24}[SN].{22}[SN].{26}[GA].{88}[LQ]


モチーフ検索はどんなときに有用か?

モチーフ検索が有用な使用例を挙げています。

  • 非常に短いシーケンスを使用するとき:Blastは4残基より短いアミノ酸配列を使用できません。 したがって、3アミノ酸配列で検索するには、モチーフ検索を使用する必要があります
  • 配列が完全一致する例を探していますか? その場合はモチーフ検索を使用して、配列の最初に^を追加し、最後に$を追加するだけでOKです。
  • 同様に、検索配列に完全一致するもの、またはより大きな配列に検索の配列が含まれている例を探している場合は、クエリの配列をそのまま使用してください。