配列をモチーフで検索できます。 CDR配列の基、特定のペプチドパターン、またはSNPの検索がこれまでになく簡単になりました。


Motif の書き方ルール

具体的に次の書き方があります:

  • 文字と文字が一致するもの(以下のあいまい検索も使えます)
  • .(ドット)任意の文字に置き換え

  • ?前のエンティティが 0回または1回 

  • * 前のエンティティが 0回またはそれ以上

  • +前のエンティティが 1回以上

  • [ ] 代替文字列を含む

  • [^]は、^の後のどの文字とも一致しない(含まない)ことを意味します

  • ( )エンティティをまとめる

  • (|)置き換え

  • {n} nには数値を入れてください。 前のエンティティがちょうどn回一致する 

  • {n、m} nとmには数値を入れてください。 少なくともn回、最大でm回の前のエンティティ。 nまたはmは空でもよく、任意の数にすることができます。 {1,5}:1〜5回。

  • ^ は^に続くもので始まる必要があります:^ ATC:ATCで始まる必要があります

  • $ は$で止まるの意

  • DNAとアミノ酸のあいまいな文字が完全に展開されています。 たとえば、DNAのあいまいコードB(Aを除くすべてを意味する)は[BCGTU]に展開され、TとUは[TU]…に展開されます。

検索例:


代替アミノ酸を使用したシンプルなモチーフ検索:

[EK]FWEVISDEHGIDPS


間にスペースがある3つのCDR検索:

SYWMY.*RIDPNSGSTKYNEKFKN.*DYRKGLYAMDY

注:*は、文字なしを含むすべてのスペースを意味することにご留意ください。


代替3塩基(そのうちの1字は任意です)で始まり、1〜4個のHまたはWを含む:

^(DYR | SYW | W.W)EVISDE [HW] {1,4} GID


完全一致の配列(^始まり、$終わり)検索:

^RIDPNSGSTKYNEKFKN$


変異のリスト検索:S24G、S33T、S53G、S78N、S101N、G128AおよびL217Q

> motif_WT

^.{23} S.{8}S.{19} S.{24} S.{22}S.{26}G.{88}L

> motif_MUT

^.{23}G.{8}T.{19}G.{24}N.{22}N.{26}A.{88}Q

> motif_BOTH

^.{23}[SG].{8}[ST].{19}[SG],{24}[SN].{22}[SN].{26}[GA].{88}[LQ]


モチーフ検索はどんなときに有用か?

モチーフ検索が有用な使用例を挙げています。

  • 非常に短いシーケンスを使用するとき:Blastは4残基より短いアミノ酸配列を使用できません。 したがって、3アミノ酸配列で検索するには、モチーフ検索を使用する必要があります
  • 配列が完全一致する例を探していますか? その場合はモチーフ検索を使用して、配列の最初に^を追加し、最後に$を追加するだけでOKです。
  • 同様に、検索配列に完全一致するもの、またはより大きな配列に検索の配列が含まれている例を探している場合は、クエリの配列をそのまま使用してください。