目次


検索結果および検索された配列の確認


OBSを起動する際、ユニークな配列の数を最大数として設定する必要があります。 先験的にどれだけの結果が得られるか分からないので、デフォルトのままでもいいですし、少し設定して例えば500でもいいでしょう。 結果が計算されたら、その数が正しいかどうかを確認する必要があります。 それを確認するために、最後のページに行き、最悪の結果をチェックします。 それらが、あなたが良いと思う数値以下であれば、あなたが望む結果が得られているはずです。 最悪の結果がまだ十分なものであれば、OBSの実行を再度開始し、ユニークな配列結果の最大数を増やす必要があります。


詳しくは、配列の検索方法についてをご覧ください。


結果が出ない場合は、検索方法を確認してください


結果が出ないとさすがに心配になります。自分の配列やパラメータが正しくないから結果が0なのか、それとも本当に0なのか(結果が本当に0ならば普通は良いニュースですが)。MOTIF検索を行った場合、モチーフが限定的すぎるため、結果が0になる可能性があります。 モチーフを少し緩めてみて、間違っていないことを確認するとよいでしょう。 非常に短い配列でBlast検索を行った場合、セットアップに起因する可能性があります。 非常に短いDNA配列(10残基のプライマーなど)や、特に短いCDR(例えば5アミノ酸長)の場合は、「short input sequences」フラグを選択し、Max E値を最大値(5M)にする必要があります。 これらはよくある間違いです。 疑問がある場合は、私たちの素晴らしいサポートチームがいつでもお手伝いします。


詳しくはBiosequence: MOTIF searching


Identityフィルターで結果を絞り込む


まず、パーセント同一性の意味を定義していきます。 パーセント同一性は常に何かに対して計算され、その何かとはQuery、SubjectAlignment です。 つまり、クエリのパーセント同一性 は、クエリ残基が一致する割合となります。 同様に、SubjectとAlignmentについても計算されます。 ギャップがある場合、これは少し不思議な結果に見えるかもしれないことに注意してください。 例えば、全ての残基が一致するクエリでも、クエリ配列にギャップがあると、クエリの残基の100%が一致することになります。 このように、クエリの同一性が100%だからといって、完全に一致する配列が見つかるわけではありません。


では、どちらを使うべきなのでしょうか? 例えば、一つのqueryまたは複数のクエリーに類似した対象配列を見つけたいとしましょう。 この場合、queryとsubjectのパーセント同一性を共に高い値、例えば80に設定することができます。これにより、すべてのヒットが非常に近いもの、つまり、queryとsubjectが互いに非常に類似していることが保証されます。 もう一つのケースは、1つまたは複数の短いクエリがあり、それらを対象の配列(例えばCDRや鎖を想定)に埋め込みたい場合です。 この場合、% query identity のみを設定することになります。


良い割合(%)のアイデンティティ=同一性とは...


残念ながら、これはよく聞かれる質問ですが、この質問に対する良い答えはありません。 ある特許は70%の同一性かもしれませんし、ある特許は90%の同一性かもしれません。 配列が非常に短い場合は、ミスマッチの数や特定の置換の数が言及されたり、クレームされたりします。 大まかに言えば、クエリや対象に対して80%のidentityがあれば、一般的に良い割合と考えられていますが、これもケースバイケースでしょう。


その他のフィルターについて


その他のフィルタとその用途を紹介します。


 エラー数

-  これはアライメントにおけるエラーの数で、エラーとはミスマッチやギャップのことです。 アライメントの品質をより細かく制御するために使用することができます。


 o ギャップ数

-  ギャップがあるアライメントとないアライメントを分けたい場合。


 o 請求項に制限

-  請求項に記載された配列のみがヒットとして表示されます。


o  クエリー名

-  複数のクエリー配列を使用している場合、全てまたは一部のクエリー名を選択すると、選択した全てのクエリーがヒットするファミリーのみが表示されます。 これは、対象のCDR全てにヒットするファミリーを見つけたい場合に特に有効です。


o  subjectの長さとalignmentの長さ

-  これらのフィルタは、subjectやアライメントの長さに適用されます。 MOTIF検索で発生する長いサブジェクト(ゲノムの部分配列など)や非常に長いアラインメントを制御するために使用します。


o  生物

-  ある時点までの特許の配列に紐づく生物名を、正規化しています。 完全なシステムではありませんが、配列アラインメントをより細かく制御することができる。


詳しくはBiosequence specific filtersをご覧ください。



OBS固有のカラムと表示についてはこちら


FAMPAT のカラム(Title, Assignee, ...)の隣に表示できる OBS 独自のカラムが 7 つあります。 ファミリー行の上にある「表示」メニュー(プリンターマークの隣)で、どのカラムを表示させるかを制御します。 なお、これらの数値は、結果を開いたときに一度だけ計算されます。 その後のフィルタリングでは、これらの静的な数値は変更されません。


- ベスト%QID


o このファミリーのクエリに対する最大の同一性保持率


- Claimed seq.


o Yes or no: ヒットした主題配列がクレームされているか?


- ユニークseq.ヒット


o ヒットしたユニークな配列の数


- 最長アライメント


- ヒットしたクエリの数


o 複数のクエリを使用した場合、このファミリーでヒットしたクエリの数。


- Nb pub.ヒット数


o ヒットを持つファミリーの異なる出版物の数。


- ヒットしたクエリのリスト


o ファミリーでヒットしたクエリの名前。



アライメントタブ:配列のパワフルな表示


右側のアライメントタブは、使用したフィルターによって動的に再計算されます。 現在ハイライトされているファミリーのアライメント情報が表示されます。


最初にヒットしたクエリーが表示され、次にこのファミリーの出版物、出版物ごとのヒット数、この出版物で知られている配列の総数が表示されます。


これらのヘッダに続いて、クエリ名が表示されます。 その左側にある小さな三角形をクリックすると、そのクエリに関連する以下の全てのアラインメントを開いたり閉じたりすることができます(例えば、他のクエリのヒットを見る場合など)。


アラインメントエリアは、「配列」、出版物のリスト、SEQ ID NOから始まります。 この配列は、このファミリーにおいて、リストされたすべての出版物とSEQ ID Nosの組み合わせに共通するものである。 配列という言葉をクリックすると、生の配列が表示された小さなウィンドウがポップアップします。


アラインメントは2つの形式で表示されます。グラフィカルな表示と、「詳細」をクリックすると、従来のテキストによるアラインメントが表示されます。 グラフ表示では、多くの情報を可能な限り美しく表示することができます。 クエリー配列とサブジェクト配列のサイズ、アライメントの開始点と停止点、フレームまたはストランド(FWは順方向、REVは逆方向の補集合、-3から+3は順方向と逆方向の補集合フレーム)、エラー数とマッチ数、BlastスコアとE値が含まれます。 なお、座標は特定のフレームで使用されている場合でも、常に元の配列座標となります。


詳細アライメントは、よりテキストに近く、アライメントの特徴(ギャップ数、...)や、クレーム状況、生物など、各公開バージョンの詳細が続きます。


詳しくは、アラインメントの読み方をご覧下さい。