目次
データに関する説明
Orbit NGとQP(Orbit 1.9.8) 検索エンジンの数としての差異は微差ですが、 これら2つの検索エンジンは同じものではなく、データもまったく同じではないため、微妙に異なる結果をなぜもたらすのかを説明します。
旧バージョン QPと新バージョン NG(Elasticサーチ)によるデータ索引付けは厳密に同一ではありません:
- QP 内では、FULLTEXTデータベースでは公報が提供元から届き次第Orbit Intelligenceに掲載されていました。FAMPATのファミリーとFULLPATの出願データは、週に一度(日曜日)、データ構築が行われると更新されていました。一方、Orbit NG(Elasticサーチ)では、すべての公報/出願/ファミリーが同時にデータ投入され、更新されます。これにより、3つのコレクションの同期更新が簡素化され、以前よりも高速になりました。
- このプロセスの直接的な結果として、火曜日とその翌日には、Elastic Search(Orbit NG)で検索すると、旧バージョン(QP)で検索した場合よりも多くの検索結果が得られることになります。
- メンテナンスとバグ修正などは新バージョンのElastic Searchのコレクションに適用され、常にQPデータベースに適用されるわけではありません。
- このような改善措置により、相当数の文書の更新がない、その差がほとんどない場合は、QPデータの更新を行わず、齟齬が生じないようにし、より長期間の運用を確保します。
エイリアスと検索フィールドの違い
エイリアスとは、現在の検索フィールドの多くを置き換える検索フィールドのことで、各フィールドに命名することを回避できます。以下に影響のあるエイリアスのリストと、以前/現在の動作を示します:
- /IPC と /CPC
- QPでは、これらのエイリアスは現在および過去のすべてのIPCコードを検索していました。
- Orbit NG(Elasticサーチ)では、/CPCと/IPCは現在の分類コードのみを検索するため、エイリアスによる置き換えがなくなりました。分類の履歴を含めるには、/ICH と /CPCH フィールドを明示的に追加してください。
- /DESCと/CLMS
● QPでは、すべての詳細な説明(すべての言語で)とすべての請求項(すべての言語で)を検索していました。
- 現在ES(Orbit NG)では、“オリジナル言語の” 請求項と詳細な説明(非ラテン語の場合)は、/DESC/CLMSの索引の一部ではなくなりました。この場合、/OCLMや/ODESのような該当フィールドを明示的に追加して検索してください。
F演算子の違い
F演算子は同じフィールド内を検索することができます。 旧バージョン QPでは 、
"Usb "と "Key "がタイトルまたは要約に同時に存在する文書を検索します。
しかし新バージョンOrbit NGでは、この演算子は少し違った働きをします:
- QPでは、SDOC演算子に基づいて、同じ公開段階内で検索を行っていました。
- ES(Orbit NG)では、F演算子は、ファミリー/出願の異なる公開段階間で同じフィールド内を検索します。以前の動作を踏襲する必要がある場合は、99DまたはP演算子に置き換えてください。
SおよびP演算子の違い
F演算子で検索される動きがわずかに変わったことに伴って、S演算子やP演算子も、主に新バージョンES(Orbit NG)での文章や段落の構造によって進化します:
- エラスティック サーチの文章のルール制限により、検索語の数は200語までに制限されます。さらに、段落は 20,000語までのかたまりとして定義されます。これらの数値を超えると、各構造は2つに分割、または文や段落を充足するのに必要な数に分割されます。そのため、検索された2つの単語が上記の制限を超える語数で区切られている場合、QPモードでは文書が見つかり、ESモードでは見つからないことがあります。
- 2つ以上の単語がSまたはPと組み合わされる場合、例えば以下のようになります:
- QPでは、まずUsbをkeyと同じ文章で検索し、次にKeyをKeyboardと同じ文章で検索します。
- ESでは、すべての用語が同じ文の一部でなければヒットしません。
DおよびW演算子の違い
新バージョンでの演算子DとWは、上述のほかの演算子同様に文章と段落の構造を尊重します。
例えば、
という構文は、KeyがUsbの後ろにあったり、Usbという単語が別の文の頭にある場合、たとえ文書を読んだときにこれらの単語が近かったとしても、検索できません。
200語の文章構造は、特別に長い文章に影響があるかもしれません。とはいえ、主な違いは単語間の距離計算にあり、例えば次のような検索がります。
QPでは、演算子SとPで説明したように、この場合2回検索され、KeyとUsbが1語で区切られるところと、それからUsbとKeyboardを最大3語まで区切られるところをもう1回検索します。
ESでは、この3つの単語が 4つの単語(1+3)で区切られる場所を検索します。
QP検索を模倣するには、次のように括弧を入れなければなりません: