特許検索に関するあれこれ その6~最終章 いざ、人海戦術~

特許検索に関するあれこれ その5の続きです。

⑥FI、Fタームの絞り込みを見極める が終わったら

⑦最終的な検索式を抽出件数に基づいて確定する。

いよいよ、最終的な検索式を決定し、その検索結果として抽出された文献を読んで調査を実行する段階、人海戦術の段階です。

1.読む件数を決めておく

ここで一つ重要な事です。

「何件の特許文献を読めますか?」

この「読めますか?」という問いは、「読む気力がありますか?」でも、「読む時間がありますか?」でもいいです。

前回の作業でも多少触れましたが、いくらでも時間をかけられるのであればたっぷり時間をかけて沢山の文献を読めばいいです。
それこそ、今回の「最終的な検索式の決定」の作業等不要で、前回の作業の途中の3000件以内に絞られた段階のものをすべて読んでいけばいい。

しかし、実際にはそうはいきません。
依頼を受けて調査を行うのであれば、依頼料に対して見合った時間で作業を完了させなければ商売あがったりです。
依頼者が調査結果を必要としている期限もありますし、会社員だとしても1つの仕事を延々とやっているわけにはいきません。

だからこそ、「マックスで何件の文献を読む」と予め決めておき、その件数に収まる様なヒット件数になるように検索式を定める必要があります。
他方、ヒット件数ありきで検索式を定めるというのは、「適切な検索式を設定し、抽出された文献を調査する」という本来の趣旨からすれば間違っていることは明白ですね。

この相反する要因の間でバランスの取れた検索を行うための作業が、最終的な検索式の決定です。

以下では、「マックスで300件の文献を読む」という前提で書きます。
ここでの件数は、「許されている時間」に応じて変わりますが、ここまで来た段階で300件の文献を読む時間が取れないのであればそもそも仕事として成立していないかな、、、なんて。

2.FI、Fタームによる絞り込みの確定

前回までの作業により、
・漏れの可能性の低いFIの階層
・漏れの可能性の低いテーマコード、Fタームの設定

この2つを確定させることができました。

まずは、この2つだけを検索条件として設定して検索を行ってみます。

その結果、抽出件数が300以内であれば、その300件をすべて読んでしまえばいいです。
逆に、抽出件数が極端に少なくなるようであれば、

・FIの階層を上位に調整したり、
・Fタームを増やしたり、
・Fタームの指定をやめてテーマコードのみにしたり、
・テーマコードの検索条件から外したり、

色々と調整して抽出件数を増やしてもいいと思います。

3.キーワード検索の調整

FI、Fタームによる絞り込みでは300件以下の妥当な件数にならない場合には、やはりキーワードでの絞り込みを行います。
キーワードでの絞り込みにおける調整ポイントは

・orで入れる類語の数の調整
・検索対象の調整
・新たなand条件キーワードの追加

の3点です。

・orで入れる数の調整

キーワードでの検索に際しては、「顔、表情、フェイス、頭、人」のように、一つの言葉に対して類語をor条件で入れていきますが、その類語を削っていくという作業です。

え、いいの?

と思いますよね。
でも絞れないのだから仕方がない。
現実的な調査を行うために、キーワードを削ります。

が、ここでも考えなければいけません。
例えば、今回で言えば「顔認識」が主題であるにも関わらず「顔」を削る事は絶対にNGでしょう。
では何を削ればいいのか、これはヤマ勘ではだめです。

そのために、前回の作業の中でやっておかなければいけない事がありましたが、書き忘れていました。

3000件以内に絞って関連性のありそうな文献をピックアップしていく中で、ピックアップした文献中では、今回の主題である「顔認識」が説明されている文章中の「顔」を指す言葉がどんな言葉になっていたかを見ておきます。

ある文献では「顔」でしょうし、他の文献では「表情」という言葉かもしれません。
また、まったく別の言葉で表現されている場合もあるでしょうから、そういう場合にはその言葉をor条件として追加しなければいけません。

そうやって、「どんな言葉が使われているか」を調べ、「言葉の優先順位」を付けていきます。

その結果、

1位 顔
2位 表情
3位 フェイス
4位 頭
5位 人

という順位になったとします。
そうなれば簡単、5位の「人」から順番に削っていき、抽出件数が300件以内になるかを見ていきましょう。

ただし、ピックアップした文献の中で「人」が用いられている文献がごく少数あり、かつその文献の関連性が高いような場合、その言葉を削るか否かが考えものです。
その文献自体は既にピックアップできており、これ以外にその言葉で引っかかる文献は無いだろうと判断して「人」を削るのか、関連性の高い文献をひっかけた言葉として残しておくのか、その辺の判断は調査で抽出される文献の空気を読みながら判断する必要があります。

・検索対象の調整

キーワード検索を行う場合の検索対象は「全文」「要約/抄録」「請求の範囲」「発明・考案の名称/タイトル」「審査官フリーワード」「審査官フリーワード+全文」といったところから選択することとなります。

当然ながら、「審査官フリーワード+全文」や「全文」は、検索対象が文献全体ですので、ヒット数が最も多くなります。

「要約/抄録」「請求の範囲」「審査官フリーワード」に関しては、どっちがより多くの言葉を含むとは一概に言えないので、適宜使い分ける事になりますが、「要約/抄録」が一番妥当だと思います。

「発明・考案の名称/タイトル」に関しては、日本国内出願の場合にはほとんど役に立ちません。

私は基本的には「要約/抄録」でやりますが、ヒット数が少ないという特殊な場合には「全文」や「審査官フリーワード+全文」を使ったりします。
構造的にFIやFタームと同じ話ですが、「審査官フリーワード」の精度が上がっていくといいですね。

・新たなand条件キーワードの追加

これまでの作業では、「入力された画像に含まれる人間の顔を認識して自動的にシャッターを切る」という技術に関連する文献を抽出するため、「顔」「認識」「シャッター」という言葉とそれぞれの類語を設定していました。
しかしそれでは絞り込みが不十分となれば、新たなキーワードをand条件で入れていくしかありません。

文章を見比べると、「自動」という要素が抜けていることに気づきます。
というわけで、「自動」という言葉をand条件で追加することにより、更なる件数の絞り込みを図ります。
この際、自分で考えた類語や、既にピックアップできている文献での記載に基づいてorで入れるべき類語を設定します。

こんな感じで、可能な限り重要文献が漏れないように色々と検索条件を調整し、例えば300件以下などの読む上で妥当な件数になったら人海戦術スタート。ガンガン読んで、関連するものはピックアップして、ピックアップした文献に基づいてレポートを書く。

お仕事終了!

あ、請求書を書くまでがお仕事だった。

というわけで、自分自身の確認のためも兼ねて全6回にわたって書いてきました特許検索のノウハウシリーズ。
このノウハウは比較的AIによる自動化に適したノウハウだと思っています。
ですので特許検索の仕事がAIに奪われてしまう日はいつか来るでしょう。

では、弁理士の仕事が減るのか?
そんな事は無いですね。

まず、300件以下に絞ってからの部分。つまり全部読んで関連する文献をピックアップしていく部分。
ここの自動化は無理ではないでしょうが、かなり先の話だと思います。
3000件に絞ってとりあえず関連する案件をピックアップする部分も同様。
ですので、ノウハウの部分はAIによる自動化ができても、それを利用する知識を持った弁理士は当面必要です。

更に、そのピックアップがAIによって自動化できたとしても、最後のレポートを書く部分です。
この部分がAIによる自動化に適しているとは現状思えません。

無効引例調査や、登録可能性調査ならばまだ可能性は感じますが、ビジネス上の特許クリアランス調査となるとかなり難しいでしょう。

つまりAIによる特許調査の進歩は、弁理士にとって便利な世の中の到来にこそなれ、弁理士の仕事が奪われるような事態には当面ならない、という結論で今っぽく締めくくっておきたいと思います。

っていうか、まともな特許調査ができる弁理士なんてほとんどいねぇんだから、AIが特許調査できるようになったって仕事を食われる弁理士なんてほとんどいねぇってことだよ!

特許検索に関するあれこれ その6~最終章 いざ、人海戦術~” への1件のフィードバック

コメントを残す

メールアドレスが公開されることはありません。