【イベントレポート】J-PlatPatによる特許検索講座&パフォーマンス

こんなイベントを開催してみました。

結果的にとても楽しいイベントにはなったものの時間の見通しや段取りが甘く、予定の2時間を経過してもまだまだ先は長くて次々と参加者が脱落していくという、反省点も多い結果となりました。
今後に活かすためにもイベントをレポートしてみようと思います。

1.検索テーマヒアリング

まずは、当日参加していただいたエンジニアの方に、検索してみたい特許の内容をヒアリングします。

今回は参加者のうち3人の方がテーマを提供してくださいましたが、中でも

【問題意識】
 暗号化された文書をメールで送る際、パス付zipで2通目にパスワードを送るやり方は良くない S/MIMEもハードルが高い
【内容】
 pgpを使う
送信者も受信者もウェブサービスにログイン済み
送信者
 ブラウザ上で相手の公開鍵で暗号化する
 サーバーに暗号化ファイルを置く、
 受信者を指定する
受信者
 指定の通知を受ける
 暗号化ファイルをダウンロードして、ブラウザ上で受信者の秘密鍵で復号する

こんな感じでヒアリングした内容を検索対象のテーマとしました。

2.検索テーマ具体化

検索するにしても検索対象が具体的にまとまっていないと進みません。
上記のような仕様が列挙された状態では、何を検索すればいいのかが曖昧ですので、ヒアリングした内容に基づいて、検索する技術の内容をまとめた一文を作成します。

今回は、下記のような文章にまとめました。

 サービスにログインした状態で、同じくログインした受信者を指定し、クライアント側で相手の公開鍵で暗号化したファイルをサーバにアップロードし、受信者としての通知を受けた相手側が暗号化ファイルをダウンロードして、クライアント側で自身の秘密鍵で復号する技術

3.足がかり抽出

検索テーマを具体化した一文を作成したら、その文章に基づいてざっくり検索するためのワードを抜き出します。

今回は、最初に「公開鍵」「秘密鍵」「ログイン」「クライアント」というワードを選択し、要約/抄録を対象としてすべてand条件にして検索してみました。

その検索結果は2件

どちらも関連性の薄い文献だったので、やり方を変えます。
次は、「公開鍵」「秘密鍵」「ファイル」「共有」というワードを選択し、要約/抄録を対象としてすべてand条件にして検索してみました。

その結果は7件

各文献を読んでみると、
特開2015-033068
特開2008-035449
特開2005-209181
この辺りはある程度関連性があると判断してキープします。

この時点で開始からすでに1時間、つまり想定時間の半分が過ぎていました。。。

4.関連文献抽出

足がかりとして抽出した文献から辿っていき、関連している文献を同じく抽出します。
見る部分は「先行文献」と「審査時の引用文献」

「先行文献」はその特許出願に際して出願人が自主的に記載する公知の文献で、「発明の詳細な説明」の中に記載されていますが、出願によっては無い場合もあります。

「審査時の引用文献」は、その出願が審査請求されて特許庁により審査されていれば、その審査において引用文献や先行文献として提示されます。確認するためには画面右上にある「経過情報」をクリックして表示されるウィンドウで「拒絶理由通知書」を確認しますが、審査されていない案件の場合には「拒絶理由通知書」が表示されません。
 審査されていない案件は二通りあり、まだ審査前の段階である場合と、審査請求されることなく出願から3年が経過し、取り下げられたものとして処理された場合です。

結果的に
特開2002-9762
を抽出しました。

5.FIの参照、
6.Fタームの参照

FIとは、特許庁で付与される技術分類、File Indexの略です。
Fタームも同じく、特許庁で付与される技術の分類記号ですが、FIは文献の趣旨に応じて付与されるのに対して、Fタームは技術的事項がより細分化されており、その文献が含む技術的要素に基づいて幅広く付与されるというイメージです。

J-PlatPatにおける特許検索においては、このFIとFタームをうまく使っていくことがポイントになります。

技術検索というと、技術的な文言を類語も含めて幅広く特定して検索するという方法を思い浮かべるかもしれませんが、実質的には文言だけで漏れのない検索を行うことはかなり厳しいものがあります。

特許の仕事をしていると言葉の上位概念、下位概念に悩まされることが日常茶飯事ですが、検索に際しても同様です。
今回採用したテーマの場合、「暗号化」ということが重要事項の1つになります。
なので、「暗号化」を様々な言葉に言い換えてor条件として指定するのが基本になりますが、予想外の言葉が使われている可能性もゼロではありません。類義語をどれだけピックアップしても検索漏れが発生するリスクがあります。また、類義語をピックアップすればするほど検索ノイズは増えていきます。

結論からいえば、今回の検索においてゴールとした文献では、特許請求の範囲にて「暗号化」という言葉が使われておらず、「符号化」という言葉で表現されていました。
要約においては「暗号化」という言葉が使われていたので「要約/抄録」を対象として「暗号化」を指定すれば漏れにはなりませんが、要約で用いる言葉は請求項の言葉に合わせるという実務も存在します。ですので、対象の文献がその実務に従っていた場合には「暗号化」という言葉で「要約/抄録」を検索してもヒットせず、or条件で「符号化」という言葉を指定しなければ漏れになってしまうことになります。

また、類義語をピックアップするだけでは不十分で、その言葉をより抽象的にして上位概念化した言葉や、より具体的にして下位概念化した言葉も必要で、そうすると更にor条件が増えていき、それに従って検索ノイズも増えます。

そんな問題を解決してくれるのが、上記のFI、Fタームです。
それぞれの文献に含まれている技術的な事項に基づいて付与されるので、技術的な文言を直接指定する場合のような類義語や上位概念、下位概念の心配が原則的にありませんし、それぞれ階層構造になっているので、上位概念化、下位概念化が簡単に可能です。

ただ、これも分類記号として付与される仕組みや実際に付与されている実情を理解して用いないと適切な検索条件の設定にはならないので、それを確認するための作業がこのセクションです。
個人的にはこのイベント最大の見せ場だと思っていたパートです。

が、

個人的には「この時間が一番聞いてる人にとって退屈な時間だったかなぁ。。。」
と反省しているところです。

やることは、
・上記で抽出した文献のFIやFタームを見る
・J-PlatPatの特許・実用新案分類照会(PMGS)を参照して、付与されているFI、Fタームの内容を確認する
・検索対象のテーマに関連すると思ったものを抽出する
ということです。

それぞれの文献にFIであれば数個、Fタームは数十個と付与されているので、それを確認してピックアップして整理していく作業はやはり人に見せる、聞かせる時間としては辛いものがありますかね。
FIは全て確認できたものの、Fタームの抽出をしている間に予定の2時間を経過してしまい、途中で退席される方が出始めましたので、Fタームに関しては上記で抽出した文献の全てを確認する前に次に進んでしまいました。

この段階で開始から2時間10分を超えています。

結果として抽出したFI、Fタームは以下の通り。
FI
H04L9/00,601 ・鍵の管理
G09C1/00,620・公開鍵暗号方式

Fターム(+が付与されているのは複数の文献で採用されていたもの)
5J104AA01 ・秘密通信・秘話 第三者が通信文を盗聴しても、その内容は理解できないようにするもの。暗号化(スクランブル)を用いて達成される。このタームを付与している場合は、観点HA00又は観点JA00についても適切なタームを全て付与している。
+5J104AA07 ・・エンティティ認証(ユ-ザ認証・端末認証) 通信あずかる人間(ユーザ)や端末機器が正当であるか否かを検査するためのもの。このタームを付与している場合は、観点KA00についても適切なタームを全て付与している。
+5J104AA16 ・機密保護用情報の管理 システムの機密保護の要となる情報(暗号鍵やパスワード)の管理を目的とするもの。このタームを付与している場合は、観点EA00についても適切なタームを全て付与している。
5J104AA32 ・暗号器の制御 暗号器の動作の制御。
5J104EA04 ・暗号鍵の管理 暗号鍵の管理に特徴があるものについて付与している。
5J104EA19 ・・・・暗号化に非対称暗号系を用いるもの 機密保護用情報を非対称暗号系で暗号化して配送するもの。機密保護用情報が暗号鍵である場合は、タームEA06も付くので注意。
5J104JA21 ・非対称暗号系(公開鍵暗号系) 暗号化に用いる鍵と復号化に用いる鍵とが異なる暗号系であり、一方の鍵を秘密に保管し、他方は公開するもの。非対称暗号系に関するタームは、その暗号の数学的意味について充分に理解していないと正しく付与できないので、入念に技術理解をしてから付与している。
+5J104KA01 ・ユ-ザ認証 エンティティのうち、使用者が正当であるかどうかを検証するもの。
+5J104NA02 ・・暗号鍵
5J104NA05 ・・パスワ-ド パスワード。暗証番号。パスフレーズも含む。
+5J104PA07 ・コンピュ-タ・ネットワ-ク、インタ-ネット

5B017BA05 ・パスワード パスワードなどの利用者資格確認コードを利用者が入力し、真正な者のアクセスであるとき許可するもの
5B017BA06・アクセス権 アクセスすべき者(利用者だけでなく、メモリをアクセスするプログラムなども含む)の権限を種々の条件(パスワードを除く)より判断し、アクセスの可否を決定するもの
5B017CA16 ・ファイル

5B082GA11 ・アクセス保護 ファイルシステムやデータベースシステムに対する正当なアクセスの容認、または不当なアクセスからの保護に関するもの。

7.FI、Fタームガッツリ限定検索

このような感じで抽出したFI、Fタームを用い、階層構造になっているFI、Fタームを下位層までガッツリ限定して検索を行ってみます。

とりあえず、抽出されたもののうち
G09C1/00,620・公開鍵暗号方式
5J104AA07 ・・エンティティ認証(ユ-ザ認証・端末認証) 通信あずかる人間(ユーザ)や端末機器が正当であるか否かを検査するためのもの。このタームを付与している場合は、観点KA00についても適切なタームを全て付与している。
5J104AA16 ・機密保護用情報の管理 システムの機密保護の要となる情報(暗号鍵やパスワード)の管理を目的とするもの。このタームを付与している場合は、観点EA00についても適切なタームを全て付与している。
5J104KA01 ・ユ-ザ認証 エンティティのうち、使用者が正当であるかどうかを検証するもの。
5J104NA02 ・・暗号鍵
5J104PA07 ・コンピュ-タ・ネットワ-ク、インタ-ネット
これらを選択し、すべてand条件で設定して検索してみたところ、結果は8件。

全て確認するも、すでに抽出済みの文献以外、めぼしい文献は見当たりませんでした。

8.FI、Fターム階層見極め

「7.FI、Fタームガッツリ限定検索」においてはすべてのFタームをandで入れたので、本来であればandで入れるFタームを削ったりとかするんですが、ちょっと焦っていたので次のセクションに進みました。
このセクションでは、FIやFタームを限定する階層を緩めて、より多くの文献がヒットするようにしつつ、キーワードも交えて更に文献を拾っていきます。

まず、採用したFI、G09C1/00,620を上位化します。
これは末尾の620を取りました。そうするとG09C1/00となりますが、この末尾の”00″は「すべて」を意味するので、意味合いとしてはG09C1/**ということになります。

次にFターム
こちらは抽出されたリストを見て判断するのですが、主に5J104~と、5B017~を使うことにします。

[G09C1/00/FI]*[5B017****/FT]*[5J104****/FT]という指定ができるといいのですが、知る限りできません。
Fタームの先頭5文字の部分(主テーマ)を指定する方法は、論理式検索の部分では不可能で、検索オプションの欄で1つだけ指定が可能となっているのみです。

なので今回は、より多くピックアップされている5J104~の方をこの検索オプションの主テーマに入力し、5B017~については、5B017BA00、5B017CA00をorで指定する形としました。末尾の二文字”00″は上記のFIと同様に「すべて」を意味します。

結果として、
[G09C1/00/FI]*[5B017BA00/FT+5B017CA00/FT]
*検索オプションにて、主テーマに[5J104]

という形で検索を行うと、結果は2517件。
やはり、ここからキーワードで絞っていく必要があります。

では、入れるべきキーワードは何かというと、検索対象の技術的事項のうち、FIやFタームでは特定できていない技術的事項に関するキーワードです。

改めて確認しますと、「ファイル共有」という観点が抜けていることに気付きます。
そこで、「共有」に加えて類語として「転送」、「送信」をピックアップし、要約/抄録を対象としてorで指定します。

[G09C1/00/FI]*[5B017BA00/FT+5B017CA00/FT]*[共有/AB+送信/AB+転送/AB]
*検索オプションにて、主テーマに[5J104]

そうすると結果は672件

時間的に余裕があれば、この672件すべてをチェックしないまでも、この辺からチラホラと文献を見始めて更に近い文献をピックアップし始めたりするのですが、この段階ですでに開始から2時間30以上、今はとにかく時間がありません。

ということで、それぞれのキーワードの前に「ファイル」を付けて「ファイル共有」、「ファイル転送」、「ファイル送信」としました。

[G09C1/00/FI]*[5B017BA00/FT+5B017CA00/FT]*[ファイル共有/AB+ファイル送信/AB+ファイル転送/AB]
*検索オプションにて、主テーマに[5J104]

そうすると、結果は、8件

サスガにこれは減り過ぎか。。。
と思ったのですが、焦る心では引き返せません。
とりあえず8件の文献を読んでいきます。

すると!

特開2007-128131

特許請求の範囲の記載は以下の通り。

(A)複数のユーザ端末とデータの送受信可能なネットワークに接続し、ファイル転送元ユーザ端末により特定されたファイル転送先ユーザ端末にファイルを転送可能なサーバであって、
(B)ファイル転送元ユーザ端末からの要求に応じてファイル符号化手段を前記ファイル転送元ユーザ端末に送信する手段と、
(C)ファイル転送元ユーザ端末において前記ファイル符号化手段によって符号化された符号化済みファイルを保存する手段と、
(D)ファイル転送先ユーザ端末からの要求に応じてファイル復号化手段を前記ファイル転送先ユーザ端末に送信する手段と、
(E)ファイル転送元ユーザ端末において前記ファイル符号化手段によって符号化された符号化済みファイルを前記ファイル転送先ユーザ端末に送信する手段とを備えることを特徴とするサーバ。

では改めて、今回の検索対象を表現した文章を見てみると

 サービスにログインした状態で、
同じくログインした受信者を指定し、→(A)
クライアント側で相手の公開鍵で暗号化したファイルをサーバにアップロードし、→(B)(C)
受信者としての通知を受けた相手側が暗号化ファイルをダウンロードして、→(E)
クライアント側で自身の秘密鍵で復号する技術→(D)
※(B)、(D)についてはこの文章中では明記されていないものの、ウェブサービスとして実現し、暗号化、複合はブラウザ上で行うというのは「1.検索テーマヒアリング」にて記載の通り。

かなり近い文献が抽出されました!

イメージ的には、この抽出された文献に対して「サービスにログインすること」「送信相手の公開鍵で暗号化すること」「受信者の秘密鍵で複合すること」を限定することで今回の検索対象になります。つまり、抽出された文献は、今回の検索対象を上位概念化した発明ということになるでしょうか。
もし、抽出された文献が特許されていれば、今回の検索対象の技術は特許侵害になってしまう可能性が高いと思いますが、拒絶査定で終わっていました。

ご覧の通り、「要約/抄録」においては「暗号化」という言葉が使われているので、そこは大丈夫でした。
他方、最初の足がかり検索で採用した「秘密鍵」「公開鍵」という言葉は使われていませんので、その言葉やその類義語、上位/下位概念の言葉をいくらor条件で追加していってもこの文献をヒットさせることはできないということです。
また、「S/MIMEはハードルが高い」という問題意識に対応する事項として注目した「サービスにログインする」という内容に関する事項は存在しないこともわかります。

このように、特許検索は1つでも余計な条件を設定してしまうと途端に漏れにつながってしまうリスクがあり、その観点で最も重要になってくるのは「2.検索テーマ具体化」における文章の作り方です。

今回の文章

 サービスにログインした状態で、同じくログインした受信者を指定し、クライアント側で相手の公開鍵で暗号化したファイルをサーバにアップロードし、受信者としての通知を受けた相手側が暗号化ファイルをダウンロードして、クライアント側で自身の秘密鍵で復号する技術

という文章を見返してみると、「サービスにログインした状態」「公開鍵」「秘密鍵」という部分に拘りすぎると検索漏れになってしまうリスクがあったということがわかりますね。

9.最終検索式の確定&人海戦術

実際には、「8.FI、Fターム階層見極め」において抽出した文献を参照しつつ、最終的なFIやFタームの階層を見極めたり、それぞれの文献において用いられている言葉を参照して類語の網羅度を高めたりして最終的な検索式を確定するのですが、今回はめぼしい文献が抽出されたということで、以降は口頭での説明となり、アフタートーク的な流れとなりました。

依頼を請けて仕事として検索を行う場合には、上記の最後でキーワードとして入力した「ファイル共有」に関する部分も対応するFタームを抽出していく作業を行います。
それにより、8件という極端な絞り込みではなく更に幅広い文献を参照することができるようになるでしょう。

10.終わりに

その後はアフタートークとして特許調査を仕事でやる場合の時間のことや費用の考え方についての話をしたり、特許出願を前提として仕事の依頼があった場合に、自主的に特許調査を行ってドンピシャ文献を見つけてしまうと仕事を不意にするという話をしたり、あまりにもドンピシャな文献が抽出されたことに恐れおののいた依頼者が事業計画を廃止してしまった話をしたりしました。

また、日本古代史探訪シリーズ、よろしくおねがいします!
という話もしました(宣伝)

他方、シークレットゲスト的にオブザーバーとして参加して頂いた方からは、文献に付与されているFI、Fタームの確認は、文献のページ右上の「検索キー」から行うと改廃状態が反映された最新のものが確認可能であるという情報提供を頂きました。

検索を行っていてFI、Fタームの内容を確認する際、「あれ、このFI、Fタームはリストにないぞ?」という事が多々あります。改廃が行われていることは知っているので改廃されたんだろうなあと予想はしつつ、改廃後の状態をどうすれば把握できるのか謎でしたので、非常に有意義な情報を頂きました。

今後、FI、Fタームの確認は「検索キー」から行うことにします。

11.開催後記、反省点

何はともあれ、「これだっ!」と思える文献を抽出することができたので、開始から3時間経過という長丁場にお付き合い頂いた方々には文献抽出の瞬間をお見せすることができてほっと一安心。自分としても非常に満足感高く終わることができました。
少なくとも、文献抽出の瞬間にお立ち会い頂いた方々にはご満足頂けたようです。

反面、予定の2時間を経過後、一人また一人と退席された方にとってはなんとも中途半端な時間になってしまったのではないかと申し訳なさが強く残る結果となりました。
予定の2時間以内に退席される方が一人もいらっしゃらなかったのも申し訳無さに拍車をかけます。。。

上記の通り、キーワードを指定した検索には限界があるので、FI、Fタームを抽出したり、その階層を見極めていったりという作業が特許検索の手法として非常に重要な部分かと思います。
今回も、
[G09C1/00/FI]*[5B017BA00/FT+5B017CA00/FT]
*検索オプションにて、主テーマに[5J104]
という形で見定めたFI、Fタームがある程度うまく行った結果として、最後の[ファイル共有/AB+ファイル送信/AB+ファイル転送/AB]という「えいやっ!」という感じのキーワードを指定して抽出された8件の中にかなり近い文献が含まれていたということでしょう。

ですが、やはり「人に聞かせるイベント」としては退屈な時間になってしまうなぁと感じるところ。

事前に検索テーマを知らされず、当日その場で検索テーマを知って「よ~いドン!」とするからこそ、文献抽出の瞬間の感動をお届けできると思うのですが、第2回をやるのであればやはり事前にテーマを募集した上でFI、Fターム抽出までは終わらせとかないと厳しいかなぁ。。。と思ったりもします。

一つ案として思ったのは、検索テーマのヒアリングとその具体化に思っていたよりも長い時間が必要だったので、テーマを提案する予定の人には1時間前に参加してもらうという方法ですかね。
ただ、そこを適切な文章にできないと検索も適切に行えないので、そこが特許検索を構成する各パートの中でも重要なパートだということも上述した通り。
更に、イベント内で少し言及したようにそのパートは「AIによる自動化に適さない部分」ですので、人が会話の中で文章を確定していく様をできれば生で見て頂きたいというのもあります。

そもそも、調査の仕事を請けてどんだけ時間かけて調査してんだ?と考えれば、2時間という時間設定が無謀なことはすぐに分かりそうなもんです。

が、

実際に調査をはじめて1時間位で「出ちゃいました。。。」ということも過去に何度もあるので。。。

何はともあれ、ご参加頂いた方々、今回採用できなかったものも含めてテーマを提供してくださった参加者の方々、重ねて感謝します。
改めて、感想やイベントの構成に対するご意見等、なんでも好きに言って頂ければ今後に活かしていきたいと思います。

※イベントレポートは以上ですが、
・採用させて頂いた検索テーマ以外に提案して頂いたテーマのこぼれ話
・検索対象に近い文献が抽出された場合に行うFI、Fタームの確認作業
を内容とするオマケレポートを書きました

【イベントレポート】J-PlatPatによる特許検索講座&パフォーマンス” への1件のフィードバック

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です