1.はじめに
Patent Intelligence(パテントインテリジェンス)に機械学習を利用する際の機会と課題についてまとめられた論文があったので調べてみました。
パテントインテリジェンスについて頭の中の整理がつきました。
2.内容
(1)Patent Intelligenceについて
最初にPatent Intelligence(パテントインテリジェンス)について先行文献を整理しつつまとめられています。抽出・前処理・分析の各段階で表されるような広い範囲の活動のことを意味するみたいです。
Patent intelligence refers to the retrieval, structuring, examination and evaluation of patent information for systematic knowledge development as well as using the knowledge for business-relevant decisions” (Wustmans 2019, p. 25, translated from German).
パテントインテリジェンスの各段階(Fig.1)と階層(Fig.2)
段階

階層

(2)機械学習をパテントインテリジェンスに利用する際の機会と課題の仮説
特許データはイノベーションと技術マネジメントにおいて重要な役割を果たしており、特許データを扱う(抽出・前処理・分析)手法(=パテントインテリジェンス)が模索されています。
しかし、特許情報は増加し続けていて、従来のパテントインテリジェンス手法では対応できなくなってきており、機械学習を利用することが検討されてきています。
そこで、機械学習をパテントインテリジェンスに利用する際の機会と課題を探っています。
論文中で出されているResearch Questionは以下のものです。
RQ: Which opportunities and challenges arise from using contemporary digital technologies for patent intelligence?
具体的には、デジタルテクノロジーを機械学習の2種類の手法(教師あり学習、教師無し学習)に分けて、それぞれの手法の機会と課題を分析しています。
RQ-1: Which opportunities and challenges arise from using supervised machine learning for patent intelligence?
RQ-2: Which opportunities and challenges arise from using unsupervised machine learning for patent intelligence?
ちなみに、デジタルテクノロジーの中の機械学習の位置づけについては、下記のFig.3で整理されています。

(4)機械学習をパテントインテリジェンスに利用した例
機械学習の2つの手法については、table2、table3にまとめられています。これらはパテントインテリジェンスの文脈では、17ページ、20ページに
教師あり学習:
1.Fintech関連特許の抽出 (Chen et al. (2019) 、Lerner et al.(2021) )
2.AI関連特許の抽出 (Miric et al. 2022; Giczy et al. 2021)
3.特許の藪の中の先行技術文献の抽出(Setchi et al. 2021)
教師なし学習:
1.トピックモデリングを利用してベクトル空間を特許文献毎に作成し、類似性スコアに基づく特許を発見(Ruckman and McCarthy (2017) )
2.発明者名を名寄せするためのk-means手法の利用(Balsmeier et al. (2018) )
3.中国の発明家の名前のあいまいさの解消に様々なML手法を適用(Yin et al. (2020))
4.トピックモデリングを利用して電気通信事業者毎の知識プロファイルの違いを調査する(Suominen et al. (2017) )
5.無線周波数識別 (RFID) 技術分野とその方法に関連するトピックにつてい、時系列変化を調べる(Caferoglu and Moehrle (2018))
6.新規性の判定(Jeon et al. 2022; Kaplan and Vakili 2015)や後続する出願への影響(Hain et al. 2022)
などがまとめられています。トピックモデリング大人気ですね。各論文も読んでみようと思いました。
(3)参照されている論文
4つの文献を、機械学習手法2種類*パテントインテリジェンスの3つの処理段階のマトリクスで整理して、リサーチクエスチョンについて分析しています。

4つの文献の詳細については4.1~4.4章など参照です
結果として以下の機会と課題が抽出されています。Table5~8参照。
| 教師あり学習 | 教師なし学習 | 共通(デジタル技術) |
機会 | ・非線形関係を検出する ・意思決定の補助 ・予測時のノイズ削減 | ・潜在的な特許間の関連性を探る ・潜在的な概念間の関連性を探る | ・データ駆動理論の発達 ・複数のデータソース統合 ・Work-from-anywhere |
課題 | ・ML アルゴリズムのパフォーマンスの安定化 ・ML の透明性と説明可能性 ・自動化への恐怖(抵抗感) ・特許データの質と量 |
(4)今後のML技術との関わりの課題
6.3の部分の記載が参考になりました。
・ML技術の適用には適切なレベルがある。 組織の種類、業界、規模によって、教師ありおよび教師なし ML 技術の適切なレベルが決まる場合があります。例えば、中小規模の組織に必ずしも最高レベル(のML技術)が必要なわけではありません。参考:7D patent management maturity model (Moehrle et al. 2017).
⇒これは確かに。説明がしやすいモデルの選択なども含まれると思います。
・ML技術と他のデジタルテクノロジーとの相乗効果 ML技術と他のデジタル技術を組み合わせたアプローチから恩恵を受ける可能性があります。たとえば、ブロックチェーン技術は、すでに実施されたすべての ML ベースの特許分析の改ざん防止履歴を作成することにより、特許インテリジェンスをサポートする可能性があります (Denter et al. 2022b)。さらに、クラウド コンピューティング プラットフォームは、コンピューティング能力を著しく向上させます。 「Google Colab」は、ユーザーにとっての ML 技術の価値認識を高め、ひいては ML の導入を促進する可能性があります (Miric et al. 2022; Gregory et al. 2021)
・特許検索への注目: P1 ~ P4 で概説されている方法と主題の焦点の大部分は、特許の前処理と分析を目的としています。そのため、特許調査はそれほど注目されていません。さらなる研究では、特許検索における教師ありおよび教師なし ML の機会と課題が探求される可能性があり、すでに公開されている文献に依存する可能性があります (例: Giczy et al. 2021; Lerner et al. 2021; Chen et al. 2019)。
⇒ML技術の特許検索ヘの利用はまだ開拓の余地が多そうですね。
・ダウンストリームタスクへの課題: 基礎となる ML アルゴリズムを簡潔かつ効果的に説明し、得られた洞察を伝達し、問題の定式化からモデルの選択から結果の解釈に至るまで関連する関係者を統合することが含まれる。”知識はあっても、それを明確に表現する力がないということは、まったくアイデアを持たないのと同じです。”quoting Pericles (ca. 450 BC),
⇒業務ではこれが最も重要そうですね。
Comments