1.はじめに
chatGPTなどの大規模言語モデル(LLM)とAPIの組み合わせで特許調査を行う検討をしました。
2.経緯
以前Auto-GPTで特許調査を行う検討をしましたが、Goal(とSTEP)を説明するだけではなかなか思うようにLLMが動いてくれないことがわかりました。
もう少し細かく人間の動作をかみ砕いたうえで、道具として各ステップの作業に必要な(web)APIをLLMに与えるようにしてあげたいと思います。
具体的に、LangchainのAgent+Toolsか、chatGPTのFunction Calling を使う感じです。
(2230920追加)Agents を使うと自作のfunction-callingも利用できて良さそうです。
3.検討(中)
人間の動作 | API |
発明のポイント把握&1キーワード検索を実施 ・発明の内容を理解して技術的な特徴(発明のポイント)を把握する。 ・特許検索データベースに要約レベルでAND検索をして、類似する文献がないか見る。 | API①:入力文章から技術的なポイントに対応するキーワードを抽出する。
API②:キーワードで特許文献を抽出する。
|
・ヒットした文献についている分類を集計 ・ランキング上位のものや、ピンポイントで必要そうな文献を抽出 | API③:指定した文献から特許分類を集計する API④:特許分類の定義情報から、調査対象に類似するか判定する |
・検索式を作成する。 | API⑤:特許分類とキーワードから検索式を作成する |
・検索を実行する。検索式を特許DBに入力して検索実行。1個ずつ読んで1次抽出・2次抽出をしていく。1次⇒2次で何か考えてるかは要検討 | API⑥:類似文献抽出。(抽出した文献をベクトル表現に変換する)調査対象に類似する文献を抽出する API⑦:対比表作成(発明の特徴部ごとに類似文献の記載を抽出する |
新規性・進歩性の有無を判定する | API⑧:新規性・進歩性の判定API(これは難しい) |
・調査報告書を作成する 調査対象と発見した文献をまとめて調査報告書にまとめる。 | API⑨:報告書作成API |
| |
| |
| |
ちょっとづつ作成していこうと思います。
Comments