top of page
検索


開放特許DBを俯瞰してみる
1.はじめに 開放特許DBのバルクデータがダウンロードできる ようになっていたので、どんなものがあるのか見てみました。 結構いろんな分野にまんべんなく出てるのですね。 2.処理の流れ ・csvデータをよみこみ。加工。 import pandas as pd df =...
NISHIO KEI
2024年4月24日読了時間: 2分
閲覧数:371回
0件のコメント


vertexAIでのFunction Callingについて(落とし穴)
1.はじめに LLM+APIで特許調査をしてもらうシリーズのプログラム編です。前回は概念で説明しただけだったので、プログラムに落とし込みます。。 が、さっそく躓いて2日間ほど苦しんだので、供養のつもりで書きます。 2.習字するもエラーが発生...
NISHIO KEI
2024年3月27日読了時間: 4分
閲覧数:224回
0件のコメント


特許文章の要約のembeddingと検索
1.はじめに google vertex aiのtextembedding-gecko-multilingualを使って、各国特許の要約のベクトル表現を作成して検索しました。 2.ベクトルデータベース作りと検索 検索をする際にキーワードではなく、文章からベクトルデータを使っ...
NISHIO KEI
2024年1月23日読了時間: 4分
閲覧数:326回
0件のコメント


EDINET API ver.2で企業情報を取得する
1.はじめに EDINET API ver.2が公開されました! 今までのxbrlとの格闘がなくなればいいなと思います。 2.経緯 現状、(上場)企業の財務情報や「研究開発活動」の部分のテキストを取ろうとすると、xbrlというファイル形式と格闘しないといけません。(buff...
NISHIO KEI
2023年9月5日読了時間: 2分
閲覧数:880回
0件のコメント


BERTopicを使った特許文章の分類
1.はじめに 昔GuidedLDAというのを使って特許文章を分類しようとして、うまくライブラリが動かずに終わったことがありました。 その後、文章分類等はBERTを使って行っており、言葉の共起情報をもとにしたTopicModelingはあまり使ってませんでした。...
NISHIO KEI
2023年7月21日読了時間: 2分
閲覧数:2,315回
0件のコメント
LLM+APIで特許調査を行う(概要)
1.はじめに chatGPTなどの大規模言語モデル(LLM)とAPIの組み合わせで特許調査を行う検討をしました。 2.経緯 以前Auto-GPTで特許調査を行う検討をしましたが、Goal(とSTEP)を説明するだけではなかなか思うようにLLMが動いてくれないことがわかりまし...
NISHIO KEI
2023年7月7日読了時間: 1分
閲覧数:753回
0件のコメント


特許データベースを日本語で検索する
1.はじめに 特許データべースは通常SQLで検索します。 ex:キヤノン株式会社の特許件数を調べる。 SELECT COUNT(*) FROM {データベース} WHERE applicant_name = "キヤノン株式会社"...
NISHIO KEI
2023年4月19日読了時間: 2分
閲覧数:416回
0件のコメント
LangChain+GPT-3.5で企業の技術を把握する
1.はじめに LangChianとGPT3.5を使い企業のウェブサイトから、技術情報を抽出しました。 特許出願されていなくても、その企業の技術情報を把握できるので便利です。 LangChainがすごく便利! 2.経緯 GPT-3.5がAPI経由で自由に使えるので、これを使っ...
NISHIO KEI
2023年4月5日読了時間: 2分
閲覧数:1,615回
0件のコメント


特許発明者ネットワーク関連の論文まとめ
特許発明者ネットワーク関連の論文まとめ 1.社会的ネットワーク分析 ・社会的ネットワーク分析は結構古くから色んな論文が出てるようですが、特許出願に記載の共同発明者のネットワークを分析したものはどのくらいあるんだろうかと思い集めてみました。 ・「inventor...
NISHIO KEI
2023年2月11日読了時間: 2分
閲覧数:226回
0件のコメント
bottom of page