top of page
検索
NISHIO KEI
2024年4月24日読了時間: 2分
開放特許DBを俯瞰してみる
1.はじめに 開放特許DBのバルクデータがダウンロードできる ようになっていたので、どんなものがあるのか見てみました。 結構いろんな分野にまんべんなく出てるのですね。 2.処理の流れ ・csvデータをよみこみ。加工。 import pandas as pd df =...
閲覧数:292回0件のコメント
NISHIO KEI
2024年3月27日読了時間: 4分
vertexAIでのFunction Callingについて(落とし穴)
1.はじめに LLM+APIで特許調査をしてもらうシリーズのプログラム編です。前回は概念で説明しただけだったので、プログラムに落とし込みます。。 が、さっそく躓いて2日間ほど苦しんだので、供養のつもりで書きます。 2.習字するもエラーが発生...
閲覧数:194回0件のコメント
NISHIO KEI
2024年1月23日読了時間: 4分
特許文章の要約のembeddingと検索
1.はじめに google vertex aiのtextembedding-gecko-multilingualを使って、各国特許の要約のベクトル表現を作成して検索しました。 2.ベクトルデータベース作りと検索 検索をする際にキーワードではなく、文章からベクトルデータを使っ...
閲覧数:285回0件のコメント
NISHIO KEI
2023年9月5日読了時間: 2分
EDINET API ver.2で企業情報を取得する
1.はじめに EDINET API ver.2が公開されました! 今までのxbrlとの格闘がなくなればいいなと思います。 2.経緯 現状、(上場)企業の財務情報や「研究開発活動」の部分のテキストを取ろうとすると、xbrlというファイル形式と格闘しないといけません。(buff...
閲覧数:767回0件のコメント
NISHIO KEI
2023年7月21日読了時間: 2分
BERTopicを使った特許文章の分類
1.はじめに 昔GuidedLDAというのを使って特許文章を分類しようとして、うまくライブラリが動かずに終わったことがありました。 その後、文章分類等はBERTを使って行っており、言葉の共起情報をもとにしたTopicModelingはあまり使ってませんでした。...
閲覧数:2,178回0件のコメント
NISHIO KEI
2023年7月7日読了時間: 1分
LLM+APIで特許調査を行う(概要)
1.はじめに chatGPTなどの大規模言語モデル(LLM)とAPIの組み合わせで特許調査を行う検討をしました。 2.経緯 以前Auto-GPTで特許調査を行う検討をしましたが、Goal(とSTEP)を説明するだけではなかなか思うようにLLMが動いてくれないことがわかりまし...
閲覧数:722回0件のコメント
NISHIO KEI
2023年4月19日読了時間: 2分
特許データベースを日本語で検索する
1.はじめに 特許データべースは通常SQLで検索します。 ex:キヤノン株式会社の特許件数を調べる。 SELECT COUNT(*) FROM {データベース} WHERE applicant_name = "キヤノン株式会社"...
閲覧数:406回0件のコメント
NISHIO KEI
2023年4月5日読了時間: 2分
LangChain+GPT-3.5で企業の技術を把握する
1.はじめに LangChianとGPT3.5を使い企業のウェブサイトから、技術情報を抽出しました。 特許出願されていなくても、その企業の技術情報を把握できるので便利です。 LangChainがすごく便利! 2.経緯 GPT-3.5がAPI経由で自由に使えるので、これを使っ...
閲覧数:1,609回0件のコメント
NISHIO KEI
2023年2月11日読了時間: 2分
特許発明者ネットワーク関連の論文まとめ
特許発明者ネットワーク関連の論文まとめ 1.社会的ネットワーク分析 ・社会的ネットワーク分析は結構古くから色んな論文が出てるようですが、特許出願に記載の共同発明者のネットワークを分析したものはどのくらいあるんだろうかと思い集めてみました。 ・「inventor...
閲覧数:208回0件のコメント
bottom of page