top of page
検索


EDINET API ver.2で企業情報を取得する
1.はじめに EDINET API ver.2が公開されました! 今までのxbrlとの格闘がなくなればいいなと思います。 2.経緯 現状、(上場)企業の財務情報や「研究開発活動」の部分のテキストを取ろうとすると、xbrlというファイル形式と格闘しないといけません。(buff...
NISHIO KEI
2023年9月5日読了時間: 2分


論文調査:Machine learning for patent intelligence
1.はじめに Patent Intelligence(パテントインテリジェンス)に機械学習を利用する際の機会と課題についてまとめられた論文があったので調べてみました。 パテントインテリジェンスについて頭の中の整理がつきました。 2.内容 (1)Patent...
NISHIO KEI
2023年8月5日読了時間: 5分


BERTopicを使った特許文章の分類
1.はじめに 昔GuidedLDAというのを使って特許文章を分類しようとして、うまくライブラリが動かずに終わったことがありました。 その後、文章分類等はBERTを使って行っており、言葉の共起情報をもとにしたTopicModelingはあまり使ってませんでした。...
NISHIO KEI
2023年7月21日読了時間: 2分


論文調査:Predictive Patentomics: Forecasting Innovation Success and Valuation with ChatGPT
1.はじめに 特許分野でchatGPT使って実験しました、という事例が出てくると思いましたが、出てきました。 どんな実験したかを見ていきたいと思います。 2.内容 (1)目的など Research Questionsが3つ挙げられています。...
NISHIO KEI
2023年7月12日読了時間: 4分
LLM+APIで特許調査を行う(概要)
1.はじめに chatGPTなどの大規模言語モデル(LLM)とAPIの組み合わせで特許調査を行う検討をしました。 2.経緯 以前Auto-GPTで特許調査を行う検討をしましたが、Goal(とSTEP)を説明するだけではなかなか思うようにLLMが動いてくれないことがわかりまし...
NISHIO KEI
2023年7月7日読了時間: 2分


特許出願動向調査をまとめる
1.はじめに 特許庁が提供する特許出願技術動向調査を言葉で検索できるようにしたら、結構面白かった。 UIを簡単に実装できるようなライブラリ(できればpythonで)が欲しい。 2.経緯 特許庁が提供する特許出願動向調査は、20年くらい前から始まっていて、蓄積が大きくなってき...
NISHIO KEI
2023年7月4日読了時間: 10分


論文調査:Contrastive Lossを用いた特許技術検索システムの効果的な探索モデル
1.はじめに GPT-3に興味のある論文を抽出して毎日配信してもらっています。 最近配信されたものの中に面白い論文があったので紹介します。 2.発見した論文の概要 Contrastive Lossを用いた特許技術検索システムの効果的な探索モデル...
NISHIO KEI
2023年6月29日読了時間: 3分
Vector store-augmented text generationで特許明細書生成
1.はじめに 明細書の元データを明示して指示することで、生成される文章を欲しいものに近づけられる。 2.経緯 前回は素のGPT-4に特許文章の生成をさせていたけれど、他に方法がないか探していました。このページで、特定のgithubレポジトリから、トピックを指定してブログ記事...
NISHIO KEI
2023年6月23日読了時間: 3分


特許庁の特許APIをスプレッドシートで使う
1.はじめに 仕事で、特許調査の調査結果をまとめて調査報告書を作成しています。 その報告書には、発見された公報とその諸情報(発明の名称とか公開番号とか)を入れています。こんな感じ↓公報番号にはリンクを添えて。 この作業は今まで人手でやってましたが、特許庁が昨年からAPIを提...
NISHIO KEI
2023年6月20日読了時間: 3分


Lens.orgの特許APIを使う
1.はじめに LLMによるデータ取得や分析が盛況なので、特許データもLLMから呼び出せるようにAPIになっていると便利なはず(LangChainを使うにしてもGPT Functionを使うにしても)。 ということで、特許データをAPIでアクセスできるようなものはないか、と調...
NISHIO KEI
2023年6月19日読了時間: 2分
特許情報を参照してソース付きで回答させる
1.はじめに LangChainの RetrievalQAWithSourcesChainを使うと、特許文章の読み込みが楽に! 2.利用場面 先日、ある処理に関するUS特許を読み込んで、「どんな種類の物質を処理できるか」というのを調べたい、という場面に出会いました。...
NISHIO KEI
2023年6月13日読了時間: 2分


論文調査ーA Survey on Sentence Embedding ModelsPerformance for Patent Analysis
この論文 。特許文章もテキスト埋め込み手法を使うと良いというのはわかるけれど、ではどれを選べばいいのかを実験したものです。 1.目的 ・特許情報はイノベーション、特許ランドスケープ、技術マッピング、および特許品質評価をより深く理解するのに役立つ。...
NISHIO KEI
2023年6月12日読了時間: 3分


技術のつながりをchord diagram で
1.はじめに 技術分野(特許分類=IPC)のつながりをマクロに把握したいなと思い検討しました。 plotapiというchord diagramを作成するAPIを契約し(年間11,000円くらい)、これを使って見てみることに。 2.BigQueryで共起データ作成...
NISHIO KEI
2023年5月31日読了時間: 2分


特許分類の定義情報をAPIで取得
1.はじめに ・特許分類(コード)の定義を参照する際には、いつもJ-platpatの特許分類情報からコードを指定して対応する定義を見ている。 が、すごく面倒くさい時がある。(沢山のコードの定義を参照しなければいけない時など)。...
NISHIO KEI
2023年5月13日読了時間: 3分


Auto-GPTで特許調査をしてもらう
1.はじめに Auto-GPTという、役割とゴールを設定すれば自分でタスクを進めてくれる!というライブラリがあったので、これは便利そうと思い、特許調査をやってもらいました。 方向性としてOK(クレームを分析→キーコンポーネントは何か調べる→特許分類を使って類似文書を探す)ま...
NISHIO KEI
2023年4月26日読了時間: 3分


グリーン・トランスフォーメーション技術を可視化
1.はじめに 特許庁が昨年公開したグリーン・トランスフォーメーション技術区分表(GXTI)をもとに各技術をダッシュボードとして可視化しました。 2.GXTIとは GXTIは 「GXTI (Green Transformation Technologies...
NISHIO KEI
2023年4月21日読了時間: 2分


特許データベースを日本語で検索する
1.はじめに 特許データべースは通常SQLで検索します。 ex:キヤノン株式会社の特許件数を調べる。 SELECT COUNT(*) FROM {データベース} WHERE applicant_name = "キヤノン株式会社"...
NISHIO KEI
2023年4月19日読了時間: 2分
LangChain+GPT-3.5で企業の技術を把握する
1.はじめに LangChianとGPT3.5を使い企業のウェブサイトから、技術情報を抽出しました。 特許出願されていなくても、その企業の技術情報を把握できるので便利です。 LangChainがすごく便利! 2.経緯 GPT-3.5がAPI経由で自由に使えるので、これを使っ...
NISHIO KEI
2023年4月5日読了時間: 2分
bottom of page