1.はじめに
開放特許DBのバルクデータがダウンロードできるようになっていたので、どんなものがあるのか見てみました。
結構いろんな分野にまんべんなく出てるのですね。
2.処理の流れ
・csvデータをよみこみ。加工。
import pandas as pd
df = pd.read_csv("plidb_bulkdata_202403.zip")
df.columns
・埋め込み表現作成(vertexAI):略
・俯瞰(nomic atlas):略
3.可視化したもの
操作用リンク(nomic atlasへ)
図中のラベルは発明の名称から抽出してます。
4.ちょっと分析
・とりあえず基本的なデータを。
出願日:コンスタントに出てますが、2014-2018が一番もりあがってますね。
出願人ランク(上位20):NHKってすごく提供してるのですね。あとは研究機関や大学などがずらっと並んでますが。5位のユピテルという会社はいろんな研究機関と組んでいるようで、活発ですね。
大学/企業などで集計するとこんな感じに
・分野の偏り:
field(技術分野1の列から抽出)でみると、上からこんなかんじですね。
上↑
医薬・科学
遺伝子/材料/半導体
農業/
食品/レーザ/センサ
音声処理
情報通信・衛星
下↓
・出願人の属性:
企業は左下部分(機械装置、食品などの生活関連、あと車載関連)に偏って出てますね。上(医薬・化学)や下(通信)は個人ではあまり出さないかも。
・実施実績の有無:
赤色部分が実績ありですが、かたまりで目立つのは三菱重工の風力発電関連(図中まんなか左下あたり)とファミリーイナダ(株)のマッサージ器(図中左端)、ユピテル(株)の車載関連などでしょうか。ほとんどは実施されてないですね。
有/試作でフィルター:
5.その他
ベクトル検索などで自分の欲しい技術をマッチさせるような機能を持たせたいなと思います。nomic atlasには残念ながらまだこの機能はないので、独自アプリで拡張しないとなと思います。
作成したベクトルデータを含む、今回利用したデータはこちら(GoogleDrive):
Commentaires