開放特許DBを俯瞰してみる

１．はじめに

・csvデータをよみこみ。加工。

import pandas as pd
df = pd.read_csv("plidb_bulkdata_202403.zip")
df.columns

・埋め込み表現作成(vertexAI)：略

・俯瞰（nomic atlas)：略

・とりあえず基本的なデータを。

出願人ランク（上位２０）：NHKってすごく提供してるのですね。あとは研究機関や大学などがずらっと並んでますが。５位のユピテルという会社はいろんな研究機関と組んでいるようで、活発ですね。

field(技術分野1の列から抽出)でみると、上からこんなかんじですね。

上↑

医薬・科学

遺伝子／材料／半導体

農業／

食品／レーザ／センサ

音声処理

情報通信・衛星

下↓

企業は左下部分（機械装置、食品などの生活関連、あと車載関連）に偏って出てますね。上（医薬・化学）や下（通信）は個人ではあまり出さないかも。

・実施実績の有無：

赤色部分が実績ありですが、かたまりで目立つのは三菱重工の風力発電関連（図中まんなか左下あたり）とファミリーイナダ（株）のマッサージ器（図中左端）、ユピテル（株）の車載関連などでしょうか。ほとんどは実施されてないですね。

有／試作でフィルター：

5．その他

ベクトル検索などで自分の欲しい技術をマッチさせるような機能を持たせたいなと思います。nomic atlasには残念ながらまだこの機能はないので、独自アプリで拡張しないとなと思います。
作成したベクトルデータを含む、今回利用したデータはこちら（GoogleDrive）：