MEDALS 経済産業省関連ライフサイエンス総合データベースポータル

Multi-view Fractal DataBase

成果物名	Multi-view Fractal DataBase
成果物の別名	MV-FractalDB
成果物に関する説明	多視点画像認識は、物体操作、移動ロボットサービス、ナビゲーションロボットなどのロボティクスアプリケーションで弱い視点を残さないようにするためのソリューションの 1 つです。たとえば、家庭内の移動ロボットは、家事を行うために、与えられた画像でオブジェクトのカテゴリと姿勢を判断する必要があります。この論文では、数式駆動型教師あり学習 (FDSL) に基づく自動マルチビューデータセット構築の方法を提案しています。 3D オブジェクトのデータ収集と人間による注釈付けは明らかに労働集約的ですが、提案されたマルチビューデータセットで 3D モデル、マルチビュー画像、およびそれらのトレーニングラベルを同時に自動的に生成します。大規模なマルチビューデータセットを作成するために、現実世界の多くのオブジェクトの背景情報と見なされるフラクタルジオメトリを使用します。この現実世界の背景知識により、畳み込みニューラルネットワーク (CNN) は、任意のビューの画像認識に関してより優れた表現を取得できるようになると期待されています。レンダリングされた 3D フラクタルモデルから円形に投影して、マルチビューフラクタルデータベース (MV-FractalDB) を構築します。これを使用して、事前にトレーニングされた CNN モデルを作成し、マルチビュー画像認識の問題を改善します。データセットの構築は自動であるため、当社の MV-FractalDB を使用する場合、事前トレーニング段階で 3D モデルの定義や追加の手動注釈は必要ありません。実験結果によると、MV-FractalDB の事前トレーニング済みモデルは、自己教師ありメソッド (SimCLR や MoCo など) の精度を上回り、パフォーマンスレートの点で教師ありメソッド (ImageNet 事前トレーニング済みモデルなど) に近いです。マルチビュー画像データセット。また、MV-FractalDB の事前トレーニング済みモデルは、ModelNet40 データセットの ImageNet 事前トレーニング済みモデルよりも収束速度が優れていることが確認されました。さらに、FDSL を使用した多視点画像認識の可能性を示します。
成果物のタイプ	DB
運用機関	産業技術総合研究所
機関所在国	日本
サイトURL	https://ryosuke-yamada.github.io/Multi-view-Fractal-DataBase/
インターフェイス	CUI
入力例	なし
キーワード	静止画
ダウンロードデータ総量（Mbyte） \| データ一括取得方法	0.0\|なし
使っている外部リソース	なし
主な対象データ	静止画
生物種	なし
利用条件	なし
データ更新頻度 (過去2年間)	随時
最終更新日（調査日）	2021/09/27(2022/11/16)
利用できるID	なし
IDを使った成果物の利用方法	なし
外部リンク	なし
論文等（PubMed ID）	なし
稼働状況	稼働中

＜前へ次へ＞

経済産業省関連 ライフサイエンス総合データベースポータル MEDALS

データベース

Multi-view Fractal DataBase

経済産業省関連ライフサイエンス総合データベースポータル MEDALS