データベース

Multi-view Fractal DataBase

noimage
成果物名Multi-view Fractal DataBase
成果物の別名MV-FractalDB
成果物に関する説明多視点画像認識は、物体操作、移動ロボット サービス、ナビゲーション ロボットなどのロボティクス アプリケーションで弱い視点を残さないようにするためのソリューションの 1 つです。たとえば、家庭内の移動ロボットは、家事を行うために、与えられた画像でオブジェクトのカテゴリと姿勢を判断する必要があります。この論文では、数式駆動型教師あり学習 (FDSL) に基づく自動マルチビュー データセット構築の方法を提案しています。 3D オブジェクトのデータ収集と人間による注釈付けは明らかに労働集約的ですが、提案されたマルチビュー データセットで 3D モデル、マルチビュー画像、およびそれらのトレーニング ラベルを同時に自動的に生成します。大規模なマルチビュー データセットを作成するために、現実世界の多くのオブジェクトの背景情報と見なされるフラクタル ジオメトリを使用します。この現実世界の背景知識により、畳み込みニューラル ネットワーク (CNN) は、任意のビューの画像認識に関してより優れた表現を取得できるようになると期待されています。レンダリングされた 3D フラクタル モデルから円形に投影して、マルチビュー フラクタル データベース (MV-FractalDB) を構築します。これを使用して、事前にトレーニングされた CNN モデルを作成し、マルチビュー画像認識の問題を改善します。データセットの構築は自動であるため、当社の MV-FractalDB を使用する場合、事前トレーニング段階で 3D モデルの定義や追加の手動注釈は必要ありません。実験結果によると、MV-FractalDB の事前トレーニング済みモデルは、自己教師ありメソッド (SimCLR や MoCo など) の精度を上回り、パフォーマンス レートの点で教師ありメソッド (ImageNet 事前トレーニング済みモデルなど) に近いです。マルチビュー画像データセット。また、MV-FractalDB の事前トレーニング済みモデルは、ModelNet40 データセットの ImageNet 事前トレーニング済みモデルよりも収束速度が優れていることが確認されました。さらに、FDSL を使用した多視点画像認識の可能性を示します。
成果物のタイプDB
運用機関産業技術総合研究所
機関所在国日本
サイトURLhttps://ryosuke-yamada.github.io/Multi-view-Fractal-DataBase/
インターフェイスCUI
入力例なし
キーワード静止画
ダウンロードデータ総量(Mbyte) | データ一括取得方法0.0|なし
使っている外部リソースなし
主な対象データ静止画
生物種なし
利用条件なし
データ更新頻度 (過去2年間)随時
最終更新日(調査日)2021/09/27(2022/11/16)
利用できるIDなし
IDを使った成果物の利用方法なし
外部リンクなし
論文等(PubMed ID)なし
稼働状況稼働中