1. ホーム
  2. データベース

蛋白質

ARCHAIC

noimage
要約古細菌ゲノムDNAの配列とその遺伝子情報を提供するデータベースです。古細菌ゲノムのDNA配列(独自に決定したものを含む)を独自に開発した生物情報学的方法によって解析することにより、ゲノム全体の構成を解明するとともにゲノム構成の比較を行う目的で構築されました。下記3種の情報を格納しています(Pyrococcus sp. OT3, Thermoplasma volcanium GSS1, Archaeoglobus fulgidus)。
主な対象データDNA-配列 、ゲノム
解説ページ →

ARMLiPDB

noimage
要約ARMLiPDBは、マウス肝蛋白質の年齢軸発現データベースです。年齢軸に沿った網羅的肝蛋白質発現解析を、核と細胞質、それぞれの分画蛋白質の網羅的解析を二次元電気泳動と質量計等を駆使するプロテオミックス最先端解析方法で行い、結果を網羅的年齢軸変動データベースとして公開しています(現在は運用していないようです)。[出典]・重点研究支援業務成果報告書(平成14年度?平成19年度)http://www.jst.go.jp/koryu/csspr/h14/h14-06.pdf・JITA ニュースレター(January, 2008. No.16)http://www.jita.or.jp/news/dl/index16.pdf
主な対象データ遺伝子発現
解説ページ →

ConfC

noimage
要約本データベースは、現在得られているタンパク質立体構造からこの動的情報を抽出しデータベース化したもので、1)進化的構造変化、 2)結合による構造変化、3)構造的揺らぎの3種類をそれぞれ個別に分類したものです。
主な対象データタンパク質-立体構造
解説ページ →

DB-SPIRE

noimage
要約実験的または配列解析(ホモロジーサーチとマルチプルアライメント)によって同定されたアミノ酸配列モチーフのタンパク質立体構造における位置を登録したものです。アミノ酸配列モチーフデータベースとして、PROSITEとBLOCKSの2種類を用いました。前者は実験的のみ、後者は実験的および配列解析によるモチーフを登録したデータベースです。タンパク質立体構造データベースとしてはPDBを用い、各エントリーにおけるSEQRES行とATOM 行の両方の配列情報から、それぞれモチーフ位置を決めています。
主な対象データタンパク質-モチーフ
解説ページ →

DOGAN

noimage
要約NITEでゲノム解析した微生物のゲノムデータベースです。テキストと写真による詳細な菌株情報、塩基配列データ、ORFなどの遺伝子情報、遺伝子地図、プロテオーム解析結果を公開しています。これらの情報は、アノテーターによって確認されたものであり、時間の経過に即して再アノテーションも行っています。Blastを用いた相同性検索も行えます。
主な対象データDNA-配列 、プロテオーム
解説ページ →

Evola

noimage
要約Evola (Evolutionary annotation database)はH-InvDBのサブデータベースの1つとして、ヒト遺伝子の分子進化アノテーション情報を格納しています。ヒトと14のモデル生物とのオーソログについて、アラインメントや系統樹、正負の自然選択情報を提供しています。オーソログ解析対象の生物はヒト、チンパンジー、オランウータン、マカクザル、マウス、ラット、イヌ、ウマ、ウシ、オポッサム、ニワトリ、ゼブラフィッシュ、メダカ、ミドリフグ、トラフグです。
主な対象データ比較ゲノム
解説ページ →

EzCatDB

noimage
要約EzCatDBデータベースでは、酵素立体構造情報、文献情報などに基いて、酵素触媒機構を階層的に分類しています。各酵素エントリーには、酵素番号(EC number)、PDBエントリー、触媒部位、リガンド情報や文献情報、触媒機構に関する情報、他のデータベース(Swiss-prot, CATH, KEGG, PDBsum, PubMed, CSA & MACiE)へのリンクがはられています。
主な対象データタンパク質-立体構造 酵素
解説ページ →

GENIUS II

noimage
要約多重媒介配列検索法(MISS法)を用いて各生物種ゲノムの全ORFを構造既知のタンパク質の立体構造に帰属したデータベースシステムです。
主な対象データタンパク質-配列 アミノ酸配列
解説ページ →

GenoBase

noimage
要約GenoBaseは大腸菌K-12(W3110)の生細胞システムを総合的に理解するためのデータベースである。GenoBaseは大腸菌に関する配列情報、プロテオーム、トランスクリプトーム、バイオインフォマティクス、文献に基づく知識の公共リポジトリである。NEDOプロジェクトの成果が一部含まれています。
主な対象データアノテーション
解説ページ →

H-InvDB

noimage
要約H-InvDBはヒトの遺伝子と転写産物を対象とした統合データベースです。ヒトのすべての転写産物の配列をあらゆる手法で解析することにより、ヒト遺伝子の構造、選択的スプライシング、タンパク質としての機能などの精査されたアノテーション(注釈付け)情報を提供しています。
主な対象データRNA ヒト完全長cDNA, mRNA
解説ページ →

HGPD

noimage
要約HGPDはヒトゲートウェイクローンやタンパク発現データ、細胞内局在を格納し、これらクローンを検索できるユニークなデータベースです。NEDOの完全長cDNAプロジェクトで、30000件のヒトcDNAクローン配列を解析しました。(論文からhttp://nar.oxfordjournals.org/cgi/content/abstract/gkn872?ijkey=zKpNqhZH6jrUuzi&keytype=ref)
主な対象データDNA-配列
解説ページ →

INOH Pathway Database

noimage
要約ヒト、マウス、ラット等のモデル動物のパスウェイデータベースです。シグナル伝達パスウェイや代謝を構成する複層的生体分子の関係などの情報を含みます。(備考:BioPAX)(旧URL:http://www.inoh.org/)
主な対象データタンパク質-プロテオーム
解説ページ →

LEGENDA

noimage
要約Legendaは、MEDLINE文献に書かれた遺伝子、遺伝子機能、疾患、または基質のうち、2つが共起した文献を探すシステムです。遺伝子2つのような同じタイプでも検索できます。独自の遺伝子名辞書をもっています。
主な対象データ文献 、遺伝子、疾患、基質
解説ページ →

NBRCオンラインカタログ検索

noimage
要約NBRC (NITE Biological Resource Center)は、バイオ産業の発展のため、糸状菌、酵母、細菌、放線菌、微細藻類など多様な微生物資源を収集・保存し、提供しています。本サイトでは、試験及び研究開発を行う企業・大学等が、これら資源の検索と詳細情報を確認することができます。
主な対象データDNA-配列
解説ページ →

PCDq

noimage
要約PCDqは、予測複合体を含めたヒト蛋白質複合体のデータベースです。BIND、DIP、MINT、HPRD、IntActおよびGNP_Y2Hの6つの蛋白質間相互作用(PPI)データを整理統合し、PPIネットワークの密な領域から蛋白質複合体が予測され、それらを文献と比較し修正することで、既知の複合体情報と予測された複合体情報の両方を格納しています。既知と予測のサブユニットを区別・活用するため、品質管理指数(complex quality index: CQI)を、各複合体に付与しています。また、複雑なネットワークを簡素に示す図を表示・編集できる機能PPI-Mapがあります。
主な対象データ相互作用
解説ページ →

PDB-REPRDB

noimage
要約PDB(Protein Data Bank)により提供されるタンパク質チェインを分類して代表タンパク質チェインを決定し、「代表チェインのリスト」と「代表チェインに従属するチェイングループのリスト」を提供するデータベースです。 また、SCOP の分類をもとに、coiled coil proteins と peptides のチェインは分類対象から除くものとします。
主な対象データタンパク質-立体構造 タンパク質チェイン
解説ページ →

Phosphorylation activity measurement-based pathway profiling database for drug-response

noimage
要約Phosprofは、細胞が薬剤を投与された際にどのようなパスウェイの活性が変化するかを、産業技術総合研究所 細胞分子生物工学研究所 が独自開発したタンパク質リン酸化測定および解析技術を用いて全94化合物に対して2つの細胞株で調査した結果をまとめたデータベースです。タンパク質のリン酸化測定には、細胞内シグナル伝達経路を構成する1300以上の合成タンパク質を搭載したプロテインアレイを用い、全376パスウェイについてその活性を統計的に評価しています。Phosprofではリン酸化活性が特に変化した分子群をパスウェイマップ上で表示させたり、これらをもとに特徴的なパスウェイ名を調べたり、薬剤間でパスウェイ活性を比較することができます。これは、薬剤開発や機能解析に役立ちます。
主な対象データタンパク質
解説ページ →

PPI view

noimage
要約PPI viewは、ヒトのタンパク質間相互作用 (PPI:Protein-Protein Interaction)情報を表示しています。主要な5つのPPIデータベース(BIND, DIP, MINT, HPRD, IntAct)から、データの収集・統合を行い、H-InvDBの独自予測されたタンパク質についてPPIの割り当てを行いました。その結果、9,268件のタンパク質からなる32,198件のヒトのタンパク質間相互作用情報が得られました。 (H-InvDB version 5.0時点)PPI viewはユーザーの興味あるタンパク質(遺伝子産物)と相互作用するタンパク質を表示し、そのタンパク質の遺伝子の位置(Locus view)や遺伝子の機能情報(cDNA view)へのリンク、そしてデータ元PPIデータベースへの参照情報や、文献、実験手法を表示します。PPI view: http://www.h-invitational.jp/hinv/ppi/ PPI view サンプル画面:http://www.h-invitational.jp/hinv/ppi/ppi_view.cgi?hip=HIP000084307
主な対象データタンパク質-プロテオーム
解説ページ →

ProSeg

noimage
要約PrpSegは、タンパク質分子の部分構造を網羅的に分類、整理したデータベースです。7万以上のセグメントが主鎖の構造類似性にしたがって数千個程度のクラスタに分類されています。[出典]産総研プレスリリース(2008.4.5)http://unit.aist.go.jp/brf/brf-breed/ci/outputs/
主な対象データタンパク質-モチーフ
解説ページ →

SARS(severe acute respiratory syndrome)-CoV2 Protein NMR Database

noimage
要約AMEDプロジェクト「新規コロナウイルス病およびその他の感染症に対処するための技術開発プロジェクト」の一環として、産業技術総合研究所 細胞分子生物工学研究所は、無細胞発現タンパク質発現系を利用し、SARS-CoV-2タンパク質の45の構造ドメインのうち27を発現および精製することに成功しました。 これらはウイルスのORFの50%以上をカバーしています。 また、ORF3bやORF9bなどの非定型タンパク質の取得にも成功しました。  SARS-CoV2-NMR DBは、3つの非標準配列を含む22の構造ドメインの2D NMRスペクトルを保持し、精製タンパク質の構造の均一性と品質を保証します。 スペクトルはまた、SARS-CoV-2タンパク質の相互作用と構造を原子レベルで分析することを可能にします。これは、薬剤開発と基本的な生物学的研究に役立ちます。
主な対象データタンパク質
解説ページ →

SEVENS

noimage
要約GPCR遺伝子の網羅的データベースです。7本膜貫通ヘリックス型タンパク質のGPCR遺伝子を網羅的に収めたデータベースです。32の真核生物のゲノムからバイオインフォマティクス手法で、遺伝子を高精度に同定しています。
主な対象データタンパク質-配列 アミノ酸配列
解説ページ →

TMBETA-DISC

noimage
要約アミノ酸配列からベータバレル構造タンパクを識別する統計的かつSVM法をベースとした手法を開発しました。アミノ酸構成であるresidue pair preferenceとモチーフがこのプログラムの主な特徴です。TMBETADISC-COMP、TMBETADISC-DIPEPTIDE、TMBETADISC-MOTIF、TMBETADISC-SVM、TMBETADISC-RBFの5種のプログラムがあります。(オリジナルサイトから翻訳)
主な対象データタンパク質-アミノ酸特性
解説ページ →

TMBETA-GENOME

noimage
要約TMBETA-GENOMEはゲノム配列が完了している生物種のゲノム中に含まれるβ?バレル型膜タンパク質のデータベースです。各ゲノム配列に対して、機械学習と統計手法を用いた計算が実行され、それらのアノテーション結果がデータベースに格納されています。その他、アミノ酸配列を入力してβ-バレル型膜タンパク質の判別解析を行う"TMBETA-DISC"や"TMBETA-SVM"などのツールも提供されています。
主な対象データタンパク質-立体構造
解説ページ →

TMFunction

noimage
要約TMFunctionはアルファへリックスやベータバレル膜タンパクの機能に重要な残基についてのデータベースです。2907件のデータ、108件の論文、83件のタンパク、29種の機能が格納されています(オリジナルサイトから翻訳)。
主な対象データタンパク質-立体構造 、機能残基
解説ページ →

TOT-DB

noimage
要約TOT-DB (The Theileria orientalis Genome Annotation Database)は、寄生性原虫タイレリア・オリエンタリスの遺伝子と転写産物を対象にしたデータベースです。G-integraプラットフォームのゲノムブラウザによって、発現データおよび遺伝子予測ソフトウェアからアノテーションされた遺伝子領域が表示されます。ゲノムブラウザ上で閲覧するだけではなく、BLASTによる相同検索やデータの一括ダウンロードも行えます。
主な対象データ比較ゲノム
解説ページ →

TraP

noimage
要約7種の古細菌の解糖系などの代謝経路を比較したデータベースです。
主な対象データ代謝産物
解説ページ →

VarySysDB

noimage
要約VarySysDBは、ゲノム統合プロジェクトによって、H-Inv転写産物に関連付けられる形で注釈付けられたヒト多型情報を、公開する目的で作成されたデータベースです。つまり、転写領域やスプライス・サイト上の一塩基多型、挿入欠失多型、STR多型、単一アミノ酸多型、構造多型、連鎖不平衡領域について、それぞれH-InvDBの転写産物と機能ドメインに関連づけて、情報整備して公開しています。VarySysDBでは、個々の多型情報ごと及び転写産物ごとに整備された情報を、検索し表示ができる他、キーワードによる検索も可能になりました。検索した情報はダウンロードもできます。
主な対象データDNA-多型
解説ページ →

ラットの脳断面図

noimage
要約ラットの脳断面の画像データを7枚見ることができるデータベース。画像は超精細画像であり、拡大表示するとニューロンが見える。産業技術総合研究所、(株)映像美術院、(株)PFUの協力により作成された。(オリジナルサイトから)
主な対象データ形態 画像
解説ページ →

微生物データベースシステム

noimage
要約微生物名がわかっている場合、その属種名を入力すれば、オリジナル論文、旧名(もしあれば)、系統的位置、type strain、分離源、化学分類指標になる各種化学成分、基質利用性、エネルギー獲得様式、16S rDNAのDDBJ/EMBL/GenBankなどへのaccession numberなどの情報が得られます。微生物名以外にも、ある特定成分をもつ微生物を検索することもできます。
主な対象データ文献 旧名(もしあれば)、系統的位置、type strain、分離源、化学分類指標になる各種化学成分、基質利用性、エネルギー獲得様式、16S rDNAのDDBJ/EMBL/GenBankなどへのaccession numberなど
解説ページ →

糸状菌ゲノム・転写制御データベース

noimage
要約糸状菌の一種である麹菌(Aspergillus oryzae)は、日本では伝統的に酒・味噌・醤油な ど、 発酵・醸造工業に広く用いられています。また、最近ではバイオテクノロジーによるタンパク質や酵素などの分泌生産にも用いられるようになりました。このデータベースは、この麹菌について、塩基配列および発現制御などの役に立つ情報を集めるために企画したものです。EST データベース、転写制御データベース、 コスミドシークエンスの3種類のデータで校正されています。EST データベースでは、富栄養培地および貧栄養培地で培養した麹菌菌体よりRNAを調製し、プラスミドによるクローンを無作為に シングルパスのシークエンスを行なった結果に対して、FastAによる相同性検索ができます。
主な対象データDNA-配列
解説ページ →