キュレーションされたCNV、シーケンスバリエーション、アクセスの簡素化。
がんゲノムアトラス(TCGA)は、30種類以上のがんタイプで12,000腫瘍に近づくゲノムプロファイルを含むように成長している驚くべき資源です。 データを再分析し、訓練を受けた科学者によって各サンプルの結果を手動でキュレーションすることにより、TCGA Premierデータベースは、この豊富なリソースから最も忠実度の高いコピー番号情報を提供します。
専門家によってキュレーションされた機能と利点
特別なアクセスを通じて入手可能な生データから始めて、我々は、生殖細胞多型を除去するために、それらの適合した正常と腫瘍をペアリングしています。 その後、専門家の科学者は、各サンプルのゲノムプロファイルを確認し、ベースライン倍数およびセグメンテーションを修正し、モザイク閾値境界上のコピー中性ホモ接合セグメント(LOH)および事象を手動で呼び出します。
統合シーケンスバリアント
全エクソームシーケンシングによって得られたシーケンスバリアントは、CNVに統合され、より包括的なゲノム画像を提供します。
完全注釈付きデータセットデータセットには、特定のサンプルのレビュー担当者コメント、使用されたパラメータ設定の呼び出し、その他のサンプル固有の情報、および生存率、腫瘍の悪性度などの詳細な臨床的注釈が付いており、詳細な分析を促進します。
TCGAプレミアを選ぶ理由
集団全体のプロファイルに適した結果を生成GISTICサンプルを処理する研究の広い範囲に有用ですが、個々のサンプルは過剰セグメント化され、多くは間違った倍数を有していました。 これらを修正し、配列多様体を統合することで、データセットが生存分析や腫瘍サブタイプのプロファイリングなどの研究でより有用になることを可能にしました。
---