次世代シーケンサーアッセンブラーモジュール
SeqMan NGen(エヌジェン)
- version 3.0
SeqMan NGenは、1台のWindowsおよびMacintosh PCのGUIのプロジェクトウィザードを用いて、Illumina®, 454®, Helicos, SOLiD (GFF), IonTorrent, そしてサンガーテクノロジーからの配列データを独自のアルゴリズムで高速にアッセンブルするアプリケーションです。
このソフトウェアでは、上記のように広範囲な次世代シーケンステクノロジーの、ゲノムおよびトランスクリプトームのde novoアッセンブルや、リファレンストアッセンブル(リシーケンス)をすることができます。
最新バージョン、3.0では、ヒト全ゲノムに対する約30xでの高速リファレンストアッセンブル(リシークエンス)を実現しました。
これにより、シーケンスキャプチャーによる、エクソンリファレンストアッセンブル(リシーケンス)解析も可能になりました。
今後も次世代シーケンサー技術の進歩にあわせ、随時バージョンアップを重ねて行きます。
- 特長及び機能
- Illumina®, 454®、Helicos, SOLiD(GFF), IonTorrent, サンガーデータのデスクトップコンピューター(Windows、Macintosh)におけるアッセンブル
- 新開発のアルゴリズムにより、ヒト全ゲノムを含む様々なリファレンスを用いたアッセンブルをリーゾナブルな時間で処理
- 最大3000万リードによる、ゲノムおよびトランスクリプトームのde novo アッセンブルが可能
- アッセンブルのカヴァレッジは10,000x以上可能
- SNP探索機能においては、Bayesian statisticsを用いたgenotypeおよび確率解析が、dbSNP解析とともに可能
- Lasergene配列解析ソフトウェアとの併用による多様な配列解析および可視化機能
- BAM/SAM形式、ACE形式でのアッセンブル出力も可能
- GUIのプロジェクトウィザードによる簡単な設定および容易な使用
- DNASTAR社によるトータルサポート
- リファレンストアッセンブル(リシーケンス)解析においては、リファレンスファイルの準備(現時点でDNASTAR社からは、ヒト、マウス、ラット、コメのdbSNPを含むアノテーション付きリファレンスを提供)
- SeqBuilderにおけるリファレンス配列のアノテーション付け(オプション、下記参照)
- プロジェクトウィザードに従って、解析の種類、リードデータおよびリファレンス等を指定、入力
- データをアッセンブル
- SeqMan Proによる、アッセンブル結果の閲覧と、SNP解析、genotype解析、メタゲノム解析、scaffold構築等の様々なアッセンブル後解析
- リファレンス配列の事前アノテーション付け(オプション)
- 変異(SNP)
- CDS
- 多様なRNA
- リピート開始点
- rRNA
- tRNA
- エクソン
- ユーザー定義による柔軟性
- SNP検出
- SeqMan NGenでは、リファレンストアッセンブル(リシーケンシング)においてSNPを含む領域を埋めるため、アッセンブル処理回数を管理すると共に、それらの処理の中で、適合パーセンテージの最小値をセットすることが出来ます。プロジェクトによってはこれらの柔軟性は、関連性を持つSNPに特化した解析に有益と考えられます。
- コンティグサイズに関する様々な設定と機能
- コンティグの中に表されるリードの数の最小値を設定することが出来ます。
リファレンストアッセンブル後、最小値より少ない配列を持ち、リファレンス配列を含まないコンティグは逆アッセンブルされます。
アッセンブルされなかったリードはFASTAファイルに保存することが出来ます。
また、カヴァレッジが0の部分で、リファレンスを切って、独立したコンティグにすることが出来ます。
これは、より大きな変異を探索するのに有効です。
さらに、アッセンブルされなかったリードを、de novoアッセンブルすることで、生成された新規コンティグは、インサート変異の候補になり得ます。 - SeqMan Proにおける配列結果の閲覧
- 最大予測カヴァレッジ値を超える領域の閲覧
- Strategy Viewウィンドウ
- ペアエンド情報の設定と取り込み
- レポート出力
- de novoアッセンブルについて
- アッセンブル結果の閲覧、解析について
以下は、SeqMan NGenにおける一般的な作業手順です。
ここで示す手順はSeqMan NGenとLasergeneのSeqBuilderおよびSeqMan Proモジュールとの間の協調機能になります。
SeqMan NGenにて配列をアッセンブルする前に、SeqBuilder、もしくはGeneQuest、SeqMan Proにて、リファレンス配列の既知SNPや変異、その他フィーチャーのアノテーション付けが可能です。SeqBuilderはLasergeneの配列編集モジュールで、配列の可視化などを実行することができます。アノテーション付けしたリファレンス配列を用いてSeqMan NGenにてアッセンブルすると、その後のSeqMan Proにおける推定SNPの同定解析をより精密に行なうことができます。
SeqBuilderではその後のSeqMan Proにおける閲覧段階も含め、様々なフィーチャーを提供しています 。
SeqMan NGenでは、プロジェクトウィザードに入力した情報を基に、自動で最適な解析パラメータをセッティングすることが出来ますが、さらに使用者による特定のデータセットの要求に合う様にアッセンブルパラメーターを調節することができる柔軟性を提供しています。データセットやデータタイプは多種多様ですので、SeqMan NGenでは個々のアッセンブルに対してデータセットに合う様にパラメーターを調節し、アッセンブルの性能を変更することができます。ギャップパラメーターを調整してより多くの配列をそれぞれのコンティグに並べることもできます。
加えて、ベクターやエンドトリミング、既知のリピートやプライマーリードなどのコンタミ配列をアッセンブルから削除するなどの事前プロセスオプションを選択することもできます。

SeqMan NGenによるアッセンブル後、保存されたプロジェクトは、自動的に起動するLasergeneのSeqMan Proモジュールにて、カヴァレッジやSNP同定などの解析を行なうことができます。
アッセンブルはProject ウィンドウに表示されます。

SeqManには最大予測カヴァレッジ値を設定できるオプションがあります。
これによって、このカヴァレッジ値を超える領域を簡単に表示することができます。
下記はSeqMan ProのStrategy Viewウィンドウです。このウィンドウにて上記の最大予測カヴァレッジを超えた領域を赤でハイライト表示することができます。

SeqMan NGenではサンガーのペアシーケンスにおいて、Dual-Endペア情報を利用することができます。
ペア情報の利用機能は配列ペアの命名法を規定したり、挿入配列の両末端の最小・最大距離が設定できます。
同時に、クローン中の順鎖、逆鎖の命名パターンを決めることも出来ます。
454のPaired(Dual)-Endデータ、およびIlluminaのPaired-End、Mate-pairデータについても同様に取り扱うことが出来ます。
SeqMan NGenではアッセンブルされたリード、及びされなかったリードの数、プロジェクトで生成されたコンティグ数、使用パラメーター、平均クォリティスコア、最大カヴァレッジ値を超えたためにアッセンブリより除外されたリードの数など、アッセンブルにおける統計をまとめたレポートを出力することが出来ます。
de novoアッセンブルに投入できるリード数はPCのメモリ量に依存しますが、推奨スペックでは、最大で3000万リードまで投入可能です。
長さ約50Mbpまでの微生物ゲノムアッセンブルや、ほとんどの生物種のde novoトランスクリプトームアッセンブルが可能です。
SeqMan NGenはアッセンブルに特化したソフトウェアであり、単体では結果を閲覧、解析することが出来ません。
結果の閲覧、解析は、LasergeneのモジュールであるSeqMan Proにて行うことを基本としておりますが、Phrap assembly(.ace)形式、BAM/SAM形式での結果出力も可能です。
なお、SeqMan NGen御購入の際はLasergeneモジュールが同梱されますが、既にお持ちの場合は単体でも購入可能です。
システム環境
お使い頂けるPCの環境は、対象生物のゲノムサイズや解析方法に依存しますが、ここではSeqMan NGen 3の機能が最大限発揮できる構成を提示致します。
ゲノムサイズによっては、外付けハードディスクの容量が少なくてすむ場合があります。
Windows® 推奨使用環境
|
Macintosh® 推奨使用環境
|
Macintosh版につきましては30日間無料トライアル版を御用意しております。
Windows版の無料トライアル版につきましては、お問い合わせ下さい。
お問い合わせ
株式会社ネットウエル ライフサイエンス営業部
TEL:03-5368-3459
オンラインでのお問い合わせはお問い合わせフォームから


