次世代シークエンサーアッセンブラー
SeqMan NGen
SeqMan NGen(SNG)はコマンドライン操作によって、Illumina®, 454®, そしてサンガーテクノロジーからの配列データを独自のアルゴリズムでアッセンブルするアプリケーションです。
このソフトウェアでは、広範囲な次世代シークエンスプロジェクトのゲノムアッセンブルやリシークエンスタイプを処理することができます。
SeqMan NGenは、2008年1月にEarly Rerease版として発表したSeqMan Genome Assembler(SMGA)に、技術革新に伴う画期的な新機能を盛り込み、正規版として販売されるものです。
- 特長及び新機能
- Illumina®, 454®、サンガーデータのデスクトップコンピューター(Win、Mac)における
アッセンブル - 12Mbサイズのゲノムデータのアッセンブル
- テンプレート参照によるアッセンブルに加え、de novoアッセンブルも可能
- Illumina、454、Sangerデータの混合アッセンブルが可能
- アッセンブルのカバー率は10,000x以上可能
- 充実したSNPs探索機能
- Lasergene配列解析ソフトウェアとの併用による多様な配列解析および可視化機能
- 簡単な設定および容易な使用
- DNASTAR社によるトータルサポート
- SeqBuilderにおけるテンプレート配列のアノテーション付け(オプション)
- アッセンブル用スクリプトの書き込み
- SeqMan NGenにてスクリプトを実行し、配列データをアッセンブル
- アッセンブリ統計の閲覧とSeqMan Proにおける解析
- テンプレート配列の事前アノテーション付け(オプション)
- 変異(SNPs)
- CDS
- 多様なRNA
- リピート開始点
- rRNA
- tRNA
- エクソン
- ユーザー定義による柔軟性
- SNP検出とその報告処理
- SeqMan NGenでは、テンプレートによるアッセンブルにおいてSNPを含む領域を埋めるため、アッセンブル回数を管理すると共に、それらの処理の中で、適合パーセンテージの最小値をセットすることが出来ます。プロジェクトによってはこれらの柔軟性は、関連性を持つSNPに特化した解析に有益と考えられます。
- コンティグサイズの最小値設定
- コンティグの中に表される配列の数の最小値を設定することが出来ます。
アッセンブル後、最小値より少ない配列を持ち、テンプレート配列を含まないコンティグは逆アッセンブルされます。
アッセンブルされなかった配列はFASTAファイルに保存することが出来ます。 - SeqMan Proにおける配列結果の閲覧
- 最大予測カバー率深度を超える領域の閲覧
- Strategy Viewウィンドウ
- Dual-Endペア情報の設定と取り込み
- レポート出力
- de novoアッセンブルについて
- アッセンブル結果の閲覧、解析について
以下は、SeqMan NGenにおける一般的な作業手順です。ここで示す手順はSeqMan NGenとLasergeneのSeqBuilderおよびSeqMan Proモジュールとの間の協調機能になります。
SeqMan NGenにて配列をアッセンブルする前に、SeqBuilder、もしくはGeneQuest、SeqMan Proにて、テンプレート配列の既知SNPsや変異、その他フィーチャーのアノテーション付けが可能です。SeqBuilderはLasergeneの配列編集モジュールで、配列の可視化などを実行することができます。アノテーション付けしたテンプレート配列をSeqMan NGenにてアッセンブルすると、その後のSeqMan Proにおける推定SNPsの同定解析をより精密に行なうことができます。
SeqBuilderではその後のSeqMan Proにおける閲覧段階も含め、様々なフィーチャーを提供しています 。
SeqMan NGenでは、使用者による特定のデータセットの要求に合う様にアッセンブルパラメーターを調節することができる柔軟性を提供しています。デフォルトパラメータ設定ではシンプルに解析を行うことが出来ますが、データセットやデータタイプは多種多様ですので、SeqMan NGenでは個々のアッセンブルに対してデータセットに合う様にパラメーターを調節し、アッセンブルの性能を変更することができます。解析精度を最適化することで、ギャップパラメーターを調整してより多くの配列をそれぞれのコンティグに並べることもできます。
加えて、ベクターやエンドトリミング、既知のリピートやプライマーリードなどのコンタミ配列をアッセンブリから削除するなどの事前プロセスオプションを選択することもできます。

SeqMan NGenによるアッセンブル後、保存されたプロジェクトはLasergeneのSeqMan Proモジュールにて、カバー率やSNPs同定などの解析を行なうことができます。
アッセンブリはProject ウィンドウに表示されます。アッセンブルされなかった配列を保存した場合は、それらをUnassembled Sequences ウィンドウに表示させることが出来ます(*。

(*SeqMan NGenの現バージョンでは、IlluminaのデータアッセンブルについてはSeqMan Proでのアッセンブルされなかった配列表示は出来ません。
SeqManには最大予測カバー率値を設定できるオプションがあります。
これによって、このカバー率を超える領域を簡単に表示することができます。
下記はSeqMan ProのStrategy Viewウィンドウです。このウィンドウにて上記の最大予測カバー率を超えた領域を赤でハイライト表示することができます。

SeqMan NGenではサンガーのペアシークエンスにおいて、Dual-Endペア情報を利用することができます。
ペア情報の利用機能は配列ペアの命名法を規定したり、挿入配列の両末端の最小・最大距離が設定できます。
同時に、クローン中の順鎖、逆鎖の命名パターンを決めることも出来ます。
IlluminaのPaired-Endデータについても同様に取り扱うことが出来ます。
454のPaired(Dual)-Endデータについては、専用のコマンドが用意されています。
SeqMan NGenではアッセンブルされた配列、及びされなかった配列の数、プロジェクトで生成されたコンティグ数、使用パラメーター、平均クォリティスコア、最大カバー率を超えたためにアッセンブリより除外された配列の数など、アッセンブルにおける統計をまとめたレポートを出力することが出来ます。
SeqMan NGenは、454®とサンガーデータについてはde novoおよびテンプレート(リファレンス)利用の両方のアッセンブルを行うことができます。
必要に応じて複数のテンプレートを使用することもできます。
Illumina®データのアッセンブルには基本的にはテンプレートを必要としますが、Paired-Endデータに限り、de novoアッセンブルが可能です。
さらに、テンプレートを用いたアッセンブル後に、用いられなかったリードを自動的にde novoアッセンブルする機能もあります。
SeqMan NGenはアッセンブルに特化したソフトウェアであり、単体では結果を閲覧、解析することが出来ません。
結果の閲覧、解析は、LasergeneのモジュールであるSeqMan Proにて行うことを基本としておりますが、Phrap assembly形式およびFASTAフォーマットでの結果出力も可能です。
なお、SeqMan NGen御購入の際はLasergeneが同梱されます。
システム環境
Windows® 推奨使用環境
|
Macintosh® 推奨使用環境
|
Windows版につきましては30日間無料トライアル版を御用意しております。
詳細は下記までお問い合わせ下さい。
お問い合わせ
株式会社ネットウエル ライフサイエンス営業部
TEL:03-5368-3459
オンラインでのお問い合わせはお問い合わせフォームから
