Séquençage en temps réel à une molécule

Pacific Biosciences (PacBio) a commercialisé le séquençage SMRT en 2011, après avoir sorti une version bêta de son instrument RS fin 2010.

RS et RS IIEdit

La cellule SMRT pour un séquenceur RS ou RS II

À la commercialisation, la longueur de lecture avait une distribution normale avec une moyenne d’environ 1100 bases. Un nouveau kit de chimie sorti début 2012 a augmenté la longueur de lecture du séquenceur; un premier client de la chimie a cité des longueurs de lecture moyennes de 2500 à 2900 bases.

Le kit de chimie XL publié fin 2012 a augmenté la longueur de lecture moyenne à plus de 4300 bases.

Le 21 août 2013, PacBio a publié un nouveau Kit de liaison à l’ADN polymérase P4. Cette enzyme P4 a des longueurs de lecture moyennes de plus de 4 300 bases lorsqu’elle est associée à la chimie de séquençage C2 et de plus de 5 000 bases lorsqu’elle est associée à la chimie XL. La précision de l’enzyme est similaire à celle de C2, atteignant QV50 entre 30X et 40X de couverture. Les attributs P4 résultants ont fourni des assemblages de meilleure qualité utilisant moins de cellules SMRT et des appels de variantes améliorés. Lorsqu’elle est couplée à la sélection de la taille de l’ADN d’entrée (à l’aide d’un instrument d’électrophorèse tel que la Bluepippine), la longueur de lecture moyenne dépasse 7 kilobases.

Le 3 octobre 2013, PacBio a publié une nouvelle combinaison de réactifs pour PacBio RS II, l’ADN polymérase P5 avec chimie en C3 (P5-C3). Ensemble, ils étendent les longueurs de lecture de séquençage à une moyenne d’environ 8 500 bases, les lectures les plus longues dépassant 30 000 bases. Le débit par cellule SMRT est d’environ 500 millions de bases démontrées par les résultats de séquençage de la lignée cellulaire CHM1.

Le 15 octobre 2014, PacBio a annoncé la sortie d’une nouvelle chimie P6-C4 pour le système RS II, qui représente la 6ème génération de polymérase et la chimie de 4ème génération de la société, étendant encore la longueur de lecture moyenne à 10 000 à 15 000 bases, les lectures les plus longues dépassant 40 000 bases. Le débit avec la nouvelle chimie devrait être compris entre 500 millions et 1 milliard de bases par cellule SMRT, selon l’échantillon séquencé. C’était la version finale de chemistry publiée pour l’instrument RS.

Le débit par expérience pour la technologie est à la fois influencé par la longueur de lecture des molécules d’ADN séquencées ainsi que par le multiplex total d’une cellule SMRT. Le prototype de la cellule SMRT contenait environ 3000 trous ZMW qui permettaient le séquençage de l’ADN parallélisé. Lors de la commercialisation, les cellules SMRT étaient chacune modelées avec des trous de 150 000 ZMW qui ont été lus en deux séries de 75 000. En avril 2013, la société a publié une nouvelle version du séquenceur appelée « PacBio RS II » qui utilise simultanément les 150 000 trous ZMW, doublant ainsi le débit par expérience. Le mode de débit le plus élevé en novembre 2013 utilisait la liaison P5, la chimie C3, la sélection de la taille de la Bluepippine et un PacBio RS II a officiellement donné 350 millions de bases par cellule SMRT bien qu’un ensemble de données de novo humain ait été publié avec une chimie en moyenne de 500 millions de bases par cellule SMRT. Le débit varie en fonction du type d’échantillon séquencé. Avec l’introduction de la chimie P6-C4, le débit typique par cellule SMRT est passé de 500 millions de bases à 1 milliard de bases.

RS Performance
C1 C2 P4-XL P5-C3 P6-C4
Average read length bases 1100 2500 – 2900 4300 – 5000 8500 10,000 – 15,000
Throughput per SMRT Cell 30M – 40M 60M – 100M 250M – 300M 350M – 500M 500M – 1B

SequelEdit

Cellule SMRT pour un séquenceur Sequel

En septembre 2015, la société a annoncé le lancement d’un nouvel instrument de séquençage, le système Sequel, qui a augmenté la capacité à 1 million de trous ZMW.

Avec l’instrument Sequel, les longueurs de lecture initiales étaient comparables à celles du RS, puis les versions de chimie ultérieures augmentaient la longueur de lecture.

Le 23 janvier 2017, la chimie V2 est sortie. Il a augmenté les longueurs de lecture moyennes entre 10 000 et 18 000 bases.

Le 8 mars 2018, la chimie 2.1 a été publiée. Il a augmenté la longueur de lecture moyenne à 20 000 bases et la moitié de toutes les lectures supérieures à 30 000 bases de longueur. Le rendement par cellule SMRT a augmenté à 10 ou 20 milliards de bases, respectivement pour les bibliothèques à insertion importante ou les bibliothèques à insertion plus courte (par exemple, amplicon).

Pointe de pipette dans une cellule SMRT de 8 m

Le 19 septembre 2018, la société a annoncé la chimie Sequel 6.0 avec des longueurs de lecture moyennes augmentées à 100 000 bases pour les bibliothèques à insertion plus courte et 30 000 pour les bibliothèques à insertion plus longue. Le rendement des cellules SMRT a augmenté jusqu’à 50 milliards de bases pour les bibliothèques à insertion plus courte.

Performances de la suite
V2 2.1 6.0
Bases de longueur de lecture moyenne 10 000 – 18 000 20 000 -30 000 30 000 -100 000
Débit par cellule SMRT 5B-8B 10B-20B 20B-50B

8M ChipEdit

En avril 2019, la société a publié une nouvelle cellule SMRT avec huit millions de ZMW, augmentant le débit attendu par cellule SMRT d’un facteur huit. Les clients d’accès anticipé en mars 2019 ont déclaré un débit de plus de 58 cellules gérées par les clients de 250 Go de rendement brut par cellule avec des modèles d’environ 15 Ko de longueur et un rendement de 67,4 Go par cellule avec des modèles de molécules de poids plus élevé. Les performances du système sont maintenant rapportées en lectures longues continues de poids moléculaire élevé ou en lectures HiFi pré-corrigées (également appelées Séquences de consensus circulaires (CCS)). Pour les lectures de poids moléculaire élevé, environ la moitié de toutes les lectures ont une longueur supérieure à 50 ko.

Performance de Poids moléculaire élevé Sequel II
Accès anticipé 1.0 2.0
Débit par cellule SMRT ~ 67,4 Go Jusqu’à 160 Go Jusqu’à 200 Go

Les performances HiFi incluent des bases corrigées avec une qualité supérieure au score Phred Q20, en utilisant des passes d’amplicon répétées pour la correction. Ceux-ci prennent des amplicons jusqu’à 20 Ko de longueur.

Sequel II HiFi Corrected Read Performance
Early Access 1.0 2.0
Raw reads per SMRT Cell ~250 GB Up to 360 GB Up to 500 GB
Corrected reads per SMRT Cell (>Q20) ~25 GB Up to 36 GB Up to 50 GB

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.