Lý do và phương pháp giải trình tự bộ gen

Trình tự bộ gen là phức tạp, phức tạp và đòi hỏi công nghệ chuyên ngành. Một phân đoạn 500- 800 bp có thể được giải trình tự. Tuy nhiên, bộ gen rất lớn, ví dụ E. coli với 4.2 x 10 6 bp và 3.2 x 10 9 bp cho con người.

Do đó để giải trình tự các phân đoạn nhỏ là cần thiết. Các phân đoạn như vậy được tạo ra bằng cách phá vỡ DNA bộ gen thành các mảnh nhỏ ngẫu nhiên. Những mảnh như vậy thường chồng lên những mảnh khác ở đầu của chúng. Các mảnh được nhân bản trong một vectơ để tạo ra một thư viện bộ gen của sinh vật.

Lý do giải trình tự bộ gen hoàn chỉnh:

(i) Nó cung cấp thông tin làm cơ sở cho việc phát hiện ra gen và cung cấp kho gen.

(ii) Nó đại diện cho các mối quan hệ có thể có giữa các gen.

(iii) Trình tự bộ gen cung cấp một bộ công cụ để thử nghiệm thêm.

(iv) Thông tin di truyền của một sinh vật được tạo sẵn từ trình tự gen.

(v) Hoàn thành trình tự di truyền của một sinh vật cung cấp tất cả thông tin di truyền cần thiết để hình thành một sinh vật.

Phương pháp được sử dụng cho trình tự bộ gen:

(i) Trình tự được định hướng của các chuỗi nhiễm sắc thể nhân tạo vi khuẩn (BAC):

Nhiễm sắc thể nhân tạo vi khuẩn đơn giản là các plasmid được thiết kế để nhân bản các đoạn rất dài (tức là 100.000 đến 300.000 bp) DNA. Các vectơ này được sử dụng để tạo các thư viện bộ gen trong đó kích thước chèn là 80-100 kb. Các đoạn DNA của hàng ngàn cặp bazơ được nhân bản vào vec tơ BAC.

Thư viện bộ gen được sàng lọc bằng cách định vị các bản sao hạn chế phổ biến được gọi là contigs. Các thành viên của contig chứa một số vùng chồng lấn để cho phép xác định chính xác vị trí của chúng trong contig.

Mục đích cuối cùng của các phương pháp ánh xạ vật lý là nhận được một contig hoàn chỉnh cho mỗi nhiễm sắc thể của bộ gen. Các đường viền được ánh xạ được sắp xếp theo trình tự bằng cách chia các đoạn DNA lớn thành các đoạn nhỏ. Mỗi bản sao của contig được giải trình tự. Trình tự nucleotide được xác định một mình bằng cơ sở nhân bản cho đến khi bộ gen hoàn chỉnh được giải trình tự.

(ii) Trình tự bắn súng ngẫu nhiên hoặc cách tiếp cận từ dưới lên:

Có thể nhân bản trong một sinh vật bất kỳ gen mong muốn từ một sinh vật khác bằng cách bắn súng. Đối với toàn bộ bộ gen của sinh vật đầu tiên được tiêu hóa với endonuclease hạn chế để tạo ra một hỗn hợp ngẫu nhiên của các mảnh.

Các thư viện ngẫu nhiên (shotgim) của DNA bộ gen được xây dựng nhỏ, tức là 2, 0 kb và trung bình tức là các vectơ plasmid chèn 10 kb cùng với thư viện BAC shotgun lớn chèn súng (80-100 kb). Các mảnh được chèn vào vector plasmid và các plasmid tái tổ hợp chuyển thành tế bào chủ mong muốn.

Trong bắn súng, trình tự sao chép được chọn ngẫu nhiên được sắp xếp theo trình tự cho đến khi phân thân trong thư viện bộ gen được phân tích. Nói cách khác, chúng ta có thể nói rằng trong nhiễm sắc thể trình tự súng bắn ngẫu nhiên được chia thành các phần và sau đó phần DNA bộ gen được chia thành hàng triệu phân đoạn nhỏ và tất cả các phân đoạn được sắp xếp theo kiểu không thiên vị.

Các khu vực của DNA chồng chéo được khớp với nhau tạo thành các phân đoạn DNA bộ gen lớn hơn và lớn hơn. Trình tự DNA được thực hiện ở cả hai đầu của các dòng vô tính được chọn ngẫu nhiên từ cả hai thư viện plasmid chèn vừa và nhỏ để cung cấp ít nhất ba lần phạm vi của bộ gen.

Các đoạn DNA nhỏ được chèn ngẫu nhiên vào các phân tử plasmid khác nhau. Trong trường hợp chèn chồng chéo, tất cả chúng đều đến từ cùng một vị trí gen nhưng từ các vùng khác nhau chuyển sang trái hoặc phải so với nhau.

Các mảnh trùng lặp được sắp xếp thành một trong hai hoặc cho một chuỗi cho khu vực liên quan (phương pháp bắn súng). Bộ gen của prokaryotic có ít trình tự DNA và súng bắn tương ứng cho kết quả tốt. Sinh vật nhân chuẩn chịu nhiều trình tự lặp đi lặp lại.

Tất cả điều này dẫn đến sự nhầm lẫn. Tuy nhiên, sự chồng chéo của các mảnh được khai thác trong giai đoạn lắp ráp bằng bài tập tính toán. Chương trình máy tính xác định các chuỗi chồng chéo và nối chúng thành một chuỗi liên tục. Quá trình này đã được áp dụng thành công để giải trình tự tất cả các trình tự bộ gen của vi sinh vật được công bố bởi Celera Genomics.