Genomics: Nghiên cứu cấu trúc và chức năng của Genomics

Genomics: Nghiên cứu cấu trúc và chức năng của Genomics!

Thuật ngữ bộ gen được H. Winkler (1920) giới thiệu để biểu thị bộ gen nhiễm sắc thể hoàn chỉnh và nhiễm sắc thể bổ sung có trong một sinh vật, bao gồm cả virus.

Thuật ngữ genomics do TH Roderick (1987) đặt ra có nghĩa là lập bản đồ và giải trình tự để phân tích cấu trúc và tổ chức của bộ gen. Nhưng hiện tại bộ gen bao gồm giải trình tự bộ gen, xác định bộ protein hoàn chỉnh được mã hóa bởi một sinh vật, và hoạt động của gen và con đường trao đổi chất trong một sinh vật.

Nghiên cứu về bộ gen được chia thành hai lĩnh vực sau:

1. Bộ gen cấu trúc liên quan đến việc xác định chuỗi gen hoàn chỉnh hoặc bộ protein hoàn chỉnh được tạo ra bởi một sinh vật. Các bước khác nhau liên quan là: (i) xây dựng bản đồ di truyền và vật lý có độ phân giải cao, (ii) Giải trình tự bộ gen và (iii) xác định bộ protein hoàn chỉnh trong cơ thể sinh vật. Nó cũng bao gồm việc xác định cấu trúc ba chiều của các protein liên quan.

2. Bộ gen chức năng nghiên cứu chức năng của gen và con đường trao đổi chất, tức là các mẫu biểu hiện gen trong sinh vật.

Trình tự bộ gen:

Giải trình tự bộ gen là một quá trình đòi hỏi rất kỹ thuật và phức tạp. Trong một lần, một đoạn 500-600 bp có thể được giải trình tự. Ngược lại, bộ gen là vô cùng lớn, ví dụ, 4.2 x 10 6 đối với E. coli và 3.2 x 10 9 bp đối với con người. Do đó, trình tự genoxne phải thu được trong một số lượng cực nhỏ các mảnh nhỏ, những mảnh này sau đó được tập hợp thành một chuỗi cho bộ gen.

Các mảnh được sử dụng để giải trình tự được tạo ra bằng cách phá vỡ DNA bộ gen thành các đoạn tại các điểm ngẫu nhiên. Do đó, vị trí của đoạn trong bộ gen phải được xác định bằng thực nghiệm. Tất cả các mảnh thu được từ DNA bộ gen của một sinh vật được nhân bản trong một vec tơ phù hợp, điều này tạo ra một thư viện bộ gen của sinh vật. Hai cách tiếp cận để giải trình tự bộ gen là: (a) giải trình tự nhân bản vô tính và (b) giải trình tự súng ngắn.

(a) Trình tự sao chép theo bản sao:

Trong phương pháp này, các mảnh đầu tiên được căn chỉnh thành các đường viền cũng được gọi là trình tự hướng dẫn của các đường viền BAC. Một contig bao gồm một loạt các dòng vô tính có chứa các đoạn DNA chồng chéo chuyển đổi một vùng cụ thể của nhiễm sắc thể hoặc thậm chí toàn bộ nhiễm sắc thể. Chúng thường được xây dựng bằng cách sử dụng BAC (nhiễm sắc thể nhân tạo vi khuẩn) và nhân bản cosmid.

Cách tiếp cận chung trong việc tạo ra các đường viền là xác định các dòng vô tính có các đoạn DNA liền kề từ nhiễm sắc thể, ví dụ như đi bộ nhiễm sắc thể, nhảy nhiễm sắc thể, v.v. Do đó, các thành viên của một nhóm phải có cùng một vùng chồng chéo để cho phép xác định chính xác vị trí của chúng -Trong conting. Mục tiêu cuối cùng của các thủ tục lập bản đồ vật lý là có được một khung hoàn chỉnh cho mỗi nhiễm sắc thể của bộ gen.

Các đoạn DNA được nhân bản của một contig có thể tương quan với các vị trí dọc theo nhiễm sắc thể thu được từ liên kết hoặc ánh xạ tế bào học. Điều này có thể đạt được bằng cách xác định các thành viên của contig chứa các phần chèn có các gen như vậy đã được ánh xạ bằng các phương pháp liên kết hoặc tế bào học. Điều này sẽ cho phép sự liên kết của các thành viên khác của contig dọc theo nhiễm sắc thể. Ngoài ra, RFLP (đa hình đoạn giới hạn đoạn) và các dấu DNA khác có thể được sử dụng để tương quan các vị trí trong bản đồ liên kết với các thành viên của một contig.

(b) Trình tự bắn súng:

Trong phương pháp này, các dòng vô tính được chọn ngẫu nhiên được sắp xếp theo trình tự cho đến khi tất cả các dòng vô tính trong thư viện bộ gen được phân tích. Phần mềm hợp ngữ tổ chức thông tin trình tự nucleotide để thu được thành trình tự bộ gen. Chiến lược này hoạt động rất tốt với bộ gen của sinh vật nhân sơ có ít DNA lặp lại. Nhưng bộ gen của sinh vật nhân chuẩn có rất nhiều trình tự lặp đi lặp lại tạo ra sự nhầm lẫn trong sự liên kết của trình tự. Những vấn đề này được giải quyết bằng cách sử dụng sức mạnh tính toán khổng lồ, phần mềm chuyên dụng và tránh các khu vực giàu DNA lặp đi lặp lại (ví dụ, khu vực trung tâm và viễn thông).

Tổng hợp trình tự bộ gen:

Các dự án giải trình tự bộ gen đòi hỏi phải phát triển các công nghệ thông lượng cao tạo ra dữ liệu với tốc độ rất nhanh. Điều này đòi hỏi phải sử dụng máy tính để quản lý lũ thông tin này và đã sinh ra một môn học mới gọi là tin sinh học. Tin sinh học liên quan đến việc lưu trữ, phân tích, giải thích và sử dụng thông tin về các hệ thống sinh học (các hoạt động như tổng hợp trình tự bộ gen, xác định gen, gán chức năng cho các gen đã xác định, chuẩn bị cơ sở dữ liệu, v.v.).

Để đảm bảo trình tự nucleotide của bộ gen hoàn thành và không có lỗi, bộ gen được giải trình tự nhiều lần. Khi bộ gen của một sinh vật được giải trình tự, biên dịch và hiệu đính (sửa lỗi), giai đoạn tiếp theo của bộ gen, viz., Chú thích, bắt đầu.

Dự đoán và đếm gen:

Sau khi thu được trình tự bộ gen và kiểm tra độ chính xác, nhiệm vụ tiếp theo là tìm tất cả các gen mã hóa protein. Đây là bước đầu tiên trong chú thích. Chú thích là một quá trình xác định gen, trình tự quy định và chức năng của chúng. Nó cũng xác định các gen mã hóa phi protein bao gồm các gen mã hóa cho r-RNA, t-RNA và RNA hạt nhân nhỏ. Ngoài ra, các yếu tố di truyền và các họ trình tự lặp đi lặp lại được xác định và đặc trưng.

Xác định vị trí các gen mã hóa protein được thực hiện bằng cách kiểm tra trình tự, sử dụng phần mềm máy tính hoặc bằng mắt. Các gen mã hóa protein được xác định bằng các khung đọc mở (ORF). Một ORF có một chuỗi các codon xác định trình tự axit amin, nó bắt đầu bằng một codon khởi đầu (thường là ATG) và kết thúc bằng một codon kết thúc (TAA) TAG hoặc TGA). ORF thường được xác định bằng máy tính và là phương pháp hiệu quả cho bộ gen của vi khuẩn.

Các gen trong bộ gen của sinh vật nhân chuẩn (bao gồm cả bộ gen của con người) có một số tính năng khiến việc tìm kiếm trực tiếp trở nên ít hữu ích hơn. Thứ nhất, hầu hết các gen sinh vật nhân chuẩn có mô hình exon (vùng mã hóa) xen kẽ với các intron (vùng không mã hóa). Kết quả là, các gen này không được tổ chức dưới dạng ORF liên tục. Thứ hai, gen ở người và các sinh vật nhân chuẩn khác thường được đặt cách nhau rộng rãi do đó làm tăng cơ hội tìm thấy gen sai. Nhưng các phiên bản mới hơn của phần mềm quét ORF cho bộ gen của sinh vật nhân chuẩn giúp việc quét hiệu quả hơn.

Sau khi trình tự bộ gen được phân tích và dự đoán gen, mỗi gen được kiểm tra từng lần một để xác định chức năng của sản phẩm gen được mã hóa và phân loại thành các nhóm chức năng. Phân tích này liên quan đến một số chương trình. Ví dụ, người ta có thể tìm kiếm cơ sở dữ liệu như Ngân hàng Gene, để tìm các gen tương tự được phân lập từ các sinh vật khác. Các ORF dự đoán có thể được so sánh với các ORF đã biết, các gen vi khuẩn đặc trưng. Cuối cùng, người ta có thể tìm kiếm các chuỗi nucleotide như vậy cho các họa tiết chức năng mã hóa các miền protein liên quan đến các chức năng cụ thể.

Do đó, mục tiêu của phân tích bộ gen là xác định chức năng của tất cả các gen và để hiểu làm thế nào các gen này tương tác trong sự phát triển và chức năng của sinh vật.

Bộ gen chức năng:

Nó có thể được định nghĩa là việc xác định chức năng của tất cả các sản phẩm gen được mã hóa bởi bộ gen của một sinh vật. Nó bao gồm các tham số sau: (1) khi và nơi các gen cụ thể được biểu hiện (cấu hình biểu hiện), (ii) chức năng của các gen cụ thể bằng cách chọn lọc đột biến các gen mong muốn và (iii) các tương tác diễn ra giữa các protein và giữa protein và các phân tử khác. Bộ gen chức năng cố gắng kiểm tra tất cả các gen có trong bộ gen trong một lần. Do đó, các kỹ thuật được sử dụng trong bộ gen chức năng cho phép phân tích thông lượng cao cho phép tích lũy dữ liệu rất nhanh.

(i) Hồ sơ biểu hiện:

Xác định các loại tế bào / mô trong đó một gen được biểu hiện cũng như khi gen được biểu hiện được gọi là hồ sơ biểu hiện. Mục đích của bộ gen chức năng là nghiên cứu mô hình biểu hiện của tất cả các gen có trong bộ gen cùng một lúc; đây được gọi là hồ sơ biểu hiện toàn cầu. Điều này có thể được thực hiện hoặc ở cấp độ RNA hoặc ở cấp độ protein. Ở cấp độ RNA, người ta có thể sử dụng lấy mẫu chuỗi trực tiếp hoặc mảng DNA.

Ở cấp độ protein, người ta có thể sử dụng điện di hai chiều, sau đó là quang phổ khối hoặc mảng protein. Hồ sơ biểu hiện toàn cầu cung cấp cái nhìn sâu sắc về các hiện tượng sinh học phức tạp, bao gồm sự khác biệt, phản ứng với căng thẳng, khởi phát bệnh, vv Nó cũng cung cấp một cách mới để xác định kiểu hình tế bào.

(ii) Xác định chức năng gen:

Một khía cạnh quan trọng của bộ gen chức năng là xác định chức năng của các gen / chuỗi ẩn danh cụ thể. Một cách mạnh mẽ để đạt được điều này là nhân bản gen, đột biến gen in vitro và giới thiệu lại gen bị đột biến vào cơ thể vật chủ và phân tích tác dụng của nó. Bộ gen dưới các thư viện đột biến đã được phát triển ở một số sinh vật mẫu như vi khuẩn, nấm men, thực vật và động vật có vú. Điều này đôi khi được gọi là genomics đột biến. Một thư viện như vậy có thể được tạo theo một trong ba cách sau:

(a) Đột biến có hệ thống của từng gen một tại một thời điểm sẽ tạo ra một loạt các chủng đột biến cụ thể.

(b) Trong cách tiếp cận ngẫu nhiên, các gen bị đột biến đột biến các cá thể đột biến sau đó được đặc trưng và phân loại.

(c) Trong phương pháp này, một nhóm các kỹ thuật được sử dụng để ngăn chặn sự biểu hiện của các nhóm / nhóm gen cụ thể.

(iii) Tương tác protein:

Chức năng gen phản ánh hành vi của các protein được mã hóa bởi chúng. Hành vi này có thể được coi là một chuỗi các tương tác giữa các protein khác nhau và giữa các protein với các phân tử khác. Tương tác protein được nghiên cứu bằng cách sử dụng các kỹ thuật thông lượng cao. Một số phương pháp ánh xạ tương tác protein dựa trên thư viện cho phép sàng lọc hàng trăm hoặc hàng nghìn protein cùng một lúc. Những tương tác này có thể được thử nghiệm in vitro hoặc in vivo. Dữ liệu tương tác protein từ nhiều nguồn khác nhau được đồng hóa trong cơ sở dữ liệu.