Một nhóm các nhà khoa học quốc tế đã công bố trình tự hoàn chỉnh, không có khoảng trống đầu tiên của bộ gen người. Bộ gen tham chiếu mới bổ sung hàng trăm triệu cặp base (base pair: là đơn vị cơ bản của axit nucleic mạch đôi bao gồm hai nucleobase liên kết với nhau bằng liên kết hydro) vào các bản thảo gen trước đó, lấp đầy một số khoảng trống quan trọng sẽ hỗ trợ nhiều các nghiên cứu về bệnh tật và tiến hóa.
Dự án Bộ gen người (The Human Genome Project) đã được tiến hành trong nhiều thập kỷ, trở nên nổi tiếng xuất bản bản thảo gen đầu tiên vào năm 2000 và bộ gen "hoàn chỉnh" vào năm 2003. Nhưng nó chỉ bao gồm các vùng euchromatic, chiếm khoảng 92% tổng số bộ gen - các vùng khác, được gọi là dị sắc, nằm ở các đầu mút (telomere) và trung tâm (tâm động) của nhiễm sắc thể, và được coi là quá khó khăn và tốn kém để giải trình tự vào thời điểm đó.
Giờ đây, với hơn hai thập kỷ làm việc và tiến bộ công nghệ, toàn bộ bộ gen của con người với khoảng 3 tỷ base cuối cùng đã được giải trình tự mà không có khoảng trống, nhờ vào một nhóm các nhà khoa học quốc tế được biết đến với tên Telomere-to-Telomere (T2T) Consortium. Bộ gen tham chiếu mới được chỉ định là T2T-CHM13, bổ sung gần 200 triệu cặp base của trình tự DNA chưa biết trước đây. Trong số đó, có 99 gen dường như mã hóa cho protein và khoảng 2.000 gen khác sẽ cần được kiểm tra kỹ hơn. Bộ gen cũng sửa chữa hàng nghìn lỗi cấu trúc có trong các phiên bản trước đó.
Nhóm nghiên cứu cho biết, trớ trêu thay, 8% cuối cùng của bộ gen mất gấp đôi thời gian để giải trình tự so với 92% đầu tiên. Đó là bởi vì các vùng dị sắc được tạo thành từ các phần lớn các phần lặp lại, vì vậy rất khó để ghép lại với nhau một cách chính xác. Nếu một bộ gen là một trò chơi ghép hình, thì những phần này là những mảnh nền màu trơn có thể khớp với nhau theo bất kỳ cách nào.
Để giải mã, T2T Consortium đã sử dụng một số công cụ mới để đọc các chuỗi dài hơn. Xét cho cùng, hoàn thành bài toán sẽ dễ dàng hơn nhiều khi làm việc với ít mảnh ghép quy mô lớn hơn thay vì một số lượng lớn các mảnh ghép nhỏ. Các nhà nghiên cứu đã kiểm tra bộ gen bằng phương pháp giải trình tự DNA Nanopore của Oxford, phương pháp này có thể đọc tới một triệu chữ cái DNA trong một lần đọc với độ chính xác vừa phải. Một phương pháp khác, được gọi là PacBio HiFi, có thể đọc khoảng 20.000 chữ cái cùng một lúc với độ chính xác gần như hoàn hảo, do đó, kết hợp cả hai là một cách hiệu quả để giải trình tự bộ gen hoàn chỉnh của con người. Một phần khác của vấn đề, nhóm nghiên cứu cho biết, là bộ gen tham chiếu trước đây được ghép lại với nhau từ nhiều cá thể, tạo ra các đường nối trong mô hình. Phiên bản mới loại bỏ những thứ đó, tạo ra một mô hình có tính đại diện cao hơn cho bộ gen của một con người trông như thế nào.
Bộ gen người mới hoàn chỉnh sẽ hỗ trợ đắc lực cho một loạt các nghiên cứu trong tương lai, bao gồm cả các dấu hiệu di truyền của bệnh tật. Nhóm nghiên cứu cho biết, ung thư có thể phát sinh do những bất thường ở tâm động, vì vậy hiểu rõ hơn về vùng này của bộ gen có thể dẫn đến các loại liệu pháp mới. “Tạo ra một trình tự bộ gen người hoàn chỉnh thực sự là một thành tựu khoa học đáng kinh ngạc, cung cấp cái nhìn toàn diện đầu tiên về DNA của chúng ta,” Eric Green, Giám đốc Viện Nghiên cứu Bộ gen Người Quốc gia cho biết. “Thông tin nền tảng này sẽ củng cố nhiều nỗ lực không ngừng để hiểu tất cả các sắc thái chức năng của bộ gen người, do đó sẽ hỗ trợ các nghiên cứu di truyền về bệnh tật ở người.”
Và đây mới chỉ là bộ gen hoàn chỉnh đầu tiên của con người - các bước tiếp theo là tạo ra một tham chiếu hệ gen người của 350 cá thể, để nắm bắt nhiều hơn sự đa dạng tự nhiên từ người này sang người khác. Đột phá khoa học này đã được trình bày trong sáu bài báo được xuất bản trên tập san Science, cùng với các bài báo đồng hành khác xuất hiện trên các tạp chí khác.
Theo National Human Genome Research Institute
Dự án Bộ gen người (The Human Genome Project) đã được tiến hành trong nhiều thập kỷ, trở nên nổi tiếng xuất bản bản thảo gen đầu tiên vào năm 2000 và bộ gen "hoàn chỉnh" vào năm 2003. Nhưng nó chỉ bao gồm các vùng euchromatic, chiếm khoảng 92% tổng số bộ gen - các vùng khác, được gọi là dị sắc, nằm ở các đầu mút (telomere) và trung tâm (tâm động) của nhiễm sắc thể, và được coi là quá khó khăn và tốn kém để giải trình tự vào thời điểm đó.
Giờ đây, với hơn hai thập kỷ làm việc và tiến bộ công nghệ, toàn bộ bộ gen của con người với khoảng 3 tỷ base cuối cùng đã được giải trình tự mà không có khoảng trống, nhờ vào một nhóm các nhà khoa học quốc tế được biết đến với tên Telomere-to-Telomere (T2T) Consortium. Bộ gen tham chiếu mới được chỉ định là T2T-CHM13, bổ sung gần 200 triệu cặp base của trình tự DNA chưa biết trước đây. Trong số đó, có 99 gen dường như mã hóa cho protein và khoảng 2.000 gen khác sẽ cần được kiểm tra kỹ hơn. Bộ gen cũng sửa chữa hàng nghìn lỗi cấu trúc có trong các phiên bản trước đó.
Nhóm nghiên cứu cho biết, trớ trêu thay, 8% cuối cùng của bộ gen mất gấp đôi thời gian để giải trình tự so với 92% đầu tiên. Đó là bởi vì các vùng dị sắc được tạo thành từ các phần lớn các phần lặp lại, vì vậy rất khó để ghép lại với nhau một cách chính xác. Nếu một bộ gen là một trò chơi ghép hình, thì những phần này là những mảnh nền màu trơn có thể khớp với nhau theo bất kỳ cách nào.
Để giải mã, T2T Consortium đã sử dụng một số công cụ mới để đọc các chuỗi dài hơn. Xét cho cùng, hoàn thành bài toán sẽ dễ dàng hơn nhiều khi làm việc với ít mảnh ghép quy mô lớn hơn thay vì một số lượng lớn các mảnh ghép nhỏ. Các nhà nghiên cứu đã kiểm tra bộ gen bằng phương pháp giải trình tự DNA Nanopore của Oxford, phương pháp này có thể đọc tới một triệu chữ cái DNA trong một lần đọc với độ chính xác vừa phải. Một phương pháp khác, được gọi là PacBio HiFi, có thể đọc khoảng 20.000 chữ cái cùng một lúc với độ chính xác gần như hoàn hảo, do đó, kết hợp cả hai là một cách hiệu quả để giải trình tự bộ gen hoàn chỉnh của con người. Một phần khác của vấn đề, nhóm nghiên cứu cho biết, là bộ gen tham chiếu trước đây được ghép lại với nhau từ nhiều cá thể, tạo ra các đường nối trong mô hình. Phiên bản mới loại bỏ những thứ đó, tạo ra một mô hình có tính đại diện cao hơn cho bộ gen của một con người trông như thế nào.
Bộ gen người mới hoàn chỉnh sẽ hỗ trợ đắc lực cho một loạt các nghiên cứu trong tương lai, bao gồm cả các dấu hiệu di truyền của bệnh tật. Nhóm nghiên cứu cho biết, ung thư có thể phát sinh do những bất thường ở tâm động, vì vậy hiểu rõ hơn về vùng này của bộ gen có thể dẫn đến các loại liệu pháp mới. “Tạo ra một trình tự bộ gen người hoàn chỉnh thực sự là một thành tựu khoa học đáng kinh ngạc, cung cấp cái nhìn toàn diện đầu tiên về DNA của chúng ta,” Eric Green, Giám đốc Viện Nghiên cứu Bộ gen Người Quốc gia cho biết. “Thông tin nền tảng này sẽ củng cố nhiều nỗ lực không ngừng để hiểu tất cả các sắc thái chức năng của bộ gen người, do đó sẽ hỗ trợ các nghiên cứu di truyền về bệnh tật ở người.”
Và đây mới chỉ là bộ gen hoàn chỉnh đầu tiên của con người - các bước tiếp theo là tạo ra một tham chiếu hệ gen người của 350 cá thể, để nắm bắt nhiều hơn sự đa dạng tự nhiên từ người này sang người khác. Đột phá khoa học này đã được trình bày trong sáu bài báo được xuất bản trên tập san Science, cùng với các bài báo đồng hành khác xuất hiện trên các tạp chí khác.
Theo National Human Genome Research Institute