Chúng tôi sẽ tìm thấy bạn: Tìm kiếm DNA được sử dụng để kiếm Golden State Killer có thể tìm thấy khoảng 60% người Mỹ da trắng

Joseph DeAngelo, nghi phạm Golden State Killer

Randy Pench / TNS / Newscom

Chúng tôi sẽ tìm thấy bạn: Tìm kiếm DNA được sử dụng để kiếm Golden State Killer có thể tìm thấy khoảng 60% người Mỹ da trắng

Bởi Jocelyn KaiserOct. 11, 2018, 2:00 CH

Nếu bạn là người da trắng, sống ở Hoa Kỳ và một người họ hàng xa đã tải DNA của họ lên cơ sở dữ liệu tổ tiên công khai, rất có thể một thám tử internet có thể nhận dạng bạn từ mẫu DNA bạn để lại ở đâu đó. Đó là kết luận của một nghiên cứu mới, phát hiện ra rằng bằng cách kết hợp một mẫu DNA ẩn danh với một số thông tin cơ bản như tuổi của ai đó, các nhà nghiên cứu có thể thu hẹp danh tính của người đó xuống dưới 20 người bằng cách bắt đầu với cơ sở dữ liệu DNA của 1, 3 triệu cá nhân.

Một tìm kiếm như vậy có khả năng cho phép xác định khoảng 60% người Mỹ da trắng từ mẫu DNA - nếu họ chưa bao giờ cung cấp DNA của chính họ cho cơ sở dữ liệu tổ tiên. "Trong một vài năm, nó thực sự sẽ là tất cả mọi người, " nhà lãnh đạo nghiên cứu Yaniv Erlich, một nhà di truyền học tính toán tại Đại học Columbia nói.

Nghiên cứu này đã gây ra bởi vụ bắt giữ hồi tháng Tư của kẻ giết người được cho là KillerGolden State Killer, một người đàn ông ở California bị buộc tội trong một loạt các vụ hãm hiếp và giết người hàng thập kỷ. Để tìm ra anh ta và hơn một chục nghi phạm hình sự khác kể từ đó, các cơ quan thực thi pháp luật trước tiên thử nghiệm mẫu DNA hiện trường vụ án, có thể là máu, tóc hoặc tinh dịch cũ, cho hàng trăm ngàn dấu DNA. Các cột mốc dọc theo bộ gen khác nhau giữa mọi người, nhưng danh tính của họ trong nhiều trường hợp được chia sẻ với những người có cùng huyết thống. Sau đó, họ tải dữ liệu DNA lên GEDmatch, một cơ sở dữ liệu trực tuyến miễn phí, nơi mọi người có thể chia sẻ dữ liệu của họ từ các công ty kiểm tra DNA tiêu dùng như 23andMe và An tổry.com để tìm kiếm người thân đã gửi DNA của họ. Tìm kiếm gần 1 triệu hồ sơ của GEDMatch cho thấy một số người thân tương đương với anh em họ thứ ba với DNA hiện trường vụ án liên quan đến Golden State Killer. Các thông tin khác như hồ sơ phả hệ, tuổi xấp xỉ và địa điểm tội phạm sau đó cho phép các thám tử về nhà ở một người.

Các nhà di truyền học nhanh chóng suy đoán phương pháp này có thể xác định nhiều người từ một chuỗi DNA chưa biết. Nhưng để định lượng được bao nhiêu, Erlich và các đồng nghiệp đã xem xét kỹ hơn về cơ sở dữ liệu MyHeritage, nơi chứa 1, 28 triệu hồ sơ DNA của các cá nhân nhìn vào lịch sử gia đình của họ. (Erlich là giám đốc khoa học của công ty xét nghiệm DNA tổ tiên.) Nếu bạn sống ở Hoa Kỳ và có nguồn gốc châu Âu, có 60% khả năng bạn có anh em họ thứ ba hoặc họ hàng gần hơn trong cơ sở dữ liệu này, nhóm dự kiến . Tỷ lệ thành công của họ tương tự khi họ tìm kiếm 30 hồ sơ ngẫu nhiên trong GEDmatch. (Tỷ lệ cược giảm xuống 40% cho một người có nguồn gốc châu Phi cận Sahara trong cơ sở dữ liệu MyHeritage.)

Giả sử bạn có người thân trong một trong những cơ sở dữ liệu này, cơ hội nào cảnh sát có thể tìm thấy bạn từ một mẫu DNA không xác định, cách họ bắt cóc Golden State Killer bị cáo buộc? Để tìm hiểu, Erlich và các đồng nghiệp đã kết hợp thông tin cơ sở dữ liệu MyHeritage với cây gia đình và dữ liệu nhân khẩu học như tuổi thô và vị trí địa lý có thể. Trung bình, điều đó cho phép họ sử dụng chuỗi DNA giả định để về nhà trên 17 phạm nhân nghi ngờ, từ một nhóm khoảng 850 người, nhóm nghiên cứu báo cáo hôm nay trên Science.

GEDmatch có khả năng chỉ bao gồm khoảng 0, 5% dân số trưởng thành ở Hoa Kỳ, nhưng hàng triệu người Mỹ đang sử dụng dịch vụ xét nghiệm tổ tiên DNA. Khi con số GEDmatch tăng lên 2%, hơn 90% người gốc châu Âu sẽ có anh em họ thứ ba hoặc họ hàng gần hơn và có thể được tìm thấy theo cách này. Thật đáng ngạc nhiên khi cơ sở dữ liệu cần phải nhỏ như thế nào, Chuyên gia di truyền học dân số Noah Rosenberg của Đại học Stanford ở Palo Alto, California, người không liên quan đến công việc.

Rosenberg và các đồng nghiệp đã chỉ ra năm ngoái rằng một hồ sơ trong cơ sở dữ liệu DNA của người tiêu dùng có thể được khớp với hồ sơ của cùng một người trong cơ sở dữ liệu DNA pháp y, mặc dù họ sử dụng một bộ dấu DNA khác, nhỏ hơn. Hôm nay trong Cell, họ báo cáo rằng hơn 30% cá nhân trong cơ sở dữ liệu pháp y cũng có thể được liên kết với anh chị em, cha mẹ hoặc con trong cơ sở dữ liệu người tiêu dùng. Hai loại cơ sở dữ liệu được kết hợp có thể giúp tìm ra nghi phạm từ mẫu DNA dễ dàng hơn nữa. Hồ sơ DNA của người tiêu dùng được liên kết cũng có thể tiết lộ ngoại hình thực tế hoặc thông tin y tế cho một tên tội phạm hoặc người thân của họ, chẳng hạn như gen cho màu mắt hoặc bệnh, mặc dù cơ sở dữ liệu pháp y không có chứa thông tin đó. Nhiều hơn nữa có thể được thực hiện với họ hơn là đã được yêu cầu,

Mặc dù các nghiên cứu này là những tin tức đáng khích lệ để giải quyết tội phạm, nhưng chúng làm tăng mối lo ngại về quyền riêng tư đối với các công dân tuân thủ luật pháp, Erlich nói. Một giải pháp khả thi được nhóm của ông đề xuất là các công ty kiểm tra DNA tiêu dùng mã hóa kỹ thuật số dữ liệu của khách hàng và GEDMatch chỉ cho phép các tệp được mã hóa này được tải lên. Bằng cách đó, một cơ quan thực thi pháp luật không thể tải lên dữ liệu chuỗi DNA từ phòng thí nghiệm của chính mình mà không có sự hợp tác của công ty tổ tiên. (Cảnh sát không thể giả vờ là khách hàng và gửi các mẫu DNA hiện trường vụ án cho các công ty như 23andMe vì các máy giải trình tự của công ty thường không thể xử lý các mẫu DNA bị phân hủy, xuống cấp.)

Erlich cũng cho rằng các quan chức Hoa Kỳ cần xem lại các quy tắc liên bang bảo vệ những người tình nguyện nghiên cứu. Một hướng dẫn sửa đổi gần đây cho các nhà nghiên cứu y sinh học, được gọi là Quy tắc chung, giả định rằng một người tham gia nghiên cứu không thể dễ dàng được xác định từ hồ sơ DNA ẩn danh của họ. Nhưng trong bài báo của mình, nhóm của Erlich đã sử dụng GEDMatch để xác định một phụ nữ là một phần của nghiên cứu sử dụng hồ sơ DNA ẩn danh và ngày sinh của cô, thường được công khai cho các nhà nghiên cứu.

Các chuyên gia chính sách di truyền đồng ý rằng những thay đổi về cách thức cơ sở dữ liệu phả hệ và các công ty giải trình tự DNA hoạt động hoặc được quy định là cần thiết. Chữ ký số có thể là một giải pháp một phần, theo giáo sư luật Natalie Ram của Đại học Baltimore ở Maryland. Nhưng tất cả những người chơi trong ngành giải trình tự DNA trực tiếp đến người tiêu dùng sẽ phải đồng ý với sơ đồ này, bà lưu ý. Nếu không, chúng tôi sẽ quay lại quảng trường.

Thay vào đó, cô và những người khác gần đây đã tranh luận trong Khoa học rằng các quốc gia và Quốc hội nên thông qua luật hạn chế các tình huống trong đó thực thi pháp luật có thể sử dụng cơ sở dữ liệu phả hệ để tìm nghi phạm. Nó có thể hợp lý cho một vụ án giết người, nhưng không phải là một tội phạm nhỏ, Ram nói. Tìm kiếm sự cân bằng phù hợp là rất quan trọng.