Làm thế nào Dropbox biết bạn đang chia sẻ một tập tin vi phạm bản quyền?

Duy Luân
1/4/2014 7:1Phản hồi: 114
Làm thế nào Dropbox biết bạn đang chia sẻ một tập tin vi phạm bản quyền?
Dropbox.jpg

Vào một ngày cuối tháng 3, một người dùng Twitter cho biết rằng anh không thể chia sẻ được một tập tin thông qua Dropbox vì vi phạm luật bảo vệ bản quyền nội dung số (DMCA). Dòng tweet của người này đã lan đi nhanh chóng và chỉ đến trưa ngày hôm sau nó đã nhận được hơn 3 nghìn lượt đăng lại. Vậy điều gì đang xảy ra? Dropbox đang làm gì với tài khoản người dùng mà hãng có thể ngăn chặn việc chia sẻ file một cách bất ngờ như thế? Liệu họ có "quậy phá", "bới móc" thư mục của người dùng để tìm ra những tập tin vi phạm bản quyền hay không?

Câu trả lời là không. Và hệ thống lọc tập tin sao chép lậu này cũng không phải là mới mẻ gì cả. Nó đã đi vào hoạt động được nhiều năm nhưng không xuất đầu lộ diện một cách rõ ràng, đúng với cách mà một hệ thống ngăn chặn vi phạm pháp luật nên thực thi. Nó cho phép Dropbox chặn việc chia sẻ một số tập tin nhất định từ người này sang người khác (một động thái giúp hãng không bị các cơ quan chính phủ "rờ gáy"). Trước khi chúng ta tìm hiểu sâu hơn về vấn đề này, có một vài thứ cần nói rõ:
  • Một số người nói rằng nhân viên Dropbox đang lục tung các tập tin, thư mục của người dùng để tìm và chặn những tập tin vi phạm luật DMCA. Nhưng thật chất không phải như thế. Chỉ khi nào người dùng thực hiện việc chia sẻ (từ người này sang người khác, hoặc đem chia sẻ link lên Internet) thì hệ thống kiểm tra DMCA mới bắt đầu phát huy tác dụng của mình.
  • Tập tin vi phạm bản quyền không hề bị xóa khỏi tài khoản Dropbox của người dùng - Dropbox chỉ chặn việc chia sẻ mà thôi.
  • Người đưa dòng tweet nói trên cho biết anh ấy không hề nghĩ rằng Dropbox đang làm điều gì xấu xa. Anh chỉ thấy tình hình khá thú vị và muốn chia sẻ cho mọi người biết, và cũng không có ý định chỉ trích Dropbox.
Hệ thống này hoạt động như thế nào?

Trong thế giới điện toán ngày nay có một thứ được gọi là "hashing". Thực chất khái niệm này rất phổ biến đối với những người làm trong lĩnh vực IT và cũng xuất hiện ở rất nhiều nơi, từ việc cho phép các trang web kiểm tra password của bạn mà không cần lưu lại, cho đến việc xác nhận rằng một tập tin không hề bị thay đổi nội dung trong quá trình nó được sao chép từ chỗ này sang chỗ kia. Tính năng hash thực chất chỉ là một thuận toán dùng để bóc tách các số định danh riêng ra khỏi một tập tin đồ sộ.

Các thuận toán Hash sử dụng một chuỗi kí tự để hoạt động. Chuỗi hash của file A có thể là "4f2900f2fdfaf", trong khi hash của file B có dạng "dba7b12a19fe9". Tất nhiên là hash của tập tin lưu trên Dropbox sẽ dài hơn thế rất rất nhiều, nhưng nói chung ý tưởng là như thế.


Bằng việc chạy thuật toán hash hai lần trên hai file giống hệt nhau, chúng ta sẽ có hai chuỗi hash kết quả giống nhau. Nhưng nếu trong tập tin có một thứ gì đó bị thay đổi thì chuỗi hash của tập tin này sẽ hoàn toàn khác đi. Ví dụ, file A ở trên nếu chỉ bị thay đổi một vài bit thôi cũng đủ để biến hash của nó trở thành "e3c277c771c8e".

Hash_thuat_toan.jpg

Chuỗi số định danh loằng ngoằn này có thể được dùng để cho chúng ta biết rằng liệu tập tin đó có giống một tập tin tham chiếu hay không. Nếu nó bị thay đổi thì hash sẽ đổi theo, tức là tập tin đang xét không giống với tập tin gốc. Tuy nhiên, hash chỉ mang tính một chiều: nó chỉ nói được rằng hai file có giống nhau hay không chứ không thể giúp biết được đâu là tập tin gốc (trừ khi con người hoặc phần mềm biết trước những thông tin này).

Bạn có thể tưởng tượng hash giống như là dấu vân tay. Dấu vân của mỗi người là duy nhất, nhưng nếu chỉ có dấu vân tay không thì không xác định được bạn là ai, trừ khi có thêm dữ liệu từ một cơ sở dữ liệu chứa sẵn thông tin cá nhân cảu bạn. Cũng như thế, hệ thống kiểm tra DMCA của Dropbox không thể nói tập tin đó là gì, trừ khi nó giống hoàn toàn với tập tin được DMCA đưa ra trong "danh sách đen".

Khi bạn tải một file nào đó lên Dropbox, có hai thứ xảy ra: chuỗi hash cho file sẽ được tạo thành, rồi sau đó file được mã hóa để tránh việc truy cập trái phép từ những người bên ngoài (ví dụ như hacker hay nhân viên Dropbox chẳng hạn). Nói thêm về chuyện mã hóa thì chìa khóa để giải mã vẫn nằm trong tay Dropbox nên về lý thuyết thì họ có thể xem tập tin của bạn bất kì khi nào, nhưng trong thực tế thì điều này chỉ diễn ra nếu Dropbox được tòa án yêu cầu mà thôi. Và ngoài Dropbox thì hầu hết các dịch vụ lưu trữ online khác cũng phải tuân theo quy định này nếu có lệnh từ cơ quan có thẩm quyền.

Quay trở lại với hệ thống DCMA, bên phía cơ quan hành pháp sẽ đưa cho Dropbox nội dung mà họ cần ngăn chặn. Sau khi nhân viên của Dropbox xác nhận xong thì họ sẽ thêm chuỗi hash của file này vào một danh sách đen khổng lồ bao gồm các tập tin không được phép chia sẻ. Khi bạn tạo một đường link Dropbox dẫn đến các file của mình, hệ thống sẽ kiểm tra hash thuộc file của bạn với danh sách.

Nếu tập tin của bạn hoàn toàn giống với tập tin được DCMA đưa ra, Dropbox sẽ không cho phép bạn tiếp tục tiến hành việc chia sẻ. Nhưng nếu đó là một thứ khác - ví dụ như một tập tin lạ, một tập tin mới hay thậm chí là bản chỉnh sửa của cùng một file gốc từ DCMA - thì hệ thống sẽ chẳng biết nó là gì và cứ thế mà cho phép tiếp tục.

Dropbox_DCMA.png
Nội dung thông báo về tập tin bị chặn chia sẻ?

Quảng cáo


Nói cách khác, theo những gì Dropbox công bố, họ sẽ không xâm phạm vào các tập tin cá nhân của chúng ta, ngay cả khi bạn có chứa cả trăm nghìn tập tin lậu trên đó. Không có ai (hoặc robot) nào nghe hết cả thư việc MP3 mà bạn download "chùa" rồi đưa lên Dropbox, cũng không ai đọc những quyển sách bạn tải từ một nguồn torrent nào đó. Dropbox chỉ có một danh sách dài những thứ cần chặn và một khi những tập tin đó được đưa ra thế giới bên ngoài thì hãng sẽ nhanh chóng bắt nó.

Để kết lại, đây là lời bình luận của Dropbox về dòng tweet nói trên:

"Đã có nhiều lời nói về cách chúng tôi xử lí những vấn đề liên quan đến bản quyền. Chúng tôi đôi khi nhận được thông báo từ DCMA để xóa một số đường link vì vấn đề pháp lý. Khi nhận được chúng, Dropbox sẽ xử lí theo luật pháp và vô hiệu hóa link. Chúng tôi cũng có một hệ thống tự động giúp ngăn chặn việc những người dùng khác chia sẻ lại tập tin đó bằng Dropbox. Hệ thống này sử dụng các chuỗi hash của tập tin. Chúng tôi không xem nội dung chứa trong thư mục riêng của bạn và rất tận tâm trong việc giữa cho những thứ của bạn an toàn".

Nguồn: TechCrunch
114 bình luận
Chia sẻ

Xu hướng

Cẩn thận vụ bản quyền nhé các bác. Dạo này các trang web trên mạng làm căng vụ này lắm đó
@Duy Luân Hash giống MD5 hả mod?


Gửi từ GT-N7100 của tôi bằng cách sử dụng Tapatalk
Mà em còn chẳng biết những thứ trong Dropbox của em cái nào có bản quyền cái nào không nữa.
Badi King
ĐẠI BÀNG
11 năm
Đi một link chẳng nhằm j, còn các nguồn chia sẻ khác ngon hơn nếu chịu khó tìm ^^
Mình có 1 đống file vi phạm bản quyền trên đó có bị xóa ko ta
@khanhnd0709h 1 số cái bị xoá thôi bạn ơi.....xoá hết thì dân xài chùa chết hết à 😃 😃
Cái Dropbox 10GB của mình chứa bít bao là pm quan trọng, mà có chia sẻ cho ai đâu. Vĩnh biệt... 😔
@dangphucvn pm thì bác nén lại đặt password, đổi tên file là xong thôi, up thẳng lên làm j. Mà mình thấy chỉ hình ảnh và tài liệu mình sưu tầm thì sync thôi, còn phần mềm hay phim nhạc download lại mấy hồi, đâu có khó 😃
@t2k Bị khóa ACC rồi còn đâu hix
@dangphucvn mấy cái đám mây thì bác nên lưu lại các dữ liệu quan trọng nhu ảnh hay tài liệu những thứ mà ko thể mất chứ phần mềm nhạc nhẽo phim thì down lại mấy hồi
em dùng ondriver không biết nó có thế ko nhỉ
Ah thì ra là so mã hash, đơn giản mà hay nhỉ, nếu vậy cứ nén lại đặt password là xong thôi, trừ khi bị ai đó report chứ ko thì hệ thống tự động ko thể detect ra dc 😃
manht
ĐẠI BÀNG
11 năm
@t2k Nếu như DCMA cũng làm việc với soft nén file thì bạn cũng sẽ ko nén lại đc ;)
@manht nén lại đặt password đó bác, encrypt cả file name lun :p
Không như thằng MF, bị phát hiện là nó xóa thẳng tay, khóa cả account. Đợt trước nó làm căng phát bao nhiêu người phải khóc 😆

Nén lại là ok rồi, ko cần đặt pass vì theo Dropbox thì họ dùng mã hash chứ không xem từng file (thực chất họ có xem ko thì cũng chịu).
@nhoc_maruko9x Bao nhiêu tài liệu acc vip bị MF del thẳng tay. Tiếc thật, để pass hay chia nhỏ no cũng del file, ko thì thiếu file ko giải nén được.
Gìo có fshare rồi, down nhanh mà đơn giản. Chi phí dễ chịu.
Nén zip nó lại r up lên là xog 😆
dvthong
ĐẠI BÀNG
11 năm
nén lại cài pas, đổi đuôi ra 1 cái tên gì đó , chắc không tìm ra bản quyền đâu
Cái này từ mấy năm nay thấy mediafire áp dụng rồi mà, muốn vô hiệu hóa nó thì cũng chỉ cần nén file lại và đặt password là xong
RyanD
ĐẠI BÀNG
11 năm
thật ra là nó scan mã MD5 là ra hết , cũng như youtube !
tạo thêm 1 folder, 1 file rỗng hoặc mang nội dung bất kỳ trong thư mục cần chia sẻ rồi đóng gói lại, 1000 người sẽ có 1000 mã hash khác nhau rồi bác dropbox 😆
cho vào file rar rồi đặt cho nó 3 4 lớp password thì sao nhỉ?
@lam251092 Thì ok bạn ạ 😃...chỉ cần nén lại với 1 lần pass là cũng đã được rồi....mã hash đã thay đổi...Các file media thì phải dùng mấy phần mềm edit media cắt đi một chút (một chút thôi) với mục đích thay đổi mã hash thì mới có hy vọng sống online lâu dài hơn 😁
@anhmmoj Em thì chẳng biết mã hát kia là gì :3
Mình đã không thể tiếp tục sử dụng dịch vụ lưu trữ của Youtube sau khi bị block tài khoản...và cũng từ đó mình không hiểu tại sao họ lại mò ra được những tập tin của mình là "vi phạm bản quyền" cho đến khi đọc bài này 😁
Nguy hiểm nhỉ
mình mới được ông anh giải nghĩa về hasing và cách nhận biết file gốc khi dùng thằng thepiratebay không sẽ bị tụi nó cài spyware vào phần dowbload giờ đọc bài này hiểu thêm một tí...thanks
Thật ra nếu tài liệu cá nhân quan trọng thì lo gì bản quyền, nếu quá sợ thì đặt nén lại, đặt pass cẩn thận thì đổi tên là xong thôi.
Còn phần mềm, phim nhạc thì ko lo lắng lắm
hình như chỉ cần đổi tên khác đi là cũng share được thì phải
@rickstei Hash sinh ra từ data, đổi tên file thì hash vẫn giống.

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019