Lạc xoong

Lạc xoong


38% nội dung trên Internet đã mất dấu trong vòng 10 năm trở lại đây

Hassler
21/5/2024 10:11Phản hồi: 57
38% nội dung trên Internet đã mất dấu trong vòng 10 năm trở lại đây
Khi lướt web thấy trang nào hay hay là mình thường lưu nó vào bookmark hoặc đem share lên Facebook. Nhưng lâu ngày khi quay lại xem nội dung đó, nhất là qua tính năng Memories của Facebook thì có thể nó đã trở thành nội dung không thể truy cập được rồi.

Theo nghiên cứu mới được Pew Research Center mới chia sẻ thì điều này không phải là hiếm. Theo dữ liệu họ ghi nhận thì trong vòng 10 năm thì có tới 38% nội dung được đưa lên internet trên những trang web từ 2013 đã không còn tồn tại. Ở giai đoạn 2023, là thời điểm cuối của nghiên cứu, thì 8% số nội dung được tạo ra cũng đã biến mất chỉ trong 1 năm.
internet1.webp
Nhóm tác giả đã dùng cụm từ "digital decay", để mô tả hiện tượng này. Đi vào chi tiết hơn thì có 23% các trang tin tức có ít nhất 1 đường link bị gãy, bất kể trang tin đó đến từ nhà đài có tiếng hay địa phương. Số liệu được lấy từ hơn 500 nghìn trang của hơn 2 nghìn web được phân loại là trang tin tức, 1 con số đủ lớn để có ý nghĩa đối với những nghiên cứu dài hơn như thế này.
internet3.webp
Với những trang web của chính phủ thì con số này là 21%, và hiện tượng gãy link xảy ra nhiều nhất ở những trang địa phương nhỏ, như cấp huyện hay thành phố. Hầu hết xảy ra ở những trang có chế độ bảo mật nhất định như https://, 6% trong đó liên quan đến 1 file pdf nào đó, có thể 1 dạng văn bản hướng dẫn vào thời điểm nhất định, 16% trong số này thì lại được trỏ đến 1 URL khác không đúng với nội dung được ghi nhận ban đầu.
internet2.webp
Con số gãy link này ở các trang thông tin miễn phí như Wikipedia còn cao hơn rất nhiều. Trong số 50 nghìn trang thông tin thì lên đến 54% bị gãy ở phần Tham khảo.
Đối với những mạng xã hội digital decay còn diễn ra mạnh hơn. Ví dụ được lấy từ Twitter hay giờ là X thì chỉ sau vài tháng đã có gần 1/5 bài tweet không còn được đặt ở chế độ xem tự do "public" nữa. 60% trong số đó có thể do chủ tài khoản bị khóa, xóa hay được chuyển sang chế độ riêng tư. 40% còn lại là chủ tài khoản tự xóa bài viết của mình. Sâu hơn nữa thì 1% số tweet được xóa ngay chỉ sau 1 giờ đăng tải, 3% bị xóa sau 1 ngày, 10% bị xóa sau 1 tuần và 15% bị xóa sau 1 tháng.


internet4.webp
Dưới đây là các lỗi nhóm thấy thường gặp nhất
- 204 No Content
- 400 Bad Request
- 404 Not Found
- 410 Gone
- 500 Internal Server Error
- 501 Not Implemented
- 502 Bad Gateway
- 503 Service Unavailable
- 523 Origin Is Unreachable

Vậy nên giờ đây mình thấy nếu có nội dung gì đáng lưu lại thì mình thường Save as trang web đó luôn để có thể thực sự đọc được offline. Các anh em thì sao? Nếu muốn lưu thông tin có Save as như mình hay là vẫn đưa vào Bookmark của trình duyệt?

Tham khảo Pew Research Center

Quảng cáo

57 bình luận
Chia sẻ

Xu hướng

OKAYBN
ĐẠI BÀNG
24 ngày
Ưeb cần lưu thì tôi toàn Save as PDF hoặc Print as PDF.
TND NO
TÍCH CỰC
23 ngày
@OKAYBN Trước lưu Bookmark một bài báo rất hay, giờ vô lại chết link rồi, từ giờ cái gì hay phải thêm save as thôi 😓😓
kuratto
ĐẠI BÀNG
24 ngày
Web của mình thì lựa chọn phương án cập nhật lại bài cũ hơn là viết bài mới nếu ko có gì đặc biệt.
@kuratto Web kiếm tiền thì phải có bài mới.
Web cung cấp dịch vụ giống kiểu ChatGPT thì ko cần bài mới vẫn ổn.
Còn web như tinhte mà ko có bài mới thì chết ngọp ngay, ko còn traffic thì cũng mất hết tiền.
Bác làm web cá nhân thì ko quan tâm tới chuyện viết bài mới cũng đúng.
Bài hay thì mình save pdf
Mình vừa xem lại 1 số link Flickr boôkmark từ năm 2012 thì vẫn đó, bộ sưu tập ảnh của họ vẫn ở đó. Chất thật
@Ngoknc Flirkr nó là web lớn bác ạ, web lớn ít khi bị mất dữ liệu. Nếu có nó cũng sẽ thông báo trước cả vài tháng rồi mới xóa bỏ.
Những hình ảnh vớ vẩn mình up lên FB hay GG từ 2010 tới giờ vẫn còn nè.
Mất nhiều là mấy web nhỏ lẻ, do cá nhân sở hữu.
Khi web ko còn đem lại lợi ích họ sẽ Shutdown web đó mà ko cần thông báo với bất kỳ ai, nội dung trên đó cũng sẽ biến mất.
Đúng rồi, không cần 10 năm mà chỉ 2 năm là nhiều web dẹp hoặc bài bị xoá thôi. Trước đọc các bài share hay giờ quay lại thấy không còn bài, link không truy cập được, cả web cũng not found luôn
Macole
ĐẠI BÀNG
23 ngày
@anhlucky2 Xu thế chung giờ có mấy ai lướt web đâu, tương lai còn AI nữa thì web bay màu gần hết.
@anhlucky2 Đấy toàn web nhỏ nhé bác, web lớn sẽ ko có tình trạng như vậy (có nhưng rất ít)
vietkam
ĐẠI BÀNG
23 ngày
@anhlucky2 Trên đời này không gì là không lý do, đều là do nhân quả.
boanh86
TÍCH CỰC
23 ngày
@anhlucky2 reset ổ cứng, để dung lượng cho bài mới
nsphim
ĐẠI BÀNG
24 ngày
Dùng Pocket hoặc Instapaper để lưu, save pdf chật máy
Mình xem pỏn nào hay là tải xuống luôn, chứ lưu code nhiều khi bị chặn phải xài vpn thì cực quá
@Fan.MU gửi fence
@vietkam gửi fen:
vietkam
ĐẠI BÀNG
23 ngày
@sốt-siêu-vi-sốt-phát-ban-2024 quá đã luôn fen , mình cùng @anhlucky2 ngàn lần cảm tạ tấm chân tình của anh em
Cười vô mặt
@agram3ooo xàm
Cũng như báo giấy thôi, cũ thì mang đi bán giấy lộn, đồng nát. Mọi thứ trên đời cuối cùng cũng thành rác và về cát bụi. hihi.
Bao nhiêu tài liệu mật của tôi trên Ola cũng tan tành theo mây khói.
vietkam
ĐẠI BÀNG
23 ngày
@Donald Trump Bạn kể rõ hơn được thể loại tài liệu gì không ạ?
@vietkam Tài liệu mật về chăn nuôi rau sạch.
vietkam
ĐẠI BÀNG
23 ngày
@Donald Trump Nông nghiệp xanh đang được nhà nước khuyến khích, thật là một mất mát lớn rồi.
Bác Hù
ĐẠI BÀNG
23 ngày
Save static page, deploy lên firebase, versionning lên github bất tử luôn,
Những thứ quan trọng thôi, vd Nhật Kí Vàng Anh
@Bác Hù cái nào cũng có thể mất, ko thể bất tử được.
Vũ trụ rồi cũng sẽ biến mất chứ riêng gì vài trang web lẻ vớ vẩn =))
@Bác Hù Rồi ngày đẹp trời github nó sập thì sao 😂
Bác Hù
ĐẠI BÀNG
22 ngày
@agram3ooo@lucas_mufc

ờ, bất tử thì nói quá
đính chính là ở ké nhà giàu khó đi ẹ đỡ lăn tăn
qwerty87
TÍCH CỰC
23 ngày
Đó là lý do tại sao mà trang nào hay và cần thiết thì tôi đều lưu về dưới dạng single html file, (đuôi mhtml). Lúc mở ra xem lại bằng trình duyệt không có sai biệt, thích thì có thể chuyển qua pdf, hoặc mở bằng bất kỳ app nào có khả năng đọc fle mhtml chuẩn.
Chứ lâu quá tài nguyên nào lưu nổi
Trước đây mình hay copy nội dung độc lạ và hay đâu đó lượm lặt về trang riêng viết bằng wordpress. Sau 1 năm thôi các thông tin đó đọc lại thấy lỗi thời, phải xoá bớt đi cho nhẹ data
cbxncnmfg
ĐẠI BÀNG
23 ngày
@nebazoc kiểu như các bài quân sự phân tích tính ưu việt của xe tăng Nga với mắt thần bắn ra bức xạ tần số cao làm nhiễu rada , chọc mù tên lửa dẫn đường chống tăng , hệ thống Amatis bắn ra 1 viên thuốc nổ tác động làm hỏng viên đạn chống tăng bay với tốc độ 1800m/s của Nga ( tốc độ đạn của AK47 là 600m.s ) rồi hệ thống mẹ nga thần thánh bắn ra 8 quả đạn khói có bột nhôm chọc mù tầm nhìn của tên lửa dẫn đường laser , Giáp Consair thế hệ thứ 5 của Nga kháng được đạn chống tăng bất kể đánh vào phần sườn , Vật liệu Cocktail mới của Nga có thể vô hiệu hóa các tên lửa dẫn đường bằng rada nhiệt

sau cùng đây là cái tôi thấy

nếu bạn lưu được các lịch sử web 1 năm trước của bạn thì bạn sẽ thấy nhiều cái trong quá khứ nó cực kì khốn nạn và dối trá , ví dụ , 1 thanh niên bị bắt vì trên mạng đăng thông tin giả chỉ trích đinh la # tham nhũng , năm sau Đinh la # bị bắt vì tham nhũng

Chuyến bay giải cứu là tự hào và cho thấy cách di chuyển sáng tạo của VN thì năm sau thành ... Tư bản cả rồi , cung không đủ cầu , muốn đi thì đóng thêm tiền

mọi thứ là giả
SEI-167814403.webp
Tinhte cũng ko ngoại lệ. Sau cái vụ chuyển từ http sang https thì hỏng link bài viết cũ rất nhiều. Trc đây cũng hay có kiểu up ảnh lên mấy trang chuyên cho up ảnh, về sau mấy trang này sập thì bài viết hỏng hết ảnh, chỉ còn text 😆
BrioPc
TÍCH CỰC
23 ngày
Vậy là 10 năm sau cái bài mình đang đọc này sẽ bị biến mất
Vừa rồi mất 2 triệu nội dung trời đất làm tôi đau lòng lắm.
muihaovong
ĐẠI BÀNG
23 ngày
@Phi-Nhan Cái đấy khác, do diễn đàn đấy vi phạm thuần phong mỹ tục nên bị triều đình bắt. Nên diễn đàn đấy phải bị xóa, không giống trong bài.
@muihaovong Trong bài viết trên, chỉ mỗi phần nói về thông tin trên mạng xã hội là có đưa ra nguyên nhân phỏng đoán vì sao không tồn tại. Còn các phần khác về nội dung trên Internet thì có nói nguyên nhân gì đâu.
boanh86
TÍCH CỰC
23 ngày
Ổ cứng nào lưu nổi, lưu vài năm nó reset lại. chỉ có Facebook đang làm
tốt nhất
vì ngốn bộ nhớ quá nên phải clear data và cho chạy overwrite. do đó muốn xem lại chắc chơi kiểu lưu trang web luôn quá.
TqTTpT
TÍCH CỰC
23 ngày
điều này có làm ảnh hưởng đến dữ liệu dùng để train AI đúng ko?
404 huyền thoại

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019