Một nửa tổng lưu lượng truy cập internet toàn cầu là bot, hầu hết vận hành với ý đồ xấu

P.W
6/7/2024 18:8Phản hồi: 21
Một nửa tổng lưu lượng truy cập internet toàn cầu là bot, hầu hết vận hành với ý đồ xấu
Đó là thông tin mới nhất từ đơn vị vận hành hệ thống mạng phân phối nội dung trực tuyến (CDN) nổi tiếng, Akamai. Cụ thể hơn, 42% tổng lưu lượng truy cập internet toàn cầu là bot tự động vận hành để truy cập các tên miền. Và theo Akamai, 65% tổng lưu lượng truy cập do bot tạo ra rõ ràng là có ý đồ xấu. Chẳng hạn, hầu hết những bot truy cập internet đều để “cào dữ liệu”, những con bot được thiết kế để thu thập thông tin và nội dung trên mạng, rồi sau đó được dùng để thực hiện những cuộc tấn công mạng.

Những con bot này có thể ảnh hưởng rất mạnh với những doanh nghiệp vận hành trên nền web. Và ở thời kỳ LLM lên ngôi, chatbot AI biết lập trình, việc nhờ thuật toán viết hộ những con bot như thế này đang khiến tội phạm công nghệ cao dễ dàng thực hiện những ý đồ xấu hơn trước rất nhiều.

Nhiệm vụ của các CDN để internet toàn cầu vận hành và tồn tại khá quan trọng. Khi người dùng truy cập một trang web, dữ liệu từ máy chủ của trang web đó phải di chuyển trên mạng Internet để đến được máy tính của người dùng. Nếu người dùng ở xa máy chủ đó, thì sẽ mất nhiều thời gian để tải một tệp lớn, chẳng hạn như video hoặc hình ảnh trên trang web. Thay vào đó, nội dung trang web được lưu trữ trên các máy chủ CDN gần hơn với vị trí của người dùng theo khu vực địa lý để quá trình chuyển đến máy tính của họ được nhanh hơn nhiều.

Hiện tại, Akamai có quy mô và độ danh tiếng không hề thua kém Amazon AWS và Cloudflare. Và vì là một trong những CDN hàng đầu thế giới, chắc chắn họ hiểu internet vận hành như thế nào.

Kết luận về tình hình bot tự động truy cập internet là một phần của báo cáo về thực trạng “cào nội dung và dữ liệu” trên mạng internet trong năm 2024. Con số này có phần tương đồng với những báo cáo từ những nguồn khác, được công bố vào năm 2022 và 2023. Akamai cho biết, mảng thương mại điện tử bị ảnh hưởng nhiều nhất bởi những bot thu thập dữ liệu, và những bot chạy lưu lượng truy cập tự động, chẳng hạn như dùng tấn công từ chối dịch vụ làm quá tải máy chủ.


Một số loại bot có thể làm lợi cho doanh nghiệp, chẳng hạn thu thập thông tin khách hàng, hầu hết bot dạng web-scraper, suy cho cùng, cũng đều tạo ra trải nghiệm tiêu cực đối với khách hàng. Còn xét về tổng thể, bot cào dữ liệu giờ được dùng vào mọi mục đích xấu: Cạnh tranh không lành mạnh, theo dõi đối thủ, đầu cơ thu gom hàng hóa bán trực tuyến, vận hành những trang web lừa đảo, và một số hành vi phạm pháp khác.

Giám đốc kỹ thuật của Akamai, Patrick Sullivan giải thích rằng, đối mặt và truy quét bot tương đối khó, phải giải quyết vấn đề ở những tầng ứng dụng web, dịch vụ cho tới cả chủ sở hữu các API. Những bot cào nội dung trên mạng có thể dễ dàng thu gom hình ảnh, mô tả sản phẩm, thông tin giá cả và nhiều dạng dữ liệu khác. Rồi lấy ví dụ, tội phạm công nghệ cao sẽ lấy những thông tin đó để tạo những trang web giả mạo những thương hiệu lớn, phục vụ lừa đảo.

Rồi những bot cào nội dung cũng đi lấy cắp cả những bài viết và nội dung được đăng tải trên những trang web nhiều người truy cập, chỉnh sửa lại một chút, giờ làm quá dễ với công cụ tóm tắt và viết lại của chatbot AI, để đăng lại thông tin, rồi tối ưu SEO để trang web đứng ở vị trí cao hơn trên trang tổng hợp kết quả tìm kiếm của Google, thu hút người truy cập và kiếm tiền dễ dàng từ quảng cáo trực tuyến.

Nhờ những công cụ AI tạo sinh, những con bot sử dụng thuật toán AI đang ngày một khó phát hiện. Những botnet tạo ra nhờ AI thậm chí còn vận hành tốt với những dữ liệu không được phân loại, và có thể lấy luôn thông tin doanh nghiệp để tự đưa ra quyết định giúp bọn lừa đảo. Nói cách khác, nhờ AI, tội phạm công nghệ cao có thể tổng hợp, truy xuất và xử lý thông tin dễ dàng hơn xưa rất nhiều.

Rồi những con bot này sẽ được dùng để tạo những tài khoản trực tuyến giả mạo, rồi dùng chúng để nhắm tới những người thật, hoặc lừa đảo tài chính hoặc dùng những mục đích khác.

Và ngay cả khi những con bot cào nội dung và dữ liệu không có mục đích xấu, thì chúng vẫn có thể ảnh hưởng tới đánh giá trang web trong mắt Google, ảnh hưởng tới kết quả tìm kiếm trực tuyến, và tăng chi phí vận hành lưu trữ trên máy chủ.

Theo Techspot
21 bình luận
Chia sẻ

Xu hướng

Trên Tinhte này cũng thấy có mấy con bot, chủ đề nào cũng có mặt. Đăng bài xong là biến, không cần phản hồi ý kiến.
Khôn như mày :D
@LRA bot này hưởng lương mới ac =)))
@LRA Nói chi rồi lại bị soi 🤣🤣🤣
Tốn tài nguyên của nhân loại 1 cách vô tội vạ .
binhtam
TÍCH CỰC
21 ngày
@hoanglong0712 các search engine như google và các mô hình AI ngôn ngữ lớn đều dùng bot cả!
Nga, Tàu, Bắc Hàn, VN......sẽ vận hành những con bot xấu xa này. Kinh tởm
@para-hạ-sốt
Bạn thì đỉnh rồi
.Gù.
TÍCH CỰC
21 ngày
Lượng ng dùng mxh bây giờ mình cũng thấy toàn là ng dùng ảo
bởi thế đưa tiền và dữ liệu lên là nó cuỗm ,tiền giấy thẻ giấy vẫn là hữu dụng ,tin gì 4.0 mà ban ngành nào cũng la gào ,có ngày ngồi trước màn hình trống
ndthuanx
TÍCH CỰC
21 ngày
Ngày con người tận diệt con người 0 còn xa.
Âu, đây cũng là quy luật của vũ trụ.
@ndthuanx Con người là loài ký sinh nên bị diệt vong là đúng. Trả lại tự nhiên cho Trái đất.
Nhưng quy luật vũ trụ nghe hơi lạ 😁
Cho nên giờ chạy quảng cáo các loại kiếm ra dc 1 khách hàng là rất khó. Tốt nhất là chơi các ứng dụng tiktok và face rùi kiếm khách trên đó. Web thoái trào rùi.
Lãng phí tài nguyên quá xá
namdh7
TÍCH CỰC
20 ngày
ở đâu xa, ngay trên trang TT này cũng toàn bot.
leebasv
ĐẠI BÀNG
20 ngày
65% thì nên dùng từ phần lớn, đọc tiêu đề thấy hầu hết nghe ghê quá.
@leebasv Có khi tiêu đề do AI suggest để có tương tác cao 😁
holaboy
ĐẠI BÀNG
20 ngày
ko có top à
Phải đăng nhập trên điện thoại để comment. Internet ngày càng nhiều rác và chúng ta cần phải biết cách khai thác sao cho hiệu quả. Hôm qua không hiểu sao bỗng nhiên thấy facebook quảng cáo tràn lan “lấy lại tiền bị lừa đảo”, và đáng lo hơn là trong các qc ấy, vô số comments không rõ bot hay tk ảo bình luận cảm ơn đã giúp lấy lại tiền (??). Không hiểu sao fb lại để cho đống rác rưởi đó đi lừa đảo với độ phủ sóng dày đặc như vậy. Zalo thì toàn tài khoản cú có gai vào kết bạn, cũng để lừa đảo. Lên otofun thì cứ bài nào toyota chạy quảng cáo là tràn lan bot comments y hệt nhau, đến tận tháng 6 rồi vẫn comments “tết này kịp lấy xe chạy thì hết ý” (chắc chưa kịp sửa content từ trước tết). Rồi cứ ai không thích vin là một đống vinno vào lý luận cùn (gắn liền vin với “yêu nước”, không thích vin là “phản động”, “khát nước”). Các kênh review xe bị mua chuộc, khen hết lời honda và vin. Con crv overpriced thì các “reviewer” lại lên bài “mua xe này sướng quá quên cả cái giá luôn”. Có một số kênh review độc lập trước đây mình thấy có khen chê phân tích rõ ràng. Kể từ ngày nhận tiền đi sự kiện Honda cái là từ đó trở đi con Honda nào cũng “không có điểm gì để chê”… mình tìm hiểu thì được biết honda hậu hĩnh nhất với các reviewer, bảo sao… Internet trước giờ vẫn luôn có cả vàng lẫn rác nhưng gần đây rác nhiều đáng kể. Ngay cả tinhte.vn cũng vậy, trước là một diễn đàn tinh tế, thì nay có quá nhiều bài viết chất lượng kém lên trang chủ. Nào là vì sao cần phải độ xe?? Vì sao qua ngã tư cần giảm tốc độ?? Oneplus bán điện thoại với giá 50$ một gb ram??? Một loạt bài nhảm nhí của quyền vũ nào đấy, rồi một loại bài cổng c của iphone là thất bại của loài người, loài người, cái mẹ gì cũng loài người? Lâu lắm rồi ko thấy một bài phân tích xuất sắc, chỉ ra cốt lõi vấn đề hay những kiến thức đáng giá. Ngày càng nhiều bài thiếu muối, hay nói thẳng là rác
@cadenlid chuẩn quá bác ơi. bác viết thế bot nó rối vì chưa được training rồi 😁

"gày càng nhiều bài thiếu muối, hay nói thẳng là rác"
nhưng mà rác cũng mặn chát chứ không lạc như bác nói đâu :D
lehman1
ĐẠI BÀNG
14 ngày
@cadenlid bài hay bị mua bởi ban truyền thông tập đòan
Trên TT cũng nhiều bot lắm 😁

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019