Tết Tinh Tế


Camera AI Hà Nội - Engineering

maisonhai3
16/1/2026 14:26Phản hồi: 10
EditEdit
Camera AI Hà Nội - Engineering
Mình nhớ lâu lâu trước, có đọc một bài trên tinhte giải thích cách hoạt động của Camera AI của HN. Mình nghĩ chủ đề đó khá hay, nên viết thêm bài này, cho vui.

Mở bài

Đầu tiên là nhắc lại cách Camera AI hoạt động, theo bài viết trước có nói. Đó là, khi camera thu nhận được hình ảnh, dữ liệu sẽ được chuyển về một trung tâm tính toán. Tại trung tâm này, hệ thống sẽ phân tích và tìm ra lỗi vi phạm.


Về mặt tổng quan, cách này hoàn toàn đúng. Tuy nhiên, khi triển khai trên thực địa, mình e rằng, về mặt kỹ thuật, cách này không khả thi, thậm chí là không thể thực hiện được. Nguyên nhân mình nêu ra dưới đây.

Giả định sai

Cách tiếp cận này, dựa trên 2 giả định sai. Đó là.

Thứ nhất, giả định là đường truyền network (mạng) là miễn phí. Sai, đường truyền không hề miễn phí. Bằng chứng là Netflix đã từng vướng vào cuộc chiến pháp lý căng thẳng với nhà mạng SK Broadband tại Hàn Quốc, với số tiền yêu cầu bồi thường lên tới hàng chục triệu đô la (hơn 27 tỷ won chỉ riêng năm 2020) vì gánh nặng băng thông quá lớn. Nhắc lại, chi phí truyền tải dữ liệu video liên tục, realtime, là đắt.

Thứ hai, là giả định mọi thông tin nên được xử lý tập trung ở trung tâm tính toán, bởi vì cách suy nghĩ thông thường, batch processing, xử lý theo quy mô lớn, thì sẽ nhanh hơn và rẻ hơn. Giả định này không hẳn là sai nhưng không hợp lý lắm. Tạm thời gác lại việc phân tích đúng sai của giả định đó ở đây, ta sẽ đi vào thực tế cách thành phố Hà Nội triển khai bài toán này.
Vậy để tiếp cận vấn đề này với tư duy engineering, thì sẽ làm thế nào?

Đầu tiên, họ không live-stream toàn bộ những gì camera thu được về máy chủ trung tâm.
Thứ hai, nếu không xử lý tính toán tập trung vào trung tâm dữ liệu, thì phải làm cách nào? Đây là lúc nghĩ về mô hình Edge AI (Điện toán biên).

Cụ thể là, khi camera ghi được hình ảnh lỗi vi phạm, nó sẽ xử lý ngay tại đó luôn. Nghĩa là, Camera AI thực tế bao gồm một hệ máy tính, bao gồm camera để nhận input, CPU và GPU để xử lý input đó, lấy ra hành vi vi phạm cùng bằng chứng, bằng chứng chỉ là một hoặc vài frame, hoặc một đoạn video ngắn, 12 - 24 FPS, sau cùng là card mạng để gửi kết quả về máy chủ.

So với cách truyền thống, cách này đạt được những ưu điểm sau:
  • Băng thông cần thiết ít hơn.
  • Data Center nhẹ gánh hơn, cả về năng lực xử lý, lẫn lượng dữ liệu cần lưu trữ.

Tính nhanh một chút kiểu back-of-the-envelope cho dễ tưởng tượng.

Giả sử cả phố Hà thành có khoảng 4.000 camera, con số khá khiêm tốn.
  • Kịch bản 1: Streaming tập trung (Centralized) Nếu mỗi camera stream một luồng video 1080p về trung tâm.
    • - Bitrate trung bình (chuẩn H.264/H.265): khoảng 4 Mbps (Megabit/giây).
    • - Tổng băng thông mạng cần thiết: 4.000 cam×4 Mbps=16.000 Mbps=16 Gbps.
    • - Lưu trữ (Storage): 16 Gbps×86.400 giây/ngày/8 (bit to byte)≈172 Terabyte/ngày. Retention (lưu tạm thời rồi xóa) ít cũng phải 30 ngày, cần 5,1 Petabyte.
  • Kịch bản 2: Điện toán biên (Edge AI) Chỉ gửi dữ liệu khi có sự kiện (vi phạm).
    • - Giả sử một nút giao thông "nóng" có 500 lỗi vi phạm/ngày.
    • - Mỗi gói tin vi phạm gồm: 1 ảnh toàn cảnh + 1 ảnh zoom biển số + metadata (JSON). Tổng dung lượng khoảng 2 MB.
    • - Tổng lưu lượng mỗi ngày cho 4.000 camera: 4.000 cam×500 loˆ˜i×2 MB=4.000.000 MB=4 TB/ngày.

Quảng cáo



So sánh thì, 172 TB/ngày (Streaming) và 4 TB/ngày (Edge AI) là chênh nhau 43 lần.
unnamed.png
Ngoài ra, với Edge AI, ta không live-stream, nên không cần băng thông duy trì liên tục, nên lại tận dụng thêm được giải pháp rẻ hơn, tiện hơn, là dùng luôn 4G/5G, chứ không cần dựng hẳn Leased Line.

Tính khả thi

Tiếp tới, vì sao ta nói Điện toán biên này khả thi hơn phương án tính toán tập trung?


  • Cơ hội mua thiết bị ban đầu.
  • Chi phí và khả năng bảo trì.

Đầu tiên, nói về cơ hội mua sắm đi. Để tính toán tập trung, thì cần có thiết bị siêu mạnh, cỡ như H100 ấy. Còn Edge Computing thì chỉ cần mấy con Jetson hoặc Rasberry Pi, là đủ rồi. Rõ ràng, việc mua những siêu máy tính của NVIDIA là khó hơn nhiều việc mua Jetson.

Thứ hai, việc bảo trì những thiết bị điện toán camera AI này sẽ dễ dàng hơn rất nhiều. Kỹ sư Việt Nam hoàn toàn có thể tự thay thế, sửa chữa được, vì cấu thành cũng chỉ là CPU, RAM, GPU. Trong khi đó, với những siêu máy tính tập trung, nếu có bất kỳ sự cố phần cứng vật lý nào xảy ra, chắc chỉ có một phương án duy nhất, là điệu các anh engineer $200K một năm của NVIDIA bay đến sửa.

Quảng cáo

10 bình luận

Xu hướng

Nó sẽ vẫn lưu video tại bộ nhớ mấy cái AI camera trong 1 thời gian nhất định nếu được đặt. Va t nghĩ nó vẫn stream 1 luồng 720p hoặc 1080p về trung tâm điều hành ở những vị trí chủ chốt
Còn nói về giá đừng nói vo vậy, giá dự án home water sợ Nvidia còn sốc đấy 😆)
1 con H100 hàng mới thì xử lý bao nhiêu luồng CamAI, t nghĩ 200 là ít, 400 luồng fullHD30fps từ RTSP kéo về là nhiều. 1 cam AI giá dự án nhiêu, t đoán không dưới 10tr 1 cái hàng thường, PTZ thậm chí t nghĩ còn 100tr 1 cái 😃))
@Bắp_HD Máy chủ DGX H100 (8 GPU): giá trọn bộ khoảng 400.000 – 500.000 USD (10–12 tỷ VNĐ). x3 thì mất 36 tỷ vẫn ít lắm so với tiền mua đống cam kia 😃))
empty77
ĐẠI BÀNG
17/01/2026
@Bắp_HD Hơn tỏi 1 cái b ey
@empty77 K đến 😆 nhưng mấy con zoom 5x 10x hay PTZ khả năng 100tr 1 cái thật, mà cấu hình trong mấy con đó chắc chỉ ngang điện thoại cấp thấp, ống kính zoom k biết mua hãng nào nữa, nhưng mà cũng thường nốt, kk 😃)
Ở mình thì những nguồn lực như mạng, hệ thống xử lý thì vô biên mà bạn. Lo gì.
bài viết ngu vãi, 4000 cam ở HN chắc tốn băng thông hơn 3 triệu hộ gia đình, mỗ hộ 1 đường cáp quang à, coi như mỗi cam là 1 hộ gia đình đi

công an chỉ việc ép fpt, vnpt, viettel , tại mỗi nơi có cam, xin 1 line 300 mbps thậm chí 100mbps là đủ, thậm chí lấy tiền phạt trả tiền đường truyền

nhồi nhét sức mạnh vào 1 cam AI thì cực kì tốn kém và bảo trì mệt mỏi

việc của cam là thu cho thật rõ, hết, còn data xử lý tập trung

xử lý biên thật ra cũng có nhưng nó sẽ chỉ ghi lại các giây có xe vi phạm và gửi về chung máy chủ, để ở data center canh mấy giây đó check cho nhanh , tất nhiên chỉ là tham khảo
@SieuBanana Mấy con này nó lắp sim 4G tốn chi phí mua gấp bội
Ông này viết bài nhưng không hiểu gì về camera AI rồi. Camera AI có năng lực xử lý AI ngay tại camera rồi truyền kết quả về data center của trung tâm. Trong nghành gọi là “xử lý tại biên” còn camera bắt buộc phải stream hình ảnh về xử lý AI tại sever trung tâm thì chỉ gọi là camera giám sát giao thông thôi.

Các camera này có thể nhận thêm thuật toán xử lý, nâng cấp sau đó tự xử lý ngay tại camera, chỉ truyền kết quả trả về. Thế nên báo chí khi đưa tin Hanoi lắp n camera AI giao thông là lắp loại camera này chứ ko phải camera chỉ ghi hình kia. Giá đắt hơn nhiều.
1 tỷ 1 con cam cơ mà
mấy con cam này đều ghi dữ liệu vào thẻ nhớ nhé chứ không đơn thuần truyền về lưu dữ liệu ở trung tâm đâu

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2026 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: 70 Bà Huyện Thanh Quan, P. Xuân Hoà, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép cung cấp dịch vụ MXH số 134/GP-BVHTTDL, Ký ngày: 30/09/2025