Dữ liệu của ngôi sao Death Star trong Star Wars sẽ lớn tới cỡ nào nếu có thật?

Duy Luân
14/3/2016 6:48Phản hồi: 43
Dữ liệu của ngôi sao Death Star trong Star Wars sẽ lớn tới cỡ nào nếu có thật?
Fan phim Star Wars hẳn là biết đến Death Star, một trạm không gian siêu to bay lơ lửng với sức hủy diệt cực mạnh có thể tiêu diệt cả một hành tinh chỉ với một lần bắn. Nhưng đã bao giờ bạn thắc mắc là lượng dữ liệu sinh ra bởi các hoạt động của Death Star lớn đến cỡ nào, chúng bao gồm những thông tin gì và được xử lý theo cách nào hay chưa? Để biết thêm về Big Data, các thách thức liên quan cũng như sự to lớn của dữ liệu trong thế giới số hiện nay, chúng ta sẽ lấy ngay Death Star làm ví dụ để tìm hiểu nhé.

Dân số Death Star tạo ra bao nhiêu dữ liệu?


Theo cấu hình cơ bản, Death Star có khoảng 1,7 triệu người phục vụ trên đó, trong đó tính luôn cả mấy anh lính stormtroopers, các chỉ huy, người làm đồ ăn, dọn dẹp, ngoài ra còn có thêm 400.000 chú robot tự động. Với dân số như thế này thì Death Star đã có dân số gần bằng với thành phố Philadelphia ở Mỹ. Với đường kính 120 km, một nhóm sinh viên ở Đại học Lehigh University ước tính rằng sẽ phải cần hơn 1 nghìn triệu triệu tấn thép để xây dựng nên trạm không gian này. Với tốc độ sản xuất thép hiện nay, bạn sẽ phải đợi khoản 800.000 năm để có đủ số thép trên, và chi phí sẽ tầm 852 nghìn triệu triệu đô.

Storm_trooper.png

Quay trở lại với dân số của Philadelphia, số người này sẽ tạo ra một lượng dữ liệu tăng gấp đôi sau mỗi năm. Năm 2012, các hoạt động của họ đã tạo ra khoảng 2,8 zettabyte dữ liệu hồi năm 2012 theo một nghiên cứu của tạp chí MIT Technology Review. Đến năm 2020, chúng sẽ tăng thành 40 zetabytes.


Quy chiếu sang dân số 1,7 triệu trên Death Star, họ sẽ tạo ra tầm 8.84 exabytes dữ liệu mỗi năm. Đó là trong bối cảnh những người này (và các robot) sẽ tạo ra lượng dữ liệu bằng với người trên Trái Đất năm 2020. Ở thiên hà tương lai xa xôi nào đó thì hẳn là lượng dữ liệu này còn nhiều hơn nữa.

Qua đây, bạn có thể thấy rằng lượng dữ liệu được tạo ra bởi con người mỗi năm là cực kì lớn và không ngừng tăng nhanh mỗi năm. Thế nên nó mới có tên gọi là "Big", tức là lớn. Dữ liệu này không phải là một video Full-HD mà bạn hay xem, không phải là ổ cứng của bạn, không phải là ổ cứng của cả công ty bạn. Nó to hơn thế gấp trăm, thậm chí là hàng nghìn lần. Chỉ việc xử lý dữ liệu ở quy mô công ty đã vất vả, xử lý được các dữ liệu của Death Star lại càng khó hơn, vậy thì việc xử lý dữ liệu của cả thế giới là chuyện cực kì phức tạp.

Sự tiến hóa của máy móc và nhu cầu phân tích số liệu

Giờ là thời đại của Internet of Things, thế nên việc tạo ra dữ liệu không chỉ xuất phát từ máy tính, điện thoại, tablet. Chúng ta còn đeo trên người các thể loại smartwatch và smartband khác nhau, bệnh nhân thì có thể đeo máy đo nhịp tim, cảm biến định vị... Chưa hết, ở nhà còn có tủ lạnh thông minh, bộ điều khiển nhiệt độ thông minh, xe chạy trên đường thì tạo ra dữ liệu về GPS và bản đồ, chưa kể đến các camera quan sát gắn trên các con đường...

Nếu dùng Death Star để so với Trái Đất thì 400.000 con robot tự động chính là đại diện cho thế giới Internet of Things của chúng ta. Trong quá trình những con robot này hoạt động, chúng sẽ tạo ra rất nhiều dữ liệu khác nhau, từ hình ảnh ghi lại bằng mắt, số liệu các cảm biến dò đường đi, dữ liệu về giọng nói, dữ liệu về những người nó đã gặp... Giả sử những chút robot đó cũng thông minh như người thì chúng sẽ tạo ra khoảng 2,08 exabytes dữ liệu mỗi năm.

StarWarsEmpire.jpg

Nhưng dữ liệu không chỉ đơn giản là thu thập rồi vứt ở đó. Dữ liệu cần phải được phân tích và chuyển hóa thành thông tin hữu ích. Trên Death Star, dữ liệu của robot cần phải được chuyển thành thông tin giúp chỉ huy của chúng hiểu được chúng thường làm gì, chúng có gặp lỗi gì hay không, chúng có làm việc hiệu quả hay không. Tương tự, ở Trái Đất, dữ liệu của các thiết bị IoT sẽ được xài để phân tích về mức độ tiêu thụ điện, hiệu quả công việc mà chúng mang lại, sự cải thiện theo thời gian, khả năng đáp ứng của chúng với yêu cầu người dùng và ti tỉ những thứ giống như vậy.

Để phân tích được lượng dữ liệu khổng lồ sẽ cần những thuật toán đặc biệt. Có những thuật toán phải chạy nhiều ngày trời trên một lượng dữ liệu lớn kinh khủng mới cho ra được báo cáo cuối cùng. Việc các siêu máy tính xử lý dữ liệu thời tiết để đưa ra dự báo là ví dụ dễ thấy. Facebook cũng chạy phân tích để hiểu người dùng của họ đang làm gì, ở đâu, sở thích ra sao, thói quen như thế nào cũng là một ví dụ điển hình cho công tác phân tích Big Data. Đó không phải là chuyện dễ dàng và cần những kiến thức rất chuyên sâu về toán học, thống kê và cả trí tuệ nhân tạo nữa.

Quảng cáo


Cơ sở hạ tầng và nhu cầu lưu trữ dữ liệu

Để quản lý hết đống dữ liệu được tạo ra bởi con người và robot trên Death Star, trạm không gian này chắc chắn sẽ cần đến một cơ sở dữ liệu không lồ với kiến trúc phức tạp và các quy trình vận hành cũng không đơn giản. Kích thước của cơ sở dữ liệu này có thể được ước tính băng cách dùng kích cỡ của một database khác cho một thành phố tương đương, chín là Philadelphia.

Hiện tại, Philadelphia đang quản lý 326 bộ dữ liệu khác nhau bao phủ nhiều khía cạnh của thành phố: từ việc thành phố có bao nhiêu quận, dân số mỗi quận ra sao, người nào sống ở đâu, các vị trí đỗ xe, những công trình mang tính lịch sử, dữ liệu doanh nghiệp, thuế má, thu nhập, mặt hàng kinh doanh và hàng đống những thứ khác. Trong quá trình vận hành, dữ liệu được tạo ra rất nhiều nên cơ sở dữ liệu này cần phải được thiết kế theo một cách đặc biệt để có thể chạy ổn định trong thời gian dài và đón đầu những thay đổi có thể xuất hiện trong tương lai, bao gồm cả việc thay đổi chính sách về lưu trữ thông tin.

Đây cũng là một thách thức đối với những nhà nghiên cứu Big Data. Họ thường xuyên phải tìm tòi những cách lưu trữ dữ liệu trong các cơ sở dữ liệu sao cho lượng thông tin bị trùng ít nhất, tốc độ truy cập nhanh nhất và hệ thống hoạt động ổn định nhất có thể.

Star_Wars_Death_Star_1.jpg

Ví dụ đơn giản như thế này: chúng ta có một thông tin cần lưu, đó là địa chỉ phòng ở của một anh lính Stormtrooper. Nếu trong cơ sở dữ liệu quản lý binh lính ghi thông tin này một kiểu, cơ sở dữ liệu quản lý súng ống ghi một kiểu khác thì lúc anh Stormtrooper đổi phòng, sự thiếu đồng nhất sẽ xuất hiện, dẫn đến việc khó truy ngược lại xem anh lính đó thật sự đang ở đâu. Việc lặp lại thông tin này 2 lần cũng gây lãng phí không gian lưu trữ, trong bối cảnh bạn có hàng exabyte dữ liệu thì việc trùng lặp sẽ rất là tệ.

Quảng cáo


Mà để chứa đống cơ sở dữ liệu đó cũng cần những hệ thống lưu trữ rất lớn và mạnh mẽ, và không chỉ có một máy mà cần tới nhiều máy / hệ thống lưu trữ được liên kết chặt chẽ. Các nhà khoa học hiện nay đang thử nghiệm và triển khai nhiều mô hình data center khác nhau có khả năng lưu, chuyển và phân tích dữ liệu tốc độ cao nhằm phục vụ cho nhiều mục đích, từ việc tìm hiểu dân số, dự báo thời tiết, ô nhiễm môi trường, biến đổi khí hậu, bảo tồn động vật hoang dã, hiểu về cách sống của con người...

Thông tin về các vì sao và lượng dữ liệu khổng lồ

Death Star không chỉ có phi hành đoàn, mà nó còn có vũ khí nữa. Nổi bật nhất chính là khẩu súng siêu laser có thể bắn nát một hành tinh. Tất nhiên, để Death Star nhắm trúng mục tiêu của mình thì sẽ cần rất nhiều dữ liệu khác nhau. Ví dụ, Death Star cần lưu lại vị trí của các hành tinh và ngôi sao trong không gian của Star Wars. Chỉ tính riêng ở thiên hà của chúng ta, thiên hà Milky Way, đã có từ 100 đến 400 tỉ ngôi sao và ít nhất là 100 tỉ hành tinh. Với đế chế điều hành Death Star thì mọi hành tinh đều có thể gây nguy hiểm cho họ nên tia laser phải sẵn sàng bắn nát nó bất kì lúc nào, vậy nên việc lưu dữ liệu để sẵn là điều không thể thiếu.

Star_Wars_Death_Star_2.jpg

Ồ, dữ liệu của hàng triệu ngôi sao và hành tinh kèm theo một ít dữ liệu về dân số trên đó thì quả là kinh khủng. Giả sử Death Star đang quản lý khoảng 1 triệu hành tinh thì tổng lượng dữ liệu phát sinh sẽ khoảng 40,000 yottabyte. Bạn sẽ cần khoảng 250 nghìn tỉ chiếc đĩa DVD để chứa 1 yottabyte dữ liệu, hoặc hàng triệu thẻ microSDXC 200GB. Bao nhiêu đây thẻ đủ lấy đầy một chiếc khinh khí cầu Hindenburg. Tức là, để chứa hết 40,000 yottabyte, bạn sẽ cần tới 40.000 chiếc Hindenburg hay 8 tỉ mét khối thẻ nhớ. Một số nhà nghiên cứu đã nói rằng trong vụ bê bối của NSA khi theo dõi các thông tin Internet và điện thoại, họ đã thu thập được đến hàng yottabyte dữ liệu.

Trong tương lai, người ta có thể sử dụng những phương thức tiên tiến để lưu dữ liệu chứ không chỉ là HDD, SSD hay thẻ nhớ. ADN là một ví dụ, một ADN có thể chứa dữ liệu nhiều hơn cả một ổ cứng. Nếu công nghệ này đi vào hiện thực, một yottabyte sẽ chỉ cần khoảng 1 mét khối ADN mà thôi. ADN chính là tương lai của công nghệ lưu trữ khi mà trong thời gian gần đây người ta đã đạt được nhiều thành tựu về mặt này.

Star_Wars_Death_Star_5.jpg
Vui vẻ: Star War LEGO 😁

Kết


Qua ví dụ vui vẻ về Death Star, chúng ta biết được Big Data là một xu hướng không thể chối bỏ trong thế giới công nghệ hiện nay. Gần như mọi hoạt động của bạn đều tạo ra dữ liệu, từ việc bạn lên Facebook, coi YouTube, soạn file Word, đi trên đường... Để xử lý được lượng dữ liệu này cần những thuật toán phức tạp, còn để chứa nó cũng cần những database lớn khủng khiếp với cách thiết kế đặc biệt để giảm thiểu sự trùng lặp, đảm bảo tính toàn vẹn của thông tin trong khi phải tăng tốc độ xử lý. Cuối cùng, các nhà khoa học hiện nay đang tích cực phát triển nhiều cách phân tích và cách thiết kế database khác nhau để giúp hiểu hơn về con người, về cách sống, về thói quen, cũng như hiểu những vấn đề xã hội như dân số, ô nhiễm, môi trường, thiên tai, thời tiết...

43 bình luận
Chia sẻ

Xu hướng

bài viết này sẽ có: 10 người đọc và comment vì Starwar fan Việt Nam cỡ 9 người.... trong đó có em 😁
@Airblade14 em là người thứ 10 còn lại :p
mà em quan tâm cả hai :3

đọc bài này xong cũng giải đáp 1 phần nào về BIG data của mình rồi :D
@Airblade14 Chắc người duy nhất là tôi
LEGO nhe :D
@Mr KOP yên chí mod thường ko quan tâm chi tiết bé thế🆒
đầu bài viết có nói "1 nghìn triệu triệu tấn thép"...sao k đọc là 1 triệu tỷ cho nhanh nhỉ : ))...
@xetangleocay Coi chừng xoè nha đồng chí.:rolleyes::rolleyes:
@gen myoujun tại Mod chưa học tới đó....
clapika
TÍCH CỰC
8 năm
@gen myoujun Một cách đọc khác thôi mà. Giống như tiếng Trung Quốc, một triệu đôi khi người ta đọc là "một trăm vạn" vậy. Tiếng Anh cũng thế. Hồi xưa bọn em nói với Tây, ví dụ 1600 mình cứ mặc định là "one thousand six hundred" xong đến lúc nghe chúng nó đọc là "sixteen hundred" thì cứ ngớ hết cả ra, mãi sau mới hiểu 😁
@gen myoujun đấy là thói quen của 1 số người đấy, có lần 1 a tây nói eighty hundred
exa, zeta, yottabytes :eek::eek::eek:
So sánh công nghệ lưu trữ hiện tại với công nghệ lưu trữ trong Star War thì hơi khập khiễng, trong vũ trụ ấy thậm chí cả trong tương lai bao nhiêu data chắc cũng chả chiếm nhiều diện tích cho lắm.
vitkon
CAO CẤP
8 năm
Nghe thì gớm, chứ có gì tưởng tượng lưu bộ JAV bây giờ trên đĩa 1.44MB vài năm trước đâu :v
bernerasu
TÍCH CỰC
8 năm
Rồi wifi trên đó tốc độ ra sao?
mình không phải fan Starwar
Amazon đang làm rất tốt.Google,MS chỉ là kẻ đi sau.Facebook ,apple chỉ có giá trị tham khảo vì ko có dịch vụ internet of thing
@mandyhades THỜI đại công nghệ không có khái niệm trước sau. Chỉ có giữ được phong độ hay không mà thôi
tuan.tthp
ĐẠI BÀNG
8 năm
Con Chitti trong Endhiran Robot(Robot hủy diệt) của Ấn Độ cũng đc trang bị bộ nhớ 1 Zetabyte :v
Ko tạo đc cái to như vậy thì tạo thử bản sao 1/1.000.000 thử xem đc ko nhỉ ? Chắc sẽ đơn giản hơn triệu phần ấy 😁
Binpro1001
ĐẠI BÀNG
8 năm
Có ai mơ sống đến năm 3000 như e không?!
huhjun
ĐẠI BÀNG
8 năm
Không biết công nghệ ở Death Star khủng cỡ nào, nhưng mà cả đám người chạy rần rần trên đó chẳng ai kiếm được 😁
keyzi
ĐẠI BÀNG
8 năm
chưa xem tập nào, xem phần 1 được 10p cảm tưởng như phim siêu nhân vậy
Đơn giản về big data là mình lấy ví dụ về user analystic như này.
Bạn đang đi trên 1 con phố ở quận 7 lúc 11:30AM và thấy đói bụng, bạn mở điện thoại kết nối 3g và search tìm quán ăn trưa.
Hôm sau hoặc có thể 2,3 ngày sau cũng chỗ đó bạn sẽ thấy 1 biển quảng cáo của KFC, McDonald hay của 1 cửa hàng ăn uống.
Đó là bạn luôn đc track và từ những dữ liệu đó đc phân tích để đưa ra những kết quả phù hợp hơn, chứ ko phải ngẫu nhiên mà có những thứ hiện hữu đó 😃
@graphiclancer Ghê hơn mình thấy 2 cái
- Sáng tìm cái máy nướng bánh chiều vào amazon thấy nó giới thiệu máy nướng bánh ngay trang chủ - đi trang web nào cũng thấy máy nướng bánh
- mới update google + đã kết hôn nó giới thiệu ngay mua nhà + chăn ra + đồ cho em bé
ntlvn
CAO CẤP
8 năm
Cái cục Lego đó cũng Big money lắm 😔
ôi đọc mà cứ đơ ra, lên gg search đơn vị lại mới hiểu :mad:

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019