Làm công việc data có cần laptop / desktop cực mạnh, mạnh nhất vũ trụ hay không?

Duy Luân
8/6/2021 11:59Phản hồi: 146
Làm công việc data có cần laptop / desktop cực mạnh, mạnh nhất vũ trụ hay không?
Mình nhận được câu hỏi này từ nhiều anh em làm chung ngành, sẵn tiện chia sẻ kinh nghiệm của mình lên Tinh tế để nhiều người có thể xem được nhất. Mời các bạn khác cùng chia sẻ nhé. Khái niệm máy tính mà mình nói ở đây là máy tính cá nhân, là cái laptop, desktop mà bạn sẽ dùng nha.

Nói về việc làm data thì tạm thời mình sẽ nói đến 3 vai trò chính mà ở Việt Nam thường thấy nhất:
  • Data Engineer: các bạn làm việc kĩ thuật về dữ liệu, xây luồng dữ liệu, xây hạ tầng, đảm bảo dữ liệu chạy tốt, đủ, đều
  • Data Analyst / Business Analyst: các bạn này làm việc nghiên cứu về số, xây dựng báo cáo, dashboard, trả lời các câu hỏi về mặt kinh doanh, đưa ra lời khuyên, phân tích…
  • Data Scientist: các bạn này thường sẽ làm luôn cả việc của analyst, nhưng điểm khác biệt chính là các bạn làm về mô hình, về các thuật toán machine learning, AI này kia nhiều hơn, nặng hơn và có thể sẽ cần tích hợp mô hình đó vào một hệ thống khác

Lưu ý rằng tùy công ty mà các định nghĩa về 3 vai trò này có thể được hoán chuyển, đảm đương công việc của nhau. Cái đó không quan trọng lắm, cái quan trọng là bạn làm việc gì, thế nên mình sẽ không chia máy theo vai trò, mà theo việc bạn hay thực hiện khi đi làm nhé.

Việc lấy số, làm báo cáo, xây dựng dashboard


Với công việc này, thường bạn sẽ dùng một “client” trên máy tính của mình và kết nối vào hệ thống dữ liệu của công ty, ví dụ như dùng SQL để lấy dữ liệu ra và hiển thị thành biểu đồ, hoặc dùng các phần mềm như Tableau, Microstrategy, Power BI… để kết nối dữ liệu từ data warehouse / database / data lake… của công ty và vẽ nó lên thành hình thù để theo dõi và tìm hiểu ý nghĩa. Một số công ty thì có thể dùng thẳng trên trình duyệt web, bạn không cần phải cài bất kì phần mềm nào thêm, ví dụ như bạn nào dùng Superset, Redash, Metabase, Google Data Studio, AWS QuickSight…

Với những việc này, cách mình hay làm (và cũng là cách mình cho là cách tối ưu) đó là để việc nặng cho data warehouse / database / data lake… xử lý, gọi chung là đẩy việc cho server. Bạn không nên đưa phần tính toán, ghép nối dữ liệu, làm sạch dữ liệu… về máy tính laptop / desktop của mình. Các hạ tầng dữ liệu hiện nay đang làm rất tốt chuyện này, và nó chạy nhanh hơn cái máy của bạn rất nhiều nên hãy để việc cho các hạ tầng đó xử lý.

Mình đã từng thấy một số người sử dụng Tableau, PowerBI nhưng lại kéo hết dữ liệu thô (raw data) về lưu trên máy cá nhân của mình để ngồi phân tích, giai đoạn này tốn nhiều thời gian chờ load dữ liệu về, máy tính chạy thì cực, và nhiều lúc đứng luôn đâu có chạy nổi. Trong khi đẩy cho data warehouse làm thì 3 giây là xong rồi, bạn chỉ cần lấy kết quả đó đưa vô Tableau để làm biểu đồ là xong. Phần nào bạn aggregate được từ trên nơi lưu data thì nên làm trên đó, chứ kéo hết chục triệu dòng về mà máy tính chạy không được thì cũng uổng.

Như vậy, quan điểm của mình đó là nếu bạn làm các việc lấy số, báo cáo, dashboard thì không cần máy mạnh làm gì. Gần như mọi chiếc máy tính trên thị trường đều có thể làm tốt việc đó, vì phần nặng không nằm trong máy của bạn, Nếu muốn chạy nhanh mượt này kia… thì mua các máy trên 20 triệu là an tâm, còn không thì vẫn không sao. Tiền để làm việc khác, hoặc đầu tư vô một cái máy đẹp, mỏng nhẹ pin trâu gì đó cũng được 😁

laptop.JPG

Việc làm hạ tầng, xây dựng data pipeline, làm những thứ của data engineering


Với các việc này, bạn sẽ cần một cái máy mạnh hơn một chút vì đôi lúc bạn sẽ phải chạy thêm các docker container, phải chạy nhiều tool song song với nhau để phát triển giải pháp trước khi chính thức đưa lên server. Nhưng cũng không cần phải gọi là max cấu hình hay gì, một cấu hình vừa đủ là đã chơi được rồi, bạn không cần đổ quá nhiều tiền cho con PC nếu chỉ dùng cho việc của data engineer.

Một con CPU Core i7 dòng H, RAM tầm 16GB, có khi không cần GPU mạnh, vậy là đủ. Bạn có thể dễ dàng tìm được một con laptop với cấu hình như thế này với giá tầm 20 triệu trở lên.

Việc thử nghiệm các thuật toán machine learning, xây dựng, huấn luyện model


Các bạn data scientist trong team mình, cũng như trong các công ty mình đã từng làm, không cần một con laptop quá mạnh để có thể làm được những việc như train model, lọc số, làm sạch dữ liệu, hay xây dựng model để chuẩn bị tích hợp vào các hệ thống vận hành. Nhiều anh em vẫn dùng MacBook Air, nhiều bạn xài MacBook Pro 2015, có bạn xài một con Dell Gaming… nhưng không có máy nào gọi là cấu hình khủng hay cấu hình trăm triệu cả.

Quảng cáo


Vậy khi cần chạy lâu, chạy nặng thì sao? Việc train các model có thể kéo dài nhiều (chục) tiếng, kéo dài lên đến vài ngày. Việc đưa cho con máy tính cá nhân của bạn chạy việc này không hợp lý vì bạn sẽ cần phải mang đi đâu đó, và trong thời gian đấy thì để máy tính chạy liên tục có khi không phải ý hay, rồi còn phải lo về việc pin cho nó nữa. Chưa kể nếu đang chạy ở máy local của bạn mà bị cúp điện, bị hết pin thì phiền lắm.

Thế nên ở các công ty mình từng làm qua, cũng như công ty đang làm, thì bọn mình chọn giải pháp mua Google Colab với giá chỉ $10 / tháng, xài tẹt ga, thoải mái, đáp ứng đầy đủ nhu cầu công việc. Nếu không thích dùng Google Colab Pro, có thể dùng các dịch vụ khác của AWS, Microsoft Azure.. với giá cũng rất cạnh tranh, và số tiền bạn chi ra có khi rẻ hơn số tiền trăm triệu bạn đầu tư cho cái máy tính của mình, mà hiệu quả thì cao hơn vì có thể chạy trong thời gian dài, dễ dùng, linh hoạt. Nếu cần dùng GPU để train, có luôn.

Cũng có một số công ty mình thấy mua máy tính về đặt trong công ty với cấu hình rất cao để phục vụ cho việc train các model AI, tuy nhiên cái máy họ mua là để cho cả team dùng và nó được thiết lập để chạy như một server, chứ không phải để dùng như máy tính riêng của ai đó.

0.png

Tóm lại, bạn không cần cấu hình quá mạnh để làm việc data


Một số sai lầm mình thường thấy đó là các bạn mới bắt đầu học data thì đã đi đầu tư nhiều chục triệu để mua những dàn máy cực đỉnh, rồi những bạn chỉ làm phân tích mà chơi hẳn một con desktop Core i9, GPU GTX các thứ. Trừ khi bạn dùng luôn con máy đó để thực hiện phản xạ tốc độ cao với PUBG, COD, thực hiện khảo sát hành vi của con người trong đô thị với hệ thống GTA V hoặc tìm hiểu về khả năng vận hành của xe hơi với Forza Horizon thì ok, mua hẳn một con thật xịn về để học tập nghiên cứu cho sướng :D

Bạn hãy dùng chính cái máy tính mà bạn đang có để làm việc, rồi khi nào thấy cần thì hãy nâng cấp, chứ đừng vội vàng nâng cấp mà uổng tiền, lại không khai thác hết cái số tiền bạn đã bỏ ra cho việc làm data. Ngoài ra, cũng không nên nghe ai xúi bậy rằng làm việc data thì bắt buộc phải có máy tính đắt tiền nhé.

Quảng cáo



Theo thời gian, khi bạn đã làm việc, làm thực chiến, bạn sẽ biết mình cần gì, khi đó từ từ nâng cấp máy cũng không muộn. Hãy chi tiền một cách hiệu quả nhé.
146 bình luận
Chia sẻ

Xu hướng

mphp.iamt
ĐẠI BÀNG
3 năm
cần nhé các bạn, mod xài MBP 16in max options đấy thôi 😁
@hackieuhay Quét dọn cọ vệ sinh cũng phải có Mac book chứ, để còn xem youtube.
@hackieuhay Công ty trang bị Mac ghẻ cho nhân viên vệ sinh và bảo vệ xem youtube chơi. Còn những nhân viên khác xài win thôi là đủ rồi.
thien79
ĐẠI BÀNG
3 năm
Kể cả làm văn phòng. Lap phải mạnh, xử lý nhanh, ít bị lag thì công việc nó suôn sẻ và oke. Thế mới phê và hiệu quả
mushu
TÍCH CỰC
3 năm
@Duy Luân Ở phía người dùng thì 1000-2000$ với con 5000$ cũng chả khác nhau mấy nhỉ. Việc nặng thì con 5000$ sao bằng cả hệ thống vài triệu đô được 😃
@mushu Cũng được 😃)
@thontkh i3 thì chắc chưa đủ 😁
@thien79 Quan điểm của tui là thà dư còn hơn thiếu 😆 mua nên dư dư xíu cho thoải mái. ahihi
raykid
ĐẠI BÀNG
3 năm
Mạnh nhất trong khả năng tài chính là tốt nhất
Hun cái nè
Ko cần mạnh. Chỉ cẩn ổn định & nhiều ram là dc.

Nhưng đoạn này:
Mình đã từng thấy một số người sử dụng Tableau, PowerBI nhưng lại kéo hết dữ liệu thô (raw data) về lưu trên máy cá nhân của mình để ngồi phân tích, giai đoạn này tốn nhiều thời gian chờ load dữ liệu về, máy tính chạy thì cực, và nhiều lúc đứng luôn đâu có chạy nổi. Trong khi đẩy cho data warehouse làm thì 3 giây là xong rồi, bạn chỉ cần lấy kết quả đó đưa vô Tableau để làm biểu đồ là xong.

Thử trên hệ thống dễ treo lắm. Nên fai load về offline mà làm. Vì cái mà mình chạy ra & thể hiện bảng biểu dashboard nó fai thật dễ hiểu & đơn giản, cần thời gian xử lý dât, chỉ cần kéo nhầm 1 trường khi online thì cái hệ thống sẽ chạy theo cái nhầm đó làm thay đổi hầu hết dáhboard, nhiều bảng, biểu, chỉ số hay board nó có logic đi kèm, nếu kéo thả ko đúng logic thì nó sinh lỗi fai làm lại, xoá cột xoá hàng đi chứ k ctrl z như offline dc.
Dùng thử lumira đó. Power bi bên tôi k có mà tôi tự làm riêng. SAP thì chỉ máy desktop công ty là làm dc nhưng nó lại bị giới hạn sức mạnh khi quá nhiều phần mềm bảo mật gắn vào. Cảm giác dùng SAP khá lag & thiếu sinh động. Hay là do băng thông nhỉ?
@Duy Luân Chỉ chạy raw & làm phép tính formula dc thôi chứ k làm dashboard & chart dc đâu. Xây dc 1-3 cái chart mà nó lag thì làm lại đó. Nó k có cơ chế lưu auto hoặc last time như office.
@nightwish47 Tôi cũng nghĩ vậy. Máy cty i5 đời 7 mà k mạnh = i3U đời 7

Con i3 intel nuc còn xử lý mượt hơn.
Im lặng đi
@wink PBI hay Tableau có hết mấy cái này mà 😁
@Duy Luân Cty dùng Lumira & sap chứ k chơi với power bi.
Cái bi là tôi tự nghịch & làm riêng báo cáo cho phòng. Lấy ad hoc data rồi mới xử trên bi. Ko hiểu sao các báo cáo form sẵn có của bên tôi ko ứng dụng cao. Toàn fai tự tạo ad hoc riêng.
Không cần quá mạnh nhưng phải mạnh.
Máy chỉ để lướt fb đăng bài chém gió. xử lý vài file văn bản office nhẹ nhàng, nhưng cứ phải max nhất có thể với số tiền bỏ ra. Dùng cho nó khỏi lag các bác à!
20201029_154151.jpg
@Duy Luân CHơi pubg mobile = giả lập thôi mod ơi, thi thoảng tuần làm 1 trận 3-40'.
Còn lại không chơi gì, chỉ youtube xem video + gõ vài ba cái văn bản + lướt web chém gió như thế này 😁
@.Gù. Đam mê thôi bác ah
Cười vô mặt
@lamborghini_08 giống gu t, không dây hết, trừ dây bắt buộc , có điều t xài ws
@tyller end quả bàn phím kia của e là có dây, nhưng đục bàn để giấu dây đó bác 😁
Thích xài không dây, nhìn mọi thứ gọn gàng thích mắt hẳn
tanakakb
ĐẠI BÀNG
3 năm
quá đỉnh "thực hiện phản xạ tốc độ cao với PUBG, COD, thực hiện khảo sát hành vi của con người trong đô thị với hệ thống GTA V hoặc tìm hiểu về khả năng vận hành của xe hơi với Forza Horizon" là chơi game, còn "thực hiện các thuật toán phức tạp cần GPU cao" là đào coin hả =))))
Đến kỹ sư xây dựng như mình làm max hiệu năng máy chiếm chưa đến 1% thời gian sử dụng thì các ngành khác cứ yên tâm mà mua máy mỏng nhẹ dùng cho sướng!
@khunghoang kinhte 2008 Em thấy VN lạm dụng từ kỹ sư quá. Học xong đại học là có bằng kỹ sư rồi.

Mà cái tiêu chuẩn chức danh đâu có đơn giản thế.
https://m.thuvienphapluat.vn/van-ban/lao-dong-tien-luong/thong-tu-lien-tich-24-2014-ttlt-bkhcn-bnv-ma-so-tieu-chuan-chuc-danh-nghe-nghiep-vien-chuc-khoa-hoc-cong-nghe-252858.aspx
Thông tư liên tịch 24/2014/TTLT-BKHCN-BNV mã số tiêu chuẩn chức danh nghề nghiệp viên chức khoa học công nghệ
thuvienphapluat.vn
@Ice Never Dies Theo bảng bạn đưa ra thì tốt nghiệp đại học ngành kỹ thuật, công nghệ là có chức danh kỹ sư thì đâu có sai (mục kỹ sư hạng III đó bạn)
@Asimotono Chắc thế, mà công nhận cad 2007 thần thánh thiệt, rất rất nhiều các cụ không chịu rời bỏ nó. Chỉ có bọn trẻ thích thay đổi thôi
@Asimotono M đang dùng Cad2018. HP Omen2019 i7 9750H+GTX1660Ti nói chung cũng chạy được :3
@Duy Luân đang phân tích trên môi trường có 1 trăm, 1 nghìn, 10 nghìn hay 100 nghìn nhân viên vậy?
@dustonthewind à vậy là mã hóa chứ không phải nén 😁
@Duy Luân Nói túm lại là ở các công ty, tập đoàn lớn thì Core i5, ram 8G chạy còn chuối hơn con i3 ram 4G ở nhà.
Nếu mấy làm VP ở công ty càng mạnh càng tốt nhé, không thừa đâu.
catbui01
TÍCH CỰC
3 năm
Mod phát biểu ntn thì hơi ngây thơ ấy.
Có những công ty nước ngoài ở VN chỉ có vài nhân viên, nhưng họ sử dụng chính sách quản lý IT của tập đoàn rất chặt chẽ. Mình thấy gần như 1 nửa công suất máy tính là dùng để quét bảo mật ấy.
Công ty càng lớn, lượng nhân viên văn phòng toàn cầu cao thì họ càng có nhiều phần mềm bảo mật tích hợp, máy chạy đuối luôn đó.
Nên nhiều khi làm data nhưng cần core i7, ram 16G là bình thường nha mod.
SmartSelect_20210610-115944_Chrome.jpg
@catbui01 Mình tưởng đang hỏi về tình huống sử dụng data, chứ không phải đang hỏi cấu hình máy
hoasenvang
TÍCH CỰC
3 năm
PC hay laptop mà cấu hình thấp thì ảnh hưởng rất lớn đến trải nghiệm khi sử dụng, dẫn đến hệ quả sau này là người dùng có xu hướng thích làm việc với máy cấu mạnh hơn.
OH_MyGod
ĐẠI BÀNG
3 năm
Rất cần nhé AD, nhưng mạnh vừa vừa được rồi không cần mạnh quá.
Máy mạnh nhất vũ trụ mà làm online trên cáp treo VN thì đập luôn
Cười vô mặt
Ngành bán Data (Data sale) khách hàng, mod tư vấn cấu hình cho các bạn ấy luôn nhé!
@Hạt mè bé xíu bán data khách hàng là sao bạn? Sao đem bán được?
Báo chí đăng quá chời lun. Rồi mấy người Data sale hay nói đạo lý lắm... Trên mấy trang deep web á.
@Hạt mè bé xíu À 😆 thôi, không bàn tới haha
@Duy Luân Lỡ rồi tới luôn đi chớ. Nhỡ đâu cũng đang cần tư vấn mà mod
thanhhong7d
ĐẠI BÀNG
3 năm
không biết mấy cty kia sao. cty minh xuất cái data file excel chữa ko mà 5M . nhìu file hơn 900.000 dòng.
bật file lên má nó quay như gì luôn. filter đi ăn xong vô vẫn còn chạy. cấu hình cao ko bao giờ đủ. vẽ char là treo liền
@thanhhong7d Bạn cần đối chiếu với cái gì thế?
thanhhong7d
ĐẠI BÀNG
3 năm
@Duy Luân chấm công nhân viên, dữ liệu hàng hóa theo ngay,báo cáo theo tuần, tháng.
xuất ra từ hệ thống mình chỉ tổng hợp làm báo cáo đối chiếu số liệu.
thanhhong7d
ĐẠI BÀNG
3 năm
@TANG HUY mấu chốt xuất data từ sever trong filter thes là treo luôn.
thanhhong7d
ĐẠI BÀNG
3 năm
@TANG HUY thì máy đó cơ bản cty phát cho nhân viên mới chạy đc. cty xài i7 HQ với M mà nhìu lúc tụi nó chạy ko nổi
mod giàu quá
Đối với người ngoài ngành như mình thì đọc bài này mình chỉ hiểu được khoảng 15% hihi
longnhatbinh
ĐẠI BÀNG
3 năm
coder mà vẫn dùng MacMini 2014 đã thay SSD vẫn đang bơi ngoi ngóp đây 😁

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019