Trong kỷ nguyên dữ liệu bùng nổ, việc loại bỏ “rác thải số” trở thành bước khởi đầu then chốt để doanh nghiệp xây dựng hệ thống quản trị dữ liệu tinh gọn, an toàn và hiệu quả.
Diễn đàn Doanh nghiệp đã có cuộc trao đổi xoay quanh chủ đề này với ông Phạm Huân, Giám đốc kỹ thuật khu vực, ManageEngine Việt Nam.

- Theo ông, “rác thải số” nên được định nghĩa như thế nào ở góc độ quản trị doanh nghiệp và vì sao nó đặc biệt rủi ro đối với các doanh nghiệp B2B, nơi dữ liệu gắn chặt với uy tín và chuỗi cung ứng?
“Rác thải số” không đơn thuần là những tệp tin cũ hay dữ liệu không sử dụng, nó đại diện cho cả một hệ sinh thái “dữ liệu ẩn” (dark data). Khái niệm này bao gồm những thông tin bị lãng quên, dữ liệu trùng lặp, tài khoản người dùng không còn hoạt động và các cấu hình hệ thống lỗi thời đang âm thầm chiếm dụng tài nguyên.
Các phân tích trong ngành gần đây cho thấy lượng dữ liệu tạo ra trên toàn cầu trong năm 2025 đạt khoảng 181 zettabytes, tăng đáng kể so với con số 147 zettabytes của năm 2024. Trong đó, một tỷ lệ lớn dữ liệu doanh nghiệp vẫn tồn tại dưới dạng phi cấu trúc hoặc không được khai thác. Những con số này phản ánh quy mô tăng trưởng dữ liệu hiện tại cũng như những thách thức về quản trị mà các tổ chức đang phải đối mặt.
Trong bối cảnh quản trị hiện đại, rác thải số là biểu hiện của những lỗ hổng quản lý phát sinh khi tốc độ tích lũy dữ liệu vượt quá khả năng phân loại và xử lý của tổ chức. Điều này tạo ra gánh nặng về chi phí lưu trữ và làm suy giảm hiệu suất vận hành của toàn bộ hạ tầng IT.
Đối với các doanh nghiệp B2B, dữ liệu không chỉ là tài sản mà còn là nền tảng của niềm tin và sự kết nối trong chuỗi cung ứng. Khi rác thải số tích tụ, nó tạo ra những “điểm mù” an ninh mạng cực kỳ nguy hiểm. Tin tặc có thể dễ dàng khai thác các dữ liệu công khai hoặc những hệ thống chạy trên các thành phần phần mềm lỗi thời, dẫn đến rò rỉ dữ liệu. Do đó, việc dọn dẹp rác thải số trong các doanh nghiệp B2B không còn là công việc bảo trì hệ thống IT thông thường, mà là một chiến lược sống còn để bảo vệ tính toàn vẹn của dữ liệu và duy trì sự bền vững của các mối quan hệ kinh doanh cốt lõi.
- Vì sao dữ liệu không được phân loại, lưu trữ tràn lan hoặc tồn tại trong các hệ thống cũ lại trở thành cửa ngõ phổ biến cho ransomware và rò rỉ thông tin tại Việt Nam, thưa ông?
Việc dữ liệu không được phân loại và lưu trữ thiếu kiểm soát đang tạo ra một “bề mặt tấn công” khổng lồ và khó kiểm soát cho các doanh nghiệp tại Việt Nam. Khi dữ liệu ẩn tồn tại trong các hệ thống cũ hoặc các ổ đĩa dùng chung không xác định, đội ngũ IT gần như không thể thiết lập được các rào cản bảo mật tương xứng với giá trị thực của dữ liệu đó. Hệ quả là những thông tin cực kỳ nhạy cảm lại chỉ được bảo vệ bởi các lớp bảo mật lỗi thời, hoặc trong một số trường hợp, chúng còn không được bảo vệ bằng mật khẩu.

Đối với ransomware, các tập tin rác và hệ thống cũ đóng vai trò là kho chứa lý tưởng để mã độc ẩn mình và lây lan âm thầm trước khi kích hoạt tổng tấn công. Nguyên nhân là do các phần mềm diệt virus hiện đại thường gặp khó khăn khi quét các khu vực này, hoặc đơn giản là không tương thích với các nền tảng lạc hậu này.
Tại Việt Nam, thói quen lưu trữ mọi thứ “để phòng hờ” mà không có quy trình tiêu hủy dữ liệu định kỳ có thể biến các tài khoản người dùng cũ hoặc các cổng kết nối bị lãng quên thành những cánh cửa chào đón tin tặc. Trong khi đó, theo báo cáo từ Hiệp hội An ninh mạng Quốc gia, năm 2025, 51,87% doanh nghiệp vẫn chưa có phần mềm phòng chống mã độc quản lý tập trung. Hơn nữa, 8,71% doanh nghiệp hoàn toàn không sử dụng bất kỳ phần mềm diệt virus nào và 9,38% cơ quan, doanh nghiệp cho biết không có bất cứ hình thức kiểm soát truy cập Internet nào như tường lửa. Điều này khiến hệ thống luôn đứng trước nguy cơ bị xâm nhập từ bên ngoài, để lại khoảng trống đáng lo ngại khi bị ransomware tấn công.
- Xin ông cho biết, trong bối cảnh chi phí cloud và hạ tầng số gia tăng, việc “tổng vệ sinh” dữ liệu có thể tác động thế nào đến biên lợi nhuận và dòng tiền của doanh nghiệp?
“Tổng vệ sinh số” không còn là một hoạt động kỹ thuật phụ trợ, mà là một đòn bẩy trực tiếp giúp tối ưu hóa biên lợi nhuận và cải thiện đáng kể dòng tiền. Khi doanh nghiệp loại bỏ được các lớp rác thải số, họ sẽ ngay lập tức giảm bớt gánh nặng chi phí lưu trữ cloud, vốn thường được tính theo dung lượng thực tế. Bằng cách giảm khối lượng dữ liệu quản lý, doanh nghiệp tránh được việc phải nâng cấp các gói lưu trữ đắt đỏ hoặc đầu tư thêm vào hạ tầng máy chủ vật lý. Điều này giúp bảo toàn một lượng vốn lưu động đáng kể, cho phép tái đầu tư vào các hoạt động kinh doanh cốt lõi thay vì chi trả cho các tài nguyên “chết”.
Tác động này còn giúp giảm thiểu các chi phí ẩn. Một hệ sinh thái dữ liệu tinh gọn đảm bảo các quy trình sao lưu, phục hồi sau sự cố và quét an ninh mạng diễn ra nhanh hơn, tiêu thụ ít điện năng và tài nguyên điện toán hơn, đồng thời giảm bớt áp lực vận hành cho đội ngũ IT.
Khi dòng tiền không còn bị “thất thoát” qua các hóa đơn dịch vụ cloud tăng theo cấp số nhân, và biên lợi nhuận được bảo vệ trước rủi ro từ các khoản phạt vi phạm dữ liệu, doanh nghiệp sẽ có một nền tảng tài chính vững chắc hơn để ứng phó với những biến động của thị trường.
- Ông nhìn nhận rác thải số liên hệ ra sao với các tiêu chuẩn ESG và yêu cầu báo cáo phát thải theo tinh thần của Nghị định 08/2022/NĐ-CP? Liệu đây có thể trở thành điểm nghẽn khi doanh nghiệp tham gia chuỗi cung ứng toàn cầu?
Rác thải số đang chuyển dịch nhanh chóng từ một khái niệm kỹ thuật sang một chỉ số định lượng trong các báo cáo phát thải. Theo tinh thần của Nghị định 08/2022/NĐ-CP và xu hướng tuân thủ ESG, rác thải số chiếm một phần đáng kể trong “dấu chân carbon” gián tiếp của doanh nghiệp. Uớc tính ngành ICT đóng góp khoảng 2–4% tổng lượng phát thải CO₂/khí nhà kính toàn cầu, tương đương với ngành hàng không; và đang tiếp tục tăng theo nhu cầu dữ liệu trong tương lai.
Mối liên hệ này càng trở nên rõ nét khi rác thải số dần trở thành “điểm nghẽn” trong chuỗi cung ứng toàn cầu. Hiện nay, các tập đoàn lớn tại EU và Hoa Kỳ đang áp dụng các chính sách như Cơ chế Điều chỉnh Biên giới Carbon (CBAM), một chính sách áp thuế carbon đối với hàng nhập khẩu và yêu cầu khắt khe về minh bạch dữ liệu phát thải từ các nhà cung cấp B2B. Nếu doanh nghiệp Việt Nam không quản lý hiệu quả rác thải số, dẫn đến tiêu tốn năng lượng hạ tầng lãng phí và không thể cung cấp dữ liệu kiểm kê phát thải chính xác cho đối tác quốc tế, họ có nguy cơ mất lợi thế cạnh tranh, thậm chí bị loại khỏi danh sách nhà cung cấp ưu tiên.
Hơn nữa, một hệ thống tràn lan dữ liệu cũ và chưa được phân loại là minh chứng cho sự lỏng lẻo trong quản trị dữ liệu, vi phạm các tiêu chuẩn về an toàn thông tin và đạo đức kinh doanh mà thị trường quốc tế đòi hỏi. Vì vậy, việc “tổng vệ sinh” dữ liệu không chỉ là để tiết kiệm chi phí, mà là bước đi chiến lược để làm sạch “hồ sơ xanh” của doanh nghiệp, đảm bảo con đường gia nhập chuỗi giá trị toàn cầu luôn thông suốt.
- Nếu phải xây dựng một lộ trình để “dọn dẹp không gian số” mà không làm gián đoạn vận hành, doanh nghiệp Việt nên bắt đầu từ đâu và cần tránh những sai lầm nào, thưa ông?
Bước đầu tiên và quan trọng nhất không phải là xóa dữ liệu, mà là rà soát và phân loại dữ liệu. Doanh nghiệp cần bắt đầu bằng việc quét toàn bộ hạ tầng để xác định đâu là dữ liệu thiết yếu, đâu là dữ liệu nhạy cảm và đâu là “dữ liệu ẩn”. Khi đã có một bản đồ dữ liệu rõ ràng, chúng ta mới có thể thiết lập các chính sách lưu trữ tự động, chuyển dữ liệu ít sử dụng sang các kho lưu trữ giá rẻ, hoặc tiến hành tiêu hủy an toàn theo quy định mà không lo ngại rủi ro xóa nhầm các tài sản số quan trọng.
Tuy nhiên, trong quá trình này, các doanh nghiệp thường rơi vào những sai lầm phổ biến, như tư duy “dọn dẹp một lần”. Thay vì thiết lập một khung quản lý vòng đời dữ liệu liên tục, họ lại để rác thải số tái tích tụ chỉ sau vài tháng.
Cuối cùng, các tổ chức nên tránh việc thực hiện thủ công trên quy mô lớn. Với khối lượng dữ liệu khổng lồ như hiện nay, việc dựa vào sức người để phân loại tệp tin là bất khả thi và dễ sai sót. Thay vào đó, hãy tận dụng các công cụ tự động hóa và phân tích hành vi người dùng để hệ thống tự động nhận diện các tệp tin rác hoặc tài khoản ảo dựa trên tần suất truy cập. Một lộ trình thông minh phải đi từ việc thấu hiểu dữ liệu đến tự động hóa quy trình, và cuối cùng là thúc đẩy văn hóa quản trị dữ liệu trong toàn tổ chức. Điều này đảm bảo môi trường số luôn sạch sẽ và an toàn một cách bền vững.
Trân trọng cảm ơn ông!