Công nghệ

Công nghệ

Doanh nghiệp nên làm sạch dữ liệu trước khi triển khai AI

Quân Bảo 27/12/2025 03:30

Hơn 90% doanh nghiệp vẫn loay hoay “dậm chân tại chỗ” ở khâu thử nghiệm AI. Nguyên nhân là họ đã triển khai AI trong khi chưa sẵn sàng về mặt dữ liệu.

Hiện nay, trí tuệ nhân tạo (AI) đã không còn là một lựa chọn “thời thượng” mà trở thành động cơ cốt lõi quyết định sức cạnh tranh của doanh nghiệp, việc từ chối AI đồng nghĩa với việc doanh nghiệp đang tự nguyện dâng nộp thị phần và lợi nhuận cho các đối thủ cạnh tranh. Tuy nhiên, giữa cơn sốt công nghệ này, một nghịch lý đang tồn tại: có tới hơn 90% doanh nghiệp đang bị mắc kẹt trong giai đoạn thử nghiệm hoặc thất bại hoàn toàn khi triển khai AI trên diện rộng. Nguyên nhân sâu xa không nằm ở sự thiếu hụt ngân sách hay hạ tầng kỹ thuật, mà xuất phát từ một sai lầm mang tính hệ thống: triển khai AI khi chưa sẵn sàng về mặt dữ liệu.

1.png

Giới công nghệ có câu “dữ liệu rác chỉ tạo ra kết quả rác” (Garbage in, Garbage out ). AI không thể tạo ra phép màu nếu dữ liệu đầu vào không được chuẩn bị kỹ lưỡng, không sạch và thiếu tính chính xác. Trong hệ sinh thái này, dữ liệu chính là nguyên liệu thô quan trọng nhất. Nếu nguyên liệu không đảm bảo chất lượng, mọi thuật toán tiên tiến nhất cũng trở nên vô dụng. Vì vậy, PGS Ali Al-Dulaimi – Trưởng khoa Khoa học máy tính & Công nghệ, Đại học Anh quốc Việt Nam – khẳng định, lộ trình đúng đắn mà mọi doanh nghiệp cần tuân thủ là chiến lược “làm sạch dữ liệu trước” (Data First). Trước khi vội vã mua sắm phần mềm hay hệ thống robot đắt tiền, doanh nghiệp phải đạt được trạng thái “sẵn sàng kỹ thuật số” thông qua việc thu thập, làm sạch và phân tích dữ liệu một cách bài bản.

Đồng quan điểm với tư duy chiến lược này, TS Dương Hồng Loan – Viện trưởng Viện Sáng kiến Việt Nam - nhấn mạnh rằng hành trình AI phải bắt đầu bằng việc “kiểm toán công nghệ” toàn diện. Theo dó, doanh nghiệp cần phải nhìn thẳng vào thực tế để biết mình thực sự đang sở hữu tài sản số gì và năng lực số của đội ngũ nhân sự đang ở đâu. Một khảo sát thực tế đã chỉ ra con số đáng suy ngẫm: 95% lao động trong ngành sản xuất hiện nay có trình độ phân tích dữ liệu ở mức trung bình hoặc yếu. Nếu không giải quyết được bài toán về chất lượng dữ liệu và năng lực con người, việc đổ tiền vào AI chỉ giống như mua một bộ áo giáp bóng bẩy để cất vào kho.

Tầm quan trọng của việc làm sạch dữ liệu còn liên quan trực tiếp đến độ tin cậy của hệ thống. Bà Dương Hồng Loan chia sẻ về hiện tượng “ảo giác AI” (hallucination), nơi các công cụ AI có thể đưa ra những câu trả lời sai lệch nhưng được trình bày một cách vô cùng thuyết phục. Nếu doanh nghiệp vận hành dựa trên nguồn dữ liệu không được kiểm chứng, AI có thể tự ý thay đổi các thông tin quan trọng hoặc dẫn đến những quyết định sai lầm trong sản xuất.

Bài học đắt giá về việc áp dụng công nghệ thiếu sự chuẩn bị về dữ liệu và lòng tin con người đã được bà Loan dẫn chứng thông qua trường hợp của một công ty bảo hiểm lớn của Việt Nam. Khi doanh nghiệp này cố gắng dùng AI để thay thế hoàn toàn tương tác của con người trong dịch vụ khách hàng, kết quả nhận được là sự sụt giảm đáng kể mức độ hài lòng của người dùng. Ngược lại, những dự án thành công như tối ưu hóa năng lượng hay bảo trì dự đoán tại một số tập đoàn lớn đều có điểm chung là bắt đầu từ những dự án nhỏ (pilot projects), nơi dữ liệu được kiểm soát chặt chẽ và chứng minh được hiệu quả tức thì.

Trao đổi với phóng viên Tạp chí Diễn đàn Doanh nghiệp, PGS Ali cho biết, có nhiều người lo ngại rằng việc làm sạch dữ liệu sẽ tốn rất nhiều tiền, nhưng thực tế chưa hẳn như vậy. Việc này không cần nguồn tài chính khổng lồ mà cần đội ngũ nhân sự phù hợp. Thay vì tìm kiếm bên ngoài, doanh nghiệp hãy đầu tư nâng cao kỹ năng cho chính nhân viên hiện tại của mình, vì họ là những người hiểu rõ nhất về hệ thống và công ty.

Đồng thời, doanh nghiệp cần thiết lập các chính sách thu thập dữ liệu đúng đắn và thiết kế hệ thống thu thập dữ liệu chuẩn xác ngay từ đầu. Khi có một hệ thống dữ liệu chất lượng và một đội ngũ nhân sự có kỹ năng, việc ứng dụng AI chắc chắn sẽ khả năng cao thành công.

Nhìn về dài hạn, việc làm chủ dữ liệu nội bộ còn là chìa khóa để bảo vệ bí mật kinh doanh. Việc phụ thuộc quá nhiều vào các nền tảng AI công cộng có thể khiến doanh nghiệp vô tình tiết lộ những thông tin nhạy cảm. Doanh nghiệp có thể thuê hoặc mua các nền tảng sẵn có để có kết quả nhanh, nhưng về lâu dài phải tự thiết kế và xây dựng hệ thống dữ liệu riêng để đảm bảo tính an toàn và bền vững. Việc sở hữu nguồn dữ liệu sạch và độc quyền chính là tài sản quý giá nhất giúp doanh nghiệp duy trì lợi thế cạnh tranh trong kỷ nguyên số.

Hiện nay, năng suất lao động chính là “loại tiền tệ mới” trong năng lực cạnh tranh toàn cầu và AI chính là công cụ để tạo ra loại tiền tệ đó. Nhưng như một cỗ máy vận hành bằng nhiên liệu đặc biệt, AI chỉ thực sự phát huy sức mạnh khi được “nuôi dưỡng” bởi nguồn dữ liệu chất lượng cao. Thông điệp dành cho các nhà lãnh đạo công nghệ rất rõ ràng: hãy ngừng tìm kiếm những giải pháp thần kỳ và bắt đầu từ những bước đi cơ bản nhất là làm sạch dữ liệu của chính mình.

Quân Bảo