Zalo AI Challenge - cuộc thi đầu tiên về trí tuệ nhân tạo (AI) tại Việt Nam theo mô hình Kaggle, đã kết thúc với buổi chia sẻ kiến thức, thuật toán giữa các kỹ sư trong cộng đồng AI vào 16/9 vừa qua.
Cũng tại sự kiện này, những đội chơi có thành tích xuất sắc nhất trong số 700 đội thi đã được vinh danh.
Sức hấp dẫn từ bài toán của riêng người Việt
Trong buổi chia sẻ với sự tham gia của hơn 200 kỹ sư đang làm việc trong mảng trí tuệ nhân tạo, ông Phan Kim Long - trưởng ban tổ chức (BTC) cuộc thi cho biết, nhận dạng giọng nói, địa điểm, giai điệu không phải là bài toán xa lạ trên thế giới nhưng đưa vào trường hợp của người Việt lại trở nên khác biệt hoàn toàn do vấn đề ngôn ngữ, văn hóa.
Lấy ví dụ về thách thức phân loại giai điệu, ông Trần Công Thiên Qui – đại diện hội đồng chuyên môn cho biết đa số các kỹ sư đều từng xây dựng thuật toán nhận diện các loại nhạc Pop, Rock, Jazz nhưng chắc ít AI nào của thế giới phải tìm cách nhận diện ra nhạc Trịnh hay nhạc bolero, nhạc tiền chiến. Đây chính là điểm khó khăn mang màu sắc bản địa của đề thi.
Ông Trần Công Thiên Qui đánh giá về đề thi và bài làm của thí sinh
Đặc biệt, yếu tố mà tất cả những thí sinh tham gia đều đánh giá cao là vấn đề “độ nhiễu” của dữ liệu. Điều này thường xuyên bắt gặp trong thực tế khi người dùng chụp một bức ảnh ruộng bậc thang ở Hà Giang nhưng lại gắn thẻ nhầm ở Sapa hoặc sinh ra ở Hà Nội nhưng chuyển vào Sài Gòn sinh sống.
Trong bài chia sẻ giải pháp của mình, Bạn Nguyễn Hoàng Bảo Đại – đại diện đội VietAI, quán quân trong bài toán nhận diện giọng nói đã đánh giá bộ dữ liệu khá mất cân bằng khi có đoạn thu âm dài 3 giây nhưng cũng có dữ liệu dài tới 10 phút, có những đoạn thu âm lại có 30 giây đầu chỉ là nhạc không lời khiến thuật toán phải xử lý vô cùng khó khăn. “Đội còn tình cờ phát hiện ra có một đoạn ghi âm là của một người miền Nam đang giả giọng Huế và nói một câu tiếng Anh.” – Bảo Đại tâm sự.
Được biết, để tìm cách xử lý, đội thi đã phải tìm mọi sự trợ giúp từ Google cho tới các diễn đàn chuyên sâu về machine learning (học máy) và dùng tới 7 model (mô hình) khác nhau để tìm cách xác định đúng câu trả lời.
Bảo Đại –đại diện đội VietAI chia sẻ giải pháp nhận diện giọng nói
Đòn bẩy cho sự kết nối trong cộng đồng AI Việt
Con số 700 đội thi ở mùa đầu tiên tổ chức, trong đó có 140 thí sinh là những kỹ sư AI người Việt đang sống và làm việc ở các nước Nhật, Mỹ, Tây Ban Nha, Singapore… đã cho thấy các vấn đề AI tại Việt Nam đang nhận được sự quan tâm lớn của cộng đồng trong và ngoài nước.
Phỏng vấn một số thí sinh tham gia cuộc thi năm nay, bạn Nguyễn Bá Dũng (DungNB), người đoạt giải nhất phần nhận diện giai điệu chia sẻ rằng động lực tham gia cuộc thi là muốn mọi người “vượt qua” mình. “Mình chỉ muốn thúc đẩy phong trào AI của Việt Nam, giống như bên Nga có một cộng đồng ODS.AI rất mạnh. Khi bạn đạt một điểm số cao trên bảng xếp hạng thì những thành viên khác sẽ phải cải thiện model của mình và mình cũng phải cải thiện để nếu không muốn tụt khỏi bảng xếp hạng”.
Nguyễn Bá Dũng chia sẻ giải pháp nhận diện đoạn nhạc
Khác với Dũng, bạn Nguyễn Hoàng Bảo Đại – đại diện đội VietAI cho biết, cuộc thi là cơ hội để gặp gỡ với những người cùng ngành, để tìm hiểu thêm về các giải pháp của những kỹ sư khác cho những vấn đề rất Việt Nam này. Bảo Đại cũng chia sẻ rằng, đội gồm 4 thành viên hiện đang học và làm việc tại 4 quốc gia khác nhau, nếu không có cuộc thi, 4 kỹ sư người Việt này cũng không lý do để cùng bù đầu làm việc chung.
Bảo Đại tham gia cuộc thi vì muốn được trao đổi chuyên môn với các đồng nghiệp cùng ngành
Chia sẻ của Bảo Đại khá đúng với thực tế đã diễn ra, ngay sau ngày phát động 9/8/2018, hàng loạt các topic (chủ đề) được lập ra trên các diễn đàn, hội nhóm công nghệ như forum machine learning cơ bản, Data Science & Big Data Vietnam để thảo luận đề bài cũng như kêu gọi lập đội nhóm tham gia thi. Có thể thấy, những thách thức từ Zalo AI Challenge đã tạo thành một đòn bẩy để cộng đồng các kỹ sư AI tương tác và chia sẻ chuyên môn với nhau nhiều hơn.
Khán giá đặt câu hỏi trao đổi
Không chỉ là các chủ đề trực tuyến, ngay trong buổi tổng kết cuộc thi, các kỹ sư đã không ngần ngại trao đổi các vấn đề thực tiễn của mình trong quá trình xây dựng AI ví dụ như làm cách nào để xác định đúng trọng số (weight) cho mỗi một model hay tinh chỉnh các bộ lọc (Filter) khi áp dụng trong từng bài toán.
Trong hơn 3 tuần diễn ra cuộc thi, trên khắp các diễn đàn về khoa học máy tính đã có hàng trăm chủ đề thảo luận xung quanh giải pháp của từng thử thách kéo theo sự đóng góp chất xám của rất nhiều kỹ sư hàng đầu Việt Nam. Được biết, tất cả các phần chia sẻ thuật toán của những đội đoạt giải sẽ được BTC Zalo AI Challenge chia sẻ công khai trên các diễn đàn về khoa học máy tính để tất cả các kỹ sư AI có thể tham khảo.
Tại buổi trao giải, ông Vương Quang Khải - người đứng đầu Zalo cho biết mình rất hạnh phúc khi gặp được nhiều người trẻ có cùng mối quan tâm về trí thông minh nhân tạo.
Ông Khải tỏ ra lạc quan về tương lai của công nghệ AI tại Việt Nam, khi lượng thí sinh tham gia Zalo AI Challenge tuổi đời còn rất trẻ (dưới 27 tuổi) mà đã giải quyết được những bài toán có độ khó rất cao. "Tôi có niềm tin là những người trẻ ở đây sẽ tiếp tục phát triển và làm những sản phẩm AI đẳng cấp thế giới", ông Khải chia sẻ.
Sau hơn 3 tuần tham gia giải quyết các thách thức của Zalo Ai Challenge, 3 đội thi đạt thành tích xuất sắc nhất mỗi thử thách đã được xướng tên với phần thưởng giải nhất lên tới 30 triệu đồng. Thử thách nhận dạng địa điểm, giải nhất: TQT – độ chính xác 94%, giải nhì: 2ez4Zalo – độ chính xác 93,5%, giải ba: DungNB – độ chính xác 93,2%. Thử thách nhận dạng giọng nói, giải nhất: VietAI – độ chính xác 84,7%, giải nhì: AIS-HelloKitty – độ chính xác 83,2%, giải ba: ZE – độ chính xác 82,2%. Thử thách phân loại giai điệu, giải nhất: DungNB – độ chính xác 70,1%, giải nhì: Toppan – độ chính xác 65,2% , giải ba: Ezio – độ chính xác 64,9%. |