[eMagazine] Báo chí và Trí tuệ nhân tạo

Đinh Thanh• 03/02/2018 05:45

Đối với các nhà báo, vấn đề không phải là liệu có sử dụng AI hay không, mà là khi nào AI sẽ trở thành một phần gắn liền với hoạt động của tòa soạn.

Một số hãng tin trên thế giới đã áp dụng và phát hiện thấy rằng AI có thể mang lại rất nhiều lợi ích để nâng cao chất lượng báo chí, chứ không phải thay thế lực lượng nhà báo hiện nay.

Từ các báo cáo về hoạt động doanh nghiệp cho đến tin tức về các giải bóng nhỏ, tự động hóa và các thuật toán đang trở thành một phần quan trọng tạo nên dòng chảy thông tin. Các nhà báo của AP, Reuters, Washington Post, New York Times, ProPublica, Forbes, Oregon Public Broadcasting, Yahoo cùng nhiều cơ quan báo chí khác đang sử dụng thuật toán để kể các câu chuyện về kinh doanh, thể thao cũng như giáo dục, bình đẳng giới, an toàn công cộng…

Cách đây vài năm, hãng tin Associated Press của Mỹ nhận thấy rằng cạnh tranh trên thị trường digital quá dư thừa nguồn cung đòi hỏi một cách tiếp cận mới mẻ. Với việc hơn một nửa dân số toàn cầu tiếp cận nội dung mỗi ngày, hãng tin này không những phải mở rộng quy mô phục vụ mà còn phải mang đến những dịch vụ tốt hơn.

“Chúng tôi cần khối lượng nội dung lớn hơn để có thể mang lại nhiều lựa chọn hơn và đáp ứng nhu cầu ngày càng tăng của các khách hàng mua tin,” Francesco Marconi, giám đốc chiến lược kiêm đồng lãnh đạo khối AI kể lại. “Chúng tôi cũng cần phải tạo ra sự khác biệt, để tách AP khỏi tất cả các đối thủ cạnh tranh khác. AI có thể giúp chúng tôi đạt cả hai mục tiêu này".

Bước tiến đầu tiên của AP vào lĩnh vực AI là tập trung vào vấn đề tự động hóa những công việc lặp đi lặp lại trong quá trình viết tin bài luôn theo một cấu trúc chung. Mô hình tự động hóa này chủ yếu được dùng để sản xuất thông tin tài chính hoặc tổng hợp kết quả các trận đấu thể thao với số lượng lớn.

Trước khi bắt tay với công ty chuyên về trí tuệ nhân tạo là Automated Insights, đội ngũ 65 phóng viên kinh tế của AP chỉ có thể viết khoảng 6% báo cáo hoạt động cho 5.300 công ty Mỹ niêm yết trên sàn chứng khoán. Hai năm sau, hệ thống AI của AP có khả năng tạo ra 3.700 bài viết hoạt động quý, tức là gấp đến 10 lần.

“Ngoài việc tăng được số lượng nội dung và lẩy ra được những thông tin ẩn giấu từ rất nhiều dữ liệu, AI có thể cải thiện các quá trình, ví như tự động tạo tag cho ảnh, tạo chú thích cho video và thậm chí điều khiển các camera để bắt những góc hình mà thông thường các phóng viên khó xử lý được,” - ông Marconi nói.

Năm 2016, AP bắt đầu sử dụng phần mềm này để đưa tin về hơn 10.000 trận đấu bóng chày trong khuôn khổ Minor League trên toàn quốc. Bằng cách sử dụng dữ liệu từ các bảng kết quả, các bài viết sẽ chạy thẳng lên hệ thống chỉ vài phút sau khi tiếng còi mãn cuộc cất lên.

Bên cạnh đó, hãng tin AP cũng đã thử nghiệm với Raspberry Pi, tức là hàng loạt chiếc máy tính có khả năng lập trình một cách dễ dàng và giá rẻ, để tính toán độ rung mặt đất tại các công trường xây dựng, cấp độ âm thanh tại các sự kiện giải trí hoặc các cuộc vận động chính trị. Từ đó, các nhà báo có thể gián tiếp xác định những yếu tố quan trọng, chẳng hạn như những ca khúc được yêu thích nhất tại một buổi biểu diễn âm nhạc, những khoảng thời gian quan trọng nhất của một trận đấu thể thao hoặc những giây phút nghẹt thở tại một cuộc mít tinh.

“Việc triển khai thành công AI trong tòa soạn sẽ giải phóng các phóng viên khỏi những công việc lặp đi lặp lại và đòi hỏi nhiều công sức,” ông Marconi nhấn mạnh - “Nó không chỉ giúp tiết kiệm thời gian và tiền bạc trong kỷ nguyên hiện nay, mà còn tìm ra những biện pháp để theo kịp với quy mô ngày càng tăng của chính bản thân tin tức.”

Thay vì mất quá nhiều thời gian làm việc quý báu vào việc giải băng các bài phỏng vấn và miệt mài nghiền ngẫm các bộ dữ liệu, giờ đây phóng viên có thể tập trung theo đuổi những phần việc quan trọng hoặc bám những vấn đề mà AI gợi ý sau quá trình phân tích.

Tất nhiên, ứng dụng AI trong báo chí có rất nhiều thách thức. Theo ông Marconi, để tận dụng hết tiềm năng của trí tuệ nhân tạo trong các tòa soạn đòi hỏi nhiều kỹ năng và quá trình đào tạo.

“Trí tuệ nhân tạo vô cùng phức tạp, và có nhiều cách ứng dụng vào bộ phận nội dung” - ông nói - “Giống như bất kỳ công nghệ nào, bạn càng hiểu rõ công cụ thì càng sử dụng hiệu quả.”

Là một trong những công ty tiên phong về sáng tạo trong ngành báo in, Washington Post sớm nhận thấy AI mang lại hiệu quả như thế nào cho tòa soạn. Theo lời ông Jeremy Gilbert, giám đốc phụ trách các sáng kiến chiến lược, bất kỳ công nghệ nào có thể giúp các nhà báo hoạt động hiệu quả hơn thì đều được hoan nghênh tại đây.

Gilbert nói ông tin rằng AI có thể mang lại cho các nhà báo những bộ công cụ và kỹ năng toàn diện để đẩy nhanh quá trình sản xuất, xác định hướng để viết tin bài và loại bỏ những công đoạn buồn tẻ.

“Trí tuệ nhân tạo có ích với các nhà báo giống như khi họ bắt đầu biết tới máy tính cá nhân và điện thoại thông minh” - ông giải thích - “AI không thay thế cho hoạt động đưa tin và biên tập tin. Nó sẽ giúp cho các nhà báo làm tốt công việc của mình hơn và mang đến cho độc giả những tin tức mà họ muốn, theo cách thức cá nhân hơn và bao phủ được nhiều chủ đề hơn.”

Trong hơn 1 năm, Washiongton Post đã thử nghiệm Heliograf, một công cụ tự động hóa do họ tự nghiên cứu ra với mục đích giúp thúc đẩy tốc độ, quy mô cũng như việc cá nhân hóa việc kể chuyện. Phần mềm này nhận dạng các dữ liệu liên quan, gắn kết với các câu tương ứng trong một mẫu có sẵn và xuất bản thành nhiều phiên bản của cùng một câu chuyện trên những nền tảng khác nhau. Ban đầu, tờ báo sử dụng công cụ này để viết mấy trăm tin ngắn cũng như để báo tin mới cho độc giả trong suốt quá trình diễn ra Olympic Rio 2016.

“Các phóng viên-biên tập viên con người đóng vai trò quan trọng trong việc định hình xem những câu chuyện nào đáng đưa tin và nên kể những câu chuyện đó ra sao,”- Gilbert nhấn mạnh - “Heliograf sẽ đi xa hơn nữa trong việc kể cả câu chuyện đó.”

Sau khi kết thúc Olympic, tờ báo này đã tái lặp thành công ban đầu với Heliograf trong cuộc bầu cử tổng thống Mỹ, khi nó giúp cập nhật hơn 500 tin bài sau mỗi 90 giây.

“Kể cả một tòa soạn với đầy những tài năng như Washington Post thì cũng không thể đạt tần suất này,” - Gilbert nói - “Ngoài ra, nó giải phóng các phóng viên khỏi những con số thống kê có sẵn để làm những việc khác. Giờ đây phóng viên có thời gian để đào sâu câu chuyện – chẳng hạn để có những cuộc phỏng vấn hay hơn và phân tích tin tức kỹ lưỡng hơn.”

Kể từ đó, Washington Post đã tăng cường sử dụng Heliograf để đưa tin về tất cả các trận bóng đá học sinh trung học thuộc khu vực Washington, D.C. mỗi tuần. Heliograf cũng tự động viết những bài về cá nhân các cầu thủ và các đội bóng trong suốt mùa giải.

Ảnh hưởng tích cực của AI còn thể hiện rõ trong bộ phận kiểm duyệt comment của Washington Post. Do lượng truy cập báo quá lớn, không phải là chuyện hiếm khi chỉ trong vòng vài phút, một bài viết có thể thu hút hàng trăm lời bình luận của độc giả.

Để xử lý vấn đề này, nhóm kỹ sư của báo đã phát triển Modbot, sử dụng tính năng máy học để lọc và xác định xem những comment nào cần phải kiểm duyệt, rồi phê duyệt hoặc xóa comment dựa trên quy định của báo.

Giám đốc các dự án tin tức kỹ thuật số Greg Barber kể lại rằng trước đây các nhân viên phụ trách kiểm duyệt comment phải mất ít nhất một phần tư thời gian làm việc để duyệt những bình luận mà “nói chung là ổn.” Nguồn chủ yếu của những comment vi phạm quy định là từ những tài khoản mới lập.

Ông cho biết, trước đây chúng tôi mất quá nhiều nguồn lực. Nhờ Modbot, giờ đây chúng tôi có một dịch vụ có thể kiểm tra và chấm điểm từng comment, do vậy các nhân viên kiểm duyệt có thể tập trung vào những bình luận có nội dung sâu sắc, hoặc có rắc rối lớn nhất, hoặc những comment mà Modbot không phân tích được – những nhiệm vụ cần có sự đánh giá quan trọng của con người chứ không đơn giản chỉ đóng vai trò chốt chặn.

Trong khi đó, Washington Post tiếp tục tìm kiếm khả năng sử dụng công nghệ AI của chính Amazon để phát hành tin tức theo những cách thức phi truyền thống. Hồi đầu năm 2017, báo này đã triển khai một chương trình thử nghiệm mùa hè, theo đó họ sử dụng Amazon Polly để chuyển các bài viết thành các bài đọc. Trong vòng 1 tháng, độc giả mobile có thể chọn cách nghe thay vì đọc nội dung. Người dùng có thể chọn tới 4 bài một lần khi tham gia thử nghiệm này.

Theo Joe Price, quản lý sản phẩm, nhóm của ông đã chuyển hơn 150 bài báo sang dạng âm thanh theo các mục nhất định như kinh doanh, lối sống, công nghệ và giải trí.

“Một số độc giả rất thích tương tác với nội dung âm thanh và chúng tôi nhận thấy hiệu quả lớn hơn mong đợi khi chuyển từ văn bản sang âm thanh như vậy” - ông nói - “Chúng tôi đang theo dõi sát sao xem các công nghệ chuyển văn bản sang âm thanh như Polly phát triển ra sao và tiếp tục tìm kiếm các cách thức phục vụ những độc giả trung thành của Washington Post muốn nghe tin hơn là đọc.”

Tìm hiểu và thử nghiệm những khả năng của bot trong báo chí là mối quan tâm hàng đầu của trang tin tức Quartz. Ứng dụng mobile của họ, được tung ra vào năm 2016, vốn trình bày nội dung theo cách thức thông thường, giống như bất kỳ ứng dụng tin tức nào.

Nhà lập trình bot và quản lý sản phẩm John Keefe kể lại một thử nghiệm đang được thực hiện với chatbot Facebook Messenger về chương trình “Stranger Things” của Netflix.

“Người hâm mộ có thể sử dụng bot này cho dù họ có quyết định xem chương trình đó hay không, cho dù họ đã xem bao nhiêu phần” - Keefe nói - “Chúng tôi biết được họ đang ở đâu và thận trọng tránh gây ra sự khó chịu".

Với thành công của app này và những thử nghiệm gần đây, Keefe cho hay ông tin tưởng rằng những giao diện giống như tán gẫu (chat) sẽ tiếp tục hiệu quả. “Việc các nhà xuất bản tin tức có thể hoạt động hiệu quả hay không với chatbot thì còn phải xem xét nhưng đó là những gì chúng tôi đang làm với Quartz Bot Studio,” ông nói.

Ra mắt vào tháng 11/2016, Bot Studio của Quartz tập trung thử nghiệm các ứng dụng bot, AI cũng như các công nghệ liên quan dành cho báo chí trên các nền tảng mới. Gần đây nhất, studio này công bố một bộ công cụ dựa trên Slack nhằm hỗ trợ các nhà báo trong các công việc hằng ngày, gọi là Quackbot.

Hiện tại, nó mới làm những công việc đơn giản như tìm kiếm các nguồn dữ liệu tin cậy hoặc giúp chụp màn hình một website nào đó. Theo Keefe, về lâu dài nó có thể trích xuất nội dung văn bản từ các file PDF, làm ra những biểu bảng đơn giản và theo dõi các website xem có thay đổi gì không.

Chẳng hạn, một nhà báo có thể sử dụng công cụ này để tạo ra bot theo dõi website của cảnh sát tại một thành phố và nhận thông báo ngay khi có thông tin cập nhật.

Keefe thừa nhận sự tồn tại của những “bot độc” mạo danh con người, nhiều loại virus và những phần mềm giả mạo, vì thế các tòa soạn cần phải hiểu rõ cách thức hoạt động của chúng và thông báo cho người dùng.

“Chắc chắn có những phần mềm phản ánh quan điểm thiên kiến của những người tạo ra chúng và bất kỳ dữ liệu nào được dùng để dạy những phần mềm đó” - Keefe nhấn mạnh - “Là những người được đào tạo để nhận rõ được các vấn đề định kiến trong quá trình đưa tin, viết tin và biên tập tin tức, điều quan trọng là cũng cần phải tính đến những vấn đề định kiến đó cả trong các phần mềm máy học và những mô hình mà chúng ta tạo ra.”

Trong số những chức năng cơ bản nhưng vô cùng quan trọng mà AI có thể mang lại có việc thẩm định sự thực. Duke Tech & Check Cooperative, một dự án nhận được nhiều khoản tài trợ lên tới 1 triệu USD, đang phát triển các ứng dụng để tự động kiểm tra xem thông tin có đúng sự thực hay không.

Trong giai đoạn 2 năm của dự án, khoa báo chí và các nhà khoa học máy tính của Duke và một số trường đại học khác đã tạo lập nên nhiều công cụ và ứng dụng mới để giúp các nhà báo thẩm định thông tin.

“Những người chịu trách nhiệm thẩm định sự thực có thể sử dụng AI để thực hiện những công việc buồn tẻ lặp đi lặp lại” - Bill Adair, giáo sư về Thực hành báo chí và Chính sách công tại Đại học Duke đồng thời là người đứng đầu dự án Tech & Check Cooperative cho biết.

Chẳng hạn, các phóng viên và biên tập viên thường phải mất rất nhiều thời gian đọc bản ghi các chương trình truyền hình và các hồ sơ khiếu kiện để kiểm tra các yêu cầu đòi bồi thường. Bằng cách hợp tác với một nhóm các nhà khoa học máy tính thuộc trường Đại học Texas ở Arlington, Adair cho hay họ đã tự động hóa công việc đó, dùng bot có tên ClaimBuster để dò theo các bản ghi và đề xuất những yêu cầu cần kiểm tra.

“Việc này giúp các tờ báo địa phương không mất nhiều nguồn lực trong nhiều giờ đồng hồ để đọc các bản ghi nhưng thỉnh thoảng vẫn muốn thẩm định thông tin” - ông nói.

Tuy việc thẩm định thông tin tự động không còn là viễn cảnh xa vời, Adair lưu ý rằng công nghệ hiện nay chưa đủ khả năng thay thế các nhà báo bằng xương bằng thịt.

“Robot không thể thay thế con người trong việc thẩm định thông tin,” - ông nói - “Chúng chỉ giúp các nhà báo phát hiện những vấn đề nổi lên cần phải được thẩm định và xác định những lần thẩm định thông tin trước đó khi các chính trị gia lặp lại một yêu cầu. Đây mới là những bước đi đầu tiên.”

Stephen Masiclat, giám đốc chương trình Quản trị Truyền thông Mới tại trường Truyền thông Công cộng S.I. Newhouse, khẳng định khả năng “nhà báo robot” đưa tin tức giống được như con người là một kỹ năng mà “máy móc còn phải mất nhiều, nhiều năm mới đạt được".

“Chúng ta chưa sẵn sàng cho việc được chatbot phỏng vấn,” ông nói. “Để các nguồn tin cởi mở và cung cấp thông tin, chúng ta cần những nhà báo bằng xương bằng thịt".

Theo Masiclat, chính các phóng viên truyền hình là đối tượng đáng phải lo ngại. “Ngay khi có một hệ thống có thể thổi luồng sinh khí cho một phát thanh viên tin tức nhân tạo thì những công việc đầy hào nhoáng của tin tức truyền hình sẽ bị máy móc thay thế. Và thời điểm đó cũng không còn xa nữa.”

Hệ thống trí tuệ nhân tạo mà Masiclat cho biết ông đang cố thiết kế cho tòa soạn sẽ nhằm mục tiêu giúp các phóng viên kết nối tốt hơn với độc giả bằng cách theo dõi thời gian họ dành cho các bài viết và duy trì hiệu quả với những bài được đọc nhiều nhất.

“Chúng tôi sẽ gọi đây là những bài viết có ‘tương tác cao’ và nó phụ thuộc vào từng độc giả,” - ông nói - “Sau đó trí tuệ nhân tạo sẽ phân tích các bài viết này để hiểu rõ những đặc điểm của các bài viết có tương tác cao, ví như cấu trúc của bài viết, xu hướng lựa chọn ngôn từ và mức độ phức tạp của câu.” Kết quả là mỗi độc giả sẽ có một bộ đặc điểm riêng về những nội dung tương tác cao, và hệ thống sẽ hiểu đặc điểm nội dung mà từng độc giả ưa thích. Rồi phóng viên viết tin, phỏng vấn, tập hợp thông tin, viết nội dung chính theo kiểu “chỉ cần thông tin sự thực cơ bản.” Tiếp theo, cỗ máy AI sẽ cá nhân hóa nội dung tùy theo đặc điểm ưa thích của từng độc giả.

“Mỗi độc giả có một phiên bản riêng của câu chuyện ‘được viết’ theo giọng điệu và phong cách khiến họ tương tác hiệu quả nhất,” Masiclat nhấn mạnh. “Như vậy một phóng viên có thể tiếp cận và tương tác với nhiều độc giả hơn và theo cách thức đa dạng hơn.”

Ngoài ra, theo Masiclat, độc giả sẽ nhận được những bài viết phù hợp với nhu cầu của họ, đổi lại sẽ đánh giá cao sự phục vụ của đơn vị xuất bản.

“Phóng viên sẽ có nhiều thời gian hơn cho việc đưa tin, tìm hiểu các nguồn tin, và biết rằng hệ thống sẽ giúp họ tạo ra bài viết thành phẩm,” ông nói. “Các nhà quảng cáo sẽ hoan nghênh tỷ lệ tương tác cao và sẽ muốn sử dụng dữ liệu đó để cá nhân hóa quảng cáo của mình nhằm tương tác cao hơn với độc giả.”

Tuy nhiên, Masiclat cũng thừa nhận rằng hệ thống mà ông nhắm tới có khả năng sẽ vấp phải một số thách thức mang tính đạo đức nghề nghiệp.

“Trước hết, ai sở hữu phong cách viết? Nếu nhà xuất bản tin tức tạo ra và sở hữu hệ thống AI tạo nên phong cách viết thì họ có sở hữu nó không?” ông đặt câu hỏi. “Nếu một phong cách ưa thích của độc giả xuất phát từ phong cách của một vài phóng viên, liệu họ có quyền sở hữu không? Tìm ra câu trả lời cho những vấn đề kiểu này sẽ giúp chúng ta biết AI mang lại lợi ích hay là sự rắc rối.”

Đinh Thanh