Công ty khởi nghiệp sử dụng công cụ hỗ trợ AI tạo ứng dụng nhân bản giọng nói

DIỆU OANH 23/01/2024 01:48

Công ty khởi nghiệp sáng tạo hoạt động trên phần mềm AI ElevenLabs có trụ sở tại London/New York đã huy động được 80 triệu USD trong vòng tài trợ series B.

Vòng này do các nhà đầu tư nổi tiếng bao gồm Andreessen Horowitz, cựu Giám đốc điều hành GitHub Nat Friedman và doanh nhân Daniel Gross đồng dẫn đầu. Tham gia vòng này còn có Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital và Credo Ventures.

>>Công ty khởi nghiệp Betavolt sản xuất pin phát điện trong 50 năm

Mặc dù Công ty khởi nghiệp sáng tạo hoạt động trên phần mềm AI này không tiết lộ mức định giá của mình nhưng một người trong cuộc nói với Reuters rằng vòng tài trợ đã định giá ElevenLabs ở mức 1,1 tỷ USD. Vòng mới nhất chuyển sang trạng thái kỳ lân, đưa ElevenLabs trở thành thành viên của câu lạc bộ kỳ lân.

Nguồn vốn huy động thành công được diễn ra trong bối cảnh các nhà đầu tư ngày càng quan tâm đến công nghệ AI tổng hợp. Đây cũng là động lực đẩy việc định giá các công ty khởi nghiệp lên một tầm cao mới.

Được thành sáng lập vào năm 2022 bởi Piotr Dabkowski, cựu kỹ sư máy học của Google và Staniszewski, cựu chiến lược gia triển khai Palantir. ElevenLabs đã ra mắt phiên bản beta khoảng một năm trước. 

>>Công ty khởi nghiệp công nghệ sinh học tạo cây đột biến gen thanh lọc không khí trong nhà

Piotr Dabkowski và Mati Staniszewski, cả hai đều đến từ Ba Lan, đã tận mắt chứng kiến vấn đề này khi họ xem những bộ phim lồng tiếng kém. Thử thách này đã truyền cảm hứng cho họ thành lập ElevenLabs, một công ty thực hiện sứ mệnh làm cho tất cả nội dung có thể truy cập được trên toàn cầu bằng bất kỳ ngôn ngữ và giọng nói nào bằng sức mạnh của AI.

Công ty khởi nghiệp này được biết đến nhiều nhất là ứng dụng tạo giọng nói dựa trên trình duyệt có thể tạo ra giọng nói sống động như thật với các nút điều chỉnh ngữ điệu, cảm xúc, nhịp điệu và các đặc điểm giọng hát quan trọng khác. ElevenLabs cho người dùng nhập văn bản và nhận bản ghi văn bản đó được đọc to bằng một trong một số giọng nói mặc định. Khách hàng trả tiền có thể tải lên các mẫu giọng nói để tạo phong cách mới bằng cách sử dụng tính năng sao chép giọng nói của ElevenLabs.

Hai đồng sáng lập của ElevenLabs

Hai đồng sáng lập của ElevenLabs

Thời gian đầu, ElevenLabs đã tạo nên làn sóng với mô hình chuyển văn bản thành giọng nói tổng hợp giọng nói AI nghe tự nhiên bằng tiếng Anh. Sau đó, mô hình này được mở rộng thành Eleven Multilingual v1 và v2, giới thiệu tính năng hỗ trợ tổng hợp bằng nhiều ngôn ngữ hơn, bao gồm tiếng Ba Lan, tiếng Đức, tiếng Tây Ban Nha, tiếng Pháp, tiếng Ý, tiếng Bồ Đào Nha và tiếng Hindi.

Bên cạnh đó, ElevenLabs cũng tập trung phát triển Voice Lab, nơi người dùng có thể sao chép giọng nói của chính họ hoặc tạo ra giọng nói tổng hợp hoàn toàn mới (bằng cách lấy mẫu ngẫu nhiên các thông số giọng nói) để sử dụng với công cụ tổng hợp. Điều này cho phép họ chuyển đổi văn bản họ chọn, chẳng hạn như tập lệnh của podcast, thành nội dung âm thanh bằng giọng nói và ngôn ngữ ưa thích của họ.

Ở giai đoạn thử nghiệm, ElevenLabs đã đạt được sức hút đáng kể với hơn một triệu người dùng tham gia. Công ty khởi nghiệp này cũng xây dựng nghiên cứu giọng nói AI của mình bằng cách tung ra AI Dubbing, một công cụ chuyển đổi giọng nói thành giọng nói cho phép người dùng dịch âm thanh và video sang 29 ngôn ngữ khác nhau trong khi vẫn giữ được giọng nói và cảm xúc của người nói ban đầu. Tính đến thời điểm hiện tại, nó chiếm 41% trong số Fortune 500 trong số khách hàng của mình. Điều này cũng bao gồm các nhà xuất bản nội dung đáng chú ý như Storytel, The Washington Post và TheSoul Publishing.

>>Công ty khởi nghiệp dùng AI hỗ trợ bác sĩ tư vấn cho bệnh nhân

Quy trình làm việc được xây dựng dựa trên sản phẩm Lồng tiếng AI và cung cấp cho người dùng chuyên nghiệp một bộ công cụ chuyên dụng để không chỉ lồng tiếng toàn bộ phim bằng ngôn ngữ họ chọn mà còn tạo và chỉnh sửa bản ghi, bản dịch và mã thời gian, cho phép kiểm soát thực tế hơn trong quá trình sản xuất. Nó hỗ trợ 29 ngôn ngữ, như AI Dubbing, nhưng bỏ lỡ một yếu tố quan trọng đối với việc bản địa hóa nội dung: hát nhép. 

Điều này có nghĩa là nếu một bộ phim được bản địa hóa bằng công cụ này, nó sẽ chỉ lồng âm thanh bằng ngôn ngữ được nhắm mục tiêu cử động môi trong video sẽ vẫn như nguyên bản. Staniszewski xác nhận rằng công ty hiện đang tập trung vào việc mang lại trải nghiệm âm thanh tốt nhất nhưng hy vọng sẽ bổ sung khả năng này trong tương lai.

Trong những năm tới, chúng tôi đặt mục tiêu xây dựng vị thế là công ty dẫn đầu toàn cầu về nghiên cứu AI bằng giọng nói và triển khai sản phẩm. Chúng tôi cũng có kế hoạch phát triển các công cụ ngày càng tiên tiến phù hợp với người dùng chuyên nghiệp và các trường hợp sử dụng,” Staniszewski cho biết.

Những người chơi khác trong không gian tạo giọng nói và giọng nói được hỗ trợ bởi AI là MURF.AI , Play.ht và WellSaid Labs. Theo Market US, thị trường toàn cầu cho những công cụ như vậy đạt mức 1,2 tỷ USD vào năm 2022 và ước tính sẽ chạm mốc gần 5 tỷ USD vào năm 2032, với tốc độ CAGR trên 15,40% một chút.

Có thể bạn quan tâm

  • Công ty khởi nghiệp Land Moto đặt mục tiêu tạo ra loại pin đa chức năng

    Công ty khởi nghiệp Land Moto đặt mục tiêu tạo ra loại pin đa chức năng

    01:29, 22/01/2024

  • Phát triển bền vững gắn với khởi nghiệp

    Phát triển bền vững gắn với khởi nghiệp

    08:28, 21/01/2024

  • Xu hướng di chuyển bằng điện mở đường cho các công ty khởi nghiệp xe điện

    Xu hướng di chuyển bằng điện mở đường cho các công ty khởi nghiệp xe điện

    02:26, 21/01/2024

(0) Bình luận
Nổi bật
Mới nhất
Công ty khởi nghiệp sử dụng công cụ hỗ trợ AI tạo ứng dụng nhân bản giọng nói
POWERED BY ONECMS - A PRODUCT OF NEKO