Kinh doanh

Chỉ mất 3,7 giây, phần mềm 'Deep Voice' của Baidu có thể giả giọng nói của bất cứ ai

字号+ 作者:NEWS 来源:Thời sự 2025-02-06 23:46:43 我要评论(0)

Chỉ với một đoạn ghi âm dài 3,ỉmấtgiâyphầnmềmDeepVoicecủaBaiducóthểgiảgiọngnóicủabấtcứkết quả vô địckết quả vô địch đứckết quả vô địch đức、、

Chỉ với một đoạn ghi âm dài 3,ỉmấtgiâyphầnmềmDeepVoicecủaBaiducóthểgiảgiọngnóicủabấtcứkết quả vô địch đức7 giây, một thuật toán AI mới được phát triển bởi ông lớn ngành công nghệ Trung Quốc, Baidu, có khả năng giả giọng người nói một cách rất chân thực. Tương tự như những nghiên cứu phát triển phần mềm học máy với khả năng tạo ra những video giả tạo, nghiên cứu này một lần nữa nhắc nhở chúng ta rằng ngày càng khó để có thể đặt lòng tin vào những nội dung truyền thông trên mạng.

Các nhà nghiên cứu tại công ty công nghệ này đã công bố những tiến bộ mới nhất mà họ đạt được trong phần mềm Deep Voice, một hệ thống được phát triển để sao chép giọng nói. Một năm trước, công nghệ này yêu cầu các đoạn thu âm dài đến 30 phút để có thể tạo ra một đoạn audio mới với giọng nói giả. Giờ đây, công nghệ này đã có thể tạo ra được những thành quả tốt hơn mà chỉ cần một vài giây thu âm giọng mẫu.

Đương nhiên, nếu công nghệ này càng có nhiều mẫu để thử nghiệm, kết quả mà nó cho ra sẽ càng tốt hơn. Nếu chỉ cung cấp cho phần mềm này một đoạn ghi âm ngắn thì chất lượng giọng nói sao chép có thể sẽ không tốt lắm, chỉ tương đương với một đoạn thu âm giọng thật với chất lượng thấp.

Hệ thống này thậm chí còn có thể thay đổi giọng nữ thành giọng đàn ông, và thay đổi giọng Anh thành giọng người Mỹ. Điều này cho thấy AI này có khả năng bắt chước những biến thể ngôn ngữ khác nhau.

Các nhà nghiên cứu đã viết trong một bài đăng của Baidu: "Việc sao chép giọng nói sẽ có những ứng dụng quan trọng trong định hướng cá nhân hoá giao diện giữa người và máy móc."

Sự thành công của Deep Voice một lần nữa cho thấy công cuộc mô phỏng giọng nói bằng AI trong một vài năm gần đây đang tiến triển rất tốt. Adobe đã trình diễn khả năng của phần mềm VoCo vào năm 2016. Phần mềm này có thể tạo ra những bài nói từ văn bản chỉ sau khi nghe một giọng nói trong vòng 20 phút. Một startup tại Montreal chuyên về AI cũng đã tuyên bố rằng họ có thể tạo ra các bài nói từ văn bản chỉ với một đoạn thu âm mẫu dài 1 phút.

Những tiến bộ công nghệ này cho thấy con người đang có những bước nhảy vọt trong công cuộc phát triển AI, song nó cũng dấy lên nhiều lo ngại. Nếu AI chỉ cần một đoạn thu âm giọng nói ngắn vài giây, và một bộ dữ liệu khuôn mặt, việc làm giả một cuộc phỏng vấn, một cuộc họp báo hay đưa tin giả mạo sẽ trở nên rất đơn giản. Hệ luỵ có nó sẽ không thể lường trước.

Theo GenK

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • Nhận định, soi kèo Ludogorets Razgrad vs Botev Plovdiv, 22h59 ngày 4/2: Khẳng định vị thế số 1

    Nhận định, soi kèo Ludogorets Razgrad vs Botev Plovdiv, 22h59 ngày 4/2: Khẳng định vị thế số 1

    2025-02-06 23:24

  • Soi kèo góc Argentina vs Peru, 7h00 ngày 30/6

    Soi kèo góc Argentina vs Peru, 7h00 ngày 30/6

    2025-02-06 23:04

  • ‘Đào Phở và Piano’ lãi 3 tỷ đồng đã mừng, chưa biết chia tiền thế nào?

    ‘Đào Phở và Piano’ lãi 3 tỷ đồng đã mừng, chưa biết chia tiền thế nào?

    2025-02-06 21:46

  • Nhận định, soi kèo HAGL vs Thanh Hóa, 17h ngày 24/7

    Nhận định, soi kèo HAGL vs Thanh Hóa, 17h ngày 24/7

    2025-02-06 21:19

网友点评