Zalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt miễn phí
VMLU (Vietnamese Multitask Language Understanding) do Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) xây dựng nhằm giúp cộng đồng nghiên cứu và phát triển AI ở Việt Nam có thêm công cụ đánh giá chất lượng đầu ra của các mô hình Generative AI tiếng Việt. TheôngbốbộtiêuchuẩnđánhgiánănglựctiếngViệtmiễnphílich nhao đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường hiện nay với 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Tại sao AI Việt Nam cần một bộ tiêu chuẩn đánh giá năng lực tiếng Việt hoàn chỉnh? Sự phát triển bùng nổ của ChatGPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo số liệu thống kê, kể từ thời điểm ChatGPT được giới thiệu, trên thế giới hiện có khoảng 16.000 mô hình tương tự như ChatGPT ra đời. Việt Nam cũng không đứng ngoài xu thế đó khi có rất nhiều nhóm nghiên cứu với quy mô, tiềm lực khác nhau cũng đang muốn thử nghiệm với Generative AI sử dụng tiếng Việt. Điều này đã kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt. Trên thị trường hiện nay, hầu hết các nhóm nghiên cứu LLM ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường. Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp những nhóm nghiên cứu nhỏ có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau. Từ đó, tạo ra động lực hoàn thiện hơn mô hình. Tạo động lực cho AI Việt Nam gia nhập làn sóng Generative AI thế giới Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU. Đây là bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI. Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu nhỏ trong việc phát triển ra các mô hình AI tiếng Việt mới. Điều này tạo điều kiện cho các nghiên cứu mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt. Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam đi nhanh hơn, bắt kịp với làn sóng phát triển AI trên thế giới. Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì? Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, hướng đến 2 phần chính: Dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt. Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực bao gồm: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”. Với khối dữ liệu này, VMLU có sự phân tầng độ khó với 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp - cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn giải quyết các vấn đề phức tạp. Bên cạnh đó, để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn để các nhóm có thể sử dụng một cách nhanh chóng và đơn giản. Lưu ý: VMLU giới hạn 5 lần thử nghiệm/tài khoản/ngày. Kết quả được ghi nhận từ lịch sử đánh giá gần nhất. Đóng góp cho cộng đồng AI Việt Nam Bộ tiêu chuẩn VMLU ra đời chính là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào. Trước đó, Zalo AI đã thực hiện, triển khai và tổ chức hàng loạt các cuộc thi, chương trình cho cộng đồng AI Việt Nam như: Zalo AI Challenge, Zalo AI Hackathon, Zalo AI Summit… Những hoạt động này không chỉ tạo sân chơi cho cộng đồng AI Việt mà còn khuyến khích việc ứng dụng AI vào cuộc sống, giải quyết các bài toán cấp thiết của xã hội, phục vụ cho nhu cầu của hàng triệu người Việt Nam. Tiến sĩ Châu Thành Đức, Trưởng bộ phận nghiên cứu Zalo AI - Giảng viên Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP Hồ Chí Minh khẳng định: “Zalo AI luôn hướng tới sự đóng góp cho cộng đồng AI Việt Nam, tạo động lực để AI Việt Nam phát triển. Từ đó, kỳ vọng ngày càng có nhiều sản phẩm AI của người Việt, cho người Việt”.
相关推荐
-
Nhận định, soi kèo Lamphun Warrior vs Sukhothai, 18h00 ngày 9/2: Khó cho cửa trên
-
Nhận định, soi kèo America de Cali vs Alianza Petrolera, 6h ngày 10/12
-
Nhận định, soi kèo U19 Albania vs U19 Pháp, 20h00 ngày 10/11 - Vòng loại U19 châu Âu 2022. Dự đoán, phân tích châu Âu, châu Á trận U19 Albania đối đầu với U19 Pháp từ các chuyên gia hàng đầu.Nhận định, soi kèo U19 Armenia vs U19 Scotland, 17h00 ngày 10/11" alt="Nhận định, soi kèo U19 Albania vs U19 Pháp, 20h00 ngày 10/11"> Nhận định, soi kèo U19 Albania vs U19 Pháp, 20h00 ngày 10/11
-
Nhận định, soi kèo Albirex Niigata vs Ehime, 12h ngày 13/11
-
Soi kèo phạt góc Sevilla vs Barcelona, 03h00 ngày 10/2
-
Từ các cuộc điều tra sơ bộ, 8 nạn nhân nằm trong danh sách những người tham gia một lễ tang.
Chính phủ Guinea Xích đạo đã gửi mẫu cho quốc gia láng giềng Gabon và Senegal để xét nghiệm thêm.
Bộ trưởng Ayekaba nói với Reuters: “Chúng tôi đang cố gắng nhanh chóng xác định liệu các nạn nhân có nhiễm sốt xuất huyết do virus Lassa hoặc Ebola gây ra hay không”. Vị quan chức trên thông tin các nhà chức trách đã hạn chế di chuyển xung quanh hai ngôi làng và tiến hành truy vết. Hơn 200 người, dù hiện chưa có triệu chứng, đã được cách ly.
Các bệnh nhân bị sốt, chảy máu mũi. Ảnh minh họa: Chemist-4-u Ngày 10/2, nước láng giềng của Guinea Xích đạo là Cameroon đã hạn chế di chuyển dọc biên giới sau những cái chết không rõ nguyên nhân trên. Bộ trưởng Y tế Malachie Manaouda giải thích Cameroon áp đặt các hạn chế vì "nguy cơ lây nhiễm căn bệnh này cao và để phát hiện, ứng phó với bất kỳ trường hợp nào ở giai đoạn đầu".
Các chuyên gia của Tổ chức Y tế Thế giới (WHO) cũng đang tham gia các cuộc điều tra và giám sát dịch tễ học. Người phát ngôn của WHO cho biết, cơ quan này hỗ trợ xét nghiệm các mẫu để xác định nguyên nhân gây ra cái chết và kết quả sẽ có trong vài ngày tới. Triệu chứng của căn bệnh chưa xác định là chảy máu mũi, sốt, đau khớp… khiến nạn nhân tử vong trong vòng vài giờ.
Đường lây của virus khiến 9 người chết sau khi đi dự đám tang
Virus Marburg có thể gây ra các triệu chứng nặng, tỷ lệ tử vong cao nhưng chưa có vắc xin và cách chữa đặc trị." alt="WHO hỗ trợ điều tra căn bệnh khiến 8 người tử vong sau khi dự đám tang">WHO hỗ trợ điều tra căn bệnh khiến 8 người tử vong sau khi dự đám tang
- 最近发表
-
- Nhận định, soi kèo Wigan Athletic vs Fulham, 22h00 ngày 8/2: Khó có bất ngờ
- Nhận định, soi kèo Ceramica Cleopatra vs Al Mokawloon, 20h00 ngày 24/12
- HLV Park tính kế, quyết lội ngược dòng thắng Thái Lan
- 5 sai lầm phổ biến của những người lần đầu mua nhà
- Nhận định, soi kèo Deportivo Alaves vs Getafe, 20h00 ngày 9/2: Chưa thể thoát khỏi nhóm cầm đèn đỏ
- Nhận định, soi kèo Dalian Pro vs Chongqing Liangjiang, 14h30 ngày 28/12
- Nhận định, soi kèo Puerto Cabello vs Portuguesa, 6h30 ngày 1/12
- Nhận định, soi kèo River Plate vs Villa Espanola, 19h45 ngày 30/11
- Soi kèo phạt góc Bayern Munich vs Bremen, 02h30 ngày 8/2
- Nhận định, soi kèo Shaanxi Changan vs Beijing Sport Univ, 18h30 ngày 14/12
- 随机阅读
-
- Nhận định, soi kèo Saint
- Tuyển Việt Nam bao giờ về nước sau khi chia tay AFF Cup 2020?
- Nhận định, soi kèo Gijon vs Sociedad B, 3h ngày 13/11
- Nhận định, soi kèo AZ vs Heracles, 0h ngày 16/12
- Nhận định, soi kèo RB Leipzig vs St Pauli, 23h30 ngày 9/2: Tin vào chủ nhà
- Nhận định, soi kèo Tianjin Tigers vs Luoyang Longmen, 14h30 ngày 28/12
- Nhận định, soi kèo Hy Lạp U21 vs Belarus U21, 21h00 ngày 12/11
- Kiến tạo không gian sống văn minh cho người dân Hà Nam
- Nhận định, soi kèo Lamphun Warrior vs Sukhothai, 18h00 ngày 9/2: Khó cho cửa trên
- Nhận định, soi kèo Việt Nam vs Indonesia, 19h30 ngày 15/12
- Nhận định, soi kèo Shabab Manama vs Sitra Club, 22h59 ngày 13/12: Hướng tới ngôi đầu
- Nhận định, soi kèo Junior Barranquilla vs Atletico Nacional, 6h ngày 16/12
- Kèo vàng bóng đá Rayo Vallecano vs Valladolid, 03h00 ngày 8/2: Khách ‘tạch’
- Nhận định, soi kèo Aberystwyth Town vs The New Saints, 3h ngày 10/11
- Nhận định, soi kèo Vejle vs Midtjylland, 1h00 ngày 30/11
- Nhận định, soi kèo Erzgebirge Aue vs Heidenheim, 19h30 ngày 7/11
- Nhận định, soi kèo Everton vs Bournemouth, 22h00 ngày 8/2: Chiến thắng thứ tư
- Nhận định, soi kèo Dalian Yifang vs Cangzhou Mighty Lions, 14h30 ngày 18/12
- Nhận định, soi kèo Benfica vs Sporting Covilha, 2h ngày 16/12
- Nhận định, soi kèo Randers vs Midtjylland, 20h ngày 31/10
- 搜索
-
- 友情链接
-