Sự thông thạo tiếng Anh từ lâu đã là một lợi thế trong nhiều lĩnh vực, và ảnh hưởng của trí tuệ nhân tạo (AI) đang củng cố xu hướng này trên thị trường việc làm toàn cầu. Phần lớn dữ liệu đào tạo cho các hệ thống AI tạo sinh hiện tại đến từ các nguồn tiếng Anh, với ước tính khoảng 90%.
Sự thống trị của tiếng Anh trong AI xuất phát từ các yếu tố lịch sử, kinh tế và công nghệ. Các công ty công nghệ lớn như Google, Meta và OpenAI có trụ sở tại Hoa Kỳ, nơi tiếng Anh đã ăn sâu vào cơ sở hạ tầng kỹ thuật số, ảnh hưởng đến sự phát triển của các mô hình và ứng dụng AI.
Tuy nhiên, cách tiếp cận tập trung vào tiếng Anh này gây ra những thách thức đáng kể cho những người không nói tiếng Anh. Các hệ thống AI được đào tạo chủ yếu trên dữ liệu tiếng Anh có xu hướng hoạt động kém hiệu quả khi xử lý các ngôn ngữ khác, dẫn đến sự loại trừ và các thành kiến tiềm ẩn.
Để giải quyết những khác biệt này, các sáng kiến đang được tiến hành để phát triển các mô hình AI đa ngôn ngữ. Microsoft đang hợp tác với Hugging Face để cung cấp dữ liệu đa ngôn ngữ thông qua GitHub và tài trợ cho việc tạo nội dung bằng nhiều ngôn ngữ châu Âu. UNESCO cũng nhấn mạnh tầm quan trọng của sự đa dạng ngôn ngữ trong AI để bảo tồn di sản văn hóa và thúc đẩy sự hòa nhập toàn cầu.
Bất chấp những nỗ lực này, việc đạt được sự hòa nhập ngôn ngữ thực sự trong AI vẫn là một thách thức. Sự thống trị tiếp tục của tiếng Anh có thể tạo ra những trở ngại cho những người không nói tiếng Anh, có khả năng làm trầm trọng thêm những bất bình đẳng hiện có.
Khi AI ngày càng được tích hợp vào xã hội, điều quan trọng là phải đảm bảo rằng lợi ích của nó có thể tiếp cận được với tất cả mọi người, bất kể ngôn ngữ nào. Các chính phủ và ngành công nghiệp nên đầu tư vào việc phát triển các mô hình AI đa ngôn ngữ và đảm bảo rằng tất cả các ngôn ngữ đều được đại diện trong dữ liệu đào tạo AI.
Một nghiên cứu của Đại học Cambridge cho thấy sự thiên vị về ngôn ngữ trong AI có thể dẫn đến việc phân bổ nguồn lực không công bằng, với các ứng dụng và dịch vụ AI được tối ưu hóa cho tiếng Anh, trong khi các ngôn ngữ khác bị bỏ lại phía sau. UNESCO đã công bố một báo cáo vào năm 2023 nhấn mạnh rằng sự đa dạng ngôn ngữ trong AI là rất quan trọng để bảo tồn di sản văn hóa và thúc đẩy sự hòa nhập toàn cầu.