Phát thải vô hình từ máy móc thông minh: Minh bạch hóa chi phí môi trường của LLM

11:29, 23 tháng 4

Chỉnh sửa bởi: Gane Reed

Mỗi khi bạn đặt câu hỏi cho một mô hình ngôn ngữ lớn, các máy chủ ở đâu đó lại hoạt động dồn dập, tiêu thụ lượng điện năng thường bắt nguồn từ các nguồn tài nguyên không tái tạo. Sự tiện lợi kỹ thuật số này đi kèm với một cái giá vật lý cụ thể được đo bằng lượng khí thải carbon dioxide và sự cạn kiệt tài nguyên, thế nhưng hầu hết người dùng vẫn chưa hề hay biết về quy mô của nó. Một bài báo khoa học gần đây trên arXiv đã giới thiệu các phương pháp sàng lọc minh bạch nhằm ước tính những tác động môi trường này với độ chính xác và tính cởi mở cao hơn cho cả giai đoạn huấn luyện lẫn giai đoạn suy luận của các LLM.

Việc huấn luyện các mô hình này đòi hỏi nguồn tài nguyên tính toán khổng lồ, đôi khi phải chạy liên tục trong nhiều tháng trên các cụm phần cứng chuyên dụng. Nghiên cứu chỉ ra rằng lượng khí thải carbon từ việc huấn luyện một mô hình tiên tiến có thể tương đương với lượng khí thải của một chiếc ô tô chạy bằng xăng di chuyển hàng trăm nghìn dặm. Tuy nhiên, bài báo nhấn mạnh rằng quá trình suy luận — diễn ra trong mỗi lần tương tác của người dùng — đang gia tăng nhanh chóng đến mức hiệu ứng tích lũy của nó có thể sớm vượt xa chi phí huấn luyện. Nếu không có các phương pháp đo lường nhất quán, việc so sánh giữa các mô hình hoặc nhà cung cấp khác nhau sẽ trở nên thiếu tin cậy.

Các phương pháp sàng lọc được đề xuất gây chú ý nhờ nhấn mạnh vào tính minh bạch. Chúng phác thảo các quy trình từng bước bao gồm các yếu tố như loại phần cứng được sử dụng, hiệu suất năng lượng của nó, hiệu quả sử dụng điện của trung tâm dữ liệu và cường độ carbon cụ thể của lưới điện địa phương. Theo nghiên cứu, những chi tiết này thường bị bỏ qua hoặc chỉ được ước tính sơ sài trong các báo cáo ngành, dẫn đến việc đánh giá thấp mức độ tác động hoặc tạo ra những so sánh khập khiễng. Bằng cách giúp phương pháp luận có thể được tái lập hoàn toàn, cách tiếp cận này cho phép xác minh độc lập và khuyến khích tiêu chuẩn hóa trong toàn lĩnh vực.

Sự phát triển này phơi bày một nghịch lý nghiêm trọng trong việc chúng ta áp dụng công nghệ AI. Một mặt, chúng ta kỳ vọng AI sẽ tối ưu hóa việc sử dụng năng lượng trong các lĩnh vực khác, từ lưới điện thông minh đến mô hình hóa khí hậu. Mặt khác, chính cơ sở hạ tầng hỗ trợ AI lại ngày càng tiêu tốn nhiều năng lượng hơn. Động lực thúc đẩy rất rõ ràng: các công ty công nghệ ưu tiên việc nâng cao năng lực nhanh chóng và chiếm lĩnh thị trường, trong khi trách nhiệm giải trình về môi trường vẫn chỉ là thứ yếu trừ khi nó phục vụ cho mục đích xây dựng thương hiệu. Đóng góp của bài báo có thể phá vỡ mô hình này bằng cách trang bị cho các nhà nghiên cứu, các nhà hoạch định chính sách và thậm chí cả người tiêu dùng những công cụ để yêu cầu sự thay đổi tốt hơn.

Hãy xem xét một phép so sánh đời thường. Giống như việc đọc thành phần trên bao bì thực phẩm giúp chúng ta đưa ra những lựa chọn lành mạnh hơn, việc sàng lọc tác động minh bạch cho LLM cho phép chúng ta hiểu được "thành phần" trong các câu lệnh AI của mình. Một yêu cầu phức tạp đòi hỏi nhiều bước suy luận có thể tiêu thụ năng lượng tương đương với việc chạy một chiếc máy tính xách tay trong một giờ, trong khi một yêu cầu đơn giản chỉ tiêu tốn một phần nhỏ trong số đó. Sự minh bạch như vậy có thể định hình lại hành vi của người dùng một cách tinh tế, thúc đẩy sự tương tác có ý thức hơn với những công cụ mạnh mẽ nhưng ngốn tài nguyên này. Nó cũng tạo áp lực buộc các nhà phát triển phải đổi mới để tăng hiệu quả, có thể thông qua nén mô hình, cải thiện thuật toán hoặc đặt các trung tâm dữ liệu một cách chiến lược ở những khu vực có năng lượng sạch hơn.

Vượt ra ngoài các hành động cá nhân, các mô hình mang tính hệ thống đã nói lên nhiều điều. Khi AI được tích hợp vào mọi thứ, từ công cụ tìm kiếm đến phần mềm sáng tạo, dấu chân môi trường của nó chuyển từ một mối quan tâm nhỏ hẹp thành một vấn đề xã hội lớn. Các cơ quan quản lý đang bắt đầu chú ý, với những lời kêu gọi công bố thông tin bắt buộc ngày càng nhận được nhiều sự ủng hộ. Tuy nhiên, bài báo cảnh báo rằng nếu không có các phương pháp minh bạch và nghiêm ngặt, các quy định như vậy có nguy cơ mất hiệu quả hoặc dễ dàng bị lách luật. Điểm mấu chốt tiềm ẩn ở đây là quyền kiểm soát câu chuyện về sự tiến bộ — liệu sự thăng tiến về công nghệ sẽ được định nghĩa thuần túy bởi trí thông minh và tốc độ, hay bởi sự cân nhắc thấu đáo về hạnh phúc lâu dài của con người và hành tinh.

Việc lựa chọn những công nghệ phù hợp với các giá trị của chúng ta bắt đầu từ việc nhìn nhận rõ ràng cái giá thực sự của chúng.

13 Lượt xem