Github Copilot và những vấn đề với nguồn mở❓ Software Freedom Conservancy (SFC)- Tổ chức Bảo tồn Tự do Phần mềm, là một tổ chức phi lợi nhuận nhằm bảo vệ đạo đức của ngành công nghệ phần mềm. Hôm 30/6 vừa rồi, tổ chức này chính thức tuyên bố việc phản đối và kêu gọi cộng đồng tránh xa Github. ❌Lý do nằm ở Github Copilot, một dịch vụ AI tự động viết code dựa trên yêu cầu của người dùng, được Github chính thức tung ra với giá 10 USD/tháng sau 1 thời gian thử nghiệm miễn phí. Copilot được xem như một cuộc cách mạng lớn trong ngành công nghệ: không chỉ trở thành cánh tay thứ 3 cho lập trình viên trở nên hiệu quả hơn, code nhanh và chính xác hơn, mà nó còn giúp cho người không có kinh nghiệm gì về lập trình có được sự hỗ trợ tận răng khi bắt đầu muốn tự mình viết code. Vậy có vấn đề gì mà SFC lại phản đối Github đến vậy? Ngắn gọn là: SFC cảm thấy “không ưng” với việc Github (hay cao hơn là Microsoft, chủ sở hữu hiện tại của Github sau khi mua lại nền tảng này vào năm 2018 với giá 7.5 tỉ USD) sử dụng code nguồn mở được lưu trữ trên Github, để làm dữ liệu dạy cho Copilot, và sau đó đi thu tiền của người dùng. Và tệ hơn: Github không “ghi nguồn” khi Copilot đề xuất code của người dùng Github cho người dùng khác đang dùng Copilot. 🏞️Vấn đề ở đây giống như giới nhiếp ảnh. Bạn dùng ảnh của người khác, kể cả họ không bắt trả tiền, trách nhiệm đạo đức (và thậm chí nghĩa vụ theo luật, tùy quốc gia) của bạn vẫn là dẫn nguồn hoặc ghi tên tác giả. Microsoft tận dụng nguồn code nguồn mở khổng lồ từ Github, kết hợp với GPT-3, một mô hình máy học nổi tiếng của OpenAI để tạo ra Copilot, với mục đích như đã nói ở trên. Tuy nhiên, Copilot chỉ có thể đưa ra đề xuất code chứ không thể dẫn nguồn đoạn code hoặc repo cụ thể nào giúp nó đưa ra đoạn code đề xuất. Việc này không khác gì Microsoft tự nhiên sử dụng công sức của cộng đồng công nghệ, làm công cụ kiếm tiền từ chính cộng đồng đó. Và ngoài Github ra, gần như không có nền tảng nào tương tự (Gitlab, Amazon, v.v) có thể có được nguồn dữ liệu nguồn mở lớn đến vậy. 💡Giải pháp cho chuyện này: Ngừng Copilot lại. Hoặc Github phải đánh dấu và ghi nguồn rõ ràng cụ thể từng dòng code mà Copilot tạo ra. Một giải pháp nữa đó là kệ nó. Bản thân dữ liệu dùng trong phát triển Copilot mà Microsoft công bố là dữ liệu nguồn mở. Tức cộng đồng đã “vô hình” đồng ý với việc những đoạn code đó có thể được sử dụng bởi bất kỳ ai, mà cũng không nhất thiết phải trích dẫn nguồn. Thế giới công nghệ vẫn còn là Miền Viễn Tây, không có luật lệ rõ ràng cho tất cả mọi thứ. Một thời gian ngắn nữa thôi, chúng ta sẽ tiếp tục phải hoài nghi về Dall-E, công cụ đang được coi như có thể thay thế tất cả họa sĩ. Nhưng vẻ đẹp của thế giới này cũng nằm ở chỗ tất cả dữ liệu đều đã ở đó sẵn, chúng ta chỉ đang dần dần khám phá ra cách sử dụng chúng một cách tối ưu để khiến cho cuộc sống của chúng ta dễ dàng và tốt đẹp hơn.

Copilot works so well because it steals open source code and strips credit

TNW | Neural

Copilot works so well because it steals open source code and strips credit

6 tháng 7 năm 2022 am 8:01

 • 

113 lượt xem

Bình luận 2