Gần đây thấy nhà sáng lập DeepMind Hassabis trong một cuộc phỏng vấn tại YC, có một số quan điểm khá chấn động. Ông nói rằng nếu bạn bắt đầu một dự án công nghệ sâu trong vòng mười năm, phải tính đến việc AGI xuất hiện giữa chừng trong kế hoạch. Đây không phải là lời nói suông, thời gian cá nhân của ông là khoảng năm 2030.



Nghe ông nói chi tiết kỹ thuật mới hiểu tại sao AGI còn thiếu một hai mảnh ghép. Các công nghệ như huấn luyện trước quy mô lớn, RLHF, chuỗi suy nghĩ đã được chứng minh rồi, ông rất chắc chắn chúng sẽ trở thành phần cuối cùng của kiến trúc AGI. Nhưng học liên tục, suy luận dài hạn, một số khía cạnh của trí nhớ vẫn chưa thực sự giải quyết được. Cách làm hiện tại chủ yếu là nhồi tất cả mọi thứ vào khung ngữ cảnh, điều này khá thô sơ. Ông lấy ví dụ, một cửa sổ ngữ cảnh 1 triệu token trông có vẻ lớn, nhưng nếu xử lý luồng video trực tiếp, thực ra chỉ đủ 20 phút dữ liệu. Muốn hệ thống hiểu cuộc sống của bạn trong một hoặc hai tháng, còn xa lắm.

Vấn đề suy luận còn thú vị hơn. Ông thường lấy Gemini chơi cờ để quan sát, phát hiện đôi khi nó nhận ra nước đi không tốt, nhưng không tìm ra lựa chọn tốt hơn, kết quả vẫn đi nước cờ dở. Hệ thống suy luận chính xác không nên như vậy. Đó là lý do vì sao ta thấy hiện tượng “hình răng cưa trí tuệ” — có thể giải các đề thi vàng IMO, nhưng lại bị toán tiểu học làm khó.

Về phần Agent, ông thừa nhận chúng ta mới bắt đầu. Để đạt AGI, cần có một hệ thống có thể chủ động giải quyết vấn đề cho bạn, đó chính là con đường của Agent. Nhưng hiện tại vẫn đang trong giai đoạn thử nghiệm, đa số các trường hợp vẫn chỉ là phần bổ sung. Ông đề cập chưa thấy ai dùng AI để tạo ra game AAA đứng đầu bảng xếp hạng ứng dụng, theo lượng công suất và công cụ hiện tại, về lý thuyết là có thể, nhưng chưa xảy ra. Điều này cho thấy còn thiếu gì đó trong quy trình hoặc công cụ. Ông dự kiến trong vòng 6 đến 12 tháng tới sẽ thấy được kết quả như vậy.

Điều thú vị là các mô hình nhỏ đang thay đổi toàn bộ quy tắc chơi. Mô hình Flash của họ có thể đạt tới 95% hiệu quả của các mô hình hàng đầu, nhưng chi phí chỉ bằng một phần mười. Phương pháp蒸餾 này vốn do DeepMind phát minh, hiện vẫn là hàng đầu thế giới. Họ còn có động lực cực lớn để tối ưu — Google đang tích hợp Gemini vào từng sản phẩm, liên quan đến hàng tỷ người dùng. Điều này có nghĩa là phải cực kỳ nhanh, hiệu quả cao, chi phí cực thấp. Ông không nghĩ đã chạm tới giới hạn lý thuyết thông tin, sau khi ra mắt một mô hình hàng đầu, trong vòng nửa năm đến một năm, khả năng của nó có thể nén vào các mô hình chạy trên thiết bị biên.

Về ứng dụng khoa học, Isomorphic Labs tiến bộ rất tốt, AlphaFold chỉ là một phần trong quy trình phát hiện thuốc. Mục tiêu cuối cùng của họ là tạo ra một tế bào ảo hoàn chỉnh, một mô phỏng tế bào toàn diện có thể tác động gây nhiễu. Dự kiến còn khoảng mười năm nữa mới hoàn thành tế bào ảo đầy đủ, hiện tại bắt đầu từ nhân tế bào ảo.

Lời khuyên thực tế nhất cho các nhà khởi nghiệp là, vấn đề khó và vấn đề đơn giản thực ra khó như nhau, chỉ khác nhau về cách khó. Cuộc đời có hạn, tốt hơn là dành năng lượng vào những việc mà nếu bạn không làm thì thật sự không ai làm. Ngoài ra, trong vài năm tới, sự kết hợp liên ngành sẽ trở nên phổ biến hơn, AI sẽ giúp việc liên ngành dễ dàng hơn. Nhưng điều quan trọng nhất là nghiêm túc với thời gian biểu của AGI, hình dung ra thế giới đó sẽ như thế nào, rồi xây dựng thứ vẫn còn hữu dụng khi thế giới đó đến.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim