Tầm quan trọng của mạng trong thời đại AI và hướng đổi mới
Sự xuất hiện của thời đại mô hình lớn đã khiến mạng trở thành một phần quan trọng trong lĩnh vực AI. Khi khoảng cách giữa quy mô mô hình và giới hạn sức mạnh tính toán của một thẻ đồ họa ngày càng lớn, cụm máy chủ đa trở thành phương pháp chính để giải quyết việc đào tạo mô hình, đây cũng là cơ sở để nâng cao vị thế của mạng trong thời đại AI. So với trước đây chủ yếu được sử dụng để truyền tải dữ liệu, ngày nay mạng ngày càng được sử dụng nhiều hơn để đồng bộ hóa các tham số mô hình giữa các thẻ đồ họa, đặt ra yêu cầu cao hơn về độ dày và dung lượng của mạng.
Nhu cầu mạng chủ yếu xuất phát từ ba khía cạnh:
Kích thước mô hình ngày càng lớn dẫn đến thời gian đào tạo tăng, cần phải nâng cao hiệu suất tính toán để rút ngắn thời gian. Việc nâng cao sức mạnh tính toán trên một thiết bị là có giới hạn, chỉ có thể nâng cao tổng sức mạnh tính toán bằng cách mở rộng số lượng thiết bị và hiệu suất song song.
Giao tiếp phức tạp khi đồng bộ nhiều card. Trong quá trình huấn luyện mô hình lớn, sau mỗi lần tính toán, cần phải căn chỉnh giữa các card đơn, điều này đặt ra yêu cầu cao hơn cho việc truyền tải và trao đổi mạng.
Chi phí sự cố rất cao. Việc đào tạo mô hình lớn kéo dài hàng tháng, sự gián đoạn có thể gây ra tổn thất lớn. Bất kỳ sự cố nào trong mạng cũng có thể dẫn đến sự gián đoạn, do đó yêu cầu về tính ổn định của mạng là rất cao.
Đối mặt với những nhu cầu này, đổi mới mạng chủ yếu tập trung vào các hướng sau:
Thay đổi môi trường truyền thông. Ba loại môi trường chính là ánh sáng, đồng và silicon đều có ưu điểm riêng, đang cạnh tranh trong các tình huống khác nhau. Mô-đun quang không chỉ theo đuổi tốc độ cao mà còn giảm chi phí thông qua các phương pháp như LPO, quang silicon. Cáp đồng chiếm ưu thế trong việc kết nối trong tủ với lợi thế chi phí. Các công nghệ mới như Chiplet, Wafer-scaling đang khám phá giới hạn của kết nối dựa trên silicon.
Cạnh tranh giao thức mạng. Giao thức giao tiếp trong nút gắn chặt với GPU, như NVLINK, Infinity Fabric, v.v. Cạnh tranh giữa các nút chủ yếu là giữa IB và Ethernet.
Thay đổi kiến trúc mạng. Kiến trúc lá-gốc hiện tại thể hiện những hạn chế dưới các cụm siêu lớn, các kiến trúc mới như Dragonfly, Rail-only có khả năng trở thành hướng phát triển của thế hệ cụm siêu lớn tiếp theo.
Đổi mới trong bộ chuyển mạch. Bộ chuyển mạch quang ngày càng được chú ý nhờ vào độ trễ thấp, tiêu thụ điện năng thấp và các lợi thế khác. Bộ chuyển mạch điện thì liên tục đổi mới ở cấp độ vi mạch.
Đổi mới cụm trung tâm dữ liệu. Khi công suất của từng trung tâm dữ liệu gần đạt giới hạn, cách thực hiện kết nối hiệu quả giữa các trung tâm dữ liệu trở thành một hướng nghiên cứu mới.
Tổng thể mà nói, đổi mới mạng trong thời đại AI đang tiến triển theo ba hướng: giảm chi phí, mở cửa và quy mô hóa. Hệ thống truyền thông như một kỹ thuật hệ thống phức tạp, cần phải liên tục đổi mới ở các khâu khác nhau. Các nhà đầu tư có thể chú ý đến các nhà cung cấp thiết bị cốt lõi, đồng thời cũng cần theo dõi những cơ hội ngành nghề do công nghệ mới mang lại.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
20 thích
Phần thưởng
20
3
Chia sẻ
Bình luận
0/400
MemecoinTrader
· 07-08 04:56
tăng giá tín hiệu trong hạ tầng mạng... thời gian để tích trữ $DATA token thật sự
Xem bản gốcTrả lời0
GateUser-cff9c776
· 07-07 05:19
Tối ưu hóa đến tận cùng, thua lỗ đến nơi, phải chăng đây chính là giảm chi phí và nâng cao hiệu quả trong thời đại số?
Đổi mới mạng trong kỷ nguyên AI: Nâng cấp toàn diện từ phương tiện truyền thông đến cụm trung tâm dữ liệu
Tầm quan trọng của mạng trong thời đại AI và hướng đổi mới
Sự xuất hiện của thời đại mô hình lớn đã khiến mạng trở thành một phần quan trọng trong lĩnh vực AI. Khi khoảng cách giữa quy mô mô hình và giới hạn sức mạnh tính toán của một thẻ đồ họa ngày càng lớn, cụm máy chủ đa trở thành phương pháp chính để giải quyết việc đào tạo mô hình, đây cũng là cơ sở để nâng cao vị thế của mạng trong thời đại AI. So với trước đây chủ yếu được sử dụng để truyền tải dữ liệu, ngày nay mạng ngày càng được sử dụng nhiều hơn để đồng bộ hóa các tham số mô hình giữa các thẻ đồ họa, đặt ra yêu cầu cao hơn về độ dày và dung lượng của mạng.
Nhu cầu mạng chủ yếu xuất phát từ ba khía cạnh:
Kích thước mô hình ngày càng lớn dẫn đến thời gian đào tạo tăng, cần phải nâng cao hiệu suất tính toán để rút ngắn thời gian. Việc nâng cao sức mạnh tính toán trên một thiết bị là có giới hạn, chỉ có thể nâng cao tổng sức mạnh tính toán bằng cách mở rộng số lượng thiết bị và hiệu suất song song.
Giao tiếp phức tạp khi đồng bộ nhiều card. Trong quá trình huấn luyện mô hình lớn, sau mỗi lần tính toán, cần phải căn chỉnh giữa các card đơn, điều này đặt ra yêu cầu cao hơn cho việc truyền tải và trao đổi mạng.
Chi phí sự cố rất cao. Việc đào tạo mô hình lớn kéo dài hàng tháng, sự gián đoạn có thể gây ra tổn thất lớn. Bất kỳ sự cố nào trong mạng cũng có thể dẫn đến sự gián đoạn, do đó yêu cầu về tính ổn định của mạng là rất cao.
Đối mặt với những nhu cầu này, đổi mới mạng chủ yếu tập trung vào các hướng sau:
Thay đổi môi trường truyền thông. Ba loại môi trường chính là ánh sáng, đồng và silicon đều có ưu điểm riêng, đang cạnh tranh trong các tình huống khác nhau. Mô-đun quang không chỉ theo đuổi tốc độ cao mà còn giảm chi phí thông qua các phương pháp như LPO, quang silicon. Cáp đồng chiếm ưu thế trong việc kết nối trong tủ với lợi thế chi phí. Các công nghệ mới như Chiplet, Wafer-scaling đang khám phá giới hạn của kết nối dựa trên silicon.
Cạnh tranh giao thức mạng. Giao thức giao tiếp trong nút gắn chặt với GPU, như NVLINK, Infinity Fabric, v.v. Cạnh tranh giữa các nút chủ yếu là giữa IB và Ethernet.
Thay đổi kiến trúc mạng. Kiến trúc lá-gốc hiện tại thể hiện những hạn chế dưới các cụm siêu lớn, các kiến trúc mới như Dragonfly, Rail-only có khả năng trở thành hướng phát triển của thế hệ cụm siêu lớn tiếp theo.
Đổi mới trong bộ chuyển mạch. Bộ chuyển mạch quang ngày càng được chú ý nhờ vào độ trễ thấp, tiêu thụ điện năng thấp và các lợi thế khác. Bộ chuyển mạch điện thì liên tục đổi mới ở cấp độ vi mạch.
Đổi mới cụm trung tâm dữ liệu. Khi công suất của từng trung tâm dữ liệu gần đạt giới hạn, cách thực hiện kết nối hiệu quả giữa các trung tâm dữ liệu trở thành một hướng nghiên cứu mới.
Tổng thể mà nói, đổi mới mạng trong thời đại AI đang tiến triển theo ba hướng: giảm chi phí, mở cửa và quy mô hóa. Hệ thống truyền thông như một kỹ thuật hệ thống phức tạp, cần phải liên tục đổi mới ở các khâu khác nhau. Các nhà đầu tư có thể chú ý đến các nhà cung cấp thiết bị cốt lõi, đồng thời cũng cần theo dõi những cơ hội ngành nghề do công nghệ mới mang lại.