Những bước tiến trong trí tuệ nhân tạo đang thay đổi hoàn toàn nhận thức và kỳ vọng của con người đối với Bots. Khi các mô hình ngôn ngữ lớn bắt đầu tương tác với thế giới phần mềm bên ngoài, nhiều người từng nghĩ rằng các tác nhân AI chính là hình thái cuối cùng. Tuy nhiên, khi nhìn lại các tác phẩm khoa học viễn tưởng kinh điển, chúng ta sẽ nhận ra rằng giấc mơ thực sự của con người là có những Bots có thể tương tác trong thế giới vật lý.
Các chuyên gia trong ngành cho rằng một bước đột phá lớn trong lĩnh vực Bots sắp diễn ra. Những tiến bộ trong trí tuệ nhân tạo trong những năm gần đây đang định hình lại bối cảnh ngành, trong khi những cải tiến về công nghệ pin, tối ưu hóa độ trễ và thu thập dữ liệu sẽ tiếp tục định hình bức tranh tương lai. Công nghệ mã hóa cũng sẽ đóng vai trò quan trọng trong quá trình này. An toàn của Bots, tài chính, đánh giá và giáo dục là những lĩnh vực đáng được chú ý.
Yếu tố cách mạng
đột phá trí tuệ nhân tạo
Tiến bộ của các mô hình ngôn ngữ lớn đa phương thức cung cấp "bộ não" cần thiết cho các Bots thực hiện các nhiệm vụ phức tạp. Bots chủ yếu cảm nhận môi trường thông qua thị giác và thính giác. Các mô hình thị giác máy tính truyền thống rất giỏi trong việc phát hiện và phân loại đối tượng, nhưng gặp khó khăn trong việc chuyển đổi thông tin thị giác thành các lệnh hành động có mục đích. Mặc dù các mô hình ngôn ngữ lớn thể hiện xuất sắc trong việc hiểu và tạo ra văn bản, nhưng lại bị hạn chế bởi khả năng cảm nhận thế giới vật lý.
Mô hình thị giác-ngôn ngữ-hành động ( VLA ) giúp Bots có thể tích hợp nhận thức thị giác, hiểu ngôn ngữ và hành động thực thể trong một khung tính toán thống nhất. Mô hình VLA mới nhất với khả năng tổng quát mẫu không và kiến trúc hệ thống đôi đã thiết lập tiêu chuẩn mới trong ngành. Đặc điểm tổng quát mẫu không cho phép Bots thích ứng ngay lập tức với các cảnh mới, vật thể mới và chỉ dẫn mới mà không cần phải đào tạo lại cho từng nhiệm vụ. Kiến trúc hệ thống đôi tách biệt suy luận bậc cao và suy luận nhẹ, đạt được sự kết hợp giữa tư duy giống người và độ chính xác thời gian thực trong Bots hình người thương mại.
Robot kinh tế trở thành hiện thực
Công nghệ thay đổi thế giới đều có đặc điểm chung là khả năng phổ biến. Điện thoại thông minh, máy tính cá nhân, công nghệ in 3D đều đạt được sự phổ biến với mức giá mà tầng lớp trung lưu có thể chi trả. Khi giá của Bots thấp hơn ô tô thông thường hoặc mức thu nhập tối thiểu hàng năm, thì không có gì lạ khi tưởng tượng về một thế giới mà lao động chân tay và các công việc hàng ngày chủ yếu được thực hiện bởi Bots.
từ kho hàng đến thị trường tiêu dùng
Công nghệ Bots đang mở rộng từ các giải pháp kho bãi sang lĩnh vực tiêu dùng. Thế giới này được thiết kế cho con người - con người có thể thực hiện tất cả công việc của Bots chuyên nghiệp, trong khi Bots chuyên nghiệp không thể đảm nhiệm tất cả công việc của con người. Các công ty Bots không còn bị giới hạn trong việc sản xuất Bots dành riêng cho nhà máy, mà chuyển sang phát triển các Bots hình người đa năng hơn. Do đó, công nghệ Bots không chỉ tồn tại ở kho bãi, mà còn thấm nhuần vào cuộc sống hàng ngày.
Chi phí là một trong những nút thắt chính về khả năng mở rộng. Chỉ số quan trọng nhất là chi phí tổng hợp mỗi giờ, được tính bằng: tổng chi phí cơ hội cho việc đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí mua Bots, chia cho tổng thời gian hoạt động của Bots. Chi phí này phải thấp hơn mức lương trung bình của ngành liên quan để có tính cạnh tranh.
Để thâm nhập toàn diện vào lĩnh vực kho bãi, chi phí tổng hợp của Bots mỗi giờ phải thấp hơn 31.39 đô la. Trong khi đó, trong thị trường tiêu dùng lớn nhất - lĩnh vực giáo dục tư nhân và dịch vụ sức khỏe, chi phí này cần được kiểm soát dưới 35.18 đô la. Hiện tại, Bots đang phát triển theo hướng rẻ hơn, hiệu quả hơn và đa năng hơn.
Bước đột phá tiếp theo trong công nghệ Bots
tối ưu hóa pin
Công nghệ pin luôn là điểm nghẽn cho các robot thân thiện với người sử dụng. Các xe điện sớm do giới hạn của công nghệ pin dẫn đến thời gian sử dụng ngắn, chi phí cao và tính thực tiễn thấp nên khó phổ biến, các robot đang phải đối mặt với tình huống tương tự. Hiện tại, thời gian sử dụng của các robot hình người phổ biến chỉ từ 90-120 phút mỗi lần. Rõ ràng, người dùng không muốn sạc pin thủ công sau mỗi hai giờ, vì vậy việc tự sạc và kết nối với cơ sở hạ tầng trở thành hướng phát triển trọng điểm.
Hiện tại, việc sạc cho Bots chủ yếu có hai chế độ: thay pin hoặc sạc trực tiếp. Chế độ thay pin thực hiện công việc liên tục bằng cách thay thế nhanh chóng các bộ pin đã cạn kiệt, tối đa hóa thời gian hoạt động và phù hợp với các tình huống ngoài trời hoặc trong nhà máy. Sạc cảm ứng sử dụng phương pháp cung cấp năng lượng không dây, mặc dù việc sạc đầy mất nhiều thời gian hơn, nhưng có thể dễ dàng thực hiện quy trình hoàn toàn tự động.
tối ưu hóa độ trễ
Hoạt động độ trễ thấp có thể được chia thành hai loại: nhận thức môi trường và điều khiển từ xa. Nhận thức đề cập đến khả năng nhận biết không gian của机器人 đối với môi trường, trong khi điều khiển từ xa chỉ định việc kiểm soát thời gian thực của người điều khiển.
Hệ thống cảm nhận của Bots bắt đầu từ cảm biến giá rẻ, nhưng lợi thế công nghệ nằm ở việc tích hợp phần mềm, tính toán tiêu thụ điện năng thấp và vòng điều khiển chính xác trong mili giây. Khi Bots hoàn thành việc định vị không gian, mạng nơ-ron nhẹ sẽ đánh dấu các yếu tố như chướng ngại vật, khay hoặc con người. Sau khi nhãn cảnh được nhập vào hệ thống lập kế hoạch, ngay lập tức tạo ra các lệnh động cơ gửi đến chân, cụm bánh hoặc cánh tay máy.
Độ trễ cảm nhận dưới 50 mili giây tương đương với tốc độ phản xạ của con người - bất kỳ độ trễ nào vượt quá ngưỡng này sẽ khiến Bots hành động vụng về. Do đó, 90% quyết định cần phải được thực hiện qua một mạng lưới thị giác-ngôn ngữ-hành động duy nhất tại chỗ. Bots hoàn toàn tự động cần đảm bảo mô hình VLA hiệu suất cao có độ trễ dưới 50 mili giây; trong khi đó, Bots điều khiển từ xa yêu cầu độ trễ tín hiệu giữa đầu điều khiển và Bots không vượt quá 50 mili giây.
Tối ưu hóa thu thập dữ liệu
Có ba cách chính để thu thập dữ liệu: dữ liệu video từ thế giới thực, dữ liệu tổng hợp và dữ liệu điều khiển từ xa. Nút thắt chính của dữ liệu thực và dữ liệu tổng hợp là việc thu hẹp sự khác biệt giữa hành vi vật lý của mã hóa và mô hình video/mô phỏng. Dữ liệu video thực thiếu thông tin phản hồi lực, sai số chuyển động khớp và các chi tiết vật lý như biến dạng vật liệu; trong khi dữ liệu mô phỏng lại thiếu các biến không thể đoán trước như lỗi cảm biến và hệ số ma sát.
Cách thu thập dữ liệu tiềm năng nhất là điều khiển từ xa - do người vận hành điều khiển Bots thực hiện nhiệm vụ từ xa. Nhưng chi phí lao động là yếu tố hạn chế chính đối với việc thu thập dữ liệu điều khiển từ xa.
Phát triển phần cứng tùy chỉnh đang cung cấp các giải pháp mới cho việc thu thập dữ liệu chất lượng cao. Một số công ty kết hợp các phương pháp chính thống với phần cứng tùy chỉnh để thu thập dữ liệu chuyển động của con người ở nhiều chiều, sau khi xử lý sẽ chuyển đổi thành tập dữ liệu phù hợp cho việc đào tạo mạng nơ-ron của Bots, kết hợp với chu kỳ lặp nhanh để cung cấp lượng lớn dữ liệu chất lượng cao cho việc đào tạo AI Bots. Những kênh công nghệ này đã rút ngắn con đường chuyển đổi từ dữ liệu thô đến Bots có thể triển khai.
Lĩnh vực khám phá chính
mã hóa kỹ thuật và Bots融合
Mã hóa có thể khuyến khích các bên không tin cậy nâng cao hiệu quả của mạng Bots. Dựa trên các lĩnh vực chính đã đề cập trước đó, mã hóa có thể nâng cao hiệu quả trong ba lĩnh vực: tích hợp cơ sở hạ tầng, tối ưu hóa độ trễ và thu thập dữ liệu.
Mạng lưới cơ sở hạ tầng vật lý phi tập trung ( DePIN ) hứa hẹn sẽ cách mạng hóa cơ sở hạ tầng sạc. Khi các robot hình người hoạt động toàn cầu như ô tô, các trạm sạc cần phải dễ dàng tiếp cận như các trạm xăng. Mạng lưới tập trung cần đầu tư ban đầu khổng lồ, trong khi DePIN sẽ phân chia chi phí cho các nhà điều hành nút, giúp các cơ sở sạc mở rộng nhanh chóng đến nhiều khu vực hơn.
DePIN cũng có thể sử dụng hạ tầng phân tán để tối ưu hóa độ trễ điều khiển từ xa. Bằng cách tổng hợp tài nguyên tính toán từ các nút biên phân tán về mặt địa lý, các lệnh điều khiển từ xa có thể được xử lý bởi các nút địa phương hoặc nút gần nhất có sẵn, tối đa hóa việc rút ngắn khoảng cách truyền dữ liệu và giảm đáng kể độ trễ giao tiếp.
Điều khiển từ xa là phương pháp thu thập dữ liệu có tiềm năng nhất, nhưng chi phí để các thực thể trung tâm thuê chuyên gia thu thập dữ liệu là rất cao. DePIN khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa thông qua mã thông báo mã hóa để giải quyết vấn đề này. Một số dự án đang xây dựng mạng lưới điều hành từ xa toàn cầu, chuyển đổi đóng góp của họ thành tài sản số hóa có thể mã hóa, tạo ra hệ thống phi tập trung không cần cấp phép - người tham gia vừa có thể kiếm lợi nhuận, vừa có thể tham gia quản trị và hỗ trợ việc đào tạo Bots AGI.
An toàn luôn là mối quan tâm hàng đầu
Mục tiêu tối thượng của công nghệ robot là đạt được sự tự chủ hoàn toàn, nhưng điều mà con người không muốn thấy là sự tự chủ biến robot thành vũ khí tấn công. Các vấn đề an toàn của mô hình ngôn ngữ lớn đã thu hút sự chú ý, và khi những mô hình này có khả năng hành động vật lý, an toàn robot trở thành điều kiện tiên quyết cho sự chấp nhận của xã hội.
An ninh kinh tế là một trong những trụ cột cho sự phát triển của hệ sinh thái Bots. Một số công ty đang xây dựng lớp điều phối máy móc phi tập trung, thông qua mã hóa để thực hiện xác thực danh tính thiết bị, xác minh sự tồn tại vật lý và truy cập tài nguyên. Khác với việc quản lý thị trường nhiệm vụ đơn giản, các hệ thống này cho phép Bots tự chứng minh thông tin danh tính, vị trí địa lý và hồ sơ hành vi mà không cần phụ thuộc vào trung gian tập trung.
Ràng buộc hành vi và xác thực danh tính được thực hiện thông qua cơ chế trên chuỗi, đảm bảo bất kỳ ai cũng có thể kiểm toán tính tuân thủ. Các Bots đáp ứng tiêu chuẩn an toàn, yêu cầu chất lượng và quy định khu vực sẽ nhận được phần thưởng, trong khi những người vi phạm sẽ phải đối mặt với hình phạt hoặc bị loại bỏ, từ đó thiết lập cơ chế trách nhiệm và tin cậy trong mạng lưới máy móc tự trị.
Mạng tái cầm cố bên thứ ba cũng có thể cung cấp bảo đảm an toàn tương đương. Mặc dù hệ thống tham số hình phạt vẫn cần hoàn thiện, các công nghệ liên quan đã bước vào giai đoạn thực tiễn. Dự kiến các tiêu chuẩn an toàn của ngành sẽ sớm hình thành, lúc đó các tham số hình phạt sẽ được mô hình hóa theo các tiêu chuẩn này.
Lấp đầy khoảng trống trong công nghệ robot
Khác với AI, lĩnh vực Bots khó có thể tham gia khi nguồn vốn hạn chế. Để phổ biến Bots, ngưỡng phát triển cần phải giảm xuống mức độ thuận tiện như phát triển ứng dụng AI. Có không gian cải thiện ở ba cấp độ: cơ chế tài chính, hệ thống đánh giá và hệ sinh thái giáo dục.
Tài trợ là điểm đau trong lĩnh vực robot. Việc phát triển chương trình máy tính chỉ cần một chiếc máy tính và tài nguyên điện toán đám mây, trong khi xây dựng một robot hoàn chỉnh chức năng phải mua sắm động cơ, cảm biến, pin và các phần cứng khác, chi phí dễ dàng vượt qua 100.000 USD. Đặc tính phần cứng này khiến việc phát triển robot kém linh hoạt hơn và có chi phí cao hơn so với AI.
Cơ sở hạ tầng đánh giá Bots trong các tình huống thực tế vẫn đang ở giai đoạn sơ khai. Lĩnh vực AI đã thiết lập một hệ thống hàm mất mát rõ ràng, việc kiểm tra có thể được hoàn toàn ảo hóa. Tuy nhiên, các chiến lược ảo xuất sắc không thể chuyển đổi trực tiếp thành các giải pháp hiệu quả trong thế giới thực. Bots cần có cơ sở đánh giá để kiểm tra các chiến lược tự chủ trong môi trường thực tế đa dạng, để có thể thực hiện việc tối ưu hóa lặp lại.
Khi hạ tầng này trưởng thành, nhân tài sẽ đổ về ồ ạt, và robot hình người sẽ tái hiện đường cong bùng nổ của Web2. Một số công ty đang phát triển "hệ điều hành Android phiên bản robot", biến phần cứng nguyên thủy thành các thực thể thông minh có khả năng nâng cấp và có ý thức kinh tế. Các mô-đun lập kế hoạch thị giác, ngôn ngữ và chuyển động có thể cắm và chạy như ứng dụng trên điện thoại, tất cả các bước suy luận đều được trình bày bằng tiếng Anh rõ ràng, cho phép người điều hành kiểm toán hoặc điều chỉnh hành vi mà không cần tiếp xúc với firmware. Khả năng suy luận bằng ngôn ngữ tự nhiên này cho phép thế hệ nhân tài mới bước vào lĩnh vực robot một cách liền mạch, đánh dấu một bước quan trọng trong việc tạo ra nền tảng mở cho cuộc cách mạng robot.
Mật độ nhân tài quyết định quỹ đạo ngành. Hệ thống giáo dục toàn diện có cấu trúc là rất quan trọng đối với việc cung cấp nhân tài trong lĩnh vực Bots. Một số công ty đang triển khai chương trình giáo dục chung dựa trên Bots hình người tại các trường công K-12 ở Mỹ. Chương trình này được thiết kế có tính độc lập về nền tảng, có thể thích ứng với nhiều hình thức Bots khác nhau, cung cấp cơ hội thực hành cho học sinh. Tín hiệu tích cực này củng cố phán đoán của các chuyên gia trong ngành: trong những năm tới, mức độ phong phú của tài nguyên giáo dục Bots sẽ tương đương với lĩnh vực mã hóa.
Triển vọng tương lai
Mô hình thị giác-ngôn ngữ-hành động ( VLA ) với những đổi mới và hiệu ứng quy mô kinh tế đã sinh ra những robot hình người tiết kiệm chi phí, hiệu quả và đa dụng. Khi robot kho bãi mở rộng ra thị trường tiêu dùng, an toàn, mô hình tài chính và hệ thống đánh giá trở thành những hướng khám phá quan trọng. Công nghệ mã hóa sẽ thúc đẩy sự phát triển của robot thông qua ba con đường: cung cấp bảo đảm kinh tế cho sự an toàn, tối ưu hóa cơ sở hạ tầng sạc, nâng cao hiệu suất độ trễ và ống thu thập dữ liệu.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
19 thích
Phần thưởng
19
9
Chia sẻ
Bình luận
0/400
FlashLoanKing
· 07-11 10:49
Lại là đề tài để được chơi cho Suckers?
Xem bản gốcTrả lời0
MagicBean
· 07-11 07:25
Không phải là J.A.R.V.I.S của Iron Man sao?
Xem bản gốcTrả lời0
not_your_keys
· 07-09 16:53
Tôi bây giờ chỉ muốn có một con Bots hầu gái.
Xem bản gốcTrả lời0
MetaverseVagrant
· 07-08 14:58
A! Trí tuệ nhân tạo đang sục sôi.
Xem bản gốcTrả lời0
DeFiVeteran
· 07-08 14:55
Metaverse nhỏ trợ lý? Thật là cao cấp.
Xem bản gốcTrả lời0
YieldHunter
· 07-08 14:55
không nói dối, cái thứ robot này kêu lên sự bong bóng... chỉ là một kế hoạch Ponzi khác mà thật lòng mà nói
Xem bản gốcTrả lời0
GasFeeCrier
· 07-08 14:48
À, lại đến lúc chơi đùa với mọi người rồi, kết cục còn có thể thế nào?
Xem bản gốcTrả lời0
EthSandwichHero
· 07-08 14:46
Nói trắng ra là muốn tạo ra kẻ hủy diệt.
Xem bản gốcTrả lời0
CounterIndicator
· 07-08 14:34
Hoàn toàn không đánh giá cao những bẫy lừa đảo tiền bạc này.
Cách mạng robot do AI điều khiển: Công nghệ mã hóa mang đến tương lai mới cho robot hình người
Cách mạng Bots được thúc đẩy bởi AI và mã hóa
Những bước tiến trong trí tuệ nhân tạo đang thay đổi hoàn toàn nhận thức và kỳ vọng của con người đối với Bots. Khi các mô hình ngôn ngữ lớn bắt đầu tương tác với thế giới phần mềm bên ngoài, nhiều người từng nghĩ rằng các tác nhân AI chính là hình thái cuối cùng. Tuy nhiên, khi nhìn lại các tác phẩm khoa học viễn tưởng kinh điển, chúng ta sẽ nhận ra rằng giấc mơ thực sự của con người là có những Bots có thể tương tác trong thế giới vật lý.
Các chuyên gia trong ngành cho rằng một bước đột phá lớn trong lĩnh vực Bots sắp diễn ra. Những tiến bộ trong trí tuệ nhân tạo trong những năm gần đây đang định hình lại bối cảnh ngành, trong khi những cải tiến về công nghệ pin, tối ưu hóa độ trễ và thu thập dữ liệu sẽ tiếp tục định hình bức tranh tương lai. Công nghệ mã hóa cũng sẽ đóng vai trò quan trọng trong quá trình này. An toàn của Bots, tài chính, đánh giá và giáo dục là những lĩnh vực đáng được chú ý.
Yếu tố cách mạng
đột phá trí tuệ nhân tạo
Tiến bộ của các mô hình ngôn ngữ lớn đa phương thức cung cấp "bộ não" cần thiết cho các Bots thực hiện các nhiệm vụ phức tạp. Bots chủ yếu cảm nhận môi trường thông qua thị giác và thính giác. Các mô hình thị giác máy tính truyền thống rất giỏi trong việc phát hiện và phân loại đối tượng, nhưng gặp khó khăn trong việc chuyển đổi thông tin thị giác thành các lệnh hành động có mục đích. Mặc dù các mô hình ngôn ngữ lớn thể hiện xuất sắc trong việc hiểu và tạo ra văn bản, nhưng lại bị hạn chế bởi khả năng cảm nhận thế giới vật lý.
Mô hình thị giác-ngôn ngữ-hành động ( VLA ) giúp Bots có thể tích hợp nhận thức thị giác, hiểu ngôn ngữ và hành động thực thể trong một khung tính toán thống nhất. Mô hình VLA mới nhất với khả năng tổng quát mẫu không và kiến trúc hệ thống đôi đã thiết lập tiêu chuẩn mới trong ngành. Đặc điểm tổng quát mẫu không cho phép Bots thích ứng ngay lập tức với các cảnh mới, vật thể mới và chỉ dẫn mới mà không cần phải đào tạo lại cho từng nhiệm vụ. Kiến trúc hệ thống đôi tách biệt suy luận bậc cao và suy luận nhẹ, đạt được sự kết hợp giữa tư duy giống người và độ chính xác thời gian thực trong Bots hình người thương mại.
Robot kinh tế trở thành hiện thực
Công nghệ thay đổi thế giới đều có đặc điểm chung là khả năng phổ biến. Điện thoại thông minh, máy tính cá nhân, công nghệ in 3D đều đạt được sự phổ biến với mức giá mà tầng lớp trung lưu có thể chi trả. Khi giá của Bots thấp hơn ô tô thông thường hoặc mức thu nhập tối thiểu hàng năm, thì không có gì lạ khi tưởng tượng về một thế giới mà lao động chân tay và các công việc hàng ngày chủ yếu được thực hiện bởi Bots.
từ kho hàng đến thị trường tiêu dùng
Công nghệ Bots đang mở rộng từ các giải pháp kho bãi sang lĩnh vực tiêu dùng. Thế giới này được thiết kế cho con người - con người có thể thực hiện tất cả công việc của Bots chuyên nghiệp, trong khi Bots chuyên nghiệp không thể đảm nhiệm tất cả công việc của con người. Các công ty Bots không còn bị giới hạn trong việc sản xuất Bots dành riêng cho nhà máy, mà chuyển sang phát triển các Bots hình người đa năng hơn. Do đó, công nghệ Bots không chỉ tồn tại ở kho bãi, mà còn thấm nhuần vào cuộc sống hàng ngày.
Chi phí là một trong những nút thắt chính về khả năng mở rộng. Chỉ số quan trọng nhất là chi phí tổng hợp mỗi giờ, được tính bằng: tổng chi phí cơ hội cho việc đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí mua Bots, chia cho tổng thời gian hoạt động của Bots. Chi phí này phải thấp hơn mức lương trung bình của ngành liên quan để có tính cạnh tranh.
Để thâm nhập toàn diện vào lĩnh vực kho bãi, chi phí tổng hợp của Bots mỗi giờ phải thấp hơn 31.39 đô la. Trong khi đó, trong thị trường tiêu dùng lớn nhất - lĩnh vực giáo dục tư nhân và dịch vụ sức khỏe, chi phí này cần được kiểm soát dưới 35.18 đô la. Hiện tại, Bots đang phát triển theo hướng rẻ hơn, hiệu quả hơn và đa năng hơn.
Bước đột phá tiếp theo trong công nghệ Bots
tối ưu hóa pin
Công nghệ pin luôn là điểm nghẽn cho các robot thân thiện với người sử dụng. Các xe điện sớm do giới hạn của công nghệ pin dẫn đến thời gian sử dụng ngắn, chi phí cao và tính thực tiễn thấp nên khó phổ biến, các robot đang phải đối mặt với tình huống tương tự. Hiện tại, thời gian sử dụng của các robot hình người phổ biến chỉ từ 90-120 phút mỗi lần. Rõ ràng, người dùng không muốn sạc pin thủ công sau mỗi hai giờ, vì vậy việc tự sạc và kết nối với cơ sở hạ tầng trở thành hướng phát triển trọng điểm.
Hiện tại, việc sạc cho Bots chủ yếu có hai chế độ: thay pin hoặc sạc trực tiếp. Chế độ thay pin thực hiện công việc liên tục bằng cách thay thế nhanh chóng các bộ pin đã cạn kiệt, tối đa hóa thời gian hoạt động và phù hợp với các tình huống ngoài trời hoặc trong nhà máy. Sạc cảm ứng sử dụng phương pháp cung cấp năng lượng không dây, mặc dù việc sạc đầy mất nhiều thời gian hơn, nhưng có thể dễ dàng thực hiện quy trình hoàn toàn tự động.
tối ưu hóa độ trễ
Hoạt động độ trễ thấp có thể được chia thành hai loại: nhận thức môi trường và điều khiển từ xa. Nhận thức đề cập đến khả năng nhận biết không gian của机器人 đối với môi trường, trong khi điều khiển từ xa chỉ định việc kiểm soát thời gian thực của người điều khiển.
Hệ thống cảm nhận của Bots bắt đầu từ cảm biến giá rẻ, nhưng lợi thế công nghệ nằm ở việc tích hợp phần mềm, tính toán tiêu thụ điện năng thấp và vòng điều khiển chính xác trong mili giây. Khi Bots hoàn thành việc định vị không gian, mạng nơ-ron nhẹ sẽ đánh dấu các yếu tố như chướng ngại vật, khay hoặc con người. Sau khi nhãn cảnh được nhập vào hệ thống lập kế hoạch, ngay lập tức tạo ra các lệnh động cơ gửi đến chân, cụm bánh hoặc cánh tay máy.
Độ trễ cảm nhận dưới 50 mili giây tương đương với tốc độ phản xạ của con người - bất kỳ độ trễ nào vượt quá ngưỡng này sẽ khiến Bots hành động vụng về. Do đó, 90% quyết định cần phải được thực hiện qua một mạng lưới thị giác-ngôn ngữ-hành động duy nhất tại chỗ. Bots hoàn toàn tự động cần đảm bảo mô hình VLA hiệu suất cao có độ trễ dưới 50 mili giây; trong khi đó, Bots điều khiển từ xa yêu cầu độ trễ tín hiệu giữa đầu điều khiển và Bots không vượt quá 50 mili giây.
Tối ưu hóa thu thập dữ liệu
Có ba cách chính để thu thập dữ liệu: dữ liệu video từ thế giới thực, dữ liệu tổng hợp và dữ liệu điều khiển từ xa. Nút thắt chính của dữ liệu thực và dữ liệu tổng hợp là việc thu hẹp sự khác biệt giữa hành vi vật lý của mã hóa và mô hình video/mô phỏng. Dữ liệu video thực thiếu thông tin phản hồi lực, sai số chuyển động khớp và các chi tiết vật lý như biến dạng vật liệu; trong khi dữ liệu mô phỏng lại thiếu các biến không thể đoán trước như lỗi cảm biến và hệ số ma sát.
Cách thu thập dữ liệu tiềm năng nhất là điều khiển từ xa - do người vận hành điều khiển Bots thực hiện nhiệm vụ từ xa. Nhưng chi phí lao động là yếu tố hạn chế chính đối với việc thu thập dữ liệu điều khiển từ xa.
Phát triển phần cứng tùy chỉnh đang cung cấp các giải pháp mới cho việc thu thập dữ liệu chất lượng cao. Một số công ty kết hợp các phương pháp chính thống với phần cứng tùy chỉnh để thu thập dữ liệu chuyển động của con người ở nhiều chiều, sau khi xử lý sẽ chuyển đổi thành tập dữ liệu phù hợp cho việc đào tạo mạng nơ-ron của Bots, kết hợp với chu kỳ lặp nhanh để cung cấp lượng lớn dữ liệu chất lượng cao cho việc đào tạo AI Bots. Những kênh công nghệ này đã rút ngắn con đường chuyển đổi từ dữ liệu thô đến Bots có thể triển khai.
Lĩnh vực khám phá chính
mã hóa kỹ thuật và Bots融合
Mã hóa có thể khuyến khích các bên không tin cậy nâng cao hiệu quả của mạng Bots. Dựa trên các lĩnh vực chính đã đề cập trước đó, mã hóa có thể nâng cao hiệu quả trong ba lĩnh vực: tích hợp cơ sở hạ tầng, tối ưu hóa độ trễ và thu thập dữ liệu.
Mạng lưới cơ sở hạ tầng vật lý phi tập trung ( DePIN ) hứa hẹn sẽ cách mạng hóa cơ sở hạ tầng sạc. Khi các robot hình người hoạt động toàn cầu như ô tô, các trạm sạc cần phải dễ dàng tiếp cận như các trạm xăng. Mạng lưới tập trung cần đầu tư ban đầu khổng lồ, trong khi DePIN sẽ phân chia chi phí cho các nhà điều hành nút, giúp các cơ sở sạc mở rộng nhanh chóng đến nhiều khu vực hơn.
DePIN cũng có thể sử dụng hạ tầng phân tán để tối ưu hóa độ trễ điều khiển từ xa. Bằng cách tổng hợp tài nguyên tính toán từ các nút biên phân tán về mặt địa lý, các lệnh điều khiển từ xa có thể được xử lý bởi các nút địa phương hoặc nút gần nhất có sẵn, tối đa hóa việc rút ngắn khoảng cách truyền dữ liệu và giảm đáng kể độ trễ giao tiếp.
Điều khiển từ xa là phương pháp thu thập dữ liệu có tiềm năng nhất, nhưng chi phí để các thực thể trung tâm thuê chuyên gia thu thập dữ liệu là rất cao. DePIN khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa thông qua mã thông báo mã hóa để giải quyết vấn đề này. Một số dự án đang xây dựng mạng lưới điều hành từ xa toàn cầu, chuyển đổi đóng góp của họ thành tài sản số hóa có thể mã hóa, tạo ra hệ thống phi tập trung không cần cấp phép - người tham gia vừa có thể kiếm lợi nhuận, vừa có thể tham gia quản trị và hỗ trợ việc đào tạo Bots AGI.
An toàn luôn là mối quan tâm hàng đầu
Mục tiêu tối thượng của công nghệ robot là đạt được sự tự chủ hoàn toàn, nhưng điều mà con người không muốn thấy là sự tự chủ biến robot thành vũ khí tấn công. Các vấn đề an toàn của mô hình ngôn ngữ lớn đã thu hút sự chú ý, và khi những mô hình này có khả năng hành động vật lý, an toàn robot trở thành điều kiện tiên quyết cho sự chấp nhận của xã hội.
An ninh kinh tế là một trong những trụ cột cho sự phát triển của hệ sinh thái Bots. Một số công ty đang xây dựng lớp điều phối máy móc phi tập trung, thông qua mã hóa để thực hiện xác thực danh tính thiết bị, xác minh sự tồn tại vật lý và truy cập tài nguyên. Khác với việc quản lý thị trường nhiệm vụ đơn giản, các hệ thống này cho phép Bots tự chứng minh thông tin danh tính, vị trí địa lý và hồ sơ hành vi mà không cần phụ thuộc vào trung gian tập trung.
Ràng buộc hành vi và xác thực danh tính được thực hiện thông qua cơ chế trên chuỗi, đảm bảo bất kỳ ai cũng có thể kiểm toán tính tuân thủ. Các Bots đáp ứng tiêu chuẩn an toàn, yêu cầu chất lượng và quy định khu vực sẽ nhận được phần thưởng, trong khi những người vi phạm sẽ phải đối mặt với hình phạt hoặc bị loại bỏ, từ đó thiết lập cơ chế trách nhiệm và tin cậy trong mạng lưới máy móc tự trị.
Mạng tái cầm cố bên thứ ba cũng có thể cung cấp bảo đảm an toàn tương đương. Mặc dù hệ thống tham số hình phạt vẫn cần hoàn thiện, các công nghệ liên quan đã bước vào giai đoạn thực tiễn. Dự kiến các tiêu chuẩn an toàn của ngành sẽ sớm hình thành, lúc đó các tham số hình phạt sẽ được mô hình hóa theo các tiêu chuẩn này.
Lấp đầy khoảng trống trong công nghệ robot
Khác với AI, lĩnh vực Bots khó có thể tham gia khi nguồn vốn hạn chế. Để phổ biến Bots, ngưỡng phát triển cần phải giảm xuống mức độ thuận tiện như phát triển ứng dụng AI. Có không gian cải thiện ở ba cấp độ: cơ chế tài chính, hệ thống đánh giá và hệ sinh thái giáo dục.
Tài trợ là điểm đau trong lĩnh vực robot. Việc phát triển chương trình máy tính chỉ cần một chiếc máy tính và tài nguyên điện toán đám mây, trong khi xây dựng một robot hoàn chỉnh chức năng phải mua sắm động cơ, cảm biến, pin và các phần cứng khác, chi phí dễ dàng vượt qua 100.000 USD. Đặc tính phần cứng này khiến việc phát triển robot kém linh hoạt hơn và có chi phí cao hơn so với AI.
Cơ sở hạ tầng đánh giá Bots trong các tình huống thực tế vẫn đang ở giai đoạn sơ khai. Lĩnh vực AI đã thiết lập một hệ thống hàm mất mát rõ ràng, việc kiểm tra có thể được hoàn toàn ảo hóa. Tuy nhiên, các chiến lược ảo xuất sắc không thể chuyển đổi trực tiếp thành các giải pháp hiệu quả trong thế giới thực. Bots cần có cơ sở đánh giá để kiểm tra các chiến lược tự chủ trong môi trường thực tế đa dạng, để có thể thực hiện việc tối ưu hóa lặp lại.
Khi hạ tầng này trưởng thành, nhân tài sẽ đổ về ồ ạt, và robot hình người sẽ tái hiện đường cong bùng nổ của Web2. Một số công ty đang phát triển "hệ điều hành Android phiên bản robot", biến phần cứng nguyên thủy thành các thực thể thông minh có khả năng nâng cấp và có ý thức kinh tế. Các mô-đun lập kế hoạch thị giác, ngôn ngữ và chuyển động có thể cắm và chạy như ứng dụng trên điện thoại, tất cả các bước suy luận đều được trình bày bằng tiếng Anh rõ ràng, cho phép người điều hành kiểm toán hoặc điều chỉnh hành vi mà không cần tiếp xúc với firmware. Khả năng suy luận bằng ngôn ngữ tự nhiên này cho phép thế hệ nhân tài mới bước vào lĩnh vực robot một cách liền mạch, đánh dấu một bước quan trọng trong việc tạo ra nền tảng mở cho cuộc cách mạng robot.
Mật độ nhân tài quyết định quỹ đạo ngành. Hệ thống giáo dục toàn diện có cấu trúc là rất quan trọng đối với việc cung cấp nhân tài trong lĩnh vực Bots. Một số công ty đang triển khai chương trình giáo dục chung dựa trên Bots hình người tại các trường công K-12 ở Mỹ. Chương trình này được thiết kế có tính độc lập về nền tảng, có thể thích ứng với nhiều hình thức Bots khác nhau, cung cấp cơ hội thực hành cho học sinh. Tín hiệu tích cực này củng cố phán đoán của các chuyên gia trong ngành: trong những năm tới, mức độ phong phú của tài nguyên giáo dục Bots sẽ tương đương với lĩnh vực mã hóa.
Triển vọng tương lai
Mô hình thị giác-ngôn ngữ-hành động ( VLA ) với những đổi mới và hiệu ứng quy mô kinh tế đã sinh ra những robot hình người tiết kiệm chi phí, hiệu quả và đa dụng. Khi robot kho bãi mở rộng ra thị trường tiêu dùng, an toàn, mô hình tài chính và hệ thống đánh giá trở thành những hướng khám phá quan trọng. Công nghệ mã hóa sẽ thúc đẩy sự phát triển của robot thông qua ba con đường: cung cấp bảo đảm kinh tế cho sự an toàn, tối ưu hóa cơ sở hạ tầng sạc, nâng cao hiệu suất độ trễ và ống thu thập dữ liệu.