Công nghệ robot hình người đạt được cột mốc đột phá: 1X hợp tác với Nvidia mở ra chương mới cho trí tuệ vật lý.

Tại trụ sở chính của 1X Technologies ở San Francisco, một cảnh tượng lịch sử đang diễn ra – robot hình người NEO Gamma đã trao một chiếc áo khoác da màu đen được thiết kế đặc biệt cho CEO của Nvidia, Huang Renxun. Hành động đơn giản này ẩn chứa sự đột phá lớn trong sự phát triển tích hợp giữa công nghệ robot và trí tuệ nhân tạo. Cuộc gặp gỡ đặc biệt sau hội nghị GTC năm 2025 không chỉ thể hiện sự đột phá trong khả năng tương tác của robot hình người mà còn đánh dấu sự hợp tác chiến lược giữa 1X và Nvidia tiến vào giai đoạn thực chất.

Cột mốc đột phá công nghệ robot hình người: 1X hợp tác cùng Nvidia mở ra chương mới về trí tuệ thể chất

Nguồn ảnh: 1X chính thức

Xem xét “việc truyền áo khoác” để thấy sự đột phá trong trí tuệ thể chất

Chiếc áo khoác da tùy chỉnh được thiết kế bởi thương hiệu ERL ở California, với logo Nvidia gắn trên ngực và một phiên bản logo lớn thêu ở phía sau, hoàn hảo kết hợp phong cách trang phục đặc trưng của Huang Renxun với các yếu tố công nghệ tiên tiến. Sự thành công của cảnh tượng tương tác này được xây dựng dựa trên nhiều đột phá công nghệ cốt lõi của NEO Gamma:

Ở cấp độ thực hiện động tác, robot cần hoàn thành việc lấy và định vị chính xác, kiểm soát lực và lập kế hoạch đường đi. Thông qua mô hình điều khiển thị giác được 1X phát triển, NEO Gamma có khả năng dự đoán đường đi từ dữ liệu cảm biến thô, trong khi cấu trúc mạng nơ-ron của nó cho phép xác định vị trí với độ chính xác đến từng milimét. Trong quá trình giao hàng, robot điều chỉnh lực nắm trong thời gian thực thông qua hệ thống phản hồi xúc giác, đảm bảo chiếc áo không bị kéo quá mức mà vẫn được giao nhận ổn định.

Khả năng tương tác này có được là nhờ mô hình GR00T N1 được phát triển chung bởi 1X và Nvidia. Mô hình này đã thể hiện sự xuất sắc trong thử nghiệm đồng thời: trong bối cảnh gia đình của nhân viên 1X, NEO đã thành công trong việc tự động lấy cốc, truyền từ hai tay và đặt chính xác vào máy rửa chén. Dữ liệu kiểm tra cho thấy tỷ lệ thành công trong việc lấy các vật thể không đều của robot đã tăng lên 98,7%, và hiệu suất hợp tác bằng hai tay cao hơn 42% so với thế hệ sản phẩm trước.

Đổi mới cấu trúc công nghệ: chu trình dữ liệu thúc đẩy sự tiến hóa thông minh

Hợp tác giữa hai bên tập trung vào việc xây dựng một chu trình sinh thái công nghệ hoàn chỉnh. 1X đã mở ra giao diện dữ liệu thế giới thực độc đáo cho Nvidia – API bộ dữ liệu, cho phép truyền tải lên đến 2GB dữ liệu môi trường mỗi giây, bao gồm hơn 3000 tình huống tương tác hàng ngày trong môi trường văn phòng và gia đình. Kết hợp với SDK suy luận chạy ở tần suất 5Hz, GPU của Nvidia có thể thực hiện dự đoán mô hình trong thời gian thực, giảm độ trễ quyết định xuống dưới 200 mili giây.

Cơ chế chu trình dữ liệu này tạo ra giá trị ở ba cấp độ:

Nâng cao khả năng nhận thức môi trường: Thông qua việc triển khai array microphone 4 chiều trên đầu robot, kết hợp với công nghệ hình thành chùm và loại bỏ tiếng vang, tỷ lệ chính xác trong nhận diện lệnh thoại đã tăng lên 95,3%.

Tối ưu hóa kiểm soát chuyển động: Mô hình hóa không gian hành động dựa trên mô hình GR00T giúp tăng độ mượt mà trong chuyển động khớp của robot lên 60%.

Tăng cường hiệu quả quyết định: Sử dụng sức mạnh tính toán song song của GPU H100 Tensor Core của Nvidia, tốc độ tách rời nhiệm vụ phức tạp đã được nâng cao gấp 10 lần.

Trong giai đoạn xác minh công nghệ, hai bên đã sáng tạo áp dụng “phương pháp xác minh quá khớp”: đào tạo mô hình cơ bản trên một tập dữ liệu nhỏ cho đến khi quá khớp, thông qua việc so sánh độ lệch giữa dự đoán lý thuyết và thực tế thực hiện, thành công giữ cho độ đồng bộ lệnh điều khiển trong khoảng ±5ms. Tiêu chuẩn xác minh nghiêm ngặt này tạo ra cơ sở độ tin cậy cho việc ứng dụng quy mô lớn sau này.

Đột phá tiêu dùng: Định nghĩa lại robot dịch vụ gia đình

NEO Gamma nâng cấp tập trung vào nhu cầu cốt lõi của thị trường tiêu dùng, đạt được sự phát triển vượt bậc qua ba chiều:

Hệ thống tương tác an toàn:

Sử dụng vật liệu vỏ mềm, hiệu suất hấp thụ va chạm được cải thiện 70%.

Giới thiệu cơ chế phản hồi lực tiếp xúc, thời gian phản ứng phát hiện tiếp xúc giảm xuống còn 50ms.

Thiết kế khớp an toàn giúp kiểm soát lực va chạm trong trường hợp không may dưới 2N.

Hệ thống tương tác thông minh:

Trang bị mô hình LLM “bạn đồng hành” tự phát triển, hỗ trợ cuộc hội thoại kéo dài đến 20 vòng.

Thư viện biểu hiện ngôn ngữ cơ thể bao gồm 127 kiểu hành động được định sẵn.

Hệ thống ba loa thực hiện đầu ra âm thanh hi-fi 48kHz, độ tự nhiên của giọng nói đạt 4.8/5 (điểm MOS).

Đột phá độ tin cậy phần cứng:

Tuổi thọ hệ thống truyền động kéo dài đến 10000 giờ.

Mức độ ồn khi hoạt động của toàn máy giảm xuống còn 45 decibel (giảm 10dB so với thế hệ trước).

Thời gian giữa các sự cố (MTBF) tăng gấp 10 lần lên 5000 giờ.

Những cải tiến này giúp NEO Gamma có thể hòa nhập liền mạch vào môi trường gia đình. Dữ liệu đo thực tế cho thấy, trong bối cảnh gia đình mô phỏng, robot có thể làm việc liên tục trong 8 giờ hoàn thành 12 loại nhiệm vụ bao gồm sắp xếp đồ dùng ăn uống, giao hàng, tương tác giọng nói với tỷ lệ hoàn thành nhiệm vụ đạt 97,2%.

Hợp tác sinh thái: Mở đầu một mô hình công nghiệp robot hình người mới

Mô hình hợp tác giữa 1X và Nvidia đã cung cấp một hướng đi mới cho sự phát triển của robot hình người. Thông qua việc xây dựng “dữ liệu – thuật toán – phần cứng” trong một chu kỳ ba chiều:

GPU của Nvidia cung cấp công suất tính toán lên đến 200 triệu phép toán mỗi giây.

Hồ dữ liệu thực tế của 1X gia tăng hàng năm đạt cấp độ 1PB.

Phản hồi công nghệ hai chiều đã rút ngắn chu kỳ lặp lại mô hình xuống còn 3 tháng.

Mô hình hợp tác này hiện đang tạo ra hiệu quả rõ rệt: Trong buổi trình diễn gần đây, NEO Gamma đã thể hiện khả năng xử lý đa nhiệm ấn tượng – trong khi sắp xếp bàn ăn, nó cũng trả lời câu hỏi của người dùng và phát nhạc nền đồng thời. Khả năng xử lý đồng thời này dựa trên kiến trúc đa nhân của nền tảng tính toán Orin của Nvidia, cho phép suy luận trên 8 mô hình AI cùng lúc.

Các nhà phân tích ngành chỉ ra rằng giá trị của sự hợp tác này không chỉ nằm ở những đột phá công nghệ mà còn ở việc xây dựng một chu trình tuần hoàn tích cực từ “định nghĩa nhu cầu bối cảnh – nhu cầu thúc đẩy R&D – R&D hồi phục cho hệ sinh thái”. So với các nhà sản xuất khác chỉ theo một con đường công nghệ đơn lẻ, liên minh 1X-Nvidia thể hiện những lợi thế cạnh tranh độc đáo:

Chiều dữ liệu thu thập: Bao phủ cả hai bối cảnh gia đình/văn phòng.

Độ sâu tích hợp công nghệ: Tối ưu hóa dọc từ cấp độ chip đến cấp độ ứng dụng.

Đường đi thương mại hóa: Xu hướng thâm nhập đồng thời vào thị trường tiêu dùng và thị trường công nghiệp.

Tầm nhìn tương lai: trí tuệ thể chất thay đổi cuộc sống con người

Khi NEO Gamma hoàn thành nhiệm vụ rửa chén một cách trôi chảy trong buổi trình diễn, kỹ sư có mặt đặc biệt lưu ý: hành động này bao gồm 37 nút điều khiển, liên quan đến việc hợp nhất dữ liệu của 12 bộ cảm biến trong thời gian thực. Khả năng phức tạp này có được từ hơn 5 triệu lần đào tạo mô phỏng và 3000 giờ kiểm tra trong các tình huống thực tế.

Nhìn về tương lai, lộ trình công nghệ mà 1X lập kế hoạch cho thấy:

Năm 2026 đạt được năng lực sản xuất quy mô 100.000 sản phẩm.

Năm 2027 ra mắt mô-đun tương tác cảm xúc.

Năm 2028 đạt được khả năng quyết định hoàn toàn tự chủ.

Đáng chú ý, hệ thống âm thanh của NEO Gamma đã được thiết kế với giao diện mở rộng. Bộ loa trầm ở vùng xương chậu không chỉ dùng để phát nhạc, mà trong tương lai có thể phát hiện vật liệu mặt đất thông qua cảm biến rung – công nghệ đổi mới này cho phép robot tự động điều chỉnh chiến lược đi bộ để thích ứng với các môi trường nhà khác nhau từ sàn gỗ đến thảm.