Qwen 팀의 세 가지 새로운 Embodied AI 모델인 Qwen-RobotSuite를 분석합니다. Qwen3.5-4B를 기반으로 만들어진 Vision-Language-Action 모델인 RobotManip에 대해 다루고, language-conditioned video world modeling인 RobotWorld에 대해 다루고 있습니다...
새로운 모델은 기능과 가격 대비 성능의 경계를 재설정합니다. 팀은 출시로 인해 달러당 가능한 것이 바뀔 때마다 무엇을 구축할지 재평가합니다.
요약은 정보 제공 목적으로만 집계되었습니다. 전체 내용을 보려면 소스 링크를 따르세요. 데모 항목은 예시입니다.