字节跳动开发的HuMo AI可通过文本、图像及音频输入生成高质量人体视频,并提供精准控制与自然动作驱动。