IT之家 6 月 24 日消息,阿里巴巴千问大模型今天正式发布 Qwen-AgentWorld,官方称这是首个原生语言世界模型,能够在七大领域中模拟智能体交互环境,提供两种规模(35B-A3B 与 397B-A17B)。同步发布的还有 AgentWorldBench—— 覆盖七大领域的语言世界模型评测基准,每条测试样本均配备真实环境执行所得的真实环境观测数据。模型与评测基准可从 Hugging Face 和 ModelScope 获取。IT之家附官方介绍如下:AgentWorldBench 已在 Hugging Face 上发布,以按领域划分的 JSONL 文件形式提供,每个文件包含来自真实环境的交互轨迹及对应的真实观测数据。