阿里巴巴(09988.HK) +2.400 (+2.057%) 沽空 $6.57億; 比率 13.730% 通義千問於內地微訊發布更小尺寸新模型——Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 。
帖文指,今次大幅提升新模型性能。在非推理領域,Qwen3-4B-Instruct-2507 全面超越了閉源的 GPT4.1-Nano;在推理領域,Qwen3-4B-Thinking-2507能夠和中等規模的 Qwen3-30B-A3B (thinking)媲美。
通義千問相信, 小型語言模型(SLM)對代理式人工智能(Agentic AI)的發展極具價值。「2507」版本的 Qwen3-4B 模型不但體積小,而且性能強,同時有利於手機等端側硬件部署,期待更多的AI硬件採用Qwen3-4B-2507新模型系列。目前新模型已在魔搭社區、Hugging Face正式開源。(ca/u)
(港股報價延遲最少十五分鐘。沽空資料截至 2025-08-07 12:25。)
AASTOCKS新聞