阿里巴巴在科技創(chuàng)新的道路上再次邁出重要一步,正式推出了全新的推理模型——通義千問(wèn)QwQ-32B,并宣布在全球范圍內(nèi)以Apache2.0協(xié)議開源。這一舉措不僅意味著開發(fā)者可以免費(fèi)獲取并使用這一尖端技術(shù),還展現(xiàn)了阿里巴巴在推動(dòng)AI技術(shù)普及和應(yīng)用方面的堅(jiān)定決心。
千問(wèn)QwQ-32B是阿里巴巴通義團(tuán)隊(duì)經(jīng)過(guò)多輪大規(guī)模強(qiáng)化學(xué)習(xí)訓(xùn)練后的成果。在數(shù)學(xué)、代碼及通用能力上,該模型實(shí)現(xiàn)了顯著提升,其性能與業(yè)界知名的DeepSeek-R1模型不相上下。尤為千問(wèn)QwQ-32B在保持高性能的同時(shí),還極大地降低了部署成本,使得用戶即便在消費(fèi)級(jí)顯卡上也能輕松實(shí)現(xiàn)本地部署。
據(jù)了解,千問(wèn)QwQ-32B的研發(fā)過(guò)程歷經(jīng)艱辛。阿里巴巴通義團(tuán)隊(duì)在冷啟動(dòng)的基礎(chǔ)上,針對(duì)數(shù)學(xué)、編程任務(wù)以及通用能力進(jìn)行了兩輪深入的大規(guī)模強(qiáng)化學(xué)習(xí),最終在32B的模型尺寸上取得了令人矚目的推理能力提升。這一成果不僅驗(yàn)證了大規(guī)模強(qiáng)化學(xué)習(xí)在提升模型性能方面的巨大潛力,也為未來(lái)的AI技術(shù)發(fā)展提供了寶貴經(jīng)驗(yàn)。
在多個(gè)權(quán)威基準(zhǔn)測(cè)試中,千問(wèn)QwQ-32B的表現(xiàn)均十分亮眼。在數(shù)學(xué)能力測(cè)試AIME24評(píng)測(cè)集上,以及代碼能力評(píng)估LiveCodeBench中,千問(wèn)QwQ-32B的表現(xiàn)與DeepSeek-R1相當(dāng),遠(yuǎn)超OpenAI-o1-mini及相同尺寸的R1蒸餾模型。在由meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評(píng)測(cè)榜”LiveBench、谷歌提出的指令遵循能力IFeval評(píng)測(cè)集,以及加州大學(xué)伯克利分校等提出的評(píng)估準(zhǔn)確調(diào)用函數(shù)或工具方面的BFCL測(cè)試中,千問(wèn)QwQ-32B均取得了超越DeepSeek-R1的優(yōu)異成績(jī)。
千問(wèn)QwQ-32B不僅具備強(qiáng)大的推理能力,還具備低資源消耗的特點(diǎn),非常適合需要快速響應(yīng)或?qū)?shù)據(jù)安全要求較高的應(yīng)用場(chǎng)景。開發(fā)者和企業(yè)可以在消費(fèi)級(jí)硬件上輕松實(shí)現(xiàn)本地部署,并根據(jù)實(shí)際需求進(jìn)行高度定制化的AI解決方案開發(fā)。這一特性無(wú)疑將極大地推動(dòng)AI技術(shù)的普及和應(yīng)用。
千問(wèn)QwQ-32B還集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過(guò)程。這一創(chuàng)新性的設(shè)計(jì)使得千問(wèn)QwQ-32B在應(yīng)對(duì)復(fù)雜問(wèn)題時(shí)更加靈活和智能,也為未來(lái)的AI技術(shù)發(fā)展提供了新的思路。
目前,千問(wèn)QwQ-32B已在多個(gè)平臺(tái)如魔搭社區(qū)、HuggingFace及GitHub上基于寬松的Apache2.0協(xié)議開源。用戶可以通過(guò)這些平臺(tái)免費(fèi)下載模型進(jìn)行本地部署,或者通過(guò)阿里云百煉平臺(tái)直接調(diào)用模型API服務(wù)。對(duì)于需要云端部署的用戶,阿里云PAI平臺(tái)提供了快速部署、模型微調(diào)、評(píng)測(cè)和應(yīng)用搭建等一站式服務(wù)。用戶還可以選擇容器服務(wù)ACK搭配阿里云GPU算力(如GPU云服務(wù)器、容器計(jì)算服務(wù)ACS等),實(shí)現(xiàn)模型容器化部署和高效推理。
自2023年以來(lái),阿里巴巴通義團(tuán)隊(duì)已經(jīng)開源了200多款模型,涵蓋了文本生成、視覺(jué)理解/生成、語(yǔ)音理解/生成、文生圖及視頻模型等全模態(tài)領(lǐng)域,以及從0.5B到110B等全尺寸參數(shù)范圍。其中,千問(wèn)Qwen系列模型在全球范圍內(nèi)受到了廣泛關(guān)注和認(rèn)可,衍生模型數(shù)量已突破10萬(wàn),成為全球最大的開源模型族群之一。