挑戰 Google 霸權:阿通般若 Qwen-Image-2512 開源發布,重新定義企業級影像生成
阿里巴巴發布阿通般若 Qwen-Image-2512 開源影像模型,挑戰 Google Gemini 3 Pro。採用 Apache 2.0 授權,提供高精度文字排版與寫實影像生成,助力企業降低 AI 部署成本。
AI 影像生成領域競爭進入白熱化。以往由科技巨頭壟斷的高階生產力工具,正迎來翻天覆地的變化。阿里巴巴旗下的 Qwen 團隊近期發布了最新開源模型,直接向 Google 的封閉生態發起挑戰。
阿通般若 Qwen-Image-2512 開源:打破封閉模型定價高牆
繼 Google 在 11 月推出強大的 Gemini 3 Pro Image 後,業界對於高品質影像生成的需求激增。然而,Google 的模型高度依賴其雲端堆棧,且定價不菲。阿里巴巴此時推出的 Qwen-Image-2512,採用 Apache 2.0 授權協議,允許企業自由下載、修改並進行商業化部署,實現了技術的「主權自主」。
性能躍升:三大關鍵技術改良
- 人物真實感:顯著減少「AI 塑膠感」,皮膚紋理與面部表情更加自然生動。
- 材質細節:針對動物皮毛、水面等複雜材質進行最佳化,減少人工修圖成本。
- 文字排版:支持中英雙語,能準確生成無誤字的簡報、海報與資訊圖表。
在 Alibaba Cloud 的 API 定價中,生成單張影像的費用約為 0.075 美元。但對企業而言,開源權重的價值在於能將 AI 整合進私有數據管線,確保資訊安全並有效控制預算。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
Instagram 負責人 Adam Mosseri 針對 2025 年後的趨勢發表評論,指出「無限合成內容」將成為主流,傳統個人社交動態已逝。探討 AI 生成內容如何改變大眾對影像真實性的認知。
軟銀集團正式完成對 OpenAI 的 410 億美元投資,持股比例升至 11%。孫正義透過願景基金大舉佈局 AGI 領域,並結合 Stargate 計畫與 DigitalBridge 收購,建構全方位的 AI 生態系。
Meta 以超過 20 億美元收購 AI 代理新創 Manus,標誌著 AI 競爭重心轉向「執行層」。了解為何 Meta 願意為一家不研發基礎模型的公司支付巨資,以及這對企業 AI 策略的深遠影響。
解析 TechCrunch Disrupt 2025 入選的「Startup Battlefield 200」創新企業。從 Rax 的服裝租賃到 ZEZEDU 的 AI 教育,掌握未來科技新趨勢。