挑戰 Google 霸權:阿通般若 Qwen-Image-2512 開源發布,重新定義企業級影像生成
阿里巴巴發布阿通般若 Qwen-Image-2512 開源影像模型,挑戰 Google Gemini 3 Pro。採用 Apache 2.0 授權,提供高精度文字排版與寫實影像生成,助力企業降低 AI 部署成本。
AI 影像生成領域競爭進入白熱化。以往由科技巨頭壟斷的高階生產力工具,正迎來翻天覆地的變化。阿里巴巴旗下的 Qwen 團隊近期發布了最新開源模型,直接向 Google 的封閉生態發起挑戰。
阿通般若 Qwen-Image-2512 開源:打破封閉模型定價高牆
繼 Google 在 11 月推出強大的 Gemini 3 Pro Image 後,業界對於高品質影像生成的需求激增。然而,Google 的模型高度依賴其雲端堆棧,且定價不菲。阿里巴巴此時推出的 Qwen-Image-2512,採用 Apache 2.0 授權協議,允許企業自由下載、修改並進行商業化部署,實現了技術的「主權自主」。
性能躍升:三大關鍵技術改良
- 人物真實感:顯著減少「AI 塑膠感」,皮膚紋理與面部表情更加自然生動。
- 材質細節:針對動物皮毛、水面等複雜材質進行最佳化,減少人工修圖成本。
- 文字排版:支持中英雙語,能準確生成無誤字的簡報、海報與資訊圖表。
在 Alibaba Cloud 的 API 定價中,生成單張影像的費用約為 0.075 美元。但對企業而言,開源權重的價值在於能將 AI 整合進私有數據管線,確保資訊安全並有效控制預算。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
史丹佛大學調查顯示,對AI感到期待的美國人僅38%,中國高達84%。當火焰瓶砸向OpenAI執行長住宅,亞洲卻在跳舞迎接機器人——這場分歧將如何重塑全球AI版圖?
Mozilla用Anthropic AI修補271個漏洞,北韓駭客用AI竊取1200萬美元,SS7電信協議遭監控公司濫用。2026年網路安全戰場全面解析。
從ChatGPT涉嫌協助槍擊案,到Anthropic危險模型外洩、Meta監控員工鍵盤,MIT科技評論發布「現在AI最重要的10件事」,揭示AI已深入社會決策核心。
蘋果宣布執行長提姆·庫克將於2026年9月1日卸任,由硬體工程資深副總裁約翰·特努斯接任。14年間市值從3500億成長至逾4兆美元,這場權力交接對華人世界意味著什麼?
观点
分享你对这篇文章的看法
登录加入讨论