Liabooks Home|PRISM News
象徵封閉式與開源 AI 競爭的未來感科技影像
TechAI分析

挑戰 Google 霸權:阿通般若 Qwen-Image-2512 開源發布,重新定義企業級影像生成

2分钟阅读Source

阿里巴巴發布阿通般若 Qwen-Image-2512 開源影像模型,挑戰 Google Gemini 3 Pro。採用 Apache 2.0 授權,提供高精度文字排版與寫實影像生成,助力企業降低 AI 部署成本。

AI 影像生成領域競爭進入白熱化。以往由科技巨頭壟斷的高階生產力工具,正迎來翻天覆地的變化。阿里巴巴旗下的 Qwen 團隊近期發布了最新開源模型,直接向 Google 的封閉生態發起挑戰。

阿通般若 Qwen-Image-2512 開源:打破封閉模型定價高牆

Google11 月推出強大的 Gemini 3 Pro Image 後,業界對於高品質影像生成的需求激增。然而,Google 的模型高度依賴其雲端堆棧,且定價不菲。阿里巴巴此時推出的 Qwen-Image-2512,採用 Apache 2.0 授權協議,允許企業自由下載、修改並進行商業化部署,實現了技術的「主權自主」。

性能躍升:三大關鍵技術改良

  • 人物真實感:顯著減少「AI 塑膠感」,皮膚紋理與面部表情更加自然生動。
  • 材質細節:針對動物皮毛、水面等複雜材質進行最佳化,減少人工修圖成本。
  • 文字排版:支持中英雙語,能準確生成無誤字的簡報、海報與資訊圖表。

Alibaba Cloud 的 API 定價中,生成單張影像的費用約為 0.075 美元。但對企業而言,開源權重的價值在於能將 AI 整合進私有數據管線,確保資訊安全並有效控制預算。

Google 發布 Gemini 3 Pro Image,樹立企業影像生成新標竿。
阿通般若 Qwen-Image-2512 正式發布,提供完整開源權重。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

相关文章