挑戰 Google 霸權:阿通般若 Qwen-Image-2512 開源發布,重新定義企業級影像生成
阿里巴巴發布阿通般若 Qwen-Image-2512 開源影像模型,挑戰 Google Gemini 3 Pro。採用 Apache 2.0 授權,提供高精度文字排版與寫實影像生成,助力企業降低 AI 部署成本。
AI 影像生成領域競爭進入白熱化。以往由科技巨頭壟斷的高階生產力工具,正迎來翻天覆地的變化。阿里巴巴旗下的 Qwen 團隊近期發布了最新開源模型,直接向 Google 的封閉生態發起挑戰。
阿通般若 Qwen-Image-2512 開源:打破封閉模型定價高牆
繼 Google 在 11 月推出強大的 Gemini 3 Pro Image 後,業界對於高品質影像生成的需求激增。然而,Google 的模型高度依賴其雲端堆棧,且定價不菲。阿里巴巴此時推出的 Qwen-Image-2512,採用 Apache 2.0 授權協議,允許企業自由下載、修改並進行商業化部署,實現了技術的「主權自主」。
性能躍升:三大關鍵技術改良
- 人物真實感:顯著減少「AI 塑膠感」,皮膚紋理與面部表情更加自然生動。
- 材質細節:針對動物皮毛、水面等複雜材質進行最佳化,減少人工修圖成本。
- 文字排版:支持中英雙語,能準確生成無誤字的簡報、海報與資訊圖表。
在 Alibaba Cloud 的 API 定價中,生成單張影像的費用約為 0.075 美元。但對企業而言,開源權重的價值在於能將 AI 整合進私有數據管線,確保資訊安全並有效控制預算。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
律師、編劇、設計師正在湧入AI訓練數據產業。但這份「新工作」伴隨著秒級監控、隨時終止合約與持續下滑的薪資。這究竟是過渡期的緩衝,還是知識勞動的系統性瓦解?
AI先驅Yann LeCun離開Meta後創辦AMI,募資逾10億美元挑戰ChatGPT路線。豐田、三星成首批合作夥伴,這場技術路線之爭對亞洲科技格局意味著什麼?
中國人形機器人企業已掌控全球逾90%的市場份額,特斯拉Optimus最快2027年才能量產。技術分析師解析中美差距的本質,以及這場競賽真正的勝負關鍵。
AI代理人正在接管創投的盡職調查工作,一小時內完成人類需要數週的分析。但真正的威脅或許不是AI取代投資人,而是讓創業者根本不再需要投資人。
观点
分享你对这篇文章的看法
登录加入讨论