#AIベンチマーク
全3件の記事
TechJP
AI性能評価指標 v4.0 公開:OpenAI GPT-5.2とClaude Opus 4.5が「実務能力」で激突
Artificial Analysisが最新のAI性能評価指標 v4.0を公開。OpenAI GPT-5.2やClaude Opus 4.5が実務能力で激突。従来のベンチマークは廃止され、仕事の完遂能力が新たな評価軸となります。
TechJP
AIの「審判」LMArenaが1.5億ドルのA輪調達、評価額は17億ドルへ
AI評価の標準を狙うLMArenaが1.5億ドルのシリーズA資金調達を実施。評価額は17億ドルに達し、月間500万人のユーザーデータを武器に、OpenAIやGoogleなどのAIモデルを格付け。ビジネス化も加速し、ARR 3,000万ドルを達成しています。
TechJP
OpenAIの新ベンチマーク「FrontierScience」が示す、AI科学者時代の幕開け
OpenAIの「FrontierScience」は単なるAIベンチマークではない。科学研究の自動化、そしてR&Dの産業革命に向けた号砲だ。PRISMがその深層と投資家・企業への影響を徹底解説。