1/20のコストで巨大AIに挑む。MiroThinker 1.5 AI エージェント 性能の衝撃
MiroMindが発表したMiroThinker 1.5は、300億パラメータながら1兆級のAIに匹敵する性能を誇ります。ハルシネーションを抑制する「科学者モード」を搭載し、推論コストを1/20に削減。MiroThinker 1.5 AI エージェント 性能の秘密に迫ります。
1/20のコストで、1兆パラメータ級のAIに匹敵する性能を発揮します。AIスタートアップのMiroMindが発表した最新モデル「MiroThinker 1.5」が、業界の常識を塗り替えようとしています。わずか300億のパラメータでありながら、複雑な調査を自律的に遂行する能力を備えています。
MiroThinker 1.5 AI エージェント 性能を支える「科学者モード」
これまでのAIが抱えていた最大の課題は「ハルシネーション(もっともらしい嘘)」でした。MiroThinker 1.5は、独自の「サイエンティスト・モード(Scientist Mode)」を搭載することで、この問題に正面から取り組んでいます。これは単に知識を思い出すのではなく、仮説を立て、外部ソースを検証し、結論を修正するという「検証ループ」を自律的に実行する仕組みです。
- 検証可能な推論:回答の根拠となった思考プロセスと外部ソースを明示。
- 長時間のツール利用:1セッションで最大400回のツール呼び出しをサポート。
- 巨大なコンテキスト:最大256,000トークンの情報を一度に処理可能。
1兆パラメータ級の競合を凌駕するベンチマーク結果
ウェブ調査能力を測定するベンチマーク「BrowseComp-ZH」において、30B(300億)モデルは69.8というスコアを記録しました。これは、はるかに巨大なKimi-K2-Thinkingを上回る数字です。特筆すべきはそのコスト効率で、1コールあたりの推論コストはわずか0.07ドルに抑えられています。
| 指標 | MiroThinker 1.5 (30B) | Kimi-K2-Thinking (1T) |
|---|---|---|
| ベンチマークスコア | 69.8 | 競合以下 |
| 推論コスト (1コール) | $0.07 | 約$1.40 |
| ライセンス | MIT (オープン) | プロプライエタリ |
また、学習プロセスにおける工夫も見逃せません。過去のデータから未来を知ってしまう「後知恵バイアス」を防ぐため、特定の時点以前の情報のみにアクセス制限した環境でトレーニングを行う「タイムセンシティブ・サンドボックス」を採用しています。これにより、刻々と変化するビジネスの現場でも、より現実に即した推論が可能になります。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
AnthropicがClaude Codeのサードパーティツール連携を有料化。OpenClawとの対立が示す、AIサービスの持続可能性とオープンソースの未来とは。
うつ病や不安を声から検出するAIを開発したKintsugiが、FDA承認取得できずに閉業。7年間の挑戦が残したものと、精神医療AIの未来を考える。
AnthropicがClaude Codeのソースコード流出対応で8,100件のGitHubリポジトリを誤って削除。IPO準備中の企業が直面した「二重のミス」が示す、AIガバナンスの本質的課題とは。
AnthropicのClaude Codeのソースコードリークで判明した隠し機能「Kairos」。バックグラウンドで常時稼働し、ユーザーが求める前に行動するAIエージェントの未来と、日本社会への影響を考察します。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加