号外！号外！Gemini Exp 1114：有史以来最好的大模型！击败 o1-Preview + Claude 3.5 Sonnet！

2024年11月16日#AI436

AI 翻訳

この記事はAIを通じて中国語から日本語に翻訳されました。原文を表示

AI が生成した要約

Google DeepMindの最新モデルGemini Exp 1114が、Chatbot Arenaで6000以上のコミュニティ投票を得て総合1位に躍進しました。このプラットフォームはLLMの性能評価を促進するためのもので、Geminiのスコアは1344に達し、ChatGPT 4.0の1340を上回りました。また、Gemini-Exp-1114は数学競技でも並んで1位を獲得しています。現在、Gemini-Exp-1114はGoogle AI Studioで体験可能です。

Google DeepMind の最新バージョン Gemini Exp 1114 は、Chatbot Arena で重要な成果を上げ、6000 以上のコミュニティ投票を得て総合ランキング 1 位に躍り出ました。また、複数の分野で優れたパフォーマンスを示しています：

まず、LLM Arena とは何かを理解する必要があります。LLM Arena（またはチャットボットアリーナ）は、LLM を評価するためのプラットフォームで、主な目的はコミュニティ主導の LLM 性能評価を促進することです。これは最も権威ある評価プラットフォームの一つです。

https://lmarena.ai/