このウェブサイトを通じて、以下のことができます:
28 の大規模言語モデルと対話する
大規模モデル同士をランダムに対戦させる
指定した 2 つの大規模モデルを対戦させる
大規模モデルのランキングを確認する
上記のすべての操作は、登録、ログイン、支払いは必要ありません。ウェブサイトを開くだけで体験できます!
これらの 28 のモデルには、現在世界最強の GPT-4-Turbo も含まれています。
さらに、以下も含まれています:
第一陣のオンラインモデル:
GPT3.5
Gemini Pro
Claude2
第一陣のオープンソースモデル:
Llama2
Qwen
Yi-Chat
ChatGLM
Code Llama
WizardLM
実際、市場にはほとんどのモデルが含まれています。
さまざまな AI チャットモデルを素早く体験したい場合、これは間違いなく良い選択です。
以下では、具体的なプレイ方法を見てみましょう!
同時に、真の言語の王者は誰かを見てみましょう。
- モデルの大乱闘
ウェブサイトを開くと、デフォルトでアリーナ(戦闘)になっています。実際には、28 のモデルの大乱闘です。
ルールは非常にシンプルです:
ウェブページを開いた後、システムは自動的に 2 つの大規模モデルを選択し、モデルの名前は表示されません。
あなたがチャットを開始し、それらの応答に基づいて評価を行います。
システムは多数の評価に基づいてランキングを作成します。
このデザインは興味深いです。これにより、実際のユーザーのフィードバックを収集することができます。GPT 公式のチャットでも、並べて表示される結果が表示され、どちらがより良いかを選択することがあります。
このようなテストの結果は、さまざまな基本的なテストを行うよりも意味があります。
以下に例を挙げます。直接質問「父の父の娘の名前は何ですか?」を入力します。
左側の方が右側よりも少し良いです。
- 指定モデルの対戦
匿名性は公平なフィードバックの統計に有利ですが、誰と対話しているのかはわかりません。特定の 2 つの大規模モデルを直接対戦させたい場合は、第 2 の機能であるサイドバイサイドのアリーナ(side-by-side)を使用できます。実際には 1 対 1 の対戦です。
結果は明らかです。GPT4 が圧勝です。claude は OpenAI の強敵と言われていますが、実際のところは大きな差があり、時には一撃も与えられません。
専門領域の大規模モデルを作るのは比較的簡単です。
世界最大の汎用言語モデルを作ることは簡単なことではありません。
- 直接チャット
対戦したくない場合、ただ静かにチャットしたい場合は、以下の機能を使用します。1 対 1 で大規模モデルと会話することができます。(direct chat)
- ランキング
最も強力なモデルは誰なのか、これは人々が最も議論し、関心を持っている問題です。
それでは、ランキングを見てみましょう。
説明から見ると、これは 10 万人以上のユーザーの投票に基づいて作成されたランキングであり、非常に参考になると言えます。
ランキングからは、OpenAI が開発した GPT4 が上位 3 位を占めており、GPT3.5 のランキングも良いです。
その他には Claude、Gemini Pro もあります。
前述の 2 つはよく知られていますが、Mixtral はあまり知られていません。
Mixtral 8x7B は、Mistral AI チームによって開発された大規模言語モデルであり、スパースミクスチャーオブエキスパート(Sparse Mixture of Experts、SMoE)モデルに属しています。
このモデルは Mistral 7B のアーキテクチャを継承しており、各層は 8 つのフィードフォワードブロック(つまり「エキスパート」)で構成されています。各語彙を処理する際、各層のルーターネットワークは現在の状態を処理するために 2 つのエキスパートを選択し、それらの出力を組み合わせます。
このアイデアは興味深く、小さなトリックで大きな成果を上げています。
みんなが GPT4 を追い越そうと言っていますが、実際には GPT4 が圧倒的です。差は縮まっていないどころか、むしろ広がっているように感じます。
投資と関心の面でも、まったく別のレベルです。
強者は強く、予測可能な未来では、ChatGPT は同業他社を遥かにリードするでしょう。