- 週間ランキング
ファルコン40Bは、Metaが開発したLLaMA(65Bモデル等)やStability AIのStableLM、TogetherのRedPajama等、既に確固たる地位を築いているモデルをうまく退け、誰もが望むランキングを獲得することができました。指標はEleuther AI言語モデル評価ハーネスの4つの重要なベンチマークを活用しており、小学校レベルの科学のテストであるAI2リーズニング・チャレンジ(25-shot)、常識を必要とし人間にとっては簡単である一方、SOTAモデルにとっては困難なテストであるHellaSwag(10-shot) 、テキストモデルにおけるマルチタスクの正確性を測るテストであるMMLU (5-shot))、そして言語モデルの質問に対する回答が正しいかどうかをテストするTruthfulQA (0-shot)といった、生成言語モデルを評価するフレームワークを統合したものです。
ハギング・フェイスのオープンLLMスコアボードは、客観的評価ツールであり、世に出回っているLLMやチャットボットの追跡、ランク付け、評価をAIコミュニティが行います。
1兆個のトークンで訓練されたファルコン40Bは、アラブ首長国連邦にとって AI分野のリーダーシップを発揮するための重要なターニングポイントであり、研究および商業利用におけるモデルの重みへのアクセスを拡大することが可能になります。今回のランキングは、人類の利益のためにAIをより透明性高く、包括的で、アクセスしやすくするといった、モデルの優れた能力が認められたものです。
こうした最新の開発より、TIIは生成AIモデルに関してアラブ首長国連邦の地位をうまく確保することができ、AIのイノベーションとコラボレーションを牽引する数少ない国のひとつとして名を連ねることができました。
TIIはすでにファルコンの新バージョンである180B AIモデルの開発に取り組んでいます。現在オープンソース化されているファルコン40B AIモデルに関する詳細については、FalconLLM.TII.aeをご覧ください。ファルコン40Bに関する当初の発表については、こちらをご覧ください。 アラブ首長国連邦の技術革新研究所が「ファルコン40B」大規模言語モデルをオープンソース化、研究・商業利用へ
詳細情報については、こちらをご覧ください。www.tii.ae
*情報源:AETOSワイヤ
本記者発表文の公式バージョンはオリジナル言語版です。翻訳言語版は、読者の便宜を図る目的で提供されたものであり、法的効力を持ちません。翻訳言語版を資料としてご利用になる際には、法的効力を有する唯一のバージョンであるオリジナル言語版と照らし合わせて頂くようお願い致します。
Jennifer Dewan
Senior Director of Communications
jennifer.dewan@tii.ae