Metaが発表した「最強オープンソース大モデル」オープンソースとクローズソースの争い新しいページの大モデルを開くか、シャッフルを迎える
愿为素心人
发表于 2024-7-28 10:40:20
194
0
0
Metaは現地時間7月23日、最新バージョンの言語大モデルLlama 3.1を正式に発表した。今回の発表はAIコミュニティから「オープンソース後進論」への強力な反撃とされ、Meta創業者でCEOのザッカーバーグ氏も発表時に「オープンソースAIは未来への道だ」と述べた。
従来、OpenAIはChatGPTの閉鎖性のため、「Open」と呼ばれているが実際には「Close」のことをしていると非難されてきたが、ChatGPT-4 oに代表される閉源大モデルの実力は業界を退却させることが多く、「閉源大モデルの性能は必ず開源大モデルより強い」という考えがデフォルトになっているようだ。
しかし、今回のLlama 3.1のリリースはこの構造を上書きするようだ。今回のMetaは、8 B、70 B、405 BのLlama 3.1の3つのバージョンをリリースしました。このうち405 Bは「トップフィット」バージョンで、Metaは最高の閉源モデルに匹敵する性能を誇ると言われています。
「最強オープンソース大モデル」
Llama 3.1 405 Bはなぜ最高の閉源モデルと競争できるのか。Llama 3.1を発表すると同時に、Metaも「The Llama 3 Herd of Models」と題する論文を発表し、その中でLlama 3モデルの研究開発の詳細を詳しく述べた。
まず、使用上、Llama 3.1は8つの言語をサポートし、3つのバージョンのコンテキストウィンドウはGPT-4 Turboと同じ128 Kに拡張されています。同時に、Llama 3.1 405 Bは4050億個のモデルパラメータを持ち、訓練規模はLlama 2の50倍であり、より安定した性能を維持するために密集Transformerアーキテクチャを採用している。これにより、Llamaが一度に処理できるテキストの数は9.6万字に達し、同時に長いテキストでも短いテキストでも、「思い通りに」処理することができる。
論文では、MetaもLlama 3.1 405 BとChatGPT-4 oとClaude 3.5 Sonnetのこれらの頭部閉源大モデルの性能比較データを発表した。テストの結果、Llama 3.1 405 Bは汎用性能、長テキスト処理、多言語処理の多方面で得点がリードしていることが分かった。例えば、ZeroSCROLLSプロジェクトのテストでは、Llama 3.1 405 Bのスコアは95.2で、後の両方は90.5です。
優れた性能と膨大な訓練基数を表現することで、Llama 3.1は「最強オープンソース大モデル」の称号を持つようになったが、現在のLlama 3.1は依然として言語処理を主とする大モデルであり、画像、ビデオ、音声の処理をサポートしていない。これは、多モードタスク処理において、ChatGPTが依然として際立った能力を持っていることを意味する。
「オープンソースAIは未来の道」
Llamaの実際の使用体験はまだ完璧なほどではないかもしれないが、今回のLlama 3.1 405 Bの発表は、世界中のAIワーカーにとって最大の意味はやはり大モデルのオープンソースとクローズソースの争いが新たなページを開いたことにある。
メッタの公式サイトでザッカーバーグ氏は公開書簡を発表し、「オープンソースAIは未来への道だ」と力強く宣言した。同書によると、複数の企業が先行するクローズドソースモデルを開発しているにもかかわらず、オープンソースは急速に差を縮めているという。Llamaを例にとると、昨年のLlama 2は汎用大モデルの古いバージョンにしか匹敵できなかったが、今年のLlama 3は最先端の大モデルと競争し、一部の分野でリードしている。
そのため、ザッカーバーグ氏はLlamaを大モデル時代のLinuxにして、オープンソースAIの業界標準にしたいと考えている。「高性能コンピューティングの初期には、主要技術会社が独自のクローズドソースUnixバージョンの開発に巨額を投じていました……今日、オープンソースのLinuxはクラウドコンピューティングとモバイルデバイスのほとんどを実行するオペレーティングシステムの工業標準的な基礎となり、人工知能は同様の方法で発展すると信じています」
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- マースク・Cybercabのリリースが間近!国内の多くの大手企業がRobotaxi中国モデルを模索している
- 深さ|マイクロソフトとSalesforceの競争力アップグレードによるオーバーレイ販売、財務用新AIエージェント10機種発売
- クアルコム、ARMライセンス取り消しの噂に回答:ARMの反競争行為は容認されない
- ウォルマートやサムの「前置倉」モデルをコピーして小さな店を開く
- DeepMindのオープンソース生体分子予測モデルノーベル賞の成果はAI製薬の波を巻き起こすのか?
- 百度李彦宏:過去24カ月、AI業界の最大の変化は大モデルが幻覚をほぼ解消したことだ
- 「AI新世代」の大モデルメーカーがスマートボディを“巻き”、李彦宏氏は「アイデアで稼げる時代が来る」と語る
- 李彦宏氏によると、大模型幻覚は実測文心をほぼ解消したという。
- FTCはマイクロソフトのクラウドコンピューティング事業の反競争行為に関する調査を計画している
-
11월 14일, 세계예선 아시아지역 제3단계 C조 제5라운드, 중국남자축구는 바레인남자축구와 원정경기를 가졌다.축구 국가대표팀은 바레인을 1-0으로 꺾고 예선 2연승을 거두었다. 특히 이번 경기 국내 유일한 중계 ...
- 我是来围观的逊
- 4 시간전
- Up
- Down
- Reply
- Favorite
-
"영비릉: 2024회계연도 영업수입 동기대비 8% 감소"영비릉은 2024회계연도 재무제보를 발표했다.2024 회계연도 매출은 149억5500만 유로로 전년 동기 대비 8% 감소했습니다.이익은 31억 500만 유로입니다.이익률은 ...
- 勇敢的树袋熊1
- 3 일전
- Up
- Down
- Reply
- Favorite
-
계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
- 勇敢的树袋熊1
- 그저께 15:27
- Up
- Down
- Reply
- Favorite
-
본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
- 家养宠物繁殖
- 어제 15:21
- Up
- Down
- Reply
- Favorite