Metaが最強のオープンソース大モデルを発表GPT-4を追いかけ、ザ:来年反超
愿为素心人
发表于 2024-7-24 14:01:04
206
0
0
米太平洋時間7月23日、Meta(原題Facebook)は8 B、70 B、405 Bの3つのサイズを持ち、文脈の長さを128 Kに引き上げたLlama 3.1大モデルを正式に発表した。注目すべきは、Metaが提供するベンチマークテストデータによると、最も注目されている405 B(4050億パラメータ)は、OpenAI傘下のGPT-4と人工知能ベンチャー企業Anthropic傘下のClaude 3に性能的に匹敵するものとなっている。これは、すでにトップオープンソース大モデルの性能がトップクローズソース大モデルに正式に追いつき、開閉源の争いが一段落するかもしれないことを意味している。
製品を発表するほか、ザッカーバーグ氏は「オープンソース人工知能は前進の道」という「オープンソース宣言」を発表した。ザッカーバーグ氏は文の中で、「今日、いくつかの科学技術会社がリードする閉鎖モデルを開発している。しかし、オープンソースは急速に格差を縮小している」と述べた。
オープンソースLlama 3.1-405 Bの性能はクローズソースGPT-4に追いついた
公式資料によると、Llama 3.1は15兆個を超えるtokenのデータで訓練を行い、16000個のH 100を使った。使用された予備訓練データは、2023年12月現在。トレーニングの安定性を保証するために、現在流行しているハイブリッド・エキスパート・モデル(MoE)アーキテクチャではなく、Transformerモデル・アーキテクチャだけで調整しました。
現在、Llama 3.1は各国の言語対話をサポートしており、今回は8 B、70 B、405 Bの3つのサイズを発表し、文脈の長さは128 Kに向上した。シリコンベースのインテリジェント創業者の司馬華鵬氏は、Llama 3.1の情報処理能力が大幅に向上したと評価し、「例えば、4000個の中文字しか覚えられないから64000個の中文字を覚えられるようになった」と述べた。
長い間、業界では開閉源に関する議論が相次いできた。今月の世界人工知能大会では、百度の創始者で会長兼最高経営責任者の李彦宏氏が現場で「商業化された閉源モデルが最も打てる」と改めて語った。李彦宏氏によると、オープンソースモデルはいくつかの学術研究、教育分野で存在価値があり、大モデルの作業メカニズムを研究し、理論を形成するために使用できるという。しかし、激しいビジネス環境の中で、業務効率を同業者より高くし、コストを同業者より低くしたい場合、商業化された閉源モデルは「最も打ちやすい」。
しかし、Metaが提供する基準テストデータによると、オープンソースモデルは今回も「打てる」。その中で、Llama 3.1が最も注目されている405 B(4050億パラメータ)は、性能的にGPT-4とClaude 3に匹敵することができ、これはすでにトップオープンソース大モデル性が旗艦クローズソース大モデルに追いついていることを意味している。
注目すべきは、今回のオープンソースがより徹底していることだ。今年4月に製品Llama 3 8 BとLlama 3 70 Bを発売した時も、Metaは開発者がこのモデルを使って他の生成モデルを訓練することを禁止していた。今回のリリースでは、新しいオープンソースプロトコルでMetaが他のモデルを改良するために新しいモデルを使用することを禁止することはなくなりました。
Metaが新モデルを発表すると同時に、英偉達也氏は新NVIDIA AI FoundryサービスとNVIDIA NIM推理マイクロサービスを発表し、同じく発売されたばかりのLlama 3.1シリーズのオープンソースモデルとともに、グローバル企業のジェネレーションAIを強力に支援した。NVIDIA AI Foundryにより、企業や各国は現在、Llama 3.1およびNVIDIAソフトウェア、コンピューティング、および専門知識を使用して、特定の分野の業界ユースケース用にカスタムの「スーパーモデル」を作成できるようになったという。
製品を発表すると同時に、ザッカーバーグ氏は「オープンソース人工知能は前進の道」という公開書簡を発表した。ザッカーバーグ氏は初期のLinux(オペレーティングシステムカーネル)の発展過程を例に挙げている。高性能コンピューティングの初期には、テクノロジー各社が独自の閉源版Unixを開発するために巨額の資金を投じていたが、このような先進的なソフトウェアを開発できる他の方法は考えられなかったと提案した。しかし、最終的にオープンソースLinuxが流行してきました。最初は、開発者がコードを勝手に修正することができ、価格が手頃であるのに対し、時間が経つにつれてより先進的で安全になり、どのクローズソースUnixよりも多くの機能をサポートするより広範な生体システムを持っているからです。現在、Linuxはクラウドコンピューティングとほとんどのモバイルデバイスを実行するオペレーティングシステムの業界標準的な基盤となっています。
ザッカーバーグ氏は、人工知能も同様の方法で発展すると信じていると述べた。「今日、いくつかの科学技術会社がリードする閉源モデルを開発していますが、開源は急速に差を縮めています。昨年、私たちが発表したLlama 2は遅れている先代モデルに匹敵しています。今年になって、Llama 3はすでに最先端モデルに匹敵し、一部の分野でリードしています。来年からは、将来のLlamaモデルが業界最先端のモデルになると予想しています。」
さらにLlama 3の画像、ビデオ、音声機能を開発している
なぜ開発者にとってオープンソースが有利なのかというと、ザッカーバーグ氏は調査中に観察されたいくつかの現象を挙げた。世界各地の開発者、CEO、政府関係者にとって、彼らは自分のモデルを訓練し、微調整し、精製する必要があるだけでなく、閉鎖されたベンダーに縛られたくないモデルの支配権も必要です。同時に、自分のデータを保護し、データクラウドAPIをクローズドソースモデルに送信したくないと期待している。長期的な基準となる生態系への投資が期待されており、閉源モデルよりも開源モデルの発展速度が速いと考える人も少なくない。
ザッカーバーグ氏はまた、Metaにとってオープンソースモデルを選択することは、Metaがユーザーに最高の体験を提供し続けるビジョンを達成するのにも役立つと述べた。オープンソースがLlamaシリーズの大モデルを技術的優位性を失うかどうかの問題について、ザッカーバーグ氏は生態系の開放的な完全性、Metaの大モデル上の商業化ルートなどの面から答えた。
「まず、私たちが最も優れた技術を使用し、閉鎖された生態系に長期的に閉じ込められないようにするためには、ツール、効率改善、チップ最適化、その他の統合など、完全な生態系に発展する必要があります。もし私たちがLlamaを使用している唯一の会社であれば、この生態系は発展しません。次に、人工知能開発は高度な競争を維持し続けると予想しています。これは、オープンソースの任意の与えられたモデルが、次の最適なモデルに対する当時の大きな優位性を失わないことを意味しています。Llamaが業界標準になる道は、競争力、効率性、開放を維持する世代であり、第三に、Metaとクローズドソースモデルプロバイダとの間の重要な違いは、AIモデルへのアクセス権を販売することが私たちのビジネスモデルではないことです。これは、Llamaを公開しても、クローズドソースプロバイダのように私たちの収入、持続可能性、または投資研究の能力を弱めることはありません。これも一部のクローズドプロバイダが、政府がオープンソースに反対することを絶えずロビーしている理由の1つです」
Llamaの内部科学者@astonzhangAZ氏もソーシャルプラットフォームで明らかにしたところによると、研究チームは現在、モデルが画像とビデオを識別し、音声によるインタラクションをサポートできるように、画像、ビデオ、音声機能をLlama 3に統合することを検討している。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- グーグル、Gemma 2オープンソースAIモデルを発表
- 惊人逆转!特朗普Q2竞选募资额反超拜登 胜算进一步扩大
- Meta发布最强开源大模型追赶GPT-4,小扎:明年反超
- Metaが最強のオープンソースAIモデルを発表Llama 3.1ザッカーバーグ氏が企業戦略を語る
- Metaが発表した「最強オープンソース大モデル」オープンソースとクローズソースの争い新しいページの大モデルを開くか、シャッフルを迎える
- 黄峥反超钟睒睒登顶中国首富 身家486亿美元
- 黄峥反超鐘睒睒、中国初の富豪に486億ドル
- マースク:史上最強のAI訓練クラスターラインアップにGPUをさらに10万本追加
- DeepMindのオープンソース生体分子予測モデルノーベル賞の成果はAI製薬の波を巻き起こすのか?
-
11월 14일, 세계예선 아시아지역 제3단계 C조 제5라운드, 중국남자축구는 바레인남자축구와 원정경기를 가졌다.축구 국가대표팀은 바레인을 1-0으로 꺾고 예선 2연승을 거두었다. 특히 이번 경기 국내 유일한 중계 ...
- 我是来围观的逊
- 3 시간전
- Up
- Down
- Reply
- Favorite
-
"영비릉: 2024회계연도 영업수입 동기대비 8% 감소"영비릉은 2024회계연도 재무제보를 발표했다.2024 회계연도 매출은 149억5500만 유로로 전년 동기 대비 8% 감소했습니다.이익은 31억 500만 유로입니다.이익률은 ...
- 勇敢的树袋熊1
- 3 일전
- Up
- Down
- Reply
- Favorite
-
계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
- 勇敢的树袋熊1
- 그저께 15:27
- Up
- Down
- Reply
- Favorite
-
본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
- 家养宠物繁殖
- 어제 15:21
- Up
- Down
- Reply
- Favorite