オープンソースではなくGemmaを開放グーグルはなぜ大モデル競争戦略を転換したのか。
SNT
发表于 2024-2-22 16:19:07
212
0
0
米科学技術大手グーグルは大言語モデル分野でOpenAIやMetaへの攻撃を続けている。
グーグルは2月21日夜、次世代の無料商用大言語モデルGemmaを世界で公開したと発表した。このモデルはGoogle自身の「最先端のオープンモデル」と見なされている。
これは同社がオープンAIの大モデル分野で行った大きな動きだ。Google DeepMind製品管理ディレクターのTris Warkentin氏によると、オープンモデルはグーグルにとって新たな機会であり、コミュニティやグーグル以外の人と協力してAI研究開発に新たな機会を創出できるようにする。
Gemmaはラテン語の「宝石」と名付けられ、テキスト情報の処理にのみ使用され、そのインフラストラクチャはグーグル最強のAIモデルGeminiと一致しているが、パラメータ規模は小さく、20億パラメータと70億パラメータの2つの規模のバージョンしかなく、2つのパラメータ規模のGemmaモデルには予備訓練と命令微調整バージョンがある。
小さなパラメータサイズは、Gemmaのより広範な導入に役立ちます。グーグルによると、Gemmaは主流のAIフレームワークをサポートしており、ノートパソコン、デスクトップ、モノのインターネット、モバイル機器、クラウドなどの環境でも動作するという。
同社が発表した評価結果によると、Gemmaは数学、コーディング、推論精通性、知識試験など多くの外部ベンチマーク試験でLlama 2モデルより優れている。Llama 2はMetaが発表した最新世代のオープンソース大モデルで、70億、130億、700億のパラメータを含むモデル。
注目すべきは、グーグルが「オープンソース」ではなくGemmaをオープンモデルとして強調していることだ。これは、グーグルがGemmaのソースコード、トレーニングデータなど、Gemmaの多くの技術的詳細を共有しているわけではないことを意味している。アプリケーションでは、Googleは利用規約により、すべての組織が責任を持って商用および配布を行うことができると主張しています。
Gemmaを開放するか、オープンソースの大モデル分野で批判されている部分的な対応について。これまでグーグルとOpenAIは技術閉鎖を堅持したことで外部から批判されてきたが、両者とも最新、最先端のモデルでは閉源を選択しており、技術進歩に不利とされてきた。
これについて、新浪微博新技術研究開発責任者の張俊林氏は、Gemmaはグーグルの大モデル戦略の転換を代表して、オープンソースとクローズソースを両立し、オープンソースは最も高性能な小規模モデルを主力とし、MetaとMistral(欧州AI会社、Mistral 7 BオープンソースAIモデルを発売)に打ち勝ちたいと評価した。クローズドソースは規模の大きい最も効果の高い大きなモデルを主力としており、できるだけ早くOpenAIに追いつきたいと考えている。
AIコミュニティでは、現在MetaのLlama 2は最も強力なオープンソース大モデルの1つであり、このモデル情報とソースコードは無料商用をサポートしているため、大量のAI開発者の支持を得ている。
グーグルは明らかにGemmaを利用してより多くの開発者をグーグルのクラウド生態系に誘致したいと考えている。一方、Gemmaはグーグルの自己研究クラウドAIチップTPUに対して最適化を行い、より良い効果を発揮できると主張した。同時に、グーグルクラウドの新規ユーザーはGemmaを研究するために300ドルのクラウドポイントを獲得する。
また、Gemmaはクラウドデータセンター、PC側でのモデルの推論性能を加速させるために、雄大なチップ上で動作することができ、双方が協力して最適化を行うことができます。例えば、GPUを搭載したAI PCにGemmaを使用して、ローカルチャットロボットソフトウェアを駆動し、GPUを搭載した複数のAIツールと統合する。
OpenAI、グーグル、Metaなどの大手科学技術会社の大モデルの戦いはますます激しくなっている。
グーグルは2023年3月にAI対話ロボットBardを発売し、昨年5月には最新のクローズドソース大言語モデルPaLM 2を発売した。先週、同社は「次世代AIビッグモデル」のGemini 1.5を発表し、OpenAIのGPT-4 Turboを多くの面で超えたと述べた。Metaはモデルのオープンソースに熱中し、傘下のLlama 2が最も知られている。
最近、OpenAIが文生ビデオモデルSoraを発表して再びAI圏を爆発させ、他の大手モデル会社との距離をさらに広げた。グーグルが最終的にOpenAIを追い抜くには、多くの不確実性が充満するだろう。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 百度沈震:10万カード計算力クラスターアップグレード計算プラットフォーム能力文心大モデルの日調整量が7億回を超える
- Metaが重量ポンドの新製品を発表:299ドルのクエス3 Sヘッドディスプレイ、ARメガネプロトタイプ、マルチモーダルAIモデル
- 香港株アップル産業チェーンが急騰!iPhone 16 Proモデルの需要は依然として堅調ですが、将来の販売台数はどうでしょうか。
- マースク・Cybercabのリリースが間近!国内の多くの大手企業がRobotaxi中国モデルを模索している
- ウォルマートやサムの「前置倉」モデルをコピーして小さな店を開く
- DeepMindのオープンソース生体分子予測モデルノーベル賞の成果はAI製薬の波を巻き起こすのか?
- 百度李彦宏:過去24カ月、AI業界の最大の変化は大モデルが幻覚をほぼ解消したことだ
- 「AI新世代」の大モデルメーカーがスマートボディを“巻き”、李彦宏氏は「アイデアで稼げる時代が来る」と語る
- 李彦宏氏によると、大模型幻覚は実測文心をほぼ解消したという。
- 阿里通義千問コードモデルQwen 2.5-Coder全シリーズ正式オープンソース
-
"영비릉: 2024회계연도 영업수입 동기대비 8% 감소"영비릉은 2024회계연도 재무제보를 발표했다.2024 회계연도 매출은 149억5500만 유로로 전년 동기 대비 8% 감소했습니다.이익은 31억 500만 유로입니다.이익률은 ...
- 勇敢的树袋熊1
- 3 일전
- Up
- Down
- Reply
- Favorite
-
계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
- 勇敢的树袋熊1
- 그저께 15:27
- Up
- Down
- Reply
- Favorite
-
본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
- 家养宠物繁殖
- 어제 15:21
- Up
- Down
- Reply
- Favorite
-
11월 12일 소식에 따르면 소식통에 따르면 아마존은 무료스트리밍서비스 Freevee를 페쇄하고 일부 종업원과 프로를 구독서비스 Prime Video로 이전할 계획이다. 올해 초 아마존이 내놓은 몇 편의 대형 드라마의 효 ...
- 度素告
- 그저께 13:58
- Up
- Down
- Reply
- Favorite