マルチモーダルAIの次のステップは3 Dコンテンツ生成ですか?新しいツールが大ヒットGitHub
梦想飞翔
发表于 2024-3-5 16:39:46
4745
0
0
マルチモーダルコンテンツ生成はAIGCの広い応用空間を示し、3 Dは次のブレークスルーを実現するモデルになることが期待されている。
最近、DUSt 3 RというAIの新しいツールが爆発マイクロソフト傘下のGitHubプラットフォームでは、2枚の画像で2秒で3 D再構築が完了し、追加データを測定する必要はありません。このAIツールはオンラインになって間もなくGitHubのホットランキング2位にランクインした。あるネットユーザーは、2枚の写真を撮ると彼の家の台所が再建され、全体の過程で2秒もかからなかったと実測した。
3 Dモデル生成には通常、MVS推定カメラパラメータが必要であり、3 D空間中で対応する画素を三角測量する。この製品が従来と異なるのは、任意の画像を3 D立体的に再構築するための新しいパラダイムであり、カメラのキャリブレーションや視点の姿勢などの事前情報は必要ありません。これにより、2つ以上の画像を提供する場合の3 Dモデリング再構築を実現することができる。
3 Dモデリングとは、ソフトウェアを使用して3 Dオブジェクトまたは形状の数学的表現を作成するプロセスを指します。3 Dモデリング技術と3 Dモデルは医療、ゲーム、映画、建築、製品設計または仮想現実などの分野に広く応用されている。
AI+3 Dモデリングは、人工知能技術を用いて、高品質な3 Dモデルを自動生成するプロセスである。伝統的な3 Dモデリングには芸術家が多くの時間と精力を費やして手作業で創作する必要があるが、AI生成は機械学習アルゴリズムを訓練することにより、コンピュータが3 Dモデルを自動的に学習し、生成することができ、効率と正確性を大幅に向上させるとともに、全体の制作コストを削減した。
ユーザーはキーワードを入力したり、2 D画像をアップロードしたりするだけで、これらのツールは一定の時間内に比較的初期的な3 Dモデルを直接複数生成することができ、ユーザーが満足すれば、より精度の高い3 Dモデルをさらに生成することができます。
現在の3 Dコンテンツ生成ツールはすでに少なくなく、現在海外ではAI+3 D技術において主に工業シーン探索と非工業シーン探索に分けられている。非工業シーンの応用探索は主にグーグルのDreamFusionと英偉達のMagic 3 Dを代表とし、主にゲーム、元宇宙における3 D資産設計に向けている、産業シーン応用では、PTCのCreoやAutodeskのFushion 360などの派生的な設計ソフトウェアを中心に、派生的な設計能力を提供している。
国内で有名な3 D生成AIモデルには、バイト鼓動研究チームが開発したMVDream、幻方量子化傘下の大モデル企業DeepSeekが開発したDreamCraft 3 D、影眸科技は2016年から人の顔を採取して3 Dモデルを生成する業務を行っている。同社CTOの張啓煊氏によると、その人の顔が3 Dを生成するサービスは、現在国内の3 D生成の中で唯一ゲーム生産端に入っている製品のはずだが……。
ChatGPT代表の文生文から、DALL・E代表の文生図、Sora代表の文生ビデオまで、マルチモーダルはすでに共通認識のAI発展傾向になっている。中泰証券は、テキスト、コード、画像、ビデオに続いて、次のブレークスルーを実現する可能性のあるモダリティ推定率は3 Dであり、「SORAに続く次のステップ:文生3 D」を旗印として鮮明に提案している。未来はデジタル化の持続的な発展に伴い、3 D資産数の急速な増加、3 Dモデリングの自動化生成または新たな発展の風口となっているが、さまざまな大モデルに代表されるAIGC生産能力の賦能3 Dモデリング、文生3 D需要の持続的な増加は、AI賦能3 Dモデリングの急速な発展を促進するだろう。
しかし、AI+3 Dモデリング技術は現在も多くの挑戦に直面している。例えば、3 Dデータと資産の不足、AI訓練の難易度が高い、AIリアルタイムレンダリング技術が限られている、商業化の着地が難しいなどの問題がある。
同機構はさらに、産業視点の提案は文生3 Dモデリング分野の進展に引き続きフォローアップし、標的視点BIM分野は広聯達、盈建科に重点を置いている、CAX分野は中望ソフトウェア、索辰科学技術、浩辰ソフトウェアに重点を置いている、EDA分野では華大九天、概倫電子に重点を置いている。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 中信証券:グーグルGeminiモデル発表AIはマルチモーダル時代へ
- グーグルGemini、Pikaが交差!マルチモーダル昇進AI熱語算力プレートは再び「楽勝」になるのか?
- オープン予約18分で在庫切れ!代理購入は7万元に値上げ!アップルVision Proの前売りが大ヒット
- アップルVision Proの前売り人気コンテンツエコは変革的なチャンスを迎える
- MR大牛深分解Vision Pro:それは業界の次の10年間の中国メーカーの差を代表している
- ビッグニュース!目が覚めるとまた中国資産が暴騰した!「元宇宙第1株」Robloxが22%以上急落
- 体重が爆発!アップルはOpenAIと提携し、iOS 18にジェネレーションAI機能を導入
- 百度領投生数科学技術加速配置多モード大モデル
- 蔚来:電力交換モデルは固体電池の産業化を加速させ、固体電池は多方面から電力交換体験を向上させることができる
- リンゴの重さはポンド!知名な科学技術暴露者:アップルはこれまで最小のデスクトップパソコンにM 4チップを搭載してAI機能を迎える予定
-
11월 14일, 세계예선 아시아지역 제3단계 C조 제5라운드, 중국남자축구는 바레인남자축구와 원정경기를 가졌다.축구 국가대표팀은 바레인을 1-0으로 꺾고 예선 2연승을 거두었다. 특히 이번 경기 국내 유일한 중계 ...
- 我是来围观的逊
- 어제 15:05
- Up
- Down
- Reply
- Favorite
-
계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
- 勇敢的树袋熊1
- 3 일전
- Up
- Down
- Reply
- Favorite
-
본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
- 家养宠物繁殖
- 그저께 15:21
- Up
- Down
- Reply
- Favorite
-
11월 12일 소식에 따르면 소식통에 따르면 아마존은 무료스트리밍서비스 Freevee를 페쇄하고 일부 종업원과 프로를 구독서비스 Prime Video로 이전할 계획이다. 올해 초 아마존이 내놓은 몇 편의 대형 드라마의 효 ...
- 度素告
- 3 일전
- Up
- Down
- Reply
- Favorite