找回密码
 立即注册
搜索
热搜: Apple Tesla Amazon
查看: 243|回复: 0

경동기술책임자: 큰 모형은 하면 할수록 작아지고 심지어 장면까지 세분화할수 있다

[复制链接]

39

主题

0

回帖

141

积分

注册会员

积分
141
发表于 2024-7-31 19:01:33 | 显示全部楼层 |阅读模式

"통용 대형 모델은 계산력에 의해 쌓이고, 기업 대형 모델은 업무에 의해 뛰어나와야 한다."
7월 30일, 상해에서 열린 경동운봉회에서 경동그룹 기술위원회 주석이며 경동운사업부 총재인 조붕은 상술한 관점을 발표했다.그의 이해에 따르면, 큰 모델에 대해 말하자면, 데이터는 자양분이고, 장면은 연병장이다.
지난 한 해 동안 큰 모델이 지속적으로 열광하면서 업계는'천 모델 대전'을 겪었다.중국신통원의 통계에 따르면 현재 전 세계의 기초대모형은 1000여개이고 중국대모형의 수량은 전 세계의 35% 를 차지한다.
비록 기초모델의 성능이 부단히 향상되고 있지만, 개인 사용자 측에서 큰 모델은 아직 진정한 의미의 슈퍼 응용이 나타나지 않았고, 오히려 많은 기업 측 장면에서 이미 응용에 기초하여 점차 전개되었다.
정상회의 현장에서 경동운은 경동언서대모형착지업종의 최신실천을 전시하고 경동운기업대모형서비스, 언서지능체플랫폼, 지능프로그래밍조수 JoyCoder, 언서디지털인 3.0 등 8개 제품을 발표했다.
경동이 제공한 수치에 따르면 지금까지 경동대모형은 100개를 넘는 장면에 착지하여 의료건강, 전자상거래생방송, 물류, 금융 등 부동한 업종령역을 망라했으며 이미 경동자체배송원, 상가, 의사, 채굴판매 운영 및 연구개발인원이 대모형응용의 지지를 받았다.
례를 들면 의료장면에 봉사하는"경의천문"은 경동건강지능계산법부 책임자의 소개에 따르면 현재 내부적으로 4개 부동한 체량의 모형을 만들었는데 하나는 2b좌우의 미소모형으로서 좁은 구역에서 어떤 단일서비스를 제공하는데 팀은"미래에는 심지어 휴대폰에 올려놓을수도 있다."고 구상하여 사용하고있다.둘째는 14b, 22b를 핵심으로 하는 중형 체량 모델로 일부 의료 자문과 서비스 지원 업무를 완성한다;마지막으로 80b를 핵심으로 복잡한 의료 의사결정과 추리력을 전문적으로 서비스하는 큰 모델이다.
상술한 모델은 사유화 배치, 심지어 일체화 배치를 지원하는데, 이는 업계 특성과 관련이 있다."의료 업계는 완전한 순수 클라우드 모델을 받아들이기 어렵다. 이런 돌파를 받아들일 수 있는 병원은 거의 없다." 상술한 책임자는 말했다.
그의 소개에 따르면 경의천문은 실제 병원의 착지장면에서 합규상황에서 독립적으로 환자서비스를 완성하는데 더욱 많은 관심을 돌리게 되는데 여기에는 분진, 예문진, 접수, 예약, 진찰중의 배진, 진찰후 건강관리 등이 포함된다.
"GPT가 나온 첫날, 모든 사람이 생각하는 것은 이 세대의 자연스러운 대화 능력과 소위 의인화된 능력이다. 그런 관점에서 의사 조수가 더 잘 될 수 있을지는 의사가 되는 진단 도구가 되는 것보다 더 착지할 가치가 있다"고 이 관계자는 강조했다.
그러나 뷰티 장면에서는 이전의 순수 생방송과 달리 징둥 내부에서는 현재 디지털인 메이크업 테스트와 디지털인 앵커를 결합시키려고 시도하고 있다;신발옷 장면은 앞에는 디지털인 생방송, 뒤에는 아나운서가 옷을 갈아입는 장면을 보여주며 특정 품목의 속성에 기반한 생방송 스타일은 모두 디지털인으로 이전된다.
큰 모형의 발전 추세에 대해 여러 징둥 기술 책임자들은 모두 큰 모형은 하면 할수록 작아질 것이며, 수역 큰 모형은 비교적 확실한 방향이며, 심지어 장면 큰 모형까지 더욱 세분화할 수 있다고 말했다.그 내적 논리는 큰 모델이 장면, 업계에 적합해야 하기 때문에 너무 커서는 안 된다는 것이다.
경동탐색연구원 원장, 경동과학기술 인공지능업무 책임자 하효동은 데이터와 계산력의 제한으로 인해 단순히 모델의 규모를 향상시킨다면 곧 발전의 천장에 도달할 수 있어 큰 모델이 발생하는 경제효익이 자체의 원가를 지탱하기에 부족하여 지속하기 어려울 수 있다고 판단했다.
이어 "큰 모델은 매년 10배씩 성장해 매개 변수가 백억, 천억에서 조원에 이르지만 상업화가 정착하는 것은 현재로서는 낙후돼 중장기적으로는 결국 문제가 될 것"이라며 현재 많은 모델의 환각률이 여전히 높아 후속 산업 응용에 튼튼한 보장을 제공하지 못하고 있다고 지적했다.
허샤오둥의 소개에 따르면, 징둥은 모델 자체 진화 방면에서 초기 전략 모델에서 출발하여 먼저 초기 선호 데이터 세트를 구축한 후 미리 훈련된 장려 모델을 이용하여 각 대답에 점수를 매기고 득점의 높낮이에 따라 새로운 선호 데이터를 구축하는데, 이러한 새로운 선호 데이터는 모델의 반복 갱신을 크게 촉진할 것이다.
모델 추리 방면에서 현재 대언어 모델 추리 원가가 천정부지로 치솟고 있다. 이를 위해 징둥은 엔드투엔드, 저비트, 고정밀 계량화 기술을 통해 모델 구축 시효를 향상시키고 모델 출력의 정확성과 매개변수 양에 영향을 주지 않는 상황에서 모델 부피를 낮추고 추리 성능을 향상시킨다.허샤오둥에 따르면, 현재 그 기술 방안은 모델 현존을 70% 절약할 수 있게 했다.
구체적으로 기업의 착지 큰 모델에 대해 차오펑은 세 가지가 매우 관건이라고 생각한다.우선 간단하다. 장면의 다양성과 파편화는 높은 개발 원가를 지탱할 수 없다. 필연적으로 큰 모델의 사용 문턱을 최소화해야만 더 많은 응용을 커버할 수 있다.그 다음은 개방이다. 개방된 Agent 생태, 대형 모델 생태, 클라우드 원생 생태를 바탕으로 선택권을 고객에게 준다.셋째, 보안, 데이터 보안 및 개인 정보 보호, AIGC 콘텐츠 준수, 언어 자료 데이터 보안 관리를 제공하여 기업 대형 모델 서비스를 신뢰할 수 있도록 합니다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|www.LogoMoeny.com

GMT+8, 2024-11-30 07:45 , Processed in 0.095143 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表