첫 페이지 신문 본문

오늘 애플 인텔리전스 (Apple Intelligence) 가 마침내 해외에서 출시되었다.애플은 12월에 ChatGPT 서비스를 시리에 통합하고 더 강력한 이미지 생성 도구를 출시하는 등 새로운 AI 기능을 출시할 계획이다.그러나 Apple Intelligence가 중국 시장에서 언제 사용될 수 있을지는 아직 결정되지 않았습니다.
최근 국내 안드로이드 진영 업체들도 엔드사이드 AI와 운영체제 방면의 일련의 업그레이드를 잇달아 발표하면서 각종 AI 지능체, AI OS의 개념이 쏟아지고 있다.
애플 스마트가 아직 중국 시장의 창구기에 정착하지 않아 국산 휴대전화 업체들이 AI 매점으로 플래그십 모델 경쟁을 더욱 부추기고 있다고 말할 수 있다.각 핸드폰 제조업체는 모두 시스템급 AI를 해야 하고, AI OS를 해야 하며, AI 지능체를 잘 해야 한다고 명확히 했다.
IDC 중국연구경리 곽천상은 ≪ 과학창업판일보 ≫ 에 다음과 같이 표시했다. 안드로이드진영과 애플의 AI면에서의 사고방식은 류사하며 모두 단측모형, 지능체의 개념을 중시한다."AI에서 국내는 그다지 뒤처지지 않았다."
▌ 지능체는 앱을 해치울 수 있습니까?
iPhone의 음성 도우미로서 Siri는 음성 명령을 통해 간단하게 조작할 수 있습니다.그러나 과거의 대답은 주로 검색엔진에 기반했기 때문에 지능도가 매우 제한적이었고, 휴대폰의 앱 인터렉션 모델을 대체할 수 없었다.큰 모델이 발전함에 따라 시리로 대표되는 휴대전화 어시스턴트는 더욱 지능적으로 변해 음성 어시스턴트에서 AI 지능체로 업그레이드될 것으로 보인다.예를 들어 호텔 일정을 예약하려면 앱을 다시 열지 않고 AI 지능체와 직접 대화해 완성해야 한다.
스마트체가 앱을 대체할 것인지에 대해 자오밍 영광 CEO는"이 방향으로 발전할 확률이 높지만 상당 기간 앱과 스마트체는 장기적으로 공존하는 방식이 될 것"이라고 말했다."이것은 사용 습관의 문제와 관련되어 있고, 예상치 못한 다양한 체험 장애의 문제도 있기 때문에 반드시 상당한 시간 내에 병존하거나 장기적으로 병존할 수 있다."
지능체 인터렉션 모드의 첫 단계로 AI 화면 인식은 이미 국내 안드로이드폰에 정착하기 시작했다.최근 출시된 OPPO Find X8은 화면 정보를 지능적으로 분석하고 내용에 따라 사용자와 상호 작용하여 적절한 답변과 조작을 제공하는 원터치 스크린 기능을 오픈했다.
"예를 들어 평소에 찍은 관광지 사진을 AI가 어디인지, 배후에 어떤 이야기가 있는지 직접 식별하고 대답하게 한다.간단해 보이지만 배후에는 전국 3A급 이상 16000개 관광지가 관련돼 있어 백만 급이 채 안 되는 데이터로 전문훈련을 한다"고 장준 오포 AI센터 제품총감독은 말했다.
영광은 지능체를 탑재한 AI 운영체제 MagicOS 9.0을 발표했다.조명은 다음과 같이 소개했다. 현재 지능체는 사람을 모방하여 스크린을 클릭하고 스크린을 리해하며 느린 사고를 진행하고 관건적인 정보를 찾은후 상응한 조작을 진행할수 있다.현재"자율주행"의 지능체 및 응용과 상호 작용하는 지능체 두 종류로 나눌 수 있다.
"자율주행의 지능체, 제3자의 개입 없이 먼저 사용자의 의도를 분석하고 이해한다.예를 들면 나를 도와 술을 주문하고, 지능체는 의도 배후의 이러한 정보와 논리를 이해하고, 의도 장면을 분해한 후 실행 가능한 지령으로 변하여 최종적으로 커피를 주문하는 조작을 실현한다.다른 하나는 응용측의 협동이 필요하다.예를 들면 영광과 차이나모바일의 링코뿔소 큰 모형이다.휴대폰 요금의 잔액을 조회하는 데 있어서 상술한 부분의 지능체 조작에 개입하지 않은 부분도 있다.
향후 AI 인터렉션의 휴대폰에서의 발전에 대해 여러 업계인사들은 직관에 부합되고 가장 직접적인 방식이 최종적으로 주류를 차지하게 될것이라고 인정했다.
궈톈샹은 화면 인식 인터렉션은 AI 휴대폰의 새로운 인터렉션 방식에 속하며, 사용자의 사용에 더욱 편리하고 학습 원가를 낮춘다고 말했다.현재로서는 앞으로 AI 인터렉션이 가장 직접적이고 간단한 방식을 위주로 인간의 본능에서 출발할 것이다.
오포 최고제품책임자 류작호도 직관에 부합하는것은 가장 기본적인 AI리념이라고 인정했다.
"나는 매주 AI 특별회를 열고, 줄곧 하나의 개념을 주입한다: 무엇이든 우선 직관에 부합한다.우리는 기술을 과시할 수 있는 많은 것을 보았는데, 보기에는 매우 간단해 보이지만, 사실 배후의 기술 요구는 매우 높다.마치 클릭 한 번으로 화면을 묻고, 어떻게 사용자의 의도를 식별하고, 스크린을 식별하는지, 그 안에 많은 분류 기술이 관련되어 있다.그러나 기술은 결국 사용자로 돌아가 제품을 만들어야 한다.예를 들면 네비게이션을 사용할 때 열면 주소가 있고, 직접 누르면 AI가 가장 효율적인 직관이다. 이 시대는 바로 이 직관이다."
▌ 엔드 사이드 모델: 경험과 성능의 균형에 대한 어려움
큰 모형은 휴대전화에 장착해야 하며 전망이 무한함과 동시에 도전이 병존해야 한다.휴대폰의 제한된 계산력은 엔드사이드 모델이 너무 커서는 안 된다는 것을 결정하지만, 작은 매개변수의 모델은 능력에서 또 제한을 받는다.
궈톈샹은 현재 엔드사이드 모델은 더 이상 모델 매개변수의 크기를 지나치게 강조하지 않고 사용 경험, 메모리 점용 및 전력 소비 사이의 균형을 추구한다고 말했다.
류쭤후는 엔드 사이드 모델이 성능에 대한 요구가 매우 높으며 성능이나 메모리에 대한 요구가 매우 높다고 털어놓았다.그러므로 어떻게 지속적으로 구조를 최적화하고 고에너지효률로 칩의 잠재력을 발휘할것인가 하는것은 여전히 아주 긴 길이다.
"아직 할 수 있는 일이 많다.예를 들어 플랫폼에 대한 방열은 간단하다고 생각할 수도 있지만 사실 어렵다.또 밑바닥 메모리 호출을 어떻게 잘 할 것인가 등등.솔직히 AI는 휴대전화 업계에서 아직 막 시작했고, 앞으로 매우 많은 AI 변화를 보게 될 것"이라고 말했다.
장준은 오포가 메모리 등 자원의 점용을 줄이기 위해 새로운 엔드 사이드 아키텍처 AI LoRA를 곧 출시할 것이라고 밝혔다.
"단측 AI의 가장 큰 병목 현상은 휴대폰 컴퓨팅 자원의 사용이다.예를 들어 휴대폰에서 동시에 세 가지 기능의 단측화를 실현하려면 정상적으로 세 개의 상응하는 자원을 차지해야 한다.만약 모형을 기관차에 비유한다면, 세 개의 모형에 올라가면 세 개의 기관차에 다시 객차를 추가해야 한다는 것을 의미한다.LoRA 아키텍처는 기본 모형 + 응용 모형의 모드를 사용한다.한 개의 기본 모형만 있으면 된다. 즉 한 개의 기관차만 있으면 된다. 어떤 종류의 권총이 세 개의 피크 모형을 사용할 수 있는지, 어떤 종류의 왼쪽 바퀴 모형을 사용할 수 있는지.
▌ AI 휴대전화 후시대: 지능체가 더욱 많은 인공조작을 대체하게 된다
큰 모델의 발전에 대해 업계에서는 보편적으로 단기적이고 신중하며 장기적으로 락관적인 태도를 유지하고있다.끝면에서의 착지도 이와 같다.
류쭤후는 AI 시대의 변화가 매우 빠르다고 분석했다."과거 휴대전화 운영체제에 대해 우리는 반년, 1년에 따라 계획을 세웠다.그러나 AI 시대는 반드시 그렇지 않을 것이다.1년 후, AI가 어떤 모습인지 누가 알 수 있겠는가.AI 제품은 심지어 3개월마다 계획하는 것이 아니라 매달 계획해야 한다.모형의 변화가 너무 빨라서 기술이 상상 속도를 초월한다.솔직히 나 자신도 매우 긴박성이 있다"고 말했다.
류쭤후는 AI 시대에 제품을 만드는 것은 빨리 달리는 것이라고 강조했다.너는 반드시 뛰어야 한다. 빨리 뛰어야 한다. 그렇지 않으면 뒤떨어져야 한다. 기술의 변화에 따라야 한다.
최근, 중국정보통신연구원은 세계 최초의"단말기 지능화 등급별 연구보고"를 발표하여 단말기 지능화 수준을 5개 등급 L1-L5로 나누었는데, 지능화 등급이 높을수록 단말기 자주참여도가 높고 사람의 참여도가 낮다.L1급과 L2급은 일정한 지능화를 구비하여 단일류형의 임무를 완수할수 있다.L3 레벨과 L4 레벨은 복잡한 의도를 인식하는 것에서 잠재적인 의도를 식별하는 데까지 점진적으로 진행됩니다.L5급은 전면적인 지능화를 구비하여 자주적으로 계획하여 전 류형의 임무를 완수할수 있다.
조명은 다음과 같이 표시했다. 현재 단말기의 지능화수준은 L3의 수준에 처해있으며 다음 L4, L5의 단계로 나아가려면 소요시간이 좀 더 길어지고 더욱 많은 축적이 수요된다.
"오늘 우리는 사용자 이해 카테고리를 950개에 도달 할 수 있습니다.앞으로 반드시 휴대폰의 많은 운행을 포괄할 수 있을 것이다. 기존 휴대폰에서 더 많은 사람들의 간섭이 필요한 부분을 점차 모두 제거할 수 있다.이제 한 마디로 휴대폰 전화를 걸면 문제가 없다. 위챗 동영상도 되고 커피를 주문해도 할 수 있다.한 걸음 더 나아가면 더 많은, 더 모호한 지령, 그리고 더 복잡한 관계 사이의 이해를 실현해야 한다"고 말했다.
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
您需要登录后才可以回帖 登录 | Sign Up

本版积分规则

强绝商爸摇 注册会员
  • Follow

    0

  • Following

    0

  • Articles

    34