• 首頁
  • 要聞關注
  • 國際國內(nèi)
  • 龍江新聞
  • 民生關注
  • 經(jīng)濟農(nóng)業(yè)
  • 文化旅游
  • 教育體育
  • 科技健康
  • 冰城聲音
  • 法治在線
  • 數(shù)字報刊
  • ???
  • Pусский
  • 黑龍江新聞網(wǎng) >> 經(jīng)濟農(nóng)業(yè)
    中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布通用大模型評測標準

    10月12日,在2024中國移動全球合作伙伴大會期間,中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布大模型評測體系建設的重要成果《通用大模型評測標準》,為產(chǎn)業(yè)界遴選優(yōu)質大模型提供重要參考依據(jù)。中國移動總經(jīng)理何飚、副總經(jīng)理高同慶,電子標準院、中國電信、國家電網(wǎng)、中國石油、中國物流、南方電網(wǎng)、阿里、科大訊飛、智譜等聯(lián)合編制單位領導出席發(fā)布儀式。

    image.png

    大模型評測是助力人工智能賦能行業(yè)應用的重要一環(huán)。當前眾多企業(yè)已啟動大模型建設,亟需建立配套的通用大模型和行業(yè)大模型評測體系。為發(fā)揮大模型評測領域的引領作用,中國移動聯(lián)合電子標準院及16家重點央企共同開展大模型評測體系建設工作。第一階段將圍繞通用領域和4個重點行業(yè)領域,從評測標準制定、評測基地建設、評測試點應用等方面開展工作。

    目前,中國移動攜手央企及產(chǎn)業(yè)各方遵循“確保評測權威、加強業(yè)界協(xié)同、解決實際問題、保持開放態(tài)度”的原則,初步完成通用大模型評測標準制定,得到行業(yè)龍頭央企、業(yè)界頭部公司、知名高校及科研機構充分認可,為后續(xù)試點評測等工作奠定了堅實基礎。

    通用大模型評測標準基于“2-4-6”框架?!?”代表兩類評測視角,以重點行業(yè)實際使用需求為導向,與國標對模型能力要求拉齊,將評測任務劃分為理解和生成兩類視角?!?”代表四類評測要素,從評測全生命周期中提取出評測工具、評測數(shù)據(jù)、評測方式和評測指標四類關鍵要素,確保評測工作可實施性?!?”代表六大評測維度,綜合考慮大模型應用過程中的核心能力,設定功能性、準確性、可靠性、安全性、交互性和應用性六大維度。該標準廣泛吸納產(chǎn)學研用各方意見,并結合行業(yè)特色場景需求,可為通用大模型全面評估提供客觀依據(jù),為AI賦能千行百業(yè)提供保障。

    未來,中國移動將聯(lián)合行業(yè)龍頭企業(yè)、業(yè)界頭部公司、知名高校和科研機構,深入挖掘石油、電力、交通和物流等重點行業(yè)應用需求,持續(xù)打造并完善通用及行業(yè)大模型評測體系,積極建設大模型評測基地,廣泛征集各中央企業(yè)及頭部民企積極參與大模型評測,打造落地應用最佳實踐,為提升AI+行業(yè)新質生產(chǎn)力,保障國產(chǎn)大模型高質量發(fā)展,貢獻央企力量。

    10月12日,在2024中國移動全球合作伙伴大會期間,中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布大模型評測體系建設的重要成果《通用大模型評測標準》,為產(chǎn)業(yè)界遴選優(yōu)質大模型提供重要參考依據(jù)。中國移動總經(jīng)理何飚、副總經(jīng)理高同慶,電子標準院、中國電信、國家電網(wǎng)、中國石油、中國物流、南方電網(wǎng)、阿里、科大訊飛、智譜等聯(lián)合編制單位領導出席發(fā)布儀式。

    大模型評測是助力人工智能賦能行業(yè)應用的重要一環(huán)。當前眾多企業(yè)已啟動大模型建設,亟需建立配套的通用大模型和行業(yè)大模型評測體系。為發(fā)揮大模型評測領域的引領作用,中國移動聯(lián)合電子標準院及16家重點央企共同開展大模型評測體系建設工作。第一階段將圍繞通用領域和4個重點行業(yè)領域,從評測標準制定、評測基地建設、評測試點應用等方面開展工作。

    目前,中國移動攜手央企及產(chǎn)業(yè)各方遵循“確保評測權威、加強業(yè)界協(xié)同、解決實際問題、保持開放態(tài)度”的原則,初步完成通用大模型評測標準制定,得到行業(yè)龍頭央企、業(yè)界頭部公司、知名高校及科研機構充分認可,為后續(xù)試點評測等工作奠定了堅實基礎。

    通用大模型評測標準基于“2-4-6”框架?!?”代表兩類評測視角,以重點行業(yè)實際使用需求為導向,與國標對模型能力要求拉齊,將評測任務劃分為理解和生成兩類視角。“4”代表四類評測要素,從評測全生命周期中提取出評測工具、評測數(shù)據(jù)、評測方式和評測指標四類關鍵要素,確保評測工作可實施性?!?”代表六大評測維度,綜合考慮大模型應用過程中的核心能力,設定功能性、準確性、可靠性、安全性、交互性和應用性六大維度。該標準廣泛吸納產(chǎn)學研用各方意見,并結合行業(yè)特色場景需求,可為通用大模型全面評估提供客觀依據(jù),為AI賦能千行百業(yè)提供保障。

    未來,中國移動將聯(lián)合行業(yè)龍頭企業(yè)、業(yè)界頭部公司、知名高校和科研機構,深入挖掘石油、電力、交通和物流等重點行業(yè)應用需求,持續(xù)打造并完善通用及行業(yè)大模型評測體系,積極建設大模型評測基地,廣泛征集各中央企業(yè)及頭部民企積極參與大模型評測,打造落地應用最佳實踐,為提升AI+行業(yè)新質生產(chǎn)力,保障國產(chǎn)大模型高質量發(fā)展,貢獻央企力量。

    掃碼二維碼分享到手機
  • 版權所有黑龍江日報報業(yè)集團 黑ICP備11001326-2號,未經(jīng)允許不得鏡像、復制、下載
  • 黑龍江日報報業(yè)集團地址:黑龍江省哈爾濱市道里區(qū)地段街1號
  • 許可證編號:23120170002 黑網(wǎng)公安備 23010202010023號