智能體(AI Agent)作為人工智能產(chǎn)業(yè)化的關鍵載體,正從概念探索邁向大規(guī)模產(chǎn)業(yè)應用,成為推動社會生產(chǎn)力變革的重要力量。智能體核心能力已從單一的對話生成,躍升為具備自主規(guī)劃、工具調用、多模態(tài)融合及環(huán)境交互的復雜系統(tǒng)。當前,智能體以數(shù)字員工、個人助理等身份,已廣泛應用于軟件開發(fā)、金融服務、智能制造等多個領域,顯著提升行業(yè)效率與個性化服務水平。
中國信息通信研究院(簡稱“中國信通院”)人工智能研究所持續(xù)關注智能體發(fā)展態(tài)勢,通過產(chǎn)業(yè)研究、標準研制、評估測試、生態(tài)建設等工作多措并舉推動智能體高質量發(fā)展。在產(chǎn)業(yè)研究方面,編制《智能體產(chǎn)業(yè)圖譜1.0》《智能體技術和應用研究報告(2025年)》等多項成果;在標準研制方面,圍繞智能體基礎技術與行業(yè)應用,研制智能體國際標準1項、行業(yè)標準10余項、聯(lián)盟規(guī)范20余項;在評估測試方面,開展多批次可信AI智能體評估,累計為50余家單位提供智能體專項評估服務;在生態(tài)建設方面,中國信通院聯(lián)合業(yè)界百余家單位在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)共同發(fā)起成立智能體創(chuàng)新與應用委員會,并開展案例征集、技術沙龍等活動。
為促進智能體技術提升,加速智能體應用深入,推動智能體產(chǎn)業(yè)加速發(fā)展,中國信通院在前期構建了覆蓋通用智能體、場景智能體、行業(yè)智能體的可信AI評估體系1.0的基礎上,持續(xù)跟蹤智能體技術發(fā)展,升級完善評估體系,形成面向企業(yè)級智能體的全鏈路評估體系。中國信通院現(xiàn)正式發(fā)布可信AI智能體評估體系2.0,體系覆蓋智能體基礎設施、數(shù)據(jù)資源、核心組件、平臺支撐、關鍵能力、典型應用、運維管理以及價值評價等八大維度,構建全生命周期、多層次、可量化的綜合評價框架,全面保障智能體在復雜開放環(huán)境下可信可控、穩(wěn)定高效、合規(guī)安全,為技術選型、項目驗收、行業(yè)監(jiān)管與規(guī)?;涞靥峁┛茖W依據(jù)與標準化支撐。
其中,智能體基礎設施重點關注智能體運行環(huán)境、硬件資源適配、異構兼容、彈性擴展等能力。智能體數(shù)據(jù)資源重點關注面向智能體的數(shù)據(jù)開發(fā)、數(shù)據(jù)工程、DataOps等能力。智能體核心組件重點關注協(xié)作協(xié)議、RAG、Skills、編排等能力。智能體平臺支撐重點關注智能體開發(fā)、測試、運營、優(yōu)化全生命周期的平臺與工程能力。智能體關鍵能力重點關注智能體感知、決策、生成、交互以及多智能體協(xié)同、多模態(tài)智能體等能力。智能體典型應用重點關注智能助手等個人應用,客服、營銷等企業(yè)級應用,金融、工業(yè)、教育等行業(yè)應用。智能體運營管理重點關注智能體運營、運維與管理制度與能力。智能體價值評價重點關注智能體業(yè)務價值、服務質量、應用效能、功能性能以及應用成熟度的評估。
中國信通院可信AI智能體評估體系2.0

下一步,中國信通院繼續(xù)跟蹤智能體技術發(fā)展,不斷豐富可信AI智能體評估體系,歡迎各方單位共同參與建設。

來源:中國信息通信研究院