近來,詞元(Token)一詞持續(xù)刷屏科技圈、經(jīng)濟圈,而讓它“破圈”的,是一組極具沖擊力的數(shù)據(jù)——今年3月,我國日均詞元調(diào)用量突破140萬億。從2024年初的1000億,到2025年底的100萬億,再到突破140萬億,兩年間增長超千倍。
這組跳躍式增長的數(shù)據(jù),讓詞元這一專業(yè)術語走進大眾視野,折射出我國人工智能產(chǎn)業(yè)的蓬勃脈動。
什么是詞元?它是大模型處理信息的最小信息單元,如果說我們讀書寫字以“字”為單位,那么AI(人工智能)處理數(shù)據(jù)時,就會先將數(shù)據(jù)拆解成一個個可處理的詞元,它可以是單個漢字、標點符號,也可以是一個詞語片段。我們每一次向AI提問、使用AI生成內(nèi)容,都是在調(diào)用詞元。
詞元調(diào)用量的持續(xù)走高,是人工智能應用走進生活、融入產(chǎn)業(yè)的生動見證。
技術的價值,最終要體現(xiàn)在應用落地與場景賦能上。如今,AI已融入我們生活的方方面面:教師用AI輔助備課提質(zhì)增效,農(nóng)民用AI診斷病蟲害守護收成,小微企業(yè)用AI優(yōu)化供應鏈降低成本,辦公職員用AI處理文案……從“點亮”日常生活到深度賦能產(chǎn)業(yè),從文本生成到智能體的廣泛應用,AI越來越好用,帶動詞元調(diào)用量持續(xù)攀升。這背后,是億萬用戶與萬千企業(yè)對AI技術的認可,更是我國人工智能應用生態(tài)日趨成熟的有力證明。
詞元調(diào)用量的持續(xù)走高,更藏著AI產(chǎn)業(yè)商業(yè)化破局的關鍵密碼,是供給側創(chuàng)新動能的集中釋放。
詞元的每一次調(diào)用,都離不開算力、算法、電力等產(chǎn)業(yè)鏈各環(huán)節(jié)的協(xié)同支撐,人工智能產(chǎn)業(yè)鏈的競爭力,也能通過詞元這一載體得到衡量。
比如,算力越強,詞元處理速度越快、單位成本越低;算法越優(yōu),模型生成的內(nèi)容質(zhì)量越高、詞元調(diào)用頻次越高;電力供給越穩(wěn)定、成本越低,詞元的生產(chǎn)與調(diào)用成本也會降低,甚至能讓中國的綠電以詞元形式實現(xiàn)價值出?!?/p>
這種全鏈條的價值評估能力,加上詞元本身所具備的可計量、可定價、可交易的特征,使其成為連接技術供給與商業(yè)需求的“結算單位”,讓人工智能產(chǎn)業(yè)的商業(yè)化路徑愈發(fā)清晰——就像我們按流量付費使用網(wǎng)絡,人工智能服務也可以通過“按詞元計費”,進一步在產(chǎn)業(yè)、民生場景轉化落地,成為數(shù)字經(jīng)濟新的增長引擎。
詞元調(diào)用量的持續(xù)走高,是數(shù)據(jù)要素價值釋放的鮮活注腳,離不開政策措施的有力托舉。
人工智能的發(fā)展離不開數(shù)據(jù)的支撐。詞元的海量調(diào)用,得益于高質(zhì)量數(shù)據(jù)集的持續(xù)擴容——截至2025年底,我國已建成高質(zhì)量數(shù)據(jù)集超10萬個,總體量超890PB(千萬億字節(jié)),數(shù)據(jù)通過拆解為詞元被AI處理、應用,最終轉化為實實在在的生產(chǎn)力,推動模型迭代、應用落地。
這也進一步說明,隨著中國數(shù)據(jù)要素市場化配置改革向縱深推進,高質(zhì)量數(shù)據(jù)的供給體系正在形成,數(shù)據(jù)要素從供給到價值釋放的良性循環(huán)加速成形,不斷為人工智能產(chǎn)業(yè)注入源頭活水。
一個個跳動的數(shù)字背后,是技術的迭代、應用的深化,更是產(chǎn)業(yè)的躍遷。隨著技術的加速進化、智能經(jīng)濟新形態(tài)的茁壯成長,我國人工智能產(chǎn)業(yè)將向著更高質(zhì)量、更深層次、更廣領域發(fā)展,為數(shù)字中國建設注入源源不斷的新動能。