在线亚洲激情校园|无码久久精品国产亚洲AV牛牛|曰韩A级黄毛片草久伊人|av岛国在线精品国产99|久久黄片免费看视频|五月婷婷成人动漫|亚洲中文字幕性爱电影|日韩成人激情在线免费视频|成人一级片高清AV在线观看|中文动漫av在线观看

首頁 > 新聞中心 > 科技

國內多數模型訓練使用中文數據占比超60%

來源: 人民日報

2025-08-19 07:35:00

記者從國家數據局獲悉:中文數據在國內大模型的訓練性能提升方面發(fā)揮著重要作用。國內多數模型訓練使用的中文數據占比已經超過60%,有的模型達到80%。中文高質量數據的開發(fā)和供給能力持續(xù)增強,推動我國人工智能模型性能快速提升。

在人工智能時代,Token(通常所說的詞元)是處理文本的最小數據單元。國家數據局局長劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經突破30萬億,1年半時間增長了300多倍,反映了我國人工智能應用規(guī)模的快速增長。