就餐發(fā)票、文獻資料、車架號……未經(jīng)發(fā)掘的數(shù)據(jù)看似平平無奇,但經(jīng)過高質(zhì)量“開采”就成“數(shù)據(jù)珍寶”,從“沉睡的數(shù)字”變?yōu)椤百嶅X的源泉”。近日,揚子晚報/紫牛新聞記者探訪數(shù)據(jù)要素新興產(chǎn)業(yè)的三家代表企業(yè)——數(shù)族科技(南京)股份有限公司、見鯨科技(南京)有限公司、南京三百云信息科技有限公司。它們在數(shù)字時代“掘金”的應(yīng)用場景,是否給你帶來啟發(fā)?
一張購物發(fā)票藏100多類高質(zhì)量數(shù)據(jù)
如今,掃碼或在平臺勾選“我要開票”,已成為消費者就餐、住宿開發(fā)票的日常。但幾年前,“開票難、開票繁”還困擾著大家——插稅盤、輸信息,步驟繁瑣還易出錯;手撕定額票、手寫限額票,更是沒法核驗。2017年5月,數(shù)族科技推出全國首個發(fā)票云,發(fā)明全國第一張自助開票二維碼,拉開發(fā)票數(shù)字化服務(wù)的序幕。
8年多過去,數(shù)族科技的“臻票云”已服務(wù)超400萬家納稅經(jīng)營主體,每年采集發(fā)票約10億張?!耙粡堎徫锇l(fā)票,藏著100多類高價值數(shù)據(jù)?!睌?shù)族科技創(chuàng)始人徐劍說。目前,該公司已在江蘇省數(shù)據(jù)交易所上架近300款數(shù)據(jù)產(chǎn)品,既有34款產(chǎn)業(yè)集群企業(yè)數(shù)據(jù)集,也有200多款數(shù)據(jù)應(yīng)用類產(chǎn)品。
這些數(shù)據(jù)產(chǎn)品就像企業(yè)的“智能體檢單”。比如“企業(yè)發(fā)票分析報告”和“企業(yè)財稅經(jīng)營分析報告”,能清晰呈現(xiàn)企業(yè)各項經(jīng)營指標(biāo),并附帶指標(biāo)解讀、行業(yè)對標(biāo)、原因分析和對策建議。徐劍直言:“能幫企業(yè)實實在在‘省錢、賺錢、找錢’?!?/p>
2025年7月,數(shù)族科技拿下00001號人工智能高質(zhì)量數(shù)據(jù)集評價證書,印證了其數(shù)據(jù)研發(fā)實力。數(shù)據(jù)領(lǐng)域的新職業(yè)也讓人耳目一新。2025年3月,數(shù)族科技副總經(jīng)理戴方明獲得數(shù)據(jù)資產(chǎn)運營官證書?;诠灸P?,一個月數(shù)十萬條的海量售后數(shù)據(jù),他半小時就能提煉出關(guān)鍵信息;他用發(fā)票數(shù)據(jù)幫銀行做貸前審查,原本十天半個月的流程,如今5到10分鐘就完成。
結(jié)合數(shù)據(jù)對企業(yè)的“動態(tài)診斷”成為數(shù)族科技的主營業(yè)務(wù),2024年的營收首次超過發(fā)票業(yè)務(wù)。2025年,公司總營收預(yù)計3億元左右,其中超2億元來自數(shù)據(jù)業(yè)務(wù)。展望未來,“數(shù)字寶藏”的前景還很廣闊,或許正如數(shù)族科技Logo中的巧思——數(shù)字、數(shù)族的首字母都是“SZ”,二者拼成了“∞”(無窮大),“代表著無限可能?!毙靹φf。
3歲“小鯨魚”靠數(shù)據(jù)年收增逾10倍
見鯨科技的文化墻上貼著一條條“小鯨魚”,每一條上都有手寫寄語,見證著公司創(chuàng)立3年來,與員工的共同成長。“見鯨寓意我們正在科研的藍海中探索,也寄托著對創(chuàng)造美好事物的預(yù)期。”見鯨科技創(chuàng)始人任浩是一名“90后”。公司員工約100人,平均年齡28歲。
公司自研鯨靈AI科研垂直大模型,并研發(fā)了包括文獻、定題、標(biāo)書、實驗、數(shù)據(jù)、寫作等基礎(chǔ)科研全路徑的科研應(yīng)用矩陣。其中,見鯨科技的小綠鯨英文文獻閱讀器,是國產(chǎn)文獻管理類軟件用戶量第一,也是國內(nèi)首款受邀入駐“華為鴻蒙千帆計劃”的科研應(yīng)用。
公司數(shù)據(jù)集上擁有超過5萬本國際學(xué)術(shù)期刊,涵蓋醫(yī)學(xué)等共113個一級學(xué)科,并收錄超過1.6億篇優(yōu)質(zhì)英文學(xué)術(shù)文獻和800多萬項全球范圍內(nèi)科研基金數(shù)據(jù),經(jīng)過對數(shù)據(jù)的脫敏、清洗、預(yù)處理與關(guān)鍵信息提取,為國內(nèi)數(shù)百萬基礎(chǔ)科研人員提供AI與數(shù)字化解決方案。以課題申報場景為例,可將傳統(tǒng)方式下需要3個月的定題決策周期,縮短到5分鐘并顯著提升決策質(zhì)量。
“見鯨科技旗下科研應(yīng)用矩陣的累計注冊用戶即將突破400萬,高峰日活超過30萬,并以每年超100萬的新增注冊速度保持持續(xù)增長?!比魏平榻B,從2022年的營收數(shù)十萬元,到2024年的營收過千萬元,公司每年都在飛速上臺階。
二手車交易有了數(shù)據(jù)“身份證”
曾幾何時,二手車用戶對行業(yè)的不信任,是制約市場發(fā)展的痛點。“通過深度學(xué)習(xí)和人工智能技術(shù),車300深度融合公共數(shù)據(jù)、企業(yè)自有數(shù)據(jù)及第三方數(shù)據(jù),構(gòu)建了車型識別大模型、車輛估值大模型和車況分析大模型,解決了困擾千萬消費者的問題?!比僭苿?chuàng)始人&CEO(首席執(zhí)行官)許偉介紹,三百云是國內(nèi)領(lǐng)先的汽車交易與金融數(shù)字化服務(wù)商,車300APP是一款以二手車估值定價為基礎(chǔ)的汽車交易工具。
“比如,你面前有一輛2019款特斯拉Model 3,打開車300,拍攝照片并上傳,就可以知道車輛的品牌、車型、配置,并調(diào)取對應(yīng)的車輛歷史數(shù)據(jù),自動判定車況等級,基于全國交易數(shù)據(jù),可以得到買賣雙方都認(rèn)可的精準(zhǔn)定價?!痹S偉介紹,車300APP以二手車估值定價為基礎(chǔ),提供全網(wǎng)車源,支持快速查詢車況、車價。
其中,車型識別大模型可以實現(xiàn)高精度、秒級自動化識別;車輛估值大模型整合歷史交易數(shù)據(jù)庫和區(qū)域供需,動態(tài)修正折舊曲線;車況分析大模型訓(xùn)練了AI視覺識別能力,可以遠(yuǎn)程高效地檢測車輛損傷及關(guān)鍵部件狀態(tài),實現(xiàn)非標(biāo)車況的精準(zhǔn)量化。
三百云聯(lián)合創(chuàng)始人&COO(首席運營官)左強翔介紹,車300APP累計下載量超2.4億,日活130萬。估值數(shù)據(jù)累計調(diào)用量超過140億次。智能遠(yuǎn)程評估產(chǎn)品——車300快定價,月均檢測車輛45萬單,較傳統(tǒng)方式效率提升80%。
“針對汽車產(chǎn)業(yè)鏈長期存在的車型定義混亂、數(shù)據(jù)孤島林立問題,車300建立了嚴(yán)格的車輛基礎(chǔ)信息、動態(tài)數(shù)據(jù)格式及跨系統(tǒng)交互規(guī)范,讓數(shù)據(jù)有了統(tǒng)一的‘語言’和‘身份證’?!弊髲娤杞榻B,2024年,公司有員工近300人,技術(shù)人員占比65.24%。三百云已連續(xù)多年營收過億元。
【專家點評】
推動江蘇數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展從三方面著力
數(shù)據(jù)產(chǎn)業(yè)作為數(shù)字經(jīng)濟的核心引擎,是引領(lǐng)未來發(fā)展的關(guān)鍵力量。今年《政府工作報告》強調(diào)加快健全數(shù)據(jù)基礎(chǔ)制度,強化數(shù)據(jù)治理、數(shù)據(jù)應(yīng)用等標(biāo)準(zhǔn)化建設(shè)和數(shù)據(jù)安全工作,大力發(fā)展數(shù)據(jù)產(chǎn)業(yè)。江蘇作為數(shù)字經(jīng)濟大省,已在政務(wù)數(shù)據(jù)開放、工業(yè)互聯(lián)網(wǎng)數(shù)據(jù)應(yīng)用、金融與消費數(shù)據(jù)創(chuàng)新等方面形成較為堅實的基礎(chǔ),并初步構(gòu)建起涵蓋數(shù)據(jù)采集、存儲計算、開發(fā)利用、流通交易、安全治理等上下游環(huán)節(jié)的產(chǎn)業(yè)鏈。進一步推動江蘇數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展應(yīng)從以下三方面著力:
一是強化制度與政策支持。加快完善數(shù)據(jù)產(chǎn)權(quán)界定、確權(quán)登記、定價評估、交易流通、收益分配等制度建設(shè),建立數(shù)據(jù)要素市場規(guī)范運行機制。完善數(shù)據(jù)安全與個人信息保護的法規(guī)制度,形成兼顧創(chuàng)新與安全的治理框架。
二是提高數(shù)據(jù)流通效率。進一步開放公共數(shù)據(jù),簡化企業(yè)獲取公共數(shù)據(jù)的流程,降低數(shù)據(jù)獲取門檻;推動行業(yè)數(shù)據(jù)開放共享,允許企業(yè)通過合規(guī)渠道獲取脫敏數(shù)據(jù)用于模型訓(xùn)練等;探索多元流通模式,推動場內(nèi)場外交易并行發(fā)展,促進數(shù)據(jù)在區(qū)域/行業(yè)內(nèi)的流通與高效利用。
三是加快應(yīng)用場景落地。推動工業(yè)互聯(lián)網(wǎng)、智能制造、智慧交通、現(xiàn)代金融、醫(yī)療健康等重點行業(yè)率先實現(xiàn)數(shù)據(jù)要素化轉(zhuǎn)型,加快培育一批可復(fù)制推廣的典型應(yīng)用場景。通過建設(shè)省級場景創(chuàng)新聯(lián)盟和數(shù)據(jù)流通示范區(qū),實現(xiàn)需求側(cè)和供給側(cè)的高效對接,推動形成閉環(huán)的產(chǎn)業(yè)創(chuàng)新生態(tài)。注重培育數(shù)據(jù)要素產(chǎn)業(yè)鏈上下游的中小企業(yè),促進場景創(chuàng)新與商業(yè)模式創(chuàng)新的互動發(fā)展。
宋穎弘(南京大學(xué)經(jīng)濟學(xué)院博士后、江蘇省社會科學(xué)院區(qū)域現(xiàn)代化研究院助理研究員)
文字:揚子晚報/紫牛新聞記者 沈春寧 馬燕
拍攝:朱君賢
剪輯:曾宏亮 朱君賢
視覺:肖甜 黃鳳
校對 朱亞萍