5月24日,國家數據局會同生態環境部、交通運輸部、金融監管總局、中國科學院、中國氣象局、國家文物局、國家中醫藥局等部門在第七屆數字中國建設峰會上發布首批20個“數據要素×”典型案例。通過示范引領,激勵多方主體積極參與,釋放數據要素價值。
案例涵蓋了工業制造、現代農業、商貿流通、交通運輸、金融服務、科技創新、文化旅游、醫療健康、應急管理、氣象服務、城市治理、綠色低碳12個行業和領域。本期將聚焦科技創新、文化旅游、醫療健康3個領域的典型案例,詳細展示有關單位促進數據要素開發利用的典型經驗做法。
科技創新領域
案例八 高質量化學及材料科學數據集 加速材料研發范式變革
材料科學是國民經濟發展的基礎,材料研發的進步有助于國家經濟從高速發展向高質量發展轉變,新材料產業的戰略性崛起對促進高端裝備突破及保障國家重大戰略需求意義重大。但材料研發的傳統“試錯”模式存在研發周期較長、成本較高、不確定性較大等問題。合肥機數量子科技有限公司通過建立高質量化學和材料科學數據庫,訓練材料配方與合成方案人工智能分析模型,構建機器人實驗系統,打造基于數據的材料研發新模式,顯著提升新材料研發質效,大幅增強相關產品市場競爭力。
一是建立高質量化學和材料科學數據庫
通過挖掘專利論文等文獻數據,開展高效量子化學計算,建立了含9000萬化合物、1100萬化學反應路徑的大規模材料數據庫。
圖1 構建高質量化學與材料數據庫
二是訓練專項人工智能分析模型
構建包含材料結構、性能等特征的材料配方與合成方案的人工智能分析模型,借助高質量化學和材料科學數據,對模型進行訓練和調優,形成可用于尋找材料配方和合成方案的人工智能產品。
圖2 構建知識圖譜,開發智能模型
圖3 推動模型應用
三是打造智能化機器人實驗系統
建設機器人試驗系統“機器化學家”,實現“數據讀?。桨冈O計-實驗操作”全流程智能化,變革材料研發范式,提升研發效能?!皺C器化學家”日均可完成百次以上化學實驗操作,并將數千次實驗優化過程縮短至300次以下,開發效率提升超百倍,全局優化準確率達到90%以上。同時,實驗結果反哺到數據庫中,推動數據智能驅動材料研發的良性循環。2023年上線以來,系統已在20余家高校、科研機構及行業頭部企業得到應用,支撐解決了如開發記憶金屬、紅外探測芯片光吸收增強、磷礦浮選、智能窗材料等一批技術難題,提升了相關產品的技術水平和市場競爭力。
圖4 構建數據智能驅動的全流程機器化學家
案例九 多元數據融合 支撐空間與天文科技創新發現
空天科技是一種跨學科、跨領域、跨行業的綜合性科技。中國天眼FAST、子午工程等重大科技基礎設施建成應用和空間科學系列衛星的發射啟用,產生海量數據。該類數據標準不一、來源分散、類別多樣,深度應用較難,為高效應用空間天文數據,豐富研究方法,提升處理應用方式,更好地支撐復雜科學問題研究,國家空間科學數據中心、國家高能物理科學數據中心、國家天文科學數據中心等聯合通過強治理、研工具,探索形成基于數據的天文領域科學創新模式。
一是促進空間-高能物理-天文科學數據匯聚與全生命周期治理
編制分級分類、管理存儲、開放共享等空間高能天文領域系列數據標準10余項,以標準為引領,規范實施全生命周期數據治理,促進跨學科數據匯聚融合。
圖1 科技項目與科學數據雙生命周期協同管理模式
二是建立空間高能天文領域融合數據庫
聚焦跨領域前沿科學問題,面向科學真實需求,打造空天典型事件等數據庫,發布空間科學、高能物理、天文學聯合主題數據資源。自2021年以來,治理形成高質量空間天文科學數據資源約50PB。
圖2 三中心聯合發布高能瞬變源多波段監測數據專題,提供面向科學問題的跨領域數據發現服務
三是以數據驅動科學新發現
依托融合數據庫、借助人工智能等,聯合研發了20余項專用數據分析挖掘工具與模型,推出以超高能宇宙線起源、多波段時域天文、日地空間天氣傳播鏈等不同科學場景的高質量在線數據分析應用,服務空間天文領域科技系列創新活動,服務科技計劃千余項,助力取得“全球首次打開了10TeV波段的伽馬射線暴觀測窗口”“獲得納赫茲引力波存在的關鍵證據”等數十項國際領先的原創性、標志性、突破性科學發現,相關成果發表于《自然》《科學》等國際頂尖學術期刊,多項成果入選當年“中國科學十大進展”。
圖3 AI for Data空間與天文領域系列專用軟件工具
文化旅游領域
案例十 數據資源融合應用 助力文物傳承保護和價值增值
推動數字技術與文物保護利用融合發展是建設文化強國的關鍵舉措。目前,文物數據資源應用率較低,數據要素在文物的保護、管理、傳播、利用中發揮的作用不足,難以對文物關聯行業的數字化發展起到足夠的支撐作用。湖南省博物院積極推進文物數據資源的挖掘、匯聚和利用,通過創新合作開發模式,推動文物數據資源協同優化、復用增效、融合創新。
一是多手段采集匯聚文物數據資源
通過高清影像拍攝和激光掃描等手段,采集文物數據103萬條、圖片11萬張、三維模型2000余個,編制文物數據采集加工地方標準,推動構建馬王堆漢墓文物、音樂文物等文物知識圖譜,并將文物中涉及的傳統醫藥、農牧漁獵、服飾服裝、餐飲美食、禮儀文化、人物事件等元素進行數字化映射、匹配、提取和轉化,形成多種文物數據資源集。
二是構建文物數據授權和合作開發模式
積極與高校、優質企業、文化創意團體等簽署整體授權或單項合作開發協議,免費開放品牌資源和文化數據庫授權,聯合打造“數字漢生活”文化IP系列產品,實現文物數據資源在不同領域中的復用增效。先后簽約近50家企業和團隊,帶動近10億元規模的文化創意及周邊產業發展。
三是推動文物數據跨領域融合創新
面向不同行業、不同人群等差異化需求,設計、制作、推出馬王堆復原京劇展演、多年齡段“辛追”數字人、文物實景解謎游戲及數字藏品等系列產品。自2022年以來,以匯聚形成的文物數據資源為基礎,先后推出云展覽、云教育、動畫視頻、沉浸式體驗等200余項數字化項目,瀏覽量超過1200萬次;同時舉辦2個大型線下數字展覽,吸引60余萬觀眾,實現2300萬元票房收入,推動了文化傳承和文物價值增值協同發展。
圖 沉浸式體驗、數字人、元宇宙及數字藏品等數字產品
案例十一 圖書出版數據融合創新應用推動產業轉型升級
作為文化產業的重要組成部分,出版業高質量發展既是順應信息化時代發展的需要,也有助于滿足人民群眾的多樣化需求。當前,傳統出版行業存在多元化市場需求難以捕捉、數據利用分析能力不足等問題,武漢理工數字傳播工程有限公司通過整合出版圖書產業鏈上下游不同渠道的數據資源,打造了智能化數據平臺,助力出版單位以數據洞察更好把握市場趨勢和用戶需求,推動出版業數字化轉型與創新發展。
一是推動圖書出版數據融合匯聚
平臺通過整合中國國家版本館圖書數據、1.7億會員讀者數據、全國各省新華集團的線下銷售數據,以及京東、天貓、抖音等線上平臺的銷售數據,構建了包含標簽、發行渠道、讀者評價、線上數字化服務使用偏好等豐富信息的數據資源庫。
二是強化數據質量管理
應用全國統一的出版圖書數據標準,制定精細化的實施規范,確保數據格式、結構和質量統一。做好清洗、驗證、加密及訪問控制等精細化數據治理,確保數據準確、可靠和安全。
三是開發數據產品與服務
對平臺圖書數據進行深度挖掘和融合分析,為出版單位提供選題策劃、讀者偏好、市場風向、競品分析等數據服務。依托平臺豐富的圖書出版數據資源,開發人工智能(AI)大模型,推出了首個AI閱讀服務數字人等數據產品,拓展圖書出版數據應用場景和價值空間。
圖 出版圖書數據平臺界面
自2014年成立以來,公司為300多家出版單位提供了覆蓋知識策劃、整合、發行、服務等全鏈條的1300多款應用與產品,幫助出版單位在文化產品的選題、策劃等方面明顯提高了效率和準確性,引導出版企業為社會提供更多更符合大眾需求的優質文化產品,累計為出版行業創造了近150億元實際收入。同時,平臺緊跟社會文化需求風向,不僅提高了經濟效益,也繁榮了文化市場。
醫療健康領域
案例十二 醫療數據智能化分析輔助提升基層診療水平
基層醫療衛生體系是守護億萬人民群眾身體健康的“第一道防線”,事關每個人的生活質量。但基層醫療機構往往面臨人才不足、醫生隊伍不穩定、資源供給有限等問題,難以完全滿足廣大群眾對醫療服務的需求。為提升基層醫療服務水平,訊飛醫療科技股份有限公司通過對海量醫療數據的收集和分析,構建醫療AI大模型,為基層診療提供智能化輔助,促進基層醫療服務提質增效。
圖1 場景流程圖
一是匯聚高質量數據資源訓練模型
與中華醫學會雜志社、開放醫療與健康聯盟等權威機構合作,匯聚公開脫敏數據,構建涵蓋疾病知識、癥狀體征、檢驗檢查、藥物信息、臨床路徑、診療規范及指南等內容的數據資源庫,訓練形成智慧醫療AI模型。
二是推進醫療數據與“問、診、治”場景深度結合
模型與行業信息平臺和醫院信息系統對接,以“數據不出本地局域網”方式匯聚分析患者病歷數據及歷史健康信息數據。實現在醫生問診過程中,根據問診邏輯提示病情問診;在診斷過程中,對患者病歷數據進行智能化分析和判斷,協助醫生對病情進行合理診斷;在醫生下處方和檢查檢驗時,及時給出常見用藥和常見檢查檢驗建議,并將異常診斷結果數據及時報送醫療主管部門復核。截至目前,該系統已在全國506個縣區的近5.3萬個基層醫療機構應用,服務6萬余名基層醫生,累計提供7.7億次AI輔診建議,規范病歷2.9億次。經該系統提醒而修正診斷的有價值病歷超139萬例,累計識別不合理處方數6200萬,AI輔助診斷合理率提升至95%(重點地區97%),覆蓋疾病數量超1680種。
圖2 統一標準、規范的數據采集處理流程
- 相關新聞