歷時三天的2017中華醫(yī)院信息大會(2017CHINC)已圓滿落幕。作為已成功舉辦20屆的醫(yī)療信息領域年度重磅盛會,CHINC既是行業(yè)革新思想的盛宴,也是技術成果展示的舞臺,吸引了來自全國各地醫(yī)療信息化領域涵蓋政、產、學、研、資、管、用數千名代表以及百余家行業(yè)資深企業(yè)參與。
(以上圖片轉載自“中國數字醫(yī)學”)
作為“大數據應用與人工智能”分論壇的受邀嘉賓,醫(yī)渡云公司聯(lián)合創(chuàng)始人、首席技術官徐濟銘發(fā)表了主題為“喚醒數據,創(chuàng)新醫(yī)療——數據智能驅動下的臨床研究、服務與管理”的精彩演講,著重從數據智能處理技術層面闡述了對醫(yī)療信息大數據智能處理應用的認知。
徐濟銘談到,現(xiàn)代社會每個人每天都在產生大量數據,全球上百億臺規(guī)模的傳感器、檢測設備和服務器都在記錄和計算這些數據。數據科學是一個交叉學科,想要在合作的專業(yè)領域有效運用數據科學,就需要同時掌握計算機科學、數學統(tǒng)計學及相關專業(yè)領域知識這三方面的知識技能。這樣才能把數據從信息變成知識,才能產生智慧,才能在應用場景中服務到有需求的人及行業(yè)。
數據的智能應用在電商領域、精準醫(yī)療、公共衛(wèi)生領域乃至整個城市治理層面都有大量應用。當數據科學面對有巨大的發(fā)展?jié)摿Γ蟾?、挑?zhàn)更大的醫(yī)療行業(yè)結合機會時,首先需要思考的就是:驅動醫(yī)療行業(yè)大數據智能應用的核心要素是什么?
徐濟銘認為醫(yī)渡云所理解的醫(yī)療數據應用,應該是利用最先進的數據處理技術,結合醫(yī)療應用的創(chuàng)新思維,對醫(yī)療數據進行技術處理,用技術成果來驅動創(chuàng)新和應用推廣。醫(yī)渡云所做的,就是數據智能驅動下的臨床研究、服務與管理。
如對醫(yī)療數據的現(xiàn)狀特點進行分析,可以說當下的醫(yī)學數據多處于“多方割據”狀態(tài),其共享和流通做得并不充分,數據標準制定層面做的也不盡人意,甚至可以說是沒有標準;而且,醫(yī)療大數據涉及到每個患者的個人隱私,醫(yī)療大數據的泄露可能危及個人乃至國家安全。所以,醫(yī)療數據信息能否被有效安全保護也相當必要。
根據醫(yī)渡云的經驗,滿足上述現(xiàn)狀下的數據處理需求,就必須用適配的技術手段去采集這些分離孤立的數據信息,建立安全可靠的技術架構,保證醫(yī)療大數據在安全的環(huán)境下被存儲、挖掘和應用。
談及處理后的優(yōu)質數據對于醫(yī)療應用的價值,徐濟銘介紹到:因為這些數據能夠準確反映每個患者在其整個治療周期中的病情進展,醫(yī)生和研究人員通過這些記錄數據能夠觀察總結治療過程中的共性和差異性,做出特定分析,所以優(yōu)質數據對于醫(yī)療臨床
研究有著極高的應用價值。但當前條件下,受限于醫(yī)療行業(yè)相關制度及技術手段,雖然有切實的數據應用需求,但相關人員也“不愿”、“不敢”、“不會”去共享和應用這些醫(yī)療數據。醫(yī)療數據作為一種寶貴的資產,到底在什么階段可以去公開和共享這些數據,數據擁有者在想法上也是各不相同。
做為醫(yī)療大數據應用的技術服務提供方,如何保證醫(yī)療數據在應用的過程中能夠直接發(fā)揮作用、產生新價值,且不造成風險,就成為醫(yī)渡云必須思考和解決的問題。這個解決過程實際上也向數據所有者反饋了當前醫(yī)療大數據行業(yè)發(fā)展必須要具備的核心能力。
數據平臺的集成-處理-應用能力成為了制約醫(yī)療機構獲取醫(yī)療大數據價值的主要瓶頸。
首先,醫(yī)療數據集成有不小的難度。大型醫(yī)院的醫(yī)療系統(tǒng)中沉淀著大量基礎數據,這些數據產生于不同歷史時期,來源也不同,標準也不統(tǒng)一。
其次,如此多源異構的數據看起來“質量相當差”,被集成是有一定的技術難度。其次是數據處理,因為涉及到文本數據,圖像數據,甚至基因組、蛋白質組這樣多樣化的數據構成,如何面對數據量大、形式多樣、專業(yè)領域門檻高的現(xiàn)實,給數據處理平臺提供者帶來了極大挑戰(zhàn)。
最后,是數據應用,診療、科研和管理這樣的應用出現(xiàn)在科學嚴謹的醫(yī)療場景中,關乎隱私,關乎患者生命健康,關乎醫(yī)學科學事業(yè)的發(fā)展,對數據和技術準確性精確性的要求極高。
整合數據、加工數據,使其“變廢為寶”,在符合政策安全、社會道德、行業(yè)法規(guī)的前提下,在不同場景中以數據智能輔助工具的形式去應用,這是醫(yī)渡云數據應用研發(fā)團隊一直在解決的問題。
面對現(xiàn)狀,醫(yī)渡云構建了數據處理與應用平臺(DPAP)為基礎的一體化解決方案。拋去復雜的生產流程結構不談,徐濟銘認為:在醫(yī)渡云海量的數據生產經驗中,有三個核心技術研發(fā)能力最應該被重視。
能力其一是數據質量控制。
對于數據應用來說,如果數據質量不可靠,那么后續(xù)整個應用的結果、結論都是不可靠的,一切工作就會變得毫無價值。數據質量控制有三個方面:數據的完整性、標準化和處理過程的透明化。
想要把控數據質量,首先要把控數據完整性。需要通過算法對來自院內-院外-跨院的同一個患者的有效信息進行整合,不能重復也不能遺漏,最大程度上的保持整個醫(yī)療數據的完整性。
其次是數據標準化,醫(yī)療過程中存在著大量專業(yè)術語和專業(yè)定義,但因為種種原因,醫(yī)院醫(yī)療系統(tǒng)及醫(yī)療工作者書寫的病歷中卻存在大量的非標準化數據,數據表達方式隨意性較大。如果對其不能構建行業(yè)認可的數據標準,如果對非標準數據無法標準化,這些數據也將無法被分析和應用。這項工作非??简炨t(yī)療專業(yè)術語的建設落地能力及自然語言的處理能力。
另外,整個數據處理過程的透明化也非常重要,因為醫(yī)療的專業(yè)性和復雜性,整個數據處理過程會非常繁復。醫(yī)渡云的技術架構中涉及300多個模塊、多層數據模型的轉化。如何保證整個數據處理過程的正確性和可溯源就非常關鍵。
醫(yī)渡云的數據加工處理是在平臺上完成的,全流程信息生產可追蹤查詢,并且向醫(yī)療機構和數據所有者全面開放。生產過程安全透明的同時,能讓所有者和生產者雙方對數據內容、數據統(tǒng)計方式等保持理解上的一致性。整個系統(tǒng)完整記錄了數據處理各個環(huán)節(jié)的數據血緣關系,標準化基礎上進行特征提取的全程都是可追溯的。
在數據質量提升的處理過程中醫(yī)渡云發(fā)現(xiàn),不少數據存在錯誤及缺失。例如醫(yī)務工作者為了提高錄入效率,粘貼拷貝編輯電子病歷模板,造成了數據的不準確,有的甚至會有醫(yī)學邏輯上的沖突。這是當下整個臨床醫(yī)療數據的現(xiàn)狀。那么怎么區(qū)分“有效”和“無效”的數據呢?應該通過對國家和行業(yè)在病歷質量方面的評分標準進行算法化,通過機器學習模型構建數據質量智能評價服務,來進行數據質量評判,對每一份數據進行完整度、規(guī)范性、專業(yè)度等多維度分檔評分,并標識其缺陷,在后續(xù)應用上也進行分級使用。以上這些都是數據質量優(yōu)化不可缺少的步驟,因為高質量的醫(yī)療數據是醫(yī)療機構的寶貴資產,幫助機構提升數據質量,優(yōu)化數據資產,是非常重要的事情。數據評判、病歷評分和缺陷總結,都會反饋到醫(yī)療機構手中,幫助其在原始數據的生產端做出對應的調整優(yōu)化,形成良性循環(huán),不斷累積高質量的數據——高質量的醫(yī)療數據對醫(yī)學研究才真的有價值。
能力其二是醫(yī)療模型研發(fā)。
當下的醫(yī)療數據記錄并非為了科研應用而產生,而只是一個醫(yī)療過程行為的記錄,從直接應用的角度可以說"并不可用",而必需對其進行醫(yī)療專業(yè)模型的轉換。首先需要把這些散落的數據整合成為標準的患者診療模型。
從疾病的角度看,我們還可以把它整合為疾病的模型。只有模型化之后才能知道“這是一個什么樣的患者”、“哪些是相似的患者”、“這是一種什么疾病”、“如何評價一個診療過程“這些問題的答案。患者診療模型、疾病數據模型,這是臨床科研、路徑挖掘、療效評價、輔助診斷應用的基礎。
醫(yī)渡云就是根據國際國內醫(yī)學標準完成診療模型構建和數據處理,對不同疾病的不同核心信息進行整合和識別,目前已經構建了25個大病種3000多個疾病的模型,這個成果數字還在不斷擴大。
僅此還不夠,醫(yī)療行為之外,比如患者患病前還有哪些行為?被診斷之前有哪些健康數據信息?根據這些信息整合,能夠預測出患者下一步的健康變化,實現(xiàn)更大的醫(yī)療數據生態(tài),并對整個生態(tài)的遷移進行記錄和預測——這便是一整個醫(yī)學知識圖譜的價值魅力。同一種醫(yī)療手段在不同階段的信息雖然不同,但它們的內容是關聯(lián)且依賴的,需要有人真正耐心地去刻畫這個過程和行為,讓整個信息模型一目了然。
能力其三是全面的安全體系架構。
醫(yī)渡云的安全體系架構分為三個部分:安全管理、數據安全和網絡安全。
安全管理方面,醫(yī)渡云以大數據平臺用戶和內部員工為對象,構建了完整的安全管理辦法,對不同角色不同賬號授以不同授權,對不同設備在不同區(qū)域進行隔離,構建完整的安全管理SOP,并在平臺上加入行為指紋信息,保證所有過程可記錄可審計。
數據安全方面,根據國際國內行業(yè)隱私保護條例和醫(yī)療機構的數據安全要求,對敏感信息進行脫敏,對原始信息進行加密,保證原始數據的安全。
網絡安全方面,在醫(yī)療機構的私有云環(huán)境內再構建封閉獨立的安全網絡環(huán)境,將整個大數據平臺置于其中,通過堡壘機、流量控制器結合網絡安全防護系統(tǒng),在網絡設備和操作系統(tǒng)層面構建堅固的安全技術堡壘
醫(yī)渡云醫(yī)療大數據平臺技術解決方案也通過了國家公安部三級等保的安全認證。在醫(yī)渡云的安全體系架構下,保證原始數據不出醫(yī)院,捍衛(wèi)醫(yī)療數據安全,保護患者隱私。
在數據處理之后的應用問題上,徐濟銘也談及,醫(yī)渡云的數據應用研發(fā)都是圍繞著醫(yī)療研究、服務與管理進行的,能讓價值數據應用延伸至醫(yī)、教、研、管等各個應用場景。由于醫(yī)渡云在數據質量優(yōu)化和醫(yī)療模型上有著非常專業(yè)的積累,其數據應用產品研發(fā)已經取得了值得驕傲的階段性成果,其應用價值也得到了合作機構、行業(yè)專家的高度認可。
最后,徐濟銘總結到,醫(yī)療數據智能處理和應用研發(fā)對于產業(yè)來說是一項龐大的基礎工程,其技術的進步和產業(yè)化的推動僅靠醫(yī)渡云一家是難以完成的。希望更多的醫(yī)院、醫(yī)療機構和行業(yè)伙伴都能夠加入到這個體系中來,讓有識之士共聚,一同推動醫(yī)療信息智能化產業(yè)的發(fā)展,并肩矚目產業(yè)的璀璨未來。
醫(yī)渡云(北京)技術有限公司,是國內最大的醫(yī)療大數據技術企業(yè)。公司以“數據智能,創(chuàng)新醫(yī)療”為使命,通過領先技術和專業(yè)服務,與中國頂尖的醫(yī)療機構共同建立“醫(yī)療大數據人工智能應用平臺”(DPAP:DataProcess&ApplicationPlatform),利用大數據和人工智能技術對醫(yī)療數據進行集成、挖掘和利用,輔助醫(yī)療機構高效開展臨床、科研和醫(yī)院管理等工作,為患者提供高質量的醫(yī)療服務,推動中國醫(yī)療信息化的發(fā)展。目前,醫(yī)渡云已經完成與中國三甲醫(yī)院排名TOP150中的85家醫(yī)院的戰(zhàn)略合作;合作區(qū)域覆蓋超過20個重點省市、直轄市;合作醫(yī)療機構年門診量超過一億人次,年住院量超過800萬人次。公司已申請發(fā)明專利20余項,軟件著作權6項,并憑前瞻性的數據處理技術優(yōu)勢成為多家政府機構的合作單位。
更多資訊請關注醫(yī)療機械頻道