當前位置:首頁 > 科技 > 正文

醫療大數據雲端化,助推精準治療時代到來

◎ 科技日報記者 張佳星

近日,《自然》子刊報告了一種藥物開發的新技術,利用“達爾文進化論”的加速版,通過随機程序化組裝快速生成數百萬個小分子組合,迅速找到了新的腫瘤精準治療的候選藥物。

利用不同的解決方案或研究思路,通過收集、彙總大量數據,實施數據挖掘、分析,将高效地開發藥物或者制定有針對性的治療方案,越來越成為目前醫藥研發公司、醫療服務機構、醫院、診斷中心等開展精準治療的有效路徑。

在百萬乃至千萬級别的海量數據中發現有效目标,算法和算力正成為醫藥研發領域不可或缺的核心技術。醫療大數據雲端化,将較好地彌補醫療行業在算法、算力方面的“短闆”,助推精準治療時代到來。

虛拟圖,圖片由受訪單位提供

雲端化數倍增加數據挖掘量

新冠疫情到來,醫療行業更加意識到,需要通過數據的雲端化,更好地駕馭更大量的數據,助推精準治療時代到來。

以阿斯利康為例,作為在研發新冠疫苗和藥物方面進展快速的跨國型藥企,據統計,它在24小時之内約需要進行510億個數據的統計分析,這些數據包括基因類型的數據和病患的數據。這些數據的分析支撐他們在2020年可以同時進行40多種新藥開發的項目。

但并不是所有的數據都是能直接就用的,在數據挖掘之前,必須進行大量的“結構化”工作。但事實上,一些醫療機構在收集患者數據時,經常難以結構化,例如同樣的“浸潤”的描述,在不同科室學術術語不同,這使得在算法挖掘時數據不大好用。

為了讓非結構化數據也能實現分析功能,很多醫療領域的科技公司都在努力地創新、嘗試。亞馬遜雲科技通過降低門檻、準備數據和标注數據,擴大機器學習在醫療領域的數據發掘範疇。

“我們發布的應用中,之前對專業的标注有專門的設計,在新冠疫情期間,肺炎的數據通過專業團隊标注進行了及時跟進。” 亞馬遜雲科技機器學習相關負責人介紹,專業團隊擁有特定領域和專業的知識,并且符合客戶對于數據安全和隐私、合規等要求。

雲端化降低了數據挖掘的門檻,讓醫療行業更好地駕馭患者數據,提供精準化的診斷、治療的方案,提高整個醫療服務運營的效率。

雲端化實現随叫随到的“存儲”

醫療大數據裡最常見的是影像數據,由于影像數據格式标準,因而容易獲取和使用。中科院分子影像重點實驗室主任田捷曾表示,未來的影像中心就像飛機駕駛艙一樣,是各種各樣信息的綜合體;而未來的醫生則相當于飛行員,要處理各種各樣的信息。

醫療影像信息有着歸檔要求高、數據量大、存儲量大,對于雲端讀取的實時性提出更高的要求。醫療影像的數據長年不能删除,需要歸檔很多年。在實際的應用中,這些影像數據可能一年都用不到一回,但也可能突然就會要求馬上調用這個數據。

醫療數據的存儲特殊性需要雲存儲即滿足低成本的長期存儲,又要滿足即時快速調用的要求。通過智能分層的技術,亞馬遜雲科技構建了及時索引的分層,可以幫助客戶在歸檔的數據裡面産生索引,在需要取用的時候,仍然能夠像熱數據一樣馬上就能索引到。而在不需要索引的時候,這些數據像歸檔存儲一樣,長期保存在非常低的成本存儲層中。據介紹,這一技術可以使歸檔數據在毫秒級完成訪問,并将節省近70%的存儲成本。

雲端化實現低門檻的機器學習

無論是醫學領域還是數據科學領域都是注重實踐的研究領域。相關專家表示:人工智能技術在醫學上的研究、應用,不是寫文章、不是談概念、也不是紙上談兵、更不僅僅是做篩查,而是要将技術與臨床緊密結合,解決實際臨床問題。

然而,缺乏跨學科的高水平人才,仍舊是讓醫療行業與數據挖掘融合起來的難點之一。如何讓對數據和編程一竅不通的醫療學者快速上手機器學習呢?

“他們無需任何技術背景,可能連可以寫代碼的開發人員都沒有,而且他們完全不需要具備機器學習或者其他的一些技術能力,就能夠用到我們的人工智能或機器學習服務。” 亞馬遜雲科技機器學習和醫療人工智能總監Taha Kass-Hout博士表示,隻需要用自然語言去請求服務,通過聊天框搜索就能夠使用機器學習服務。

人工智能可以幫助客戶更好地去編撰數據,并對數據進行結構化處理、打标簽等工作,實現機器學習的托管型雲服務。

雲端化通過降低機器學習的使用門檻,大大加速了臨床治療的精準性。例如在慕尼黑白血病實驗室建立了世界上最大的白血病數據,通過把患者的基因數據和患者的電子病曆數據整合在一起,用于精準化的臨床治療。

編輯:劉義陽

審核:王小龍

你可能想看:

有話要說...

取消
掃碼支持 支付碼