99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

AI可以如何抗擊新冠?WHO論文稱這三大場景大有可為

2020-03-25 08:59:43 創事記
點擊關注->創芯網公眾號,后臺告知EETOP論壇用戶名,獎勵200信元
隨著新冠疫情的持續發展,全世界的研究者都在致力于疫情的緩解,其研究重點包括:追蹤病毒傳播、促進病毒檢測、開發疫苗、尋找新的治療方法、了解疫情的社會經濟影響等。在這篇綜述文章中,來自杜倫大學、蒙特利爾大學、WHO等機構的研究者探討了 AI 相關技術在疫情中發揮的作用,總結出了 AI 在醫療、分子、社會三個層面的應用。
 

  具體來說,分子層面包括藥物挖掘等相關研究;醫療層面包括個體病人的診斷和治療;社會層面包括流行病學和信息醫學研究等。此外,論文還綜述了當前可用的開源數據集和其他資源。

  這篇綜述的目的并非評估文中所述技術的重要性,也不做推薦之用,而是向讀者展示當前 AI 技術在抗擊疫情方面的應用范圍。

 

  論文鏈接:https://drive.google.com/file/d/1vDcb6HeS-hufNgqH0dDhIEGjuJpnnkzT/view

  醫療層面:從診斷到結果預測

  迄今為止,AI 在應對 COVID-19 上的應用大多集中在醫學成像的診斷上。在近期多篇文獻中,除了使用患者醫學數據預測疾病進展的方法、用于病情監測的無創檢測方法,還有 AI 協助計算機進行 CT 診斷的案例。

  醫學影像診斷

  RT-PCR 測試是診斷 COVID-19 的關鍵方法,但這種方法仍存在樣本采集、分析時間等局限性,所以人們越來越關注使用醫學成像技術進行 COVID-19 診斷。COVID-19 具有特殊的放射學特征和圖像模式,這些特征均可通過 CT 掃描的方式觀察到,但對于放射學科的醫務人員來說,識別這些圖像也頗為費時,因此在 CT 掃描診斷過程中使用機器學習方法是一種理想的選擇。

  多項研究已經將診斷定為二元分類問題,即“健康”與“新冠病毒陽性”。

  Wang 等人使用改進過的 Inception 神經網絡架構,對醫生確定過的區域進行訓練,從而對健康患者和新冠患者進行二元分類。基于 259 位患者的約 1000 個圖像切片的數據集,研究者訓練出了能夠識別疑似 COVID- 19 的模型,然后將結果提供給醫生作進一步診斷。

  Chen 等人也發現,在經由專業醫生標記過的 6000 多張 CT 圖像切片數據上訓練 UNet++神經網絡,其性能可接近專業醫生的診斷水平。這一模型之后在武漢大學人民醫院進行部署,用以協助醫生加快對病例的分析及診斷,目前這一模型也已開源。

  其他機器學習方法將診斷歸結為 3 種分類任務:健康、COVID-19 患者及其他類型肺炎患者。

  在 Xu 和 Song 的研究中,經典的 ResNet 架構可用于特征提取。Xu 等人添加了幾個用于分類的全連接層,Song 等人則添加了特征金字塔網絡(Feature Pyramid Network)和注意力模塊,使網絡更加復雜,但在圖像細粒度方面表現更好。

  這兩項研究均表明,即使在診斷過程中可能存在多個疑似結果(包括非 COVID-19 的肺炎類型),這種方法也能夠準確地區分開來。

  此外,還有一些研究采用了融合型方法:將現有的軟件與特定機器學習方法相結合,以實現更高的準確性。

  在 Gozes 等人的研究中,商業醫學影像程序可用來進行原始圖像的處理,然后與一個 ML Pipeline 結合使用。這種兩步式方法包含在肺異常醫學影像數據上訓練過的 U-Net 架構,以及在 ImagetNet 上訓練過的 Resnet-50,其中圖像分類已微調為“Coronavirus”和“健康”。

  Shan 等人的研究中,采用了“human- in-the-loop”的方法減少機器學習架構所需的標記時間。研究者使用少量人工標記的數據來訓練基于 V-Net 架構的初始模型。

  該模型對新的 CT 掃描影像進行分割,之后經由專業醫生校正,在迭代過程中不斷反饋到模型中。這種方法使得基于深度學習技術的系統可用于自動分割和感染區域統計,以及評估患者 COVID-19 病情的嚴重程度。

  研究表明,該模型的性能逐步提升,經過 200 個帶注釋的示例數據訓練之后,將新圖像分析所需的人工時間從開始的 30 分鐘以上減少到 5 分鐘以上。這個方法將機器學習的優勢與人類的專業知識相結合,是一個前途廣闊的研究方向。

  疾病跟蹤的非侵入式測量

  另外一種不需要特殊醫療成像設備的原創性方法是,通過 Kinect 深度相機來識別病人的呼吸模式。

  該方法基于最近對 COVID-19 患者癥狀的臨床發現,即 COVID-19 患者的呼吸模式不同于其他流感或普通感冒,其較明顯地表現出呼吸急促癥狀。

  基于以上臨床信息,研究者開發出一種具有注意力機制的雙向 GRU 神經網絡,并使用它來識別反常的呼吸模式。

  研究者使用 20 名參與者的真實數據以及基于真實記錄產生的大量仿真數據來訓練該模型。雖然這些反常的呼吸模式并不一定與真實的 COVID-19 診斷相關,但對這些呼吸急促癥狀的預測可作為首要診斷特征,為大范圍監控潛在患者提供幫助。

  另外一些方案是使用手機來檢測 COVID-19,有使用嵌入式傳感器來識別 COVID-19 癥狀的,也有通過回答在手機調查問卷中的一些關鍵問題來排查高風險病人的。雖然以上方法都是在移動技術方面的重要嘗試,但目前的研究并不足以評估這些方法的可行性與性能表現。

  患者預測

  Yan 等人提出一種基于患者臨床數據與血樣檢測中特征的預測方法,該方法能夠幫助臨床醫生盡早地識別出高風險患者,希望以此提高患者的預后以及減少重癥患者的死亡率。

  與此研究相類似的方法有,基于 XGBoost 算法的預測模型,其用于預測死亡風險和識別能夠在醫院中進行檢測的關鍵測量特征。基于 375 名患者的數據,作者從 300 多個輸入特征中篩選出三個關鍵臨床指標,為預測患者死亡率提供了一種臨床啟發式的依據。該方法的一大優勢是其具有良好的可解釋性,因為篩選出的這三個指標與 COVID-19 病理學進展中的幾個最重要因素相關,即細胞損傷、細胞免疫與發炎。

  一個與此互補的研究是,在半自動標記的 CT 影像上訓練一個 U-Net 變種,該方法旨在預測 COVID-19 患者是否需要長時間住院觀察。這意味著一旦完成初期診斷,我們仍然可使用機器學習的方法來預測患者病情的嚴重程度以及是否需要長期住院。

  分子層面:從蛋白質到藥物挖掘

  蛋白質結構預測

  蛋白質具有的 3D 結構由它們的基因序列決定,并且該結構會影響蛋白質的功能與作用。一般而言,蛋白質結構通過 X 光晶體衍射圖譜法等實驗研究法來確定,但這些方法花費昂貴、耗費時間。

  最近,計算模型已經被用來進行蛋白質結構的預測,主要有兩種方式:一種是模板建模,它的原理是利用相似蛋白作為模板序列進而預測蛋白質結構;另一種是無模板建模,它主要預測那些無已知相似結構的蛋白質的結構。

  2018 年底,谷歌 DeepMind 重磅推出 AlphaFold,它能夠利用基因序列預測蛋白質結構。給定一種新的蛋白質,AlphaFold 利用神經網絡來預測氨基酸對之間的距離,以及連接它們的化學鍵之間的角度。根據神經網絡預測的兩種物理屬性,DeepMind 還訓練了一個神經網絡以預測蛋白質成對殘基(residues)之間距離的獨立分布,這些概率能組合成估計蛋白質結構準確率的評分。目前,AlphaFold 可以預測與 SARS-Cov-2 相關的 6 種蛋白質的結構,分別為 SARS-Cov-2 膜蛋白、蛋白 3a、Nsp2、Nsp4、Nsp6 和 papain-like 蛋白酶。

  改進病毒 DNA 測試

  當前,機器學習和新型基因組技術也用來提升 PT-PCR 的測試效果。Metsky 等人利用 CRISPR(一種通過割裂特定基因遺傳代碼鏈并利用酶來編輯基因組的工具)來進行檢驗分析設計,用以檢測包括 SARS-CoV-2 在內的 67 種呼吸道病毒。此外,對于那些被預測為敏感性和特異性并且涵蓋多種基因組的檢測分析,有些 ML 模型可以加速它們的設計。

  老藥新用

  發現當前藥物可以用來治療 COVID-19 的一種方法是生物醫學知識圖譜。生物醫學知識圖譜網絡可以捕捉蛋白質與藥物等不同實體之間的聯系,從而可以進一步了解它們彼此之間的關聯。

  Richardson 等人利用生物醫學知識圖譜識別出了巴瑞替尼,這是一種通常用于治療關節炎的藥物,但由于它能夠抑制 AP2 相關的蛋白激酶 1(AAK1),使得病毒很難進入宿主細胞,所以該藥物可能適用于 COVID-19 的治療。

  Ge 等人也提出一種類似方法來構建關聯人體蛋白、病毒蛋白和藥物的知識圖譜,它所使用的數據集捕捉了這些實體之間的關系。這種知識圖譜用來預測可能有效的候選藥物。作者已經識別出了多聚腺苷酸聚合酶抑制劑 CVL218,目前正處在臨床試驗階段。

  其他一些研究也利用創建的模型來預測蛋白配體的復合物親和性,以解決老藥新用的難題。Hu 等人使用多任務神經網絡對親和性進行廣義預測。作者已經識別出了一系列 SARS-Cov-2 相關的蛋白質,如 RNA 依賴的核糖核酸聚合酶、3C-like 蛋白酶、解旋酶以及包膜蛋白等等,從而借助于 4895 種藥物的數據集展開靶向治療。他們推薦了 10 種可能有效果的藥物以及這些藥物的靶蛋白和復合物親和性評分。為了提升模型的可解釋性,他們還對每個靶蛋白可能出現結合的精確位置進行預測。

  同樣地,Beck 等人利用他們提出的 Molecule Transformer-Drug Target Interaction(MT-DTI)復合物親和性模型,識別出美國食品及藥物管理局(FDA)批準抗病毒藥物中可能對 6 種冠狀病毒蛋白質(分別為 3C-like 蛋白酶、RNA 依賴的核糖核酸聚合酶、解旋酶、3』-to-5』核酸外切酶、endoRNAse 和 2』-O-ribose 甲基轉移酶)有效的藥物。MT-DTI 模型以 SMILES 數據和氨基酸序列的形式輸入串數據,并運用一種借鑒 BERT 算法的文本建模方法。此外,該模型識別的藥物可能對上述蛋白具有靶向效果。

  最后,Zhang 等人利用密集全連接神經網絡,它在 PDBBind 數據集上被訓練用于預測復合物親和性,從而識別 3C-like 蛋白酶的潛在抑制劑。他們利用 SARS 病毒變體創建了靶蛋白同源(模板)模型,并探索現有復合物(如 ChemDiv 和 TargetMol)和三肽的數據集,從而找出對蛋白質具有靶向效果的治療手段。

  藥物發現

  一些研究者試圖尋找新的化合物,用來治療新冠肺炎。Zhavoronkov et al. (2020a) 等就使用了一個專有管道,尋找類 3C 的水解酶抑制劑。他們的模型使用了三種輸入:蛋白質晶體結構、類晶體的例子,以及蛋白質模型本身。對于每個輸入類型,研究者擬合了 28 種不同的模型,包括生成自編碼器和生成對抗網絡。研究者使用強化學習探索潛在的候選藥物,其中有一個獎勵函數和一些標準——藥物相似性、新穎性、和多樣性相聯系。同時,他們確認識別出的候選化合物和已有的化合物不同,說明它們確實找到了不同的藥物。

  Tang et al. (2020) 也使用了強化學習來發現藥物。研究者整理了 284 種已知的分子——能夠抑制 SARS 類病毒。他們將這些蛋白質打碎成 316 個片段,然后使用高級深度 Q-learning 來組合,進行藥物設計。這種強化學習的獎勵函數有三個評價角度:藥物相似性分數、加入的預定義“傾向使用的”片段和出現的已知藥效集團(和化合物的功效有關的特定結構)。

  結果,有 4922 個結果通過啟發式搜索被過濾。最終有排名最前的 47 個化合物在分子模擬中進行評估。研究者會選擇最可能有效的化合物,并進行生產和測試

  社會層面:流行病學和信息病學

  流行病學

  流行病學研究覆蓋領域極其廣泛,其流行的規模和相關性,以及數據的實時更新等多方面因素導致了研究工作必須進行多種類建模。但此次團隊將專注于用機器學習去完成流行病學建模的案例。

  鑒于流行病感染速度迅速,所以短期實時預測是作為提供信息的重要來源之一,同時模型必須兼備靈活性,以適應各種不斷變化的協議或是程序。

  Hu et al. (2020b)†收集了 WHO 以及其他預測參與者于 2020 年 1 月 11 日至 2 月 27 日期間收集的數據,用以開發創建一個新的關于中國國內累積或是新增確診病例的數據集。這些信息主要用于訓練調整后的自動編碼器(MAE),以便實時預測新病例,并估計流行病的嚴重程度以及持續時間。

  類似的,Al-qaness et al. (2020) 模型可以使用歷史數據并提前十天預測確診病例的總人數。而作者的模型是基于 neuro-fuzzy inference system (ANFIS) (Jang, 1993),flower pollination algorithm (FPA) (Yang, 2012) 以及 salp swarm algorithm (SSA)(Mirjalili et al., 2017) 進而最優化模型里的參數。

  而 Mizumoto et al. (2020) 通過 ML 的方法利用從鉆石公主號游輪上所收集的感染數據來了解無癥狀病例的發生率。作者利用這些數據通過貝葉斯分析對時間序列進行建模,并使用了 Hamiltonian Monte Carlo (HMC) 以及 No-U-Turn- Sampler (Homan & Gelman, 2014) 進行調整模型參數,從而預估無癥狀感染者的可能性。盡管在這種封閉式環境中進行分析是非常重要的,但是否值得對外適用于更廣泛的人群還有待觀察。

  信息學

  當下社交媒體以及在線平臺已成為疫情相關信息的主要傳播渠道,而團隊更看重的是“信息流行病”,如錯誤信息的信息或是謠言會越傳越廣。

  Cinelli et al. (2020)†分析了與 COVID- 19 相關社交媒體的內容,作者從 Twitter, Instagram, YouTube, Reddit, 以及 Gab 中收集的 800 萬條于 2020 年 1 月 1 日至 2 月 14 日間使用 COVID- 19 關鍵字的評論或帖子。作者預估了對 COVID- 19 話題的參與度,并橫向比較了各平臺間話題的發展進度。互動參與度是通過使用累積的貼子數以及 45 天內對帖子的反饋來反應的(如評論,點贊等)。作者采用 phenomenological (Fisman et al., 2013) 以及經典 SIR 模型來表示信息傳播或復制的數量。

  類似的,Mejova & Kalimeri (2020)† 研究對象是使用帶有病毒相關內容的 Facebook 廣告,通過使用“冠狀病毒”以及“COVID- 19”等關鍵字去搜索所有廣告,其范圍覆蓋了 34 個國家及地區,并收集了 923 余條結果。大部分位于美國和歐盟,而其中 5% 的廣告是具有較強的誤導信息。

  此外,也有研究者著手于新冠病毒特定新聞內容的整理,并進行了人工和自動的真實性驗證和相關性分析。Pandey et al. (2020)†開發了一個評估每日新聞頭條和 WHO 建議之間相似度的渠道。如果相似度高于某個閾值,則這篇新文章就會在用戶的時間線上出現,同時附有 WHO 的相關建議。其中相似度的閾值由人工審核確定,依據用戶反饋不斷更新。針對相互矛盾的信息,這種方法可以幫助大眾識別準確可信賴的新聞報道,也能促使重要的指導性文章產生更廣泛的影像,推動官方的關注與采納建議。

  數據集和其他資源 

  利用 AI 抗擊新冠病毒離不開各種開源數據集和其他資源,本文重點介紹了當前可用的案例數據、文本數據和生物醫學數據。

  案例數據

  案例數據是指病例的數量和地域分布,這種數據對于追蹤 COVID19 疫情的蔓延具有重要作用。這份綜述列舉的案例數據包括:

  WHO COVID-2019 現狀報告:https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports

  約翰·霍普金斯 CSSE:https://github.com/CSSEGISandData/COVID-19

  nCoV2019 GitHub 項目:https://github.com/beoutbreakprepared/nCoV2019

  人道主義社會交換項目:https://data.humdata.org/event/covid-19

  專為醫學專家開發的項目:https://github.com/CodeForPhilly/chime

  意大利封鎖后的移動變化數據:https://covid19mm.github.io/in-progress/2020/03/13/first-report-assessment.html

  文本數據

  NLP 方法在這次疫情研究中發揮了重要作用,利用該技術解讀的大量文本信息可以幫助我們了解當前有哪些信息是已知的(如病毒傳播、環境穩定性、風險因素等)。這部分的數據包括:

  WHO 全球新冠病毒研究文獻數據庫:https://www.who.int/emergencies/diseases/novel-coronavirus-2019/global-research-on-novel-coronavirus-2019-ncov

  當前最大的新冠相關文獻開源數據集 CORD-19:https://pages.semanticscholar.org/coronavirus-research

  Kaggle 開源數據集挑戰賽:https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  其他開源數據集:https://www.ncbi.nlm.nih.gov/research/coronavirus/;https://covid-19.dimensions.ai/

  社交媒體數據集:https://github.com/echen102/COVID-19-TweetIDs;https://www.kaggle.com/smid80/coronavirus-covid19-tweets

  生物醫學數據

  目前,用于診斷的開源數據集和模型還不是很多。上文中提到的一些 CT 掃描方法可以找到,但用于訓練系統的方法并沒有系統地開源。目前,這一方向的努力包括:

  Covid Chest X-Ray Dataset:https://github.com/ieee8023/covid-chestxray-dataset

  Data Against Covid-19:https://www.data-against-covid.org/

  在基因組測序和藥物挖掘方面,有幾個數據集是基于之前存在的計劃或專門為 COVID-19 從零開始創建的。這方面值得關注的項目包括:

  GISAID Initiative:https://www.gisaid.org/epiflu-applications/next-hcov-19-app/

  RCSB 蛋白質數據庫:http://www.rcsb.org/news?year=2020&article=5e3c4bcba5007a04a313edcc

  藥物挖掘信息共享網站:https://ghddi-ailab.github.io/Targeting2019-nCoV/

  跟蹤新冠病毒遺傳多樣性的 Nextstrain:https://nextstrain.org/

  蛋白質折疊游戲 Foldit:https://fold.it/

  在文章的最后,研究者呼吁社區展開更多的跨學科合作和數據共享,通過國際社區的力量共同對抗疫情。
 


免責聲明:本文由作者原創。文章內容系作者個人觀點,轉載目的在于傳遞更多信息,并不代表EETOP贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時聯系我們,我們將在第一時間刪除!

關鍵詞: AI 新冠

  • EETOP 官方微信

  • 創芯大講堂 在線教育

  • 半導體創芯網 快訊

全部評論

主站蜘蛛池模板: 99久久精品自在自看国产| 国产簧片在线观看| 麻豆国产精品视频| 亚洲欧美日韩国产一区二区三区精品 | 99久久999久久久综合精品涩 | 国产精品三级在线观看| 国产区1| 亚洲精品一区在线观看| 成年人在线免费观看视频网站| 91精品啪国产在线观看免费牛牛 | 欧美爱片| 国产高清在线精品一区二区| 做爰全过程免费的视69频| 国产精品久久久久久久9999| 欧美色色图| 亚洲aⅴ在线| 亚洲综合精品香蕉久久网| xxx性欧美人| 久久久久青草| 日本精品久久久一区二区三区| 在线日韩欧美一区二区三区| 免费直接看黄| 欧美高清激情毛片| 黄色三级国产| 日韩精品一区二区三区毛片| 欧美日韩高清一区| 国产亚洲在线观看| 国产精品亚洲第一区二区三区| 黄色欧美网站| 精品视频一区二区三区四区| 国产成人av性色在线影院| 韩国女主播精品一区二区| 麻豆传媒视频网站| 欧美视频在线观看免费播放| 午夜在线亚洲| 亚洲成人精品在线| 亚洲精品一区二区久久这里| 亚洲视频在线观看网站| 在线视频精品免费| 中文字幕成人网| 亚洲综合图色|