第二百零八章 AI和計算生物學
大量招收生物學畢業的碩士和博士,薪酬待遇比大米在江城的分部高了半個檔次。
同時江城的研究中心還和江大的生物學院展開了很多項目合作。
江大內部私下討論,都覺得鄭理作為數學學院的畢業生,最大的蛋糕反而被生物學院吃完了。
“所以這是AI和計算生物學的應用對吧?”
對鄭理的問題,江城的研發主管點頭道:“是的。”
“我們目前主要做的是序列比對和蛋白質結構預測。”
“計算生物學不僅是這兩個領域,還有基因識別、進化樹構造等方向。”
“自從ai技術走進人們視野后,機器學習技術讓計算生物學得到了極大的發展。”
“基因組學和成像技術的進步導致來自大量樣本的分子和細胞分析數據的爆炸式增長。”
“生物數據維度和采集率的快速增長對傳統分析策略提出了挑戰。現代機器學習方法,如深度學習,承諾利用非常大的數據集來尋找其中的隱藏結構,并做出準確的預測。”
“比如我們有一個小組是專門做預測癌細胞在藥物作用下的活力問題。”
“輸入特征值將捕獲細胞系的體細胞序列變體、藥物的化學組成及其濃度匯總,它們將與測量的活力一起可用于訓練支持向量機、隨機森林分類器或相關的方法。”
“給定未來一個新的細胞系,學習函數通過計算函數來預測其可能的活力。”
“即便函數在我們看來更像是一個黑盒子, 它的內部工作原理、為什么特定的突變組合會影響細胞生長并不容易找到背后的具體原因。”
“兩個回歸和分類以通過這種方式查看。”
“作為對應物,無監督機器學習方法旨在從數據樣本x本身中發現模式, 而不需要輸出標簽y。”
“類似的聚類、主成分分析和異常值檢測等方法都更接近黑盒,我們目前主要應用于生物數據的無監督模型。”