发布网友 发布时间:2022-05-16 16:12
共2个回答
热心网友 时间:2023-10-30 08:16
机器学习在生物领域的应用实际上从90年代开始就已经开始了。比如早起的基因预测就是基于hmm实现的。现在随着各种noncoding rna的发现,这类应用也还不断存在。
supervise learning经典的例子有突变致命性的预测,从21世纪初的SIFT,到后来08年的polyphen2以位点保守性,结构信息,序列信息为feature,训练贝叶斯分类器。另外的例子包括疾病预测,TF binding site预测等。
unsupervised learning的经典例子有癌症亚型分类,简单的方法如clustering,PCA。复杂得则是综合各组学及pathway相关信息构建概率图模型如PARADIGM。另外我觉得很有意思的是通过genetic信息进行欧洲人种分类,画了个pca图和欧洲地缘几乎吻合。
除了这些常规的应用,一些特别的应用比如positive-unlabeled learning本来是开发在文本分类的,也在生物领域有应用。
甚至每年还有很多竞赛,组织方提供训练集,邀请参赛者设计机器学习算法做预测。如DREAM每年都有竞赛,去年是通过组学数据预测细胞耐药性。参赛者基本把machine learning领域的算法全试了。最后结果最好的的是multi-kernel learning和random forest。
更重要的是machine learning其实也是随着在生物领域的应用而不断提高。最典型的一个例子就是high-dimensional data。这个问题基本就是组学数据所带来的。前几年statistical learning的一个很火的方向就是variable selection。
不过最近很火的deep learning倒是应用不多,一来生物数据的样本不如图片,围棋来得多,其次一些为图片识别专门设计的卷及网络在生物中也不太适合。但是我预计随着MRI等医学影像自动化分析的要求越来越多,deep learning的应用也会越来越广。
热心网友 时间:2023-10-30 08:17
网络本就非常适合做机器学习,比如social network方面的各种研究。现在人们对癌症的分子数据领悟到的东西非常多,用网络来做癌症模型,推断癌症的各种过程的机制,就像早期人们利用网络来研究细胞状态等,这可能会给我们带来系统性的认知,人们对癌症的理解将会提升一个层次。
人类观察微观世界一般都采取间接的方式。我们在观察细胞分子这个层次时,只能通过对间接观察到的现象进行建模,从而推断分子所处的状态等。当各种测序技术突飞猛进的发展时,总会带来各种新的挑战,尤其是机器学习的建模或者算法设计。当人们有技术去探测基因表达、突变、拷贝数变异、蛋白质水平等,人们也同样需要合适的方法来measure各种层次的活跃程度。