【CIS科研社】与学术巅峰对话:卡耐基梅隆大学终身教授带你走进机器学习

你好:点击上方蓝字↑关注”CIS科研社”官方微信
正文共:1862字
预计阅读时间:5分钟
你知道全世界每年在动物身上进行的生物实验有多少次吗?
比如将某种化合物滴入兔子的眼睛以检查它们是否具有刺激性,或者用化学品喂食大鼠以明确致命剂量……
而现在我们要说的是,计算机模型也许可以取代用活体动物来进行一部分这类测试。
据相关研究报道,在某些情况下,机器学习软件在经过海量数据训练后,其预测结果的准确性堪比(甚至高于)昂贵的动物试验。
去年发表于《毒理科学》(Toxicological Sciences)的一篇论文中表示,有团队开发的一种算法能够准确预测上万种化学品的毒性——超出其它已公开的模型,涵盖了从吸入损伤到水域生态系统损害的九类测试。
德国巴斯夫的毒理学家Bennard van Ravenzwaay说:“这篇论文让人注意到大数据的新潜力。我百分百相信大数据将成为未来毒理学的支柱。”
而关于生物大数据的实际应用,早在几年前就得到过论证:
2015年,有一家生物大数据的创业公司出现在媒体和公众的视线中——Deep Genomics。这个公司是干嘛的呢?简单来说就是:利用机器学习的方法,预测基因组上的变化会对人体的特征/疾病/表型产生怎样的影响。
那么它是如何实现的呢?可以概括为两步:
1、确定与某个特征/疾病/表型相关的基因易感位点。
我们每个人所带的基因是差不多的,之所以有的人卷发,有的人直发,有这么丰富多彩的变化,就是因为基因发生了改变,所以严格来说,我们要找的是基因的“多态性”。
2、以这些基因易感位点数据作为输入变量,相关的特征/疾病/表型为响应变量,训练机器学习模型。
简单两步,但却蕴含着大数据、机器学习、统计学的精粹利用。
机器学习除了能帮助我们预测实验结果外,还能为我们的科学实验数据带来更准确、快捷的处理分析。
在过去的十年中,通过对分子变量如基因、蛋白质和代谢物丰度、微生物组成和群体遗传变异等进行量化,生物学领域产生了大量高度复杂的数据集,且数据集的数量正在急剧增加。
这些数据集提供了深入了解生物系统和复杂疾病所需的原材料,但如何进一步探索这些数据的价值只能通过更高层次的分析过程来实现成为一大难点,因而处理大型异构复杂数据集的工具和技术正在变得无比重要。而机器学习,旨在帮助我们解决这一复杂问题,为我们提供下一代的分析技术,使人们能够从新的角度出发,对生命系统提出新的假设。
机器学习的应用在生物学中变得无处不在,不仅仅包括基因组注释,而且还包括对蛋白质结合的预测,癌症关键转录驱动因子的鉴定,复杂微生物群落中代谢功能的预测,和转录调控网络的表征等等。简而言之,任何可以用来学习相应的模式并应用于新数据集的任务都属于机器学习的范畴。
那么问题来了:
究竟什么是机器学习?机器学习将如何助力生物学?机器学习软件可以“代替”实验动物吗?人工智能和机器学习是否会颠覆药物研发、并应用于药物安全和个性化治疗?
北京时间4月13日(本周六),CIS科研社邀请卡耐基梅隆大学计算机系终身教授Ziv Bar-Joseph开展《机器学习在计算生物与实验数据等领域的应用》专场讲座,在线面对面带领大家了解机器学的基本概念、一般工作流程和主要类别。
Ziv Bar-Joseph是卡耐基梅隆大学计算机系终身教授和卡耐基梅隆计算机系FORE Systems主席,也是2012年Overton Prize(计算生物学届重要大奖)得主。Ziv Bar-Joseph教授的主要研究领域是计算生物学、生物信息学和机器学习,他还是CMU计算机科学学院系统生物学小组的负责人,工作内容涉及从实验设计水平到系统生物学水平的各种问题。
ps:据说在讲座过程中教授还会分享很多海外名校对留学生的录取标准、以及会偏向于哪些项的考量,干货十足、机不可失,你还在等什么?
主讲教授
Ziv Bar-Joseph
卡耐基梅隆大学计算机系终身教授
卡耐基梅隆计算机系FORE Systems主席
Overton Prize(计算生物学届重要大奖)得主
美国国家科学基金会(NSF) CAREER Award 得主
RECOMB (计算机分子生物研究领域)最佳学术研究论文奖得主
论文总引用数超过12900次! H index 达到47,i10 index达到95!
讲座主题
《机器学习在计算生物与实验数据等领域的应用》
讲座时间
北京时间4月13日(本周六)20:00-21:00
参与方式
本讲座通过zoom软件在线直播
直播讲座链接:
https://torhea.zoom.us/j/608609385
接下来还有哪些amazing讲座?
敬请关注“CIS科研社”公众号
及时获取下期讲座嘉宾及内容信息

版权声明