人工智能新模型可解码DNA隐藏“语言”
DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。
大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。
在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。
研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。
GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
热点精选
- 中外专家、产业精英等在沪共同构筑高效协同的脑机接口创新生态2026-04-19 10:51
- 中国自动驾驶产业竞争优势明显2026-04-19 10:19
- 紧抓人工智能机遇打造第二增长曲线2026-04-19 09:51
- 加快推进小型农业水利设施建设与管护攻坚行动广西新增恢复和改善灌溉面积102026-04-19 09:09
- 把握AI革命新机遇致力成为高端稀土永磁领导者2026-04-19 09:02
- 50余个清华项目亮相,清华校友三创大赛东莞晋级赛举行2026-04-19 08:32
- 记忆被拉回2008年!北京奥运博物馆的沉浸式打卡2026-04-19 07:53
- 中国海油勘探开发数据湖平台二期启用2026-04-19 07:08
- 巴黎奥运会“科技赛场”同样精彩2026-04-19 06:30
- 西气东输三线中段最长天然气管道专用隧道全线贯通2026-04-19 05:48

