文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
2003 年人类基因组计划完成了对人类 DNA 所有片段的测序。现在二十多年后,MIT 的 Jonathan Weissman 教授及其同事超越了序列,完成了首个人类细胞表达的基因的综合功能图谱。该项目的数据于 6 月 9 日发表在线上《Cell》期刊上,将每个基因与其在细胞中的工作联系起来,这是多年来在单细胞测序方法 Perturb-seq 上合作的成果。数据可供其他科学家使用。这一成果要归功于单测序工具 Perturb-seq 和 CRISPR-Cas9 基因组编辑,它们将基因变化引入细胞,然后捕获关于 RNA 表达的信息(使用单细胞 RNA 测序)。研究人员使用人类血液癌细胞系和来自视网膜的非癌细胞将该方法扩展到整个基因组,最终在超过 250 万个细胞中使用了 Perturb-seq。
北京大学等的研究团队日前宣布,以只使用化合物的新方法成功构建出人的 iPS 细胞。与京都大学山中伸弥教授发现的在人体细胞中加入 4个 基因从而构建 iPS 细胞的方法完全不同。这可能促进实现更轻松且大规模构建iPS细胞的方法等,但也存在其他研究团队能否再现同样的结果及安全性等课题。研究报告发表在《自然》期刊上。北京大学教授邓宏魁等人把利用这种新方法构建的 iPS 细胞称为“CiPS细胞”。该团队 2013 年宣布构建出小鼠 CiPS 细胞,之后又用了 9 年时间,实现人体 CiPS 细胞。在人体细胞中加入多种化合物,分四个阶段用了大约 40~50 天培养,就形成了 iPS 细胞。CiPS 细胞可以利用胎儿及成人皮肤等细胞构建,构建效率为0.2~2.5% 左右。
发表在《科学报告》期刊上的一项考古学研究,报道了公元 79 年维苏威火山喷发后在意大利庞贝去世的一名个体的人类基因组测序结果。在此之前,研究人员只测序过庞贝人和动物残骸的线粒体 DNA 短片段。丹麦哥本哈根大学和意大利萨兰托大学的研究人员此次分析了在庞贝“匠人之家”发现的两名个体的残骸,并提取了他们的DNA。根据这些骨骼的形状、构造和长度判断,一组残骸属于一名死亡时年龄 35 到 40 岁的男性,另一组残骸属于一名 50 岁以上的女性。虽然作者能提取两名个体的古 DNA 并进行测序,但他们只能获得男性残骸的完整基因组,因为女性残骸的序列存在空白。研究团队比较了这名男性个体的 DNA 与其他 1030 名古代及 471 名现代西方欧亚个体的 DNA,发现他的 DNA 与现代中部意大利人以及罗马帝国时期住在意大利的其他个体的相似性最大。不过,对这名男性的线粒体DNA和Y染色体 DNA 的分析还发现了在撒丁岛个体中常见的基因群,但在罗马帝国时期住在意大利的其他个体中没有发现这些基因群。这说明整个意大利半岛在这一时期可能有着很高的遗传多样性。
下一代基因改造技术将不只是简单的向生物体引入实验室微调的基因,而是用实验室微调的基因靶向和移除特定的天然基因,此类技术被称为基因驱动。
如果包含基因驱动的动物(亲本A)与不包含该基因驱动的动物(亲本B)交配,那么在结合了它们遗传物质形成的胚胎中,亲本A的基因驱动会立刻开始发挥作用。它会在亲本B的染色体中识别出自身的天然基因版本并加以破坏——将其从 DNA 链中切割出来。然后亲本B的染色体会修复自身——但会复制亲本A的基因驱动。因此胚胎和由此产生的后代几乎可以保证具有基因驱动,而不是只有标准转基因的 50%的几率——因为胚胎从每个亲本那里获取一半的基因。可通过基因编辑技术 Crispr 添加到基因之中创建基因驱动。这告诉它在新胚胎的另一个亲本DNA中靶向自身的自然版本。基因驱动还包含一种进行实际切割的酶。
我们希望基因驱动可用来大大减少疟蚊和其他害虫或者入侵物种的数量。Target Malaria是这方面最前沿的一个组织,它开发出了阻止蚊子产生雌性后代的基因驱动。这很重要,原因有两个——只有雌蚊子会咬人,而且没有雌性,蚊子的数量会直线下降。其核心目标是大幅减少死于疟疾的人数,据世界卫生组织称,2020 年死于疟疾的人数是 62.7 万人——一个悲伤的数字。它还可以减轻这种疾病对经济的影响。2020 年有 2.41 亿例病例,主要在非洲,据估计疟疾每年使非洲大陆经济产出损失 120 亿美元。
美国生物学家、MIT 助理教授 Kevin Esvelt 是世界基因驱动开发的先驱之一。他在 2013 年首次提出这项技术。Esvelt 教授表示,这项技术是通过一种名为“菊链(daisy chain)”的方式提供的。在这种方式下,基因驱动被设计成在几代之后就不再起作用。或者每一代的传播几率都减半,直至最终停止。他表示使用这种技术可以控制并隔离基因驱动的传播。他表示:“可以在一个城镇释放带有限制的转基因生物,以改变(特定生物)的种群数量,同时将对临近城镇的影响降至最低。”
如果包含基因驱动的动物(亲本A)与不包含该基因驱动的动物(亲本B)交配,那么在结合了它们遗传物质形成的胚胎中,亲本A的基因驱动会立刻开始发挥作用。它会在亲本B的染色体中识别出自身的天然基因版本并加以破坏——将其从 DNA 链中切割出来。然后亲本B的染色体会修复自身——但会复制亲本A的基因驱动。因此胚胎和由此产生的后代几乎可以保证具有基因驱动,而不是只有标准转基因的 50%的几率——因为胚胎从每个亲本那里获取一半的基因。可通过基因编辑技术 Crispr 添加到基因之中创建基因驱动。这告诉它在新胚胎的另一个亲本DNA中靶向自身的自然版本。基因驱动还包含一种进行实际切割的酶。
我们希望基因驱动可用来大大减少疟蚊和其他害虫或者入侵物种的数量。Target Malaria是这方面最前沿的一个组织,它开发出了阻止蚊子产生雌性后代的基因驱动。这很重要,原因有两个——只有雌蚊子会咬人,而且没有雌性,蚊子的数量会直线下降。其核心目标是大幅减少死于疟疾的人数,据世界卫生组织称,2020 年死于疟疾的人数是 62.7 万人——一个悲伤的数字。它还可以减轻这种疾病对经济的影响。2020 年有 2.41 亿例病例,主要在非洲,据估计疟疾每年使非洲大陆经济产出损失 120 亿美元。
美国生物学家、MIT 助理教授 Kevin Esvelt 是世界基因驱动开发的先驱之一。他在 2013 年首次提出这项技术。Esvelt 教授表示,这项技术是通过一种名为“菊链(daisy chain)”的方式提供的。在这种方式下,基因驱动被设计成在几代之后就不再起作用。或者每一代的传播几率都减半,直至最终停止。他表示使用这种技术可以控制并隔离基因驱动的传播。他表示:“可以在一个城镇释放带有限制的转基因生物,以改变(特定生物)的种群数量,同时将对临近城镇的影响降至最低。”
据估算人体包含了超过 200 种细胞,它们全部来自一个受精卵。皮肤的纺锤形细胞、神经节分支的神经元、肥大的脂肪细胞,极其敏感的视杆细胞和视锥细胞——所有这些都是长期发育过程的产物,它们的物理形态发生了面目全非的改变。除了少数例外,所有这些细胞都携带着与受精卵相同的基因。每种细胞之间唯一的差异是哪些基因是活跃的。但是基因相同的细胞是如何分化出不同的身份的呢?在分子水平上发生了什么将干细胞转化为皮肤细胞,为什么它们会保持这种状态而不是变成肌肉或脂肪?研究人员一直在努力回答这些问题,这些问题与所有复杂生物的发育有关,无论是芥菜植物、蜈蚣还是蓝鲸。遗传模型的早期尝试总是缺乏生物学家在自然界中看到的重要方面——尤其是一种简单性,使它能够扩大规模以定义多种细胞命运。
现在加州理工学院一群具有物理学背景的生物学家在《科学》期刊上报告称,他们设计出了一个简单的基因网络,可以产生令人惊讶的复杂、逼真的行为。这可能代表着在理解大自然如何告诉细胞分化方面的重大进展。研究人员将少量工程基因引入细胞,并施加正确的化学信号,将细胞引导出了七种不同的稳定状态,每一种在显微镜下都可以通过不同的发光颜色进行区分。细胞表现出与分化细胞相关的关键特性;例如它们坚定地致力于成为一种细胞,但它们也会表现出对以前活动的“记忆”,这会影响它们对新环境的反应。数学模型表明,只需再增加几个基因,就有可能定义数百种细胞身份,足以形成复杂生物的组织。这一发现为实验打开了大门,更接近于理解构建我们的系统在一万年前是如何构建的。
现在加州理工学院一群具有物理学背景的生物学家在《科学》期刊上报告称,他们设计出了一个简单的基因网络,可以产生令人惊讶的复杂、逼真的行为。这可能代表着在理解大自然如何告诉细胞分化方面的重大进展。研究人员将少量工程基因引入细胞,并施加正确的化学信号,将细胞引导出了七种不同的稳定状态,每一种在显微镜下都可以通过不同的发光颜色进行区分。细胞表现出与分化细胞相关的关键特性;例如它们坚定地致力于成为一种细胞,但它们也会表现出对以前活动的“记忆”,这会影响它们对新环境的反应。数学模型表明,只需再增加几个基因,就有可能定义数百种细胞身份,足以形成复杂生物的组织。这一发现为实验打开了大门,更接近于理解构建我们的系统在一万年前是如何构建的。
狼疮是一种自体免疫性疾病,即免疫系统非正常地攻击自身健康的组织和器官。狼疮的原因一直是个谜,它没有治愈方法,目前的治疗主要在于减轻症状。根据发表在《自然》期刊上的一项研究,研究人员相信他们发现了导致狼疮的单点突变。此前的研究将狼疮与 TLR7 基因关联起来,西班牙少女 Gabriela Piqueras 在 5 岁时出现了狼疮症状,研究人员在她的基因组中识别了一个单点突变,在小鼠身上利用 CRISPR 基因编辑技术重现这一突变会导致其发展出狼疮症状。这一突变增加了免疫系统对鸟嘌呤的敏感性,鸟嘌呤是 DNA 和 RNA 的基础组成部分之一。这导致了在没有病毒 RNA 存在的情况下打开感染传感器。TLR7 位于 X 染色体上,这能解释为什么女性比男性更可能发展出狼疮。
RNA世界假说认为,在 DNA 及其编码的蛋白质进化之前,第一个生物体是基于 RNA 链的。标准理论认为,在“RNA世界”里,生命可能以复杂的原始 RNA 链形式存在,它们既能复制自己,又能与其他链竞争。这些“RNA酶”可能进化出了制造蛋白质的能力,并最终将它们的遗传信息转化为更稳定的 DNA。但该过程是如何发生的仍旧是个问题,部分原因是单由 RNA 组成的催化剂的效率远远低于今天在所有活细胞中发现的蛋白质酶的效率。根据发表在《自然》期刊上的研究,化学家解决了生命起源理论中的一个关键问题,他们证明了 RNA 分子可以将短链氨基酸连接在一起。
研究人员通过连接活细胞中常见的两段RNA,构建了一种合成 RNA 分子,其中包括两种经过修饰的核苷。在第一个特异核苷位点,合成分子可以与一个氨基酸结合,然后氨基酸侧移与邻近的第二个特异核苷结合。随后,研究人员分离了原来的RNA链,并引入了一个新的RNA链,该RNA链携带自己的氨基酸,并与之前附着在第二链上的氨基酸形成强共价键。
经过了对生命起源研究的漫长实验,日本研究小组报告创建出了一个分子试管世界,其中的分子自发地演化出了复杂性和令人惊讶的合作。论文主要作者、东京大学的项目助理教授 Ryo Mizuuchi 表示,经过数百个小时的复制,一种单一 RNA 演化出了五种不同的分子“物种”或者宿主和寄生体的谱系,它们和谐共存并合作生存,就像“分子版本生态系统”的开端。他们的实验证实了先前的理论发现,表明具有复制手段的分子可以通过达尔文演化自发地发展出复杂性,研究人员写道,“这是生命出现的关键一步。”Mizuuchi 表示,“我们可以提供(试管中复制分子实现复杂性)直接证据;我们可以看到实际上发生了什么。”没有参与此项研究的荷兰格罗宁根大学系统化学教授 Sijbren Otto 表示,这是在实验室中演化出复杂复制器网络的第一步,可能也是最重要的一步。“有了这里展现的内容,前面的道路变得清晰多了,你可以更加乐观,这真的会起作用。”
参与交配游戏是有风险的。有机体必须应对存在的风险,在错误的选择上做出正确的决定也会导致后代终生受到不良基因的影响。它们还必须应对更直接的负担和风险:参与者需要收集资源进行求爱,并且耗费精力追求潜在的配偶。忙着求偶的动物还很容易成为捕食者的目标。
因此秀丽隐杆线虫在条件良好的时候不会费劲使用这个流程不足为奇。作为一个主要是雌雄同体的物种(存在少量雄性以保持多样化),这些线虫通常会对卵进行自我授精,直到其储藏的精子在寿命后期耗尽为止;只有到了这时它才会产生一种信息素吸引雄性,以继续参与生殖游戏。但当环境条件变得糟糕时,这些线虫会更快地变得有性吸引力。对它们来说,性就相当于孤注一掷——这是一场绝望的赌博,如果后代在基因上更加多样化,那么就有一些会在新的、更恶劣的条件下过得更好。
科学家一直认为这种由压力引起的转变纯粹是短暂的。但最近当特拉维夫大学的科学家在过热的环境中将秀丽隐杆线虫饲养了十多代之后,他们发现将这些线虫转移到较冷的环境中之后,性吸引力还会延续几代。这个观察结果显示出遗传并不总是简化为对生物体基因的简单解释,它可能指向一种与传统自然选择协同作用的机制,两者共同塑造了某些生物体的演化。
正如在《发育细胞》上发表的这篇新论文所述,造成这种特征的原因不是线虫 DNA 的遗传变化,而是影响 DNA 使用方式的“表观遗传”变化。研究人员——资深作者、特拉维夫大学生物学家Oded Rechavi,第一作者Itai Toker(现为哥伦比亚大学博士后研究员)及其同事——确定了一种小 RNA 分子,该分子可以在代际传递生产信息素的信号。这种可遗传的RNA分子提高了线虫在艰难时期演化的概率。
因此秀丽隐杆线虫在条件良好的时候不会费劲使用这个流程不足为奇。作为一个主要是雌雄同体的物种(存在少量雄性以保持多样化),这些线虫通常会对卵进行自我授精,直到其储藏的精子在寿命后期耗尽为止;只有到了这时它才会产生一种信息素吸引雄性,以继续参与生殖游戏。但当环境条件变得糟糕时,这些线虫会更快地变得有性吸引力。对它们来说,性就相当于孤注一掷——这是一场绝望的赌博,如果后代在基因上更加多样化,那么就有一些会在新的、更恶劣的条件下过得更好。
科学家一直认为这种由压力引起的转变纯粹是短暂的。但最近当特拉维夫大学的科学家在过热的环境中将秀丽隐杆线虫饲养了十多代之后,他们发现将这些线虫转移到较冷的环境中之后,性吸引力还会延续几代。这个观察结果显示出遗传并不总是简化为对生物体基因的简单解释,它可能指向一种与传统自然选择协同作用的机制,两者共同塑造了某些生物体的演化。
正如在《发育细胞》上发表的这篇新论文所述,造成这种特征的原因不是线虫 DNA 的遗传变化,而是影响 DNA 使用方式的“表观遗传”变化。研究人员——资深作者、特拉维夫大学生物学家Oded Rechavi,第一作者Itai Toker(现为哥伦比亚大学博士后研究员)及其同事——确定了一种小 RNA 分子,该分子可以在代际传递生产信息素的信号。这种可遗传的RNA分子提高了线虫在艰难时期演化的概率。
根据发表在上周《科学》期刊上的一项研究,一个国际联合团队开展了一项迄今为止最大的将致病基因与特定类型的免疫细胞联系起来的研究。这项研究有助于理解为什么有些治疗方法在某些患者中效果很好,但在其他患者中却不起作用。该研究通过前所未有的规模观察个体免疫细胞中的基因,提供了独特的见解。它分析了来自大约 1000 名健康个体的超过 100 万个免疫细胞的基因组图谱,以确定将遗传标记与多发性硬化症、类风湿性关节炎、狼疮、Ⅰ型糖尿病等疾病联系起来的指纹,总共探索了 14 种不同类型的免疫细胞。该研究将特定基因和免疫细胞类型与个体疾病联系起来,这意味着个人独特的遗传特征可用于提供量身定制的治疗,以精确“驯服”他们的免疫系统。
地球上的生命千姿百态——无论是在亚马逊猎杀了一头鹿的美洲豹、在刚果盘绕在树上的兰花藤、在加拿大沸腾的温泉中生长的原始细胞,还是在华尔街啜饮咖啡的股票经纪人——在基因层面,他们都遵循着相同的规则。四个化学字母(核苷酸碱基)拼出 64 个三个字母的“单词”,这些被称为密码子的单词每一个都代表 20 种氨基酸中的一种。当氨基酸按照这些编码指令串在一起时,形成了每个物种特有的蛋白质。除了少数鲜为人知的例外,所有基因组都以相同的方式编码信息。
然而上个月发表在 eLife 的一项新研究中,MIT 和耶鲁大学的研究人员证明,有可能调整其中一个历史悠久的规则,创建出更广泛、全新的遗传密码,构建更长的密码子单词。原则上他们的发现指向了将遗传密码扩展为更通用系统的几种方法之一,合成生物学家可以使用该系统来制造具有全新生物化学特性的细胞,创造出在自然界中无处可寻的蛋白质。但这项工作也表明,扩展的遗传密码受到其自身复杂性的阻碍,在某些方面变得不那么有效,甚至能力也出人意料地降低了——这些限制暗示了为什么生命一开始可能就不喜欢更长的密码子。
目前尚不确定这些发现对于宇宙其他地方生命的编码方式意味着什么,但是这确实意味着我们自己的遗传密码演化得既不太复杂也不太具有限制性,而是恰到好处——并且在 Francis Crick 称之为“冰冻事件”之后的数十亿年中统治着生命。作者表示,大自然选择了这种“金发姑娘”编码,是因为它简单且足以满足目标,而不是因为其他编码无法实现。
然而上个月发表在 eLife 的一项新研究中,MIT 和耶鲁大学的研究人员证明,有可能调整其中一个历史悠久的规则,创建出更广泛、全新的遗传密码,构建更长的密码子单词。原则上他们的发现指向了将遗传密码扩展为更通用系统的几种方法之一,合成生物学家可以使用该系统来制造具有全新生物化学特性的细胞,创造出在自然界中无处可寻的蛋白质。但这项工作也表明,扩展的遗传密码受到其自身复杂性的阻碍,在某些方面变得不那么有效,甚至能力也出人意料地降低了——这些限制暗示了为什么生命一开始可能就不喜欢更长的密码子。
目前尚不确定这些发现对于宇宙其他地方生命的编码方式意味着什么,但是这确实意味着我们自己的遗传密码演化得既不太复杂也不太具有限制性,而是恰到好处——并且在 Francis Crick 称之为“冰冻事件”之后的数十亿年中统治着生命。作者表示,大自然选择了这种“金发姑娘”编码,是因为它简单且足以满足目标,而不是因为其他编码无法实现。
科学家运用细胞重编程技术逆转老化的人类皮肤细胞,使其年轻三十年。在模拟皮肤伤口的实验中,恢复活力的细胞看起来更像是年轻细胞。人工诱导多能干细胞(iPSC)最早是由山中伸弥的团队于 2006 年发现的,山中伸弥因这一发现而在 2012 年获得诺贝尔生理医学奖。发表在《eLife》期刊上的最新研究没有诱导皮肤细胞转变成干细胞,而只是将其变成更年轻的版本,仍然保留皮肤细胞的性质。细胞重编程技术仍然存在很多局限, 比如有癌化的风险。
一些物种在其栖息环境中发挥着巨大的作用。河狸建造水坝,形成鱼群繁衍生息的小湖泊。海藻森林中的水獭吃掉了足够多的海胆,海藻可在不被吞噬的情况下生长。这些所谓的基石物种将其生态系统结合在一起。但是,如果生态系统不仅取决于单个物种,而是可以由单个基因制造或破坏呢?在发表在《科学》期刊上的一项研究中,研究人员证明了“关键基因”的存在。这一发现可能对科学家对生态系统及其中的物种随时间推移存续的思考方式产生影响。
在实验室中,研究人员构建了几个微型生态系统,每个生态系统仅由四个物种组成。位于食物链底层的是拟南芥,这是一种小型一年生植物,是生物学家最喜欢的研究生物(其基因组已在 20 多年前进行了测序)。在每个生态系统中,这种植物都是两种蚜虫的食物,而这些蚜虫又是寄生蜂的食物。每个面包盒大小的生态系统里都包含多种拟南芥植物。在一些系统中,这些植物在基因上是相同的——单一栽培。在另一些系统中,研究人员对三个基因——MAM1、AOP2和GSOH采用了不同的打开和关闭的组合,以此引入遗传变异。研究人员之所以选择这几个基因是因为它们维持名为脂肪族葡糖异硫氰酸盐的化合物的产生,这些化合物通过阻止饥饿的蚜虫来保护植物。一些实验生态系统的遗传组合数量比另一些生态系统的变化更多;研究人员观察植物、蚜虫和寄生蜂在每一种情况下的共存情况。
正如该团队预期的那样,具有更高遗传多样性植物的生态系统的结果更加稳定。和单一栽培相比,对于研究人员添加到组合中的每种具有不同基因组成的植物,昆虫的灭绝率下降了将近20%。但是令研究人员震惊的是,这一结果似乎取决于一个基因。不管多样性如何,如果系统包含了具有某种 AOP2 基因变体或等位基因的植物,那么和没有这种变体的系统相比,昆虫的灭绝率降低了 29%。本质上如果你改变 AOP2 等位基因,你就会失去昆虫。增加遗传多样性有助于昆虫,因为这增加了蚜虫遇到具有这一关键基因变异的植物的可能性。AOP2 等位基因影响蚜虫的机制也令人惊讶。尽管该变体改变了植物产生抗蚜虫化合物的方式,但它也使植物生长得更快。这反过来又使以植物为食的蚜虫和寄生蜂更快长大。
在实验室中,研究人员构建了几个微型生态系统,每个生态系统仅由四个物种组成。位于食物链底层的是拟南芥,这是一种小型一年生植物,是生物学家最喜欢的研究生物(其基因组已在 20 多年前进行了测序)。在每个生态系统中,这种植物都是两种蚜虫的食物,而这些蚜虫又是寄生蜂的食物。每个面包盒大小的生态系统里都包含多种拟南芥植物。在一些系统中,这些植物在基因上是相同的——单一栽培。在另一些系统中,研究人员对三个基因——MAM1、AOP2和GSOH采用了不同的打开和关闭的组合,以此引入遗传变异。研究人员之所以选择这几个基因是因为它们维持名为脂肪族葡糖异硫氰酸盐的化合物的产生,这些化合物通过阻止饥饿的蚜虫来保护植物。一些实验生态系统的遗传组合数量比另一些生态系统的变化更多;研究人员观察植物、蚜虫和寄生蜂在每一种情况下的共存情况。
正如该团队预期的那样,具有更高遗传多样性植物的生态系统的结果更加稳定。和单一栽培相比,对于研究人员添加到组合中的每种具有不同基因组成的植物,昆虫的灭绝率下降了将近20%。但是令研究人员震惊的是,这一结果似乎取决于一个基因。不管多样性如何,如果系统包含了具有某种 AOP2 基因变体或等位基因的植物,那么和没有这种变体的系统相比,昆虫的灭绝率降低了 29%。本质上如果你改变 AOP2 等位基因,你就会失去昆虫。增加遗传多样性有助于昆虫,因为这增加了蚜虫遇到具有这一关键基因变异的植物的可能性。AOP2 等位基因影响蚜虫的机制也令人惊讶。尽管该变体改变了植物产生抗蚜虫化合物的方式,但它也使植物生长得更快。这反过来又使以植物为食的蚜虫和寄生蜂更快长大。
在庆祝人类基因组草案的科学里程碑二十多年之后,科学家终于完成了这项工作。人类基因组的第一个完整、无间隙的测序结果已经发表,这一进展有望为关于健康以及我们这个物种独特之处的新见解铺平道路。到目前为止,大约有 8% 的人类基因组缺失,其中包括大量高度重复的序列,它们有时被称为“垃圾DNA”。但实际上,这些重复的部分被省略是因为对它们进行测序存在技术难度,而不是纯粹由于缺乏兴趣。对基因组进行测序就像是将一本书切成文本片段,然后尝试将它们再次拼凑在一起以重建这本书。和独特的文本片段相比,将包含很多常见或重复单词和短语的文本片段放置在正确的位置难度更大。新的“长读”测序技术可以一次性解码大块的DNA——足以捕捉许多重复——帮助克服了这一障碍。科学家能通过使用一种不寻常的细胞类型进一步简化这个谜题,这种细胞类型只包含从父亲那里继承的 DNA(人体内大多数细胞都包含两个基因组,这两个基因组分别来自父母)。这两项进步让我们能解码构成人类基因组的超过 30 亿个字母。研究报告发表在《科学》期刊上。
数十亿年前,贫瘠的原始地球某处出现了复杂有机分子,涌现第一批细胞。研究生命起源的研究人员提出了无数富有想象力的想法,解释这是如何发生以及必要的原材料来自哪里。蛋白质是最难解释的原材料之一,它们是细胞化学的关键支柱,因为在今天的自然界中,它们只由活细胞产生。没有生命的时候,第一批蛋白质是如何形成的?科学家多在地球上寻找线索。一项新的发现表明,可以在天空之外,在黑暗的星际云中找到答案。在上个月的《自然天文学》期刊上,一群天体生物学家表明,飘过宇宙的坚固、冰冷的宇宙尘埃颗粒上可以自发地形成肽(蛋白质的分子亚基)。理论上这些肽可以在彗星和陨石的内部到达年轻的地球——以及其他世界,成为生命的起始材料。新论文的主要作者、德国马普天文研究所(Max Planck Institute for Astronomy)和德国耶拿大学(Friedrich Schiller University)的研究人员 Serge Krasnokutski 表示,这种新的太空肽形成机制具有简单性和有利的热力学特性,使其成为在没有生命的地球上发生已知纯化学过程的更有希望的替代品。他表示,这种简单性“表明蛋白质在参与生命诞生演化过程的第一批分子之列。”
贝克曼高级科学与技术研究所的研究员 Kasra Tabatabaei 表示:“互联网每天产生数 PB 的数据。只要一克 DNA 就足以存储。”Tabatabaei 参与的一个项目项目致力于“将 DNA 的双螺旋结构转变为强大可持续的数据存储平台。”研究论文发表在上个月的《Nano Letters》期刊上。他们是第一个人工扩展 DNA 字母表的团队。DNA 用四种被称为核苷酸的分子对遗传信息进行编码。它们是腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶,或者称为 A、G、C 和 T。从某种意义上说,DNA 的字母表上有四个字母,不同的字母组合代表了不同的数据比特。如果我们有一个更长的字母表呢?这会带来更深层次的能力。按照这种思路,人为地在 DNA 库中添加七个新字母。“我们可以将 0 和 1 转换为 A、G、C、T 以及存储字母表中的七个新字母,而不是只将 0 和 1 转换为 A、G、C 和 T。”一位联合首席研究员表示,他们的工作“提供了令人兴奋的原理证明,将大分子数据存储扩展到非天然化学物质,有可能大幅提高非传统存储介质的存储密度。”
德克萨斯大学奥斯汀分校的研究人员发现了一种以前未知的蛋白质结构,负责对 DNA 错误片段进行编辑。他们经过调整能将基因编辑的脱靶突变发生概率降低 4000 倍。CRISPR 工具使用 Cas9 等蛋白质对活细胞中的特定 DNA 序列进行精确编辑,切除有问题的基因如致病基因,和/或插入有益基因。问题在于该工具可能会改变错误的部分,可能引发一系列其他健康问题。在新研究中,研究人员发现了其中一些错误是如何发生的。通常 Cas9 蛋白在 DNA 代码中寻找 20 个字母的特定序列,如果它找到了 20 个字母中有 18 个与其目标匹配的序列,它可能就会进行编辑。为了找到出现这种状况的原因,研究人员使用低温电子显微镜观察了 Cas9 与不匹配的序列相互作用时的行为。他们惊讶的发现了一种此前从未观察到的、奇怪的手指状结构。这根“手指”伸出,稳定住 DNA 序列,因此蛋白质仍然可以对其进行编辑。在发现了这种机制后,研究团队调整了这个“手指”,使其不再稳定 DNA,而是推开它。阻止 Cas9 编辑该序列,让该工具产生脱靶突变的可能性降低了 4000 倍。它们将这种新蛋白质称为 SuperFi-Cas9。研究报告发表在《自然》期刊上。