第42章 记忆
📚rainbow rainbow rainbow
bring a more beautiful smile😇
tea tea tea🍵
sweet beauty of the world🌍
tree tree tree🌴
growing up on the road📚
---^^Bonjour. Fröhlichen Sonntagnachmittags Tee📖
休息休息♨️(《Send to you.》):“大家关注下鼠疫。”“好。”“嗯,蔓姐,这是历史上各大洲曾出现的鼠疫资料……”“哇,你动作快嘛!”“感觉蔓姐会问,哈哈哈,现在有一种答题答对了的快乐感。”……短暂的网络视频会议结束后,司徒景蔓看了几份资料,便起身进了厨房。……“阿幕,这个世界上最能装东西的硬盘是什么?”“emmm?最能装的硬盘,其实是我们的遗传物质。”“啊?”司徒景蔓被苏幕的回答笑着瞪大了眼睛。“又不是《哆啦 A 梦》里的记忆面包,第一步,把信息存储到面包上;第二步,吃下面包,让信息进入人体。第三步,消化信息。”“还真有哦,简单看步骤的话,现在的科技就能做到前两步了,DNA 存储技术已经能大规模写入数据了。美国科技公司 Catalog 已能将 16 GB的维基百科英文版全部文本保存到了一条人工合成的 DNA 中。”“所以?”“所以DNA 存储最直接的优点是存储量大。我给你画个东西,你看那块黄黄的液体重 3克,但其中 DNA 重量微乎其微。根据纽约基因组中心的数据,一克 DNA 可存储 215 PB 数据。把这些数据存到 1T 容量7毫米规格的硬盘里,硬盘堆在一起,有 1505 米高。世界最高建筑,迪拜塔也只有 828 米。DNA 存储不仅存储量大,寿命还长。正常硬盘使用寿命在 5到10年,遇到断电冲击等情况还会更短。常温下 DNA 的可读性能保持很久。保存得当,简直一克永流传,甚至万年前的 DNA 都被还原了。以目前水平, DNA 可以存一些政府文件,历史材料。估计以后也没什么历史、文化遗产之争了。随着技术发展, DNA 存储可以取代数据中心。”“我亲爱的personal computer,那电子数据是怎么存进 DNA 里的呢?”“记得生物课上讲过, DNA 脱氧核糖核酸是一种双螺旋结doublehelix的生物大分子,由碱基组成。DNA 链条上的长条就是碱基,DNA 中通常有四种碱基,大家直接理解成 A,T,C,G 就可以。碱基的排列顺序决定了长相、智力,不同病症的发病风险等。举个例子, ACA 的排列让人眼神不好,按 CAC 排能让人长高。其实就是遗传信息。”“那就是DNA 链条能储存遗传信息也能储存数字信息。”“对,但这么简单的逻辑,当时却根本没人细想,大家都在忙着破解基因密码。只要找出碱基排列的规律和意义,就像拥有了人类修改器,改长相改素质改寿命,变白变美变高变长寿。于是人类基因组计划开始了一项工程。这项工程花费 30 亿美元和十几年时间,测出完整的人类基因序列。如果把破解碱基排列比作翻译一本书,此时相当于终于把书拿到手里。”“那进展呢?”“虽说没有立竿见影的成果,但这工程推动了 DNA 测序技术的发展。巨大需求量的刺激,让 DNA 测序进入自动化时代。破解不了碱基序列,人们就变实际了。毕竟都要吃饭的嘛,看不懂没关系,排成咱看得懂的样子,好歹当个 U 盘,于是 DNA 存储技术就这样出现。”“咋说?”“如果把碱基看成 A , T , C , G 四个字母,碱基序列实际上就是一串英文。而数据实际上就是一串数字。把数字和碱基字母对应起来,重新排列,就能表达内容。知道转换规则,就能从排列中读取信息。DNA 存储就是通过把碱基看成固定数字,将数字化的数据转换成碱基序列的方式。把 A,G 视为 0 ,C,T 视为 1 ,排列后合成。这就是最早的 DNA 存储。为了存储更多数据,人们尝试了把 A ,T ,C,G 看成 0 ,1,2,3 的四进制。虽然四进制能缩短数据长度,但同一碱基连续出现,会让序列不稳定,影响数据的准确。更高的进制,四种碱基又不够用,为了解决这个问题,人们用了一种三进制的方案。这种方案里从第二位开始编码,以前一位碱基来决定后一位。前一位碱基是 A ,下一位就把 A 排除,用 C,G,T 来代表 0,1,2 。”“大帅,我的脑子绕晕了”,司徒景蔓一屁股坐在木板上,苏幕看得莞尔一笑,也随地而坐。“好啊,要不今儿讲到这?”“不,我要听,继续!”“好,那我们可以试一试。刚才的数字用三进制表达是 211101 。假设碱基序列第一位是 A ,转换结果就是 ATCTCGA。第一个字母是 A 时,按照表格,代表 2 的字母是 T,T 后面代表 1 的字母是 C,C 后面代表 1 的是 T,依此类推。解决了编码问题,大家玩嗨了,动图、音频、电影先后被存入 DNA 。2017 年,纽约基因组中心将电影火车进站存入 DNA 。存入数据大小的记录也快速刷新着, 2012 年哈佛 650KB 的记录很快被 MB 级碾压。2016 年记录到了百兆级,微软存了 200M 电子书,大概等同 789 本高中语文必修一。今年微软做了个 DNA 自动存储系统,但是hello 这 5 个字母的存储和读取花了 21 个小时。emmmm,这就是 DNA 存储的缺点了。但有关 DNA 存储的科技在不停进步。2001 年至今,DNA 测序从上亿美元降到了不到一千美元。今年 Catalog 的写入速度已经到了 4M 每秒。成本降到十万分之一,写入速度快了千万倍。这种进步幅度,足以对 DNA 存储技术保持期待。在不久的将来,也许电脑里的硬盘就换成瓶装 DNA 了”,苏幕笑着举起手中的画。“噗嗤,太逗啦!”“所以的所以,记忆面包不需要,多想想我,就对啦!”“yes!”……四季有梦,天涯相随;春夏秋冬,海角相伴。你说,我是你体内的力量;我说,你是我脑中的硬盘。我们约好,一起白头。^~^(2019.11.17点滴随笔)