当化石形态学遇上信息论

特征 通信 形态学 信息熵 矩阵 噪声 编码 系统发育 信源 古生物学
中国科学院    2022-02-23    96

  长久以来,化石作为古生物学研究最主要也是几乎唯一的材料不可避免地受到保存环境的影响,其中的噪声造成了形态学特征的不完整与失真,进而影响后续的系统发育和功能形态方面研究。尽管部分研究讨论了不同地区与年代中化石保存的完整性,但其中绝大多数停留在数据收集与统计上,并没有将化石中受到噪声的影响量化。甚至在大量古生物学研究中,信息一词也常常与数据,信号,观测结果等等概念混淆,并没有清晰的定义。这些基础概念的模糊导致了在系统发育研究中,不同作者对于“特征”、“物种”等概念缺乏共识,学界始终缺乏合适的理论框架与方法对化石中的形态学信息进行定量化的研究。

1. 经典通信系统模型与基于信息论框架的古生物学

  近日,国际学术期刊《生态学与演化》(Ecology and Evolution)在线发表了由美国自然历史博物馆余琮煜,北京大学地球与空间科学学院江左其杲,古脊椎所王海冰等合作的题为“形态学特征中的信息(Information in morphological characters)”的论文,提出了可以将信息论与通信系统工程作为古生物形态学研究的理论基础。文章讨论了多个脊椎动物形态学特征矩阵中的信息熵,互信息,信道容量等参数,提出目前的形态学矩阵并没有很好地区分信源编码与信道编码,不同特征之间差异较大的信息熵往往被忽视,矩阵中过多的特征数量可能导致了信息传递的低效。

  尽管人造通信系统存在的时间几乎与人类的历史一样久远,但对通信系统完整的数学描述直到1948年才被克劳德香农提出。一个典型的通信系统可以分为信源,发送设备,信道,接收设备,信宿,其中信道在现实中往往伴随着噪声。信源中的原始消息(message)经过发送设备编码之后进入信道,接收设备收到编码信号(signal)之后进行解码将消息传递给信宿,由于现实通信中几乎无法避免噪声,为了确保解码后的消息与编码前的消息的一致性,精心设计的编码是非常必要的。香农提出编码过程可以进一步细分为信源编码与信道编码,而且这两个步骤可以分开进行互不影响。信源编码需要以尽可能低的成本(编码长度)表示出所有可能出现的消息,也就是要完整表达出信源的信息熵,其典型例子有电报通信中的摩斯电码。信道编码的主要目的是对抗信道中的噪声,恰当地引入冗余可以保证即使一部分信号丢失或者失真,接收设备依然可以解码得到原始消息,从而保证有效的通信。

  香农认为通信中最基础的问题是在一处近似或者精确地重现另一处的消息,类似的,我们认为古生物学中最基础的问题是在现代近似或者精确地重现在地质年代中的古生物,包括他们的演化历史与形态功能等诸多方面。在古生物学系统发育研究中,绝大多数研究只能依靠形态学数据,与此相反的是,在现代生物或者最近灭绝的生物的系统发育研究中,研究人员可以利用DNA或者蛋白质序列这样易于数字化的数据。因此,DNA或者蛋白质序列非常接近于现代通信系统中的数字信号,而形态学数据更接近于模拟信号。形态学的数字化通常依靠形态学特征矩阵来完成,但是如何选择特征,每个特征中有多少信息量,各个特征之间的相关性,这些问题都是模糊不清的。

  该研究首先计算了多个脊椎动物形态学特征矩阵中每个特征的信息熵(信息量),拥有更多特征状态的特征有明显较高的信息熵。对于矩阵中多个特征的联合信息熵的结果显示仅仅少数形态学特征即可描述信源信息熵,绝大多数特征并没有提供额外的信息。这与古脊椎动物学研究中报道新物种的习惯符合,即利用少数特征作为鉴定特征,而在系统发育研究中则会使用数量大得多的特征。类似地,这样的区别可以用通信系统工程当中的信源与信道编码过程解释。进一步地,研究计算了每个特征矩阵中特征对之间的互信息,发现特征之间的相关性广泛存在,但习惯上对于解剖结构的划分并没有体现出较好的模块性。 

2. 特征矩阵中的多个特征的联合信息熵与互信息分布

  基于加性高斯白噪声信道模型,研究估算了不同特征矩阵对应的信道容量,发现信道容量均被特征数量饱和。香农的理论告诉我们超越信道容量的通信速率必然带来噪声,而在加性高斯白噪声信道模型中,随着带宽的提高,信道容量并不会无限提高,过宽的带宽不仅浪费通信资源也无法改善通信的质量。这与目前被研究人员偏爱的超大型特征矩阵相悖。

  由于信息熵直接度量了单个变量的信息量多少,因此可以在系统发育的特征权重方面提供参考依据。研究比较了平等加权(equal weighting),隐含加权(implied weighting)与信息熵加权在多个脊椎动物类群中的系统发育结果。尽管最终结果十分接近,但信息熵加权由于完全不需要任何先验知识,且直接建立了特征权重与信息熵之间的关系,比其他加权方式拥有更好的解释性和更少的额外假设。 

3. 加性高斯白噪声信道模型下的特征矩阵中的信道容量与特征数的关系

  随着观测手段的进步,古生物学家需要处理飞速增加的数据,但目前大量的古生物数据依然依靠研究人员的手工处理。尽管大量的数字化手段已经在古生物学研究中被实践,例如形态学特征矩阵,基于标志点的形态几何学,CT扫描等等,如何在海量的数据中寻找我们需要的信息依然是很有挑战性的工作。利用已经发展成熟的信息论与通信系统工程作为理论基础,为形态学数据的数字化提供了理论支持,也为基于形态学的系统发育研究提供了指导。正如现代通信系统在数字信号取代模拟信号之后迎来的大发展,未来基于信息论的古生物学有希望帮助我们更好地破解生物演化的密码。

  本文第一及通信作者为美国自然历史博物馆古生物部博士研究生余琮煜,共同作者有北京大学博雅博士后江左其杲和中科院古脊椎所副研究员王海冰,参与工作的还有德国汉堡大学与美国自然历史博物馆的科研人员。

论文链接:https://onlinelibrary.wiley.com/doi/10.1002/ece3.7874
本文为专栏作者授权科易网发表,版权归原作者所有。文章系作者个人观点,不代表科易网立场,转载请联系原作者。如有任何疑问,请联系ky@1633.com。
相关推荐
企业数字化转型一体化解决方案
企业数字化转型一体化解决方案: 1)数据资产管理平台:具备多数据源的集成能力;数据的抽取、转换、落地能力;具备数据加工处理能力,并可定制化数据加工组件;具备数据资产目录、数据质量、数据血缘等数据管理能力。全平台一体化解决当前企业数字化转型中遇到的数据集成、数据交换,数据治理,数据资产管理等问题。 2)管理系统低代码生成平台:通过拖拉拽的方式快速生成PC以及手机端页面,数据接口,数据库表内容等技术体系;通过拖拉拽快速生成填报、审批流程、权限控制等业务模块的能力。可以在面对企业管理、OA系统、MES系统等定制化项目时快速、低成本的进行系统生成。并可将场景应用经验在平台上进行沉淀。 3)数据可视化平台:具备多种系统数据的集成能力;通过平台内置的可视化编辑集成开发环境,可将数据输出成图表,将多层级图表进行编辑生成画面;通过序列编辑器达成可视化画面的播放,多端控制能力;具备可视化操作系统的能力,将多种类型的web应用,3D应用在平台上进行统一集成。通过上述产品帮助客户构建参观汇报、运行监控、数据分析以及高端会议等场景的解决方案。
领域:网络应用技术
复合导电纤维技术方案
项目团队提出的复合导电纤维电缆,以低廉的玄武岩无机纤维为原材料,制备出的一种新型的导线,是一种基础材料,有非常大的应用前景,可应用于国计民生的方方面面。包括5G基站的线缆、高压输电线、民用建筑用导电,柔性可穿戴设备、音频信号线,船用航空航天等多领域 。 新型复合导电纤维电缆 以高强度无机长纤维为原料,镀上金属层,使其变成电良导体,以此线芯制成新型导电纤维电缆,可以代替金属导线在高低压供电领域使用。由于纤维基材的高强度,该导电纤维电缆具有优异的抗疲劳、抗折弯、可广泛应用于高压/特高压、以及各种特种电缆领域。在价格上具有绝对优势,不到同类产品的40%。 项目计划建立复合导电纤维线缆研发生产、中试基地;设计、制造导线纤维专用设备,包括2条全自动的纤维金属化生产线,实现全过程的自动放丝、预处理、表面金属化、线缆烘干和缠绕。
领域:纳米及粉末冶金新材料制备技术
多点式高灵敏度水浸传感器的研发和产业化
随着物联网发展和方案的成熟,水浸传感器渐渐成为各种行业解决方案中不可或缺的元素,水浸传感器是一种简易的液体泄漏监测装置,可以监测到漏水的瞬间,并及时报警。 它可以有效替代人工巡查,对所有有雨水渗漏、水管等水源的区域进行漏水监测,可以实时监测和预警漏水隐患。 我们开发的智能水浸传感器产品是专门针对通讯基站、数据机房、宾馆饭店、仓库、城市供水、电缆井口、高楼水池等场所的水浸监测而设计的, 它的监测点分成单触头检测和三点同步独立检测,配合智能水位监测平台进行及时告警。 智能水位监测平台就是将安装在多个区域的水浸产品通过网络传输实现集中维护的工具平台,它具有响应快、功能强、可集中、使用方便等优点。
领域:敏感元器件与传感器
装配式隐形厨卫
装配式隐形厨卫-用时打开,不用时隐藏的卫生间和厨房,包括折叠墙壁式和窗帘式,以及墙壁和窗帘结合式;里面有蹲坐两用折叠马桶,多功能折叠浴缸,折叠洗漱池,可升降折叠洗漱台,保暖装置,防漏装置,除味装置等等,没有气味,绝对不会漏水。 适用于集成房,工地用板房(解决临时住房的厨卫问题),钢结构住宅,小户型,单身公寓(解决空间狭窄的家庭的厨卫问题),出租房,房车(移动载体的厨卫问题),不占地方(折叠后面积为零)大小定制,不用模具,且生产速度快,价格实惠,(售价500-2000元,具体看配置,毛利50%左右),使用方便,重量轻(5-25公斤),整套打包后体积也小,物流费用便宜,可以快速拆装,且可以重复安装使用,经久耐用,体验度好。 整条产业链对环境友好,可以回收,可以自动降解,没有任何污染。 有30个专利(15个发明专利,15个实用新型专利)。授权了23个专利(8个发明专利,15个实用新型专利),另外还有8份著作权。
领域:建筑物
水环境智能监测监控机器人及大数据数字孪生平台
产品介绍:自主研发特种机器人产品,支持太阳能、风能直供电,自组网军工级宽带通信加密,7类AloT传感器人工智能控制域芯片(水文,水情,水质检测,降水,-氧化碳,二氧化碳,二氧化硫),高性能边缘计算算法,实现有效高清视频流传输。 适用行业:目前应用在水利水务,反恐维稳,矿山交通,海防河道,智慧校园,智慧园区,智慧旅游,城市大脑、海岸海岛、国际维和、一带一路。
领域:机器人
宽禁带半导体产业化
公司定位于技术水平领先的宽禁带半导体(第三代半导体)衬底材料生产商,聚焦于SiC衬底的研发、生产和销售,处于产业的上游材料端。目前公司可以较高成功率稳定产出6英寸SiC单晶晶圆,未来该技术发展方向为大尺寸SiC单晶制备生产批量成熟技术和前沿半导体技术。 主要产品为碳化硅晶片,碳化硅衬底是第三代半导体材料中氮化镓、碳化硅应用的基石。 核心技术优势:碳化硅晶体生长工艺,我们用仿真模拟来指导碳化硅晶体生长工艺的制备,这是第三代半导体的核心部分,也为第三代氮化镓和第四代半导体材料外延提供优质的衬底材料。我司创新性地开展了“气相-固相”的长晶动力学和晶体缺陷生成的机理研究,这是第三代半导体研究的无人区。我们在基础理论研究领域进行深耕,去解决晶体生长时的位错、微管密度等缺陷问题。 产品优势:我司晶圆的品质较高,处于国内一流水平,例如,微管每平方厘米2个。 且将来通过国际合作,我们的品质可有大幅度提升,达到国际领先水平。 产品技术:目前可以稳定工艺较高良率生产6寸sic晶体;7天大约100小时长晶20mm。 产业链优势:我司具备全套的设备图纸,长晶工艺,成熟的SiC粉料制成工艺和整套的SiC晶圆的冷切割及抛磨技术。我司以高品质的产品性能为优势,同时建立粉末加工、设备制造、石墨、切磨抛工艺等产业链相关子公司,推动产品成本持续优化,品质不断提升,从而完善从“设备研制—原料合成—晶体生长—晶体切割—晶片加工—清洗检测”的全流程关键技术和工艺,打通第三代半导体材料上游端的整个产业链。
领域:大功率半导体器件
找山楂核仁油技术开发服务商
找山楂核仁油技术开发服务商
山楂核仁油是一种非常受欢迎的食用油,其主要成分是山楂核仁。山楂核仁具有浓郁的香气和味道,被广泛用于烹饪和药用。本文将从定义、应用场景、技术现状和未来发展前景等方面对山楂核仁油进行探讨。一、定义山楂核仁油是从山楂果实中提取的油脂。山楂果实是一种常见的水果,通常在秋天成熟。山楂核仁油是从山楂果实中采摘的坚果壳(即山楂核)中提取的油脂。这些坚果壳包含着山楂核仁和油脂。山楂核仁油因其浓郁的香气和味道,以及丰富的营养成分,越来越受到人们的喜爱。
关键词:仁油,核仁,香气,山楂核
抗三专利申请
抗三专利申请
“抗三”是一种系统性的思考方式,通过分析复杂系统中的三个主要层面:个体、组织和环境,来理解系统的行为和确定应对策略。它通过三个相互关联的维度来分析系统:1. 内部维度:包括个体之间的相互作用和组织内部的运作方式;\n2. 组件维度:包括组织中的各个组件,如人员、流程、技术等;\n3. 环境维度:包括组织所处的环境,包括市场、政策、技术等。应用场景:在现代社会,组织面临着越来越多的复杂多变的挑战,如市场变化、技术革新、政策调整等。这些挑战不仅给组织带来了风险,也提出了新的要求。因此,抗三思考方式在组织应对这些挑战时具有重要的应用价值。首先,在市场变化方面,抗三思考可以帮助组织更好地理解市场的变化趋势,预测未来的市场环境,并制定相应的战略和计划。其次,在技术革新方面,抗三思考可以帮助组织更好地了解技术的发展趋势,预测未来的技术应用场景,并制定相应的技术战略。
关键词:组织内部,分析系统,系统性,复杂系统
食用菌功能饮料发展现状
食用菌功能饮料发展现状
食用菌功能饮料是一种以食用菌为原料生产的具有保健功能的饮料。在定义中,食用菌功能饮料是指以食用菌为原料生产的具有保健功效的饮料,包括不同类型的食用菌,如香菇、木耳、银耳等。在应用场景方面,食用菌功能饮料的应用场景非常广泛。除了传统的饮食场景外,它还可以在运动、疲惫、压力等场景下使用。食用菌功能饮料具有丰富的营养成分和保健功效,能够满足人们不同场景下的需求。
关键词:保健功能,保健功效,功能饮料,原料生产
果醋发酵产学研合作资源
果醋发酵产学研合作资源
果醋发酵技术是一种利用微生物发酵技术生产果醋的方法,旨在提高果醋的营养价值和口感。在果醋发酵过程中,利用醋酸菌、酵母菌等微生物对苹果、葡萄等水果进行发酵,生产出具有独特口感和健康营养的果醋产品。果醋发酵的应用场景非常广泛。首先,果醋作为一种调味品,可以用于烹饪、调味、蘸酱等方面。果醋的酸味可以中和碱性食物,增加口感,同时也具有降脂、减肥等健康作用。其次,果醋还具有一定的药用价值。果醋中含有的醋酸、葡萄糖、氨基酸等成分具有一定的抗菌、抗炎、降血脂等作用,可以用于治疗口腔溃疡、便秘等疾病。果醋发酵技术的发展与其应用场景密切相关。随着人们生活水平的提高和健康意识的增强,果醋作为一种健康、美味的食品越来越受到人们的欢迎。
关键词:果醋发酵,醋酸菌,酵母菌,微生物发酵技术
健康养殖技术技术哪里有?
健康养殖技术技术哪里有?
健康养殖技术是一种以保障动物健康为核心,通过科学养殖管理、预防和控制疾病、提高动物生产力和死亡率的技术。在当前社会,动物健康问题越来越受到人们的关注,健康养殖技术也成为了养殖行业不可或缺的一部分。定义:健康养殖技术是指利用科学的方法和手段,对动物进行养殖管理,以提高其生产力和死亡率,保证其健康和福利的一种技术。健康养殖技术需要综合考虑动物的生理、行为、心理等多方面因素,通过科学的饲养管理、环境控制、疾病预防和控制等措施,保证动物的健康和福利。
关键词:健康养殖技术,环境控制,综合考虑,饲养管理
找啤酒饮料技术开发服务商
找啤酒饮料技术开发服务商
啤酒饮料是指以啤酒为主要原料,通过一定工艺处理后,制成的饮料。啤酒的定义是以谷物、水和小麦等为主要原料,经酵母发酵作用,产生一种具有二氧化碳气体的发酵饮料。啤酒饮料不仅具有丰富的文化内涵,更是人们日常生活中不可或缺的饮品。应用场景:啤酒饮料的应用场景广泛,既可以在聚会、娱乐活动、体育赛事等场合下作为饮品,也可以在休闲、商务、旅行等场合下作为消遣饮品。啤酒饮料具有口感醇厚、清爽、口感丰富等特点,因此受到广大消费者的喜爱。
关键词:酵母发酵,啤酒,二氧化碳气体,啤酒饮料
深度处理工艺是什么?
深度处理工艺是什么?
深度处理工艺是一种利用神经网络等机器学习算法对数据进行高级分析和处理的技术。它的应用场景非常广泛,包括图像识别、语音识别、自然语言处理、推荐系统等各个领域。深度处理工艺的核心是神经网络。神经网络是一种由大量神经元组成的计算模型,可以通过学习自适应地改变连接权值,从而实现对数据的分析和处理。深度学习算法利用神经网络来提取数据中的特征,并对其进行分类、预测等任务。深度处理工艺已经在各个领域得到了广泛应用。例如,在图像识别领域,深度学习算法可以自动地识别出图像中的物体,并给出相应的答案。在语音识别领域,深度学习算法可以自动地识别出说话人的语音内容,并将其转化为文本形式。在自然语言处理领域,深度学习算法可以自动地生成文章,并理解其中的含义。深度处理工艺的技术现状非常发达。
关键词:机器学习算法,深度处理工艺,神经网络,语音识别
平衡架科研进展
平衡架科研进展
平衡架是一种用于固定和支撑设备、机器或工具的架子,其主要特点是具有稳定性和平衡感。在我国,平衡架又被称为随车架,主要用于起重机、电梯、桥梁、汽车等设备上。本文将从定义、应用场景、技术现状、未来发展前景四个方面对平衡架进行介绍。一、定义平衡架是一种用于固定和支撑设备、机器或工具的架子,其主要特点是具有稳定性和平衡感。它通常由轻质材料制成,具有良好的耐腐蚀性、耐高温性、耐磨性等特性。平衡架在工业、民用、运输等领域具有广泛的应用。
关键词:平衡感,架子,平衡架
服务精选
服务案例