登陆注册
19712100000084

第84章 网络的数据分析

统计分析,对数据的趋势的把握,能够转换为信息。定性和定量是不同层次的描述,样本对整体的描述可以参照不动点。本质上这是一个对频率和概率的描述,通过各种条件如方差,平均值等等来描述数据的分布。

序列的耦合可以以正交,层次之间的概率连接,模糊数学的多层次。

网络的各种数据分析,聚类,降维,SVM,神经网络等等算法可以进行一定的路径坍缩,即我们从无限高维的网络经过提取出我们可以理解的信息。其具体的形式与生物信息学的序列分析是一致的。

一维的是简单的上调下调,不同的对象形成一定的相关性路径,如我们惯见的信号通路,就是利用这些蛋白层次的相对关系来构建的宏观图景。形成各种复杂的促进/抑制机制。我认为还应该引入这些路径的相对竞争博弈,才能形成更高维的图景。

二维的是具体的数值,以此为基础我们可以根据一定的模型来拟合这些数据。

三维的是大规模数据的模式涌现:基因/蛋白的网络调控表达,这是多层次耦合的作用网络。

基本趋势:熵增及其抵抗性变化,幂律分布(聚类),序列相似性与功能相似性的对应,相互作用的蛋白质之间具有更大的概率可能产生一定的功能联系,模块化,层次的遍历和路径形成,网络的拓扑性质、生物信息、系统动力学,表达谱,概率网络和隐马尔科夫模型,网络的代偿和稳定性,通过外部的攻击来模拟基因表达变化,以此验证稳定性(类似如今的基因疗法);矩阵表示,通过聚类等等分类手段可以根据有限信息推断特定对象的位置,从而推断其他的性质。我们还可以借助贝叶斯推断来不断提高其准确性。

算法来整合数据库级别的信息,提取出适合不同层次的指标,具备一定的信息。网络的节点形成二级结构如环路等等,然后可以往上遍历形成更高维结构,这是如同编程的模块化思想。我们可以在这些结构的变化寻找与序列的对应关系。

第一章:意义;传统方法;系统观点的方法;具体的网络方法;

基于序列对相互作用网络的预测,杂交系统的预测,亚层的形成,统计指标的作用

序列信息的网络理解,这与我们尝试把网络结构降维到序列是相互耦合的。一个是从底到顶,一个是从顶到底,我们有信心它们竞争博弈能够形成一定的平衡。或许公理化体系是一种选择,当然这是内核,具体的情况还需要多体系的耦合,即其选择性表达可以有更大的与现实的拟合度。反正网络可以形成不同的层次,这些层次具有一定的相似性并且可以相互转换,可以组合形成高维的结构,知识模块化的思想。

单变量的类似数学的偏导研究模式在复杂的网络结构的实用性相比其他低耦合的系统(相对独立的分布)大大降低,因为网络的底层可以选择性表达为缺失的部分,这是网络的代偿和稳定性。当然这是一个概率分布的问题,因为如果特定的基因是网络的高连通度的中心节点可能产生比较明显的效应,如致死或者其他的明显性状改变。我们不能每次都筛选出这种不动点才做实验(目前的研究模式),我们应该寄托于大规模的数据运算使得特定模式涌现,即我们以多变量(能够根据一定的标准即相互作用)为研究对象,在这个层次构建不同的形成一定聚类的亚层结构之间的关系,即模块之间的相互作用,以概率的形式连接不同的模块,最终做到多层次的信息统合。

相互作用的蛋白质时间有更大的概率作用与相同/相似的功能。这是统计层次的模式涌现。

基于聚类的相同特征(表达趋势)可以提取出高维的图景,即不同的类可以根据一定的路径连接。首先是共表达模式可能具有相同的功能,然后是各种不动点式的指标来介绍不同模式之间的联系,最后在网络层次进行全部蛋白质的关系构建。并且在这个基础上建立于基本相关的对应关系

芯片技术/酵母双杂交/免疫共沉淀—大规模数据产出—数据分析—挖掘模式

网络级别的数据:矩阵表示,矩阵乘法就是路径形成,组合的加和也是多路径的耦合,即路径积分。

第二章:蛋白相互作用网络提供的大数据的运算,其可以比较的维度很多:拓扑,表达量等等。遍历所有路径,最后路径积分是平凡,这是路径坍缩。守恒定律,耗散结构的输入和输出。具体的表达不一定是需要的,这是概率性的。

蛋白质之间的组合是更高维的结果,这种相互作用的网络可以与特定的功能改进更大的相关性,而具体的蛋白质的表达量与这些高维功能的联系是概率分布,即存在一定的中心节点具有更大的相关性,当然大部分的节点是低概率连接的,一般来说被视为涨落。这种相互作用网络就是高维的结构,对应于复杂的功能。

对一定的物种的蛋白相互作用网络的研究可以做到一定的知识迁移,如各种分布,幂律分布,小世界模型等等性质。模块的思想引自程序设计。

连通性,分布分化

机器学习对序列的模式识别来解决可能的关系,即网络的不同对象之间的概率性连接。

不同层次的聚类,根据不同的标准划分的不同组合形式。理论上可以以一系列的特征描述来整体指代特定对象,这就是序列思想,可以做到准确对应,但这需要耗费的资源太大了不可接受。

可考虑结合贝叶斯的统计学习,即聚类不仅仅可以考虑距离之间的关系,还可以考虑概率的相对运算,而且考虑网络的幂律分布可以形成一定的高耦合低外聚的内模块

分子层次是生物网络的最低一级亚层,我们可以通过对其的遍历往上构建其他层次:细胞,组织,器官,系统等等。每一个层次都有一定的相似性,这是层次之间的相互作用的基础。但彼此之间的影响强度是收敛的(如分子层次的改变对细胞的影响最大,对其他层次的影响会衰减),此时只有使用影响范围来使得层次之间的作用传递。

生命就是一个复杂系统。网络的结构与遗传信息的传递相耦合。因为其足够细化,可以有很大细化的描述即我们认可的成果。这是机体网络的选择性表达的结果,而以这些成果构建的网络的选择性表达就是我们可以理解的生命现象。

组学是一种网络,提供一个大背景。

疾病是机体网络的选择性表达,具体表现为局部的分子数目失衡和层次之间的交流变异(网络的拓扑结构变化),但不是我们对症治疗即改变局部情况就可以使得整体网络回复稳态,因为网络具有一定的惯性会把这种努力抵消。我们可以暂时理解为聚类过度使得模块过于独立,从而信息传递减少。这是基因表达异常的隐结构。其中分子机制就是网络的坍缩路径,我们不能确定真实的情况,但我们在统计水平的观测可以构建高概率的通路,这是一种等效。

中心法则是整体的趋势,同时也有一定的抵抗性变化,如RNAi和microRNA等等的作用是我们可以用于四两拨千斤地影响整体网络表达的基础。同时也有如同本征的因子,基因等等可以调节网络行为。

镰状细胞贫血的发病机制是分子层次的表达程度很大,这是网络的分布造成的。同时也揭示了网络相对独立的模块。这是比较底层的,由于遍历形成的网络就是建立在这些底层概念上的,因此可能造成整体网络疾病的影响,如染色体病。

人工重组DNA是一种外周体系的代入,可能对网络的表达产生影响。

我们的基因还与外界环境有一定的交流,因为这些基因就是外来物,如癌基因。

组学的测序,数据的指数级爆炸。

酶是网络控制的本征,之前有一个假说:onegeneoneenzyme(基因对性状的控制是通过基因控制酶来实现的),而且酶也是各个层次的耦合点。由于网络的构造需要多层次的沟通交流,这就需要维持在一定水平的速度,不然网络就可能分解为各个模块(层次的聚类收敛),酶就起到这种提高速度的催化剂作用。

基因是有意义的编码区域,是基于我们暂时不明白其意义的非编码区域的选择性表达,这是一种分布:编码DNA,RNA等等。这是基于组学大数据的层次收敛。

同类推荐
  • 武龙真形

    武龙真形

    看天下风起云涌,我自有武龙真形。。天才骄子数不尽,均是登天踏脚梯。。云天大陆,是一个武者才能纵横的世界。武者之强大,下可移山填海,上可摘星拿月。无数人为了成为武者而奋斗着,天才就仿佛天上的星辰数之不清。一个穿越而来的富家子弟随着家族强者去猎杀一头蛟龙。。故事,从此开始。。这是讲述一个少年成为传奇强者的传奇之路。。武者巅峰!!!
  • 太古之时

    太古之时

    家畜?奴役我族人者,我必杀之灭族!功法?纵无前人传承,自我起,必创功法绝技于人族流传万世!实力?我之血脉,万古长存。慕我者,我自当使其风采绝世,照耀古今!…兄弟,可曾记得儿时林中的顽劣,如今你到底在哪里?哥哥,是否惦记着当年那个吐字不清又粘人无比的跟屁虫?还有那年的春风和女孩儿……故人今在否?终不似,少年游。这是一个亲情、友情、爱情交织,羁绊纠葛,英雄挺身,人族崛起的故事。且看木净如何于太古崛起!************向三位大神致敬,感谢你们的书陪我走过那么重要的青葱岁月。新人求支持,收藏,推荐,关注,感谢。
  • 斗王之皇

    斗王之皇

    每个男孩一出生就有一个需要打败的男人,晨星为此可以付出任何代价,只为打败心目中他曾经视若神明的那个男人,他的城主父亲。
  • 恶人大帝

    恶人大帝

    这世上有一群人,他们一无所有!他们低贱得连贵族的狗都不如,他们卑微得让人看不到他们的存在,最后,他们选择了当匪
  • 斗灵武圣

    斗灵武圣

    一个废材得一枚的神器丹药从废材进化到强者统治这一世界
热门推荐
  • 刁蛮女友爱上我

    刁蛮女友爱上我

    宅男张晨失业中遇到了刁蛮女孩,这个女孩刁蛮任性,充满了暴力,两人之间究竟擦出怎样的火花。(本文是中篇小说)目前本书确定改编成网络电影,预计八月份开机。
  • 最具影响力的文坛巨匠(下)

    最具影响力的文坛巨匠(下)

    文学是一种社会意识形态,与社会、政治以及哲学、宗教和道德等社会科学具有密切的关系,是在一定的社会经济基础上形成和发展起来的,因此,它能深刻反映一个国家或一个民族特定时期的社会生活面貌。文学的功能是以形象来反映社会生活,是用具体的、生动感人的细节来反映客观世界的。优秀的文学作品能使人产生如临其境、如见其人、如闻其声的感觉,并从思想感情上受到感染、教育和陶冶。文学是语言的艺术,是以语言为工具来塑造艺术形象的,虽然其具有形象的间接性,但它能多方面立体性地展示社会生活,甚至表现社会生活的发展过程,展示人与人之间的错综复杂的社会关系和人物的内心精神世界。
  • 繁星陨落之别离开

    繁星陨落之别离开

    当天使把快乐播撒于凡尘的每一个角落,又有多少人能读懂那份属于天使自己的忧伤。坠落人间的天使,因为爱,选择成为人类,而偏偏该死的命运不由人。诅咒无解,周围的人类,因为自己的存在,开始变的不幸,直到最后大爆发,身份慢慢的被人开始怀疑,揭露。最终的为爱奋不顾身,换来的是百般伤害。她到底该怎么做?才能守护好想要守护的人。『欢迎入坑』
  • 霸道男友来袭

    霸道男友来袭

    她以为对她好的人并不多,所以,她会刻意和别人保持距离,只想落得清闲自在。只是,他出现了,从此,世界就变得很复杂,所有的规章,全被打乱了。她不知道,这是不是一种劫数……
  • 斑一驳

    斑一驳

    学校是我们每个人成长的地方,这里见证了太多青涩年代的悲欢离合,或许我们的故事在这它历史的长河里并不浓墨重彩,却成为每个人一生都难以忘却的珍贵回忆,本文描写的是青春里的一段回忆,相信我们每个人都曾年轻。。。
  • 我用新婚忘记你

    我用新婚忘记你

    夏莱莱从出生那天起,就注定是一个受人非议的私生子。瑟瑟缩缩活到二十岁,年老色衰的妈妈却突然鱼跃龙门嫁入豪门。所有人都以为她的人生即将飞黄腾达,她却遇到了一个毒药一样的男人。那男人领她初尝禁果,当她后知后觉时早已身处地狱。婚礼现场,夏莱莱说:“我要忘记你,狠狠的忘记你。”男人含笑问:“用婚姻吗?”夏莱莱反手泼了他一杯红酒潇洒的奔向属于自己的新郎。当夏莱莱以为新的生活即将开始,可实际上这场婚姻只是报复的开端。结婚才五年昔日专情的丈夫转眼出轨,慈祥的婆婆突变刻薄,手上的公司频频出事好友的背叛朝她汹涌而来。正当她感叹自己时运不济时,身后一双冰冷的手扼住她脖子,笑问她:“我为你准备的新婚生活还适应吗?”
  • 哥们儿,丫头很拽!

    哥们儿,丫头很拽!

    两个学痞的爱情,她没有曾经的记忆,只知道自己有一个混蛋父亲。他出生于豪门望族,只知道自己可以相信的人是老头子(爷爷)。她的身世一步一步的揭开,他却一点一点的失去,他们会陪着对方走多久?
  • 眼光

    眼光

    本书是本散文集,文中虽然很多写的是生活中的事,但作者有一双锐利的审美眼光,擅于将许多人眼里看似很普通、很平常的东西,从中发现美、提炼美,体现出智慧、善良、美、真、自由、希望和爱。每一篇散文如同一幅幅熟悉的画面跃然纸上,让人如临其境,供人品尝和回味。
  • 0-18岁孩子脊骨成长必读

    0-18岁孩子脊骨成长必读

    宝宝刚出生不久,就经常无缘无故哭闹不停?无论拿什么美味进行诱惑,宝宝就是没有食欲?不知从什么时候开始,孩子突然成了“小结巴”?孩子上学还没多久,就开始多动、厌学、不听课?孩子根本不用功,但不知不觉竟成了“小四眼”?孩子头痛或气喘,怎么“对症”治疗都毫无成效?各种问题,看了此书,不再是问题。
  • 楚乱汉宫

    楚乱汉宫

    秦楚楚在《汉武大帝》剧组跑龙套,被一件作为道具的巫女服吸引,鬼使神差穿上衣服,时间飞速在她眼前倒退,最后定格在公元前143年。