登陆注册
19712100000084

第84章 网络的数据分析

统计分析,对数据的趋势的把握,能够转换为信息。定性和定量是不同层次的描述,样本对整体的描述可以参照不动点。本质上这是一个对频率和概率的描述,通过各种条件如方差,平均值等等来描述数据的分布。

序列的耦合可以以正交,层次之间的概率连接,模糊数学的多层次。

网络的各种数据分析,聚类,降维,SVM,神经网络等等算法可以进行一定的路径坍缩,即我们从无限高维的网络经过提取出我们可以理解的信息。其具体的形式与生物信息学的序列分析是一致的。

一维的是简单的上调下调,不同的对象形成一定的相关性路径,如我们惯见的信号通路,就是利用这些蛋白层次的相对关系来构建的宏观图景。形成各种复杂的促进/抑制机制。我认为还应该引入这些路径的相对竞争博弈,才能形成更高维的图景。

二维的是具体的数值,以此为基础我们可以根据一定的模型来拟合这些数据。

三维的是大规模数据的模式涌现:基因/蛋白的网络调控表达,这是多层次耦合的作用网络。

基本趋势:熵增及其抵抗性变化,幂律分布(聚类),序列相似性与功能相似性的对应,相互作用的蛋白质之间具有更大的概率可能产生一定的功能联系,模块化,层次的遍历和路径形成,网络的拓扑性质、生物信息、系统动力学,表达谱,概率网络和隐马尔科夫模型,网络的代偿和稳定性,通过外部的攻击来模拟基因表达变化,以此验证稳定性(类似如今的基因疗法);矩阵表示,通过聚类等等分类手段可以根据有限信息推断特定对象的位置,从而推断其他的性质。我们还可以借助贝叶斯推断来不断提高其准确性。

算法来整合数据库级别的信息,提取出适合不同层次的指标,具备一定的信息。网络的节点形成二级结构如环路等等,然后可以往上遍历形成更高维结构,这是如同编程的模块化思想。我们可以在这些结构的变化寻找与序列的对应关系。

第一章:意义;传统方法;系统观点的方法;具体的网络方法;

基于序列对相互作用网络的预测,杂交系统的预测,亚层的形成,统计指标的作用

序列信息的网络理解,这与我们尝试把网络结构降维到序列是相互耦合的。一个是从底到顶,一个是从顶到底,我们有信心它们竞争博弈能够形成一定的平衡。或许公理化体系是一种选择,当然这是内核,具体的情况还需要多体系的耦合,即其选择性表达可以有更大的与现实的拟合度。反正网络可以形成不同的层次,这些层次具有一定的相似性并且可以相互转换,可以组合形成高维的结构,知识模块化的思想。

单变量的类似数学的偏导研究模式在复杂的网络结构的实用性相比其他低耦合的系统(相对独立的分布)大大降低,因为网络的底层可以选择性表达为缺失的部分,这是网络的代偿和稳定性。当然这是一个概率分布的问题,因为如果特定的基因是网络的高连通度的中心节点可能产生比较明显的效应,如致死或者其他的明显性状改变。我们不能每次都筛选出这种不动点才做实验(目前的研究模式),我们应该寄托于大规模的数据运算使得特定模式涌现,即我们以多变量(能够根据一定的标准即相互作用)为研究对象,在这个层次构建不同的形成一定聚类的亚层结构之间的关系,即模块之间的相互作用,以概率的形式连接不同的模块,最终做到多层次的信息统合。

相互作用的蛋白质时间有更大的概率作用与相同/相似的功能。这是统计层次的模式涌现。

基于聚类的相同特征(表达趋势)可以提取出高维的图景,即不同的类可以根据一定的路径连接。首先是共表达模式可能具有相同的功能,然后是各种不动点式的指标来介绍不同模式之间的联系,最后在网络层次进行全部蛋白质的关系构建。并且在这个基础上建立于基本相关的对应关系

芯片技术/酵母双杂交/免疫共沉淀—大规模数据产出—数据分析—挖掘模式

网络级别的数据:矩阵表示,矩阵乘法就是路径形成,组合的加和也是多路径的耦合,即路径积分。

第二章:蛋白相互作用网络提供的大数据的运算,其可以比较的维度很多:拓扑,表达量等等。遍历所有路径,最后路径积分是平凡,这是路径坍缩。守恒定律,耗散结构的输入和输出。具体的表达不一定是需要的,这是概率性的。

蛋白质之间的组合是更高维的结果,这种相互作用的网络可以与特定的功能改进更大的相关性,而具体的蛋白质的表达量与这些高维功能的联系是概率分布,即存在一定的中心节点具有更大的相关性,当然大部分的节点是低概率连接的,一般来说被视为涨落。这种相互作用网络就是高维的结构,对应于复杂的功能。

对一定的物种的蛋白相互作用网络的研究可以做到一定的知识迁移,如各种分布,幂律分布,小世界模型等等性质。模块的思想引自程序设计。

连通性,分布分化

机器学习对序列的模式识别来解决可能的关系,即网络的不同对象之间的概率性连接。

不同层次的聚类,根据不同的标准划分的不同组合形式。理论上可以以一系列的特征描述来整体指代特定对象,这就是序列思想,可以做到准确对应,但这需要耗费的资源太大了不可接受。

可考虑结合贝叶斯的统计学习,即聚类不仅仅可以考虑距离之间的关系,还可以考虑概率的相对运算,而且考虑网络的幂律分布可以形成一定的高耦合低外聚的内模块

分子层次是生物网络的最低一级亚层,我们可以通过对其的遍历往上构建其他层次:细胞,组织,器官,系统等等。每一个层次都有一定的相似性,这是层次之间的相互作用的基础。但彼此之间的影响强度是收敛的(如分子层次的改变对细胞的影响最大,对其他层次的影响会衰减),此时只有使用影响范围来使得层次之间的作用传递。

生命就是一个复杂系统。网络的结构与遗传信息的传递相耦合。因为其足够细化,可以有很大细化的描述即我们认可的成果。这是机体网络的选择性表达的结果,而以这些成果构建的网络的选择性表达就是我们可以理解的生命现象。

组学是一种网络,提供一个大背景。

疾病是机体网络的选择性表达,具体表现为局部的分子数目失衡和层次之间的交流变异(网络的拓扑结构变化),但不是我们对症治疗即改变局部情况就可以使得整体网络回复稳态,因为网络具有一定的惯性会把这种努力抵消。我们可以暂时理解为聚类过度使得模块过于独立,从而信息传递减少。这是基因表达异常的隐结构。其中分子机制就是网络的坍缩路径,我们不能确定真实的情况,但我们在统计水平的观测可以构建高概率的通路,这是一种等效。

中心法则是整体的趋势,同时也有一定的抵抗性变化,如RNAi和microRNA等等的作用是我们可以用于四两拨千斤地影响整体网络表达的基础。同时也有如同本征的因子,基因等等可以调节网络行为。

镰状细胞贫血的发病机制是分子层次的表达程度很大,这是网络的分布造成的。同时也揭示了网络相对独立的模块。这是比较底层的,由于遍历形成的网络就是建立在这些底层概念上的,因此可能造成整体网络疾病的影响,如染色体病。

人工重组DNA是一种外周体系的代入,可能对网络的表达产生影响。

我们的基因还与外界环境有一定的交流,因为这些基因就是外来物,如癌基因。

组学的测序,数据的指数级爆炸。

酶是网络控制的本征,之前有一个假说:onegeneoneenzyme(基因对性状的控制是通过基因控制酶来实现的),而且酶也是各个层次的耦合点。由于网络的构造需要多层次的沟通交流,这就需要维持在一定水平的速度,不然网络就可能分解为各个模块(层次的聚类收敛),酶就起到这种提高速度的催化剂作用。

基因是有意义的编码区域,是基于我们暂时不明白其意义的非编码区域的选择性表达,这是一种分布:编码DNA,RNA等等。这是基于组学大数据的层次收敛。

同类推荐
  • 黄金领主

    黄金领主

    本书铁血流,种田流,起点第一部真正的猿族崛起类小说,诠释不屈的战斗之路!穿越了,在异世纵情逍遥!这是个魔法与斗气的世界,用上一世的智慧与经验,逍遥人生,指点江山。铁马冰河,金色斗气,绚烂魔法,血与火之中,谱写壮丽宏伟的战歌!不平凡的爱情,深沉的手足情,为家人为爱人而战!李文是个普通人,更想过那种普通而快乐的人生,在这个异世界里,他其实想做的,只是一个最普通男人的梦想。轻松笔触,娓娓道来,送给您一个温暖深情又热血悲壮的故事。
  • 古荒八仙

    古荒八仙

    天降大任于斯人也,古荒八仙遗物惊世,江湖纷乱!相传,只要有缘人获取其中一件遗物,必定成为至高无上!更有甚者言,齐聚八仙遗物,谈笑间,霸争天下!少年江墨,手持八仙遗物之一,被迫之下,离开生活居久的村庄,寻找至亲。江湖险恶,人心叵测,世态炎凉。至亲的无故失踪,居然牵扯出一个巨大阴谋。不过为了至亲,江墨毅然踏寻!当江墨手刃仇敌的那一瞬,他忽然明白,自己走的路,还很漫长……PS:新书发布,不足的地方,还请指点。
  • 帕若拉

    帕若拉

    一个偷溜出来的王子,一个神秘的白衣少年,一段偶遇的背后居然是一段末世天机。当两个懵懂少年披荆斩棘接近那个秘密时,却发放更大的秘密才刚刚开始上演。是命运还是阴谋?他们挣扎抗命,却又沦陷其中。。。。。。
  • 余天记

    余天记

    车祸之后,醒来发现自己竟然穿越了!占据了别人的人生,从天才变成了废材,随口答应的承诺,为了寻找修炼的出路,方逸不顾一切!一代武神即将崛起……
  • 追风少年

    追风少年

    我,一个默默无闻的青春少年,一个有着远大的理想和抱负,但却受尽了校园恶少欺凌的少年。在一次偶然之中,我的生命我的运程,从此发生了天翻地覆的变化。嘉兰公主:“我曾经沉睡了千年,但我仍然在等待,等待那个可以改变我的命运、能够拯救我们种族命运的‘人’出现。幸运的是,我等到了,所以,我相信缘分。”
热门推荐
  • 秋禾

    秋禾

    《秋禾》是一部半自传体长篇小说,这是一位民企总经理荡气回肠的职场经历;这是一位深度男人百折不挠的人生传奇;这是一位高级经理人一气呵成的长篇力作;这是一部足以改编成精彩影视剧的故事蓝本。小说除了描写职场上的传奇故事外,在爱情、婚姻、友情、亲情以及性爱等方面都有非常细腻的描写,是一部值得细品的长篇精品。十年前,主人公陆一鹏受聘到滨海市濒临倒闭的永盛集团做总经理。永盛集团在三年内换了十五个总经理,企业环境非常恶劣,陆一鹏入职不久就有数百人围着他起哄,老板亲戚、公司元老、老油条们从中作梗。陆一鹏凭借他的胆识、魄力、能力以及男人的担当与责任让企业扭亏为盈,成为滨海市的明星企业。这中间充满着职场的艰难与传奇,读过之后一定会带给你心灵的震撼。八年半之后,永盛集团资金链断裂,陆一鹏缔造企业传奇的梦想破灭,随后母亲的去世、创业的失败、婚姻的破灭等打击接踵而至。陆一鹏在艰难中永不言弃地执着前行……
  • 没有天使的国度(已出版,非参赛)

    没有天使的国度(已出版,非参赛)

    雪凌与秀介真心深爱着彼此,却不得不互相伤害:雪凌只能把自己的爱默默埋在心底,秀介的爱也无法找到停泊的港湾……两个相爱的人到底该如何选择他们的爱?在没有天使的国度里,谁来代替我爱你?
  • 赤血星际

    赤血星际

    一个平凡人,一个自由,战争,荣耀的世界,威胁与黑暗正在一步步逼近,永不止息方能迎接黎明。
  • 侯家路

    侯家路

    侯家路曾经是上海的一个老街名,那里珍藏着作家周国平的童年岁月,铭刻着他的成长记忆。因此,若干年后,周国平把这些关于岁月的记忆形成文字,记载了他童年生活的点点滴滴,如“上课时爱做小动作”、“从班级图书角里偷书”、“表演节目”、“走很长的路去上学”、“拼命节省钱买书”、“做誓师大会演讲”、“参加数学竞赛”等,描述亲情、友情,令人动容、感慨,充满童趣和哲思,能让小读者阅读后获得不一样的人生、生命体悟。
  • 演三字经

    演三字经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 穿越王妃:异族爱恋

    穿越王妃:异族爱恋

    什么鬼??她明明在跟男友吵架,却阴差阳错地穿越回了古代,还变成了一个刚生下的婴儿!!这一切到底怎么回事??她逛个街都撞得到冤家,才见过两次面就说喜欢??这也太荒唐了吧!!她按照爹爹的意思一手夺了天下,却再次为了一个男人而犹豫,她到底该怎么办呢??
  • 奉旨成婚:贵妃娘娘萌哒哒

    奉旨成婚:贵妃娘娘萌哒哒

    她一朝穿越,醒来却发现自己已成为了别人的妃。可高高在上的位置,却掩饰不住悲催的命运。前身爹爹不管,二娘不爱,庶妹狠毒,皇上对她态度冷漠让他觉得四面楚歌。“不要以为你是皇上就了不起,老子还真不稀罕这贵妃的称号。”“怎么?就算你再怎么折腾也逃不出,朕的手掌心。”就在逃与跑之间,她发现了众人不可告人的秘密……
  • 福妻驾到

    福妻驾到

    现代饭店彪悍老板娘魂穿古代。不分是非的极品婆婆?三年未归生死不明的丈夫?心狠手辣的阴毒亲戚?贪婪而好色的地主老财?吃上顿没下顿的贫困宭境?不怕不怕,神仙相助,一技在手,天下我有!且看现代张悦娘,如何身带福气玩转古代,开面馆、收小弟、左纳财富,右傍美男,共绘幸福生活大好蓝图!!!!快本新书《天媒地聘》已经上架开始销售,只要3.99元即可将整本书抱回家,你还等什么哪,赶紧点击下面的直通车,享受乐乐精心为您准备的美食盛宴吧!)
  • 半世欢

    半世欢

    声明1:我们阴阳家,不是SSR的阴阳师,也不是穿行于阴间阳界的鬼怪乱神,而是,以阴阳五行勘破宇宙奥义的科学研究者。声明2:欢脱的重生,不宅斗,只斗天下。——————奶奶说:有智者预言,当圣人身着素白长袍,手持日月之魂,踏羽御风而来之时,和平之光将会降临。奶奶说:雨良,你肩负天命,去找圣人吧。于是我出山而去,谁知,圣人还未找到,却找到了被封印的前世记忆……正是:阴阳生流转,天地育河山,怜子前生苦,再予半世欢。
  • 芝麻绿豆经济学

    芝麻绿豆经济学

    作者从事经济学相关的项目研究,专业知识丰富,且对日常生活中的经济学现象有独特的见解。所以,作者避开了传统灌输式的内容呈现方式,选择从经济学的角度出发,对恋爱、买房、赚钱、消费、销售等进行生活化的讲解,让大家明白经济学如芝麻绿豆一样简单并且和我们的生活息息相关。