如何基于R包做GO分析?实现秒出图

go · 浏览次数 : 0

小编点评

GO分析是一种生物信息学方法,用于研究基因及其产品在生物体内的功能和位置。基因本体论(Gene Ontology,GO)是一个标准化的术语体系,分为细胞成分(CC)、生物学过程(BP)和分子功能(MF)三个层次。本文将介绍如何使用R clusterProfiler包进行GO功能富集分析、制作OrgDb包并可视化结果。 1. 首先,提取基因名并建立“基因.txt”文件。这将有助于后续的GO分析。 2. 使用R语言将基因名转换为基因ID。这可以通过加载已转换的targetSymbol文件,提取基因名,并使用org.Hs.eg.db包将其转换为基因ID来实现。 3. 将id.txt文件导入GoClust包进行GO功能富集分析。这将帮助我们了解基因在生物体内的作用和功能。 4. 得到GO文件后,可以使用R包绘制气泡图和柱状图,以便更直观地展示结果。 5. 下一篇笔记将介绍如何应用R语言进行KEGG分析。敬请关注。 文章来源:皮蛋笔记。如有疑问,请联系作者。

正文

GO分析

  基因本体论(Gene Ontology, GO)是一个用于描述基因和基因产品属性的标准术语体系。它提供了一个有组织的方式来表示基因在生物体内的各种角色。基因本体论通常从三个层面对基因进行描述:细胞成分(Cellular ComponentCC)、生物学过程(Biological ProcessBP)和分子功能(Molecular FunctionMF)。

示例:

 

 

细胞成分(Cellular ComponentCC:这个层面描述了基因产物(如蛋白质)在细胞内的定位。例如,它们可能位于细胞核、细胞质、线粒体膜或其他细胞器上。这有助于了解基因产物在细胞内的作用和功能。

生物学过程(Biological ProcessBP:这个层面描述了基因参与的生物学过程。这些过程可能包括细胞生长、信号传导、基因表达调控、代谢途径等。通过了解基因参与的生物学过程,我们可以更好地理解生物体的生理功能和疾病发生机制。

分子功能(Molecular FunctionMF:这个层面描述了基因产物在分子层面的功能,通常涉及到与其他分子的相互作用或催化生化反应。例如,某个基因产物可能是一个酶,它能够催化某个特定的生化反应;或者它可能是一个结构蛋白,参与细胞骨架的组装和维持。

  本期将介绍使用R clusterProfiler包对基因进行GO功能富集分析、OrgDb包制作以及结果可视化。使用R clusterProfiler包对基因进行富集,需要导入目的基因(前景基因)相对应物种的参考基因组(背景基因),现阶段“Bioconductor”已有十几种常见动物,如人类、小鼠等物种的OrgDb。但仍然有许多物种不在Bioconductor的OrgDb列表里,但存在参考基因组,如山羊,绵羊等,因此大家可以选择性使用。

    上篇文章我们已经用Perl脚本将蛋白名批量转化为了基因名,下面首先用R语言将基因名找到基因ID,以作后续分析。

1.在上篇文章转换的结果targetSymbol文件中提取基因名,如图所示,建立“基因.txt”文件

2.导入文件,运行代码,得到id.txt文件

 

library("org.Hs.eg.db")    ##载入物种包
##id转换
rt=read.table("基因.txt",sep="\t",check.names=F,header=F) ##读取数据
genes=as.vector(rt[,1])
entrezIDs <- mget(genes, org.Hs.egSYMBOL2EG, ifnotfound=NA)
entrezIDs <- as.character(entrezIDs)
out=cbind(rt,1,entrezID=entrezIDs)
colnames(out)=c("symbol","logFC","entrezID")
write.table(out,file="id.txt",sep="\t",quote=F,row.names=F)

 

3.GO分析,将上述分析得到的id.txt文件导入,运行以下代码以做GO分析

 4.得到GO文件,绘制气泡图和柱状图

 

 

下篇笔记将会展示如何应用R语言作KEGG分析,敬请关注与期待。整理不易用你们发正刊(CNS)的金手指为本篇内容点赞支持,本文代码与文件在以下链接。

链接:https://pan.baidu.com/s/1CW6Trynp9DNPhyCncFBLfA

提取码:0jsj

文章转载自公众号:皮蛋笔记,欢迎关注,随时获取第一手文章内容。

与如何基于R包做GO分析?实现秒出图相似的内容:

如何基于R包做GO分析?实现秒出图

GO分析 基因本体论(Gene Ontology, GO)是一个用于描述基因和基因产品属性的标准术语体系。它提供了一个有组织的方式来表示基因在生物体内的各种角色。基因本体论通常从三个层面对基因进行描述:细胞成分(Cellular Component,CC)、生物学过程(Biological Proc

使用Mask R-CNN模型实现人体关键节点标注

摘要:在本案例中,我们将展示如何对基础的Mask R-CNN进行扩展,完成人体关键节点标注的任务。 本文分享自华为云社区《使用Mask R-CNN模型实现人体关键节点标注》,作者: 运气男孩。 前言 ModelArts 是面向开发者的一站式 AI 开发平台,为机器学习与深度学习提供海量数据预处理及交

IceRPC之调用管道Invocation pipeline与传出请求Outgoing request->快乐的RPC

作者引言 .Net 8.0 下的新RPC 很高兴啊,我们来到了IceRPC之调用管道 Invocation pipeline与传出请求 Outgoing request->快乐的RPC, 基础引导,让自已不在迷茫,快乐的畅游世界。 调用管道 Invocation pipeline 了解如何发送请求r

高性能Redis服务器注意事项

摘要 昨天简单理了理安装与配置相关的 但是很多比较重要的核心性能参数并没有进行学习与探讨 就基于昨天理解不深入的地方进行进一步的学习与了解 希望能够提高Redis-Server的性能. 第一部分: 规范 一切性能都是以代码为核心的. 再好的硬件. 如果代码水平都不行, 肯定是无法发挥硬件的性能. R

redis 概念初识及基本使用

博客地址:https://www.cnblogs.com/zylyehuo/ 五大数据类型 参考链接:redis学习 string,字符串类型 hash,哈希类型,如同python的dict set,无序集合 zset,有序集合 list,双向队列,向左插入数据,向右插入数据,向左、右,提取数据 r

如何基于surging架设流媒体视频推流(视频讲解)

前言 随着直播行业大火,各种直播类产品和产品层出不穷,能够满足各方人员的需求和互动,也使得斗鱼、虎牙、抖音都随着直播业的大火而欣欣向荣, 大家也对直播平台了解不少,也参与使用,但是怎么样才能研发出视频直播平台呢?那么针对于这个问题就是我今天想给大家讲解的一些东西,首先要对直播协议有所了解,然后怎么样

[转帖][译] 如何基于 Cilium 和 eBPF 打造可感知微服务的 Linux(InfoQ, 2019)

http://arthurchiao.art/blog/how-to-make-linux-microservice-aware-with-cilium-zh/ 译者序 本文内容来自 2019 年的一个技术分享 How to Make Linux Microservice-Aware with Ci

如何基于 Kubernetes 实现优质开发者平台体验?

内部开发者平台(或 IDP)是使开发团队能够更快、更轻松、更一致地交付应用程序的基础设施。Kubernetes 本身是一个功能强大的平台,但它引入了太多复杂性和功能,因此不能简单地将其作为 IDP 交给开发团队。若要期望他们能取得成功,非常重要的一点是要设置一些防护措施,使他们能够有效地使用 K8s

如何基于three.js(webgl)引擎架构,研发一套通过配置就能自动生成的3D机房系统

自动化3D机房、微模块、3D机房、3D数据中心、科技感数据中心、三维机房、3d建筑,3d消防,消防演习模拟,3d库房,3d档案室,3d密集架,webGL,threejs,3d机房,bim管理系统

如何基于G6进行双树流转绘制?

## 1. 背景 - 业务背景:CRM系统随着各业务条线对线索精细化分配的诉求逐渐增加,各个条线的流向规则会越来越复杂,各个条线甚至整个CRM的线索流转规则急需一种树形的可视化的图来表达。 - 技术背景:在开发之前考虑了三种方案,原生canvas、fabric以及G6,三种方案各有优劣势 |  |