【R语言】——基因GO/KEGG富集分析!超级简单的保姆级教程！

03-03 4616阅读 0评论

上期“干货预警——原来基因功能富集分析这么简单！”和“【R语言】——基因GO/KEGG功能富集结果可视化（保姆级教程）”介绍如何使用DAVID在线分析工具对基因进行GO/KEGG功能富集分析和使用R ggplot包对获得的基因GO/KEGG功能富集结果进行可视化。本期介绍使用R clusterProfiler包和R AnnotationHub包对基因进行GO/KEGG功能富集分析、OrgDb包制作以及结果可视化。

GO/KEGG功能富集分析中重要的是背景基因的选择，使用R clusterProfiler包对基因进行富集，需要导入目的基因（前景基因）相对应物种的参考基因组（背景基因），现阶段“bioconductor”已有十几种常见动物，如人类、小鼠等物种的OrgDb。但仍然有许多物种不在Bioconductor的OrgDb列表里，但存在参考基因组，如山羊，绵羊等，这种情况则需要用到R AnnotationHub包进行索引其对应物种的参考基因组，并制作OrgDb包使用。

1 数据准备

数据输入格式（xlsx格式）：

2　R包加载、数据导入及处理

#下载包#
if(!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("clusterProfiler") 
BiocManager::install("topGO") 
BiocManager::install("Rgraphviz") 
BiocManager::install("pathview") 
install.packages("ggplot2")
BiocManager::install('stringr')
install.packages("openxlsx")
#加载包#
library(clusterProfiler)
library(topGO)
library(Rgraphviz)
library(pathview)
library(ggplot2)
library(stringr)
library(openxlsx)
 
#导入数据#
remove(list = ls()) #清除 Global Environment
getwd()  #查看当前工作路径
setwd("C:/Rdata/jc")  #设置需要的工作路径
list.files()  #查看当前工作目录下的文件
data = read.xlsx("enrich-gene.xlsx",sheet= "enrich_genes",sep=',') #导入数据
head(data)

#数据处理-差异基因筛选#
vector = abs(data$log2FC) > 1 & data$PValue  1和PValue

相关阅读：

1、IK分词器和ElasticSearch集成使用

2、网络空间搜索引擎- FOFA的使用技巧总结

3、睿智的目标检测66——Pytorch搭建YoloV8目标检测平台

4、YOLOv8目标检测中数据集各部分的作用

5、目标检测任务中常用的数据集格式(voc、coco、yolo)

免责声明

1、本网站属于个人的非赢利性网站，转载的文章遵循原作者的版权声明。
2、本网站转载文章仅为传播更多信息之目的，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所
提供信息的准确性及可靠性，但不保证信息的正确性和完整性，且不对因信息的不正确或遗漏导致的任何
损失或损害承担责任。
3、任何透过本网站网页而链接及得到的资讯、产品及服务，本网站概不负责，亦不负任何法律责任。
4、本网站所刊发、转载的文章，其版权均归原作者所有，如其他媒体、网站或个人从本网下载使用，请在
转载有关文章时务必尊重该文章的著作权，保留本网注明的“稿件来源”，并白负版权等法律责任。

手机扫描二维码访问