当前位置：首页 > 健康养生 > 正文

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

启示号
健康养生
6天前
55

前言

Hello小伙伴们大家好，我是生信技能树的小学徒”我才不吃蛋黄“。今天是胃癌单细胞数据集复现系列第十期。第九期我们用TCGA-STAD数据进行生存分析。本期，我们将回到高级分析（分析），通过计算CNV评估上皮细胞良恶性。

1.背景介绍

在第六期推文中，我们联合TCGA-STAD数据给上皮添加了恶性评分，从而协助区分肿瘤细胞与非肿瘤细胞。在高级分析中，我们可以利用和对单细胞进行CNV(Copy , 拷贝数变异)分析，区分肿瘤细胞与非肿瘤细胞。

CNV是基因组结构变异( ，SV)的重要组成部分，主要原因是基因组发生重排,一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。CNV在肿瘤的发生和发展研究中扮演重要的角色。

本期我们使用 ( of )进行CNV分析，它是一种集成贝叶斯分割方法。利用scRNA-seq数据推断人类肿瘤的基因组拷贝数，然后通过对拷贝数数据进行分层聚类，以识别非整倍体肿瘤细胞和二倍体基质细胞之间的最大距离。其原理同样是通过单细胞转录组数据来推断细胞的染色体倍数，进而推断是正常细胞（）还是肿瘤细胞（）。

2.数据分析2.1 导入数据

首先清除系统环境变量，加载R包，设置新文件夹和工作目录，导入恶性上皮细胞数据：

rm(list=ls())
options(stringsAsFactors=F)
library(Seurat)
library(ggplot2)
library(clustree)
library(cowplot)
library(dplyr)
library(infercnv)
library(copykat)
library(tidyverse)
#devtools::install_github("broadinstitute/infercnv")
dir.create("8-CNV")
getwd()
setwd("../8-CNV")
sce=readRDS("../6-TCGA_STAD/malignant.rds")
table(sce$celltype)
Idents(sce)=sce$celltype

避免后面流程运行的太长了对细胞进行抽样：

seurat_object=sce
seurat_object<-subset(seurat_object,downsample=200)
table(Idents(seurat_object))

预测肿瘤/正常细胞状态的基本原理是非整倍体在人类癌症中很常见 (90%)。具有广泛全基因组拷贝数畸变（非整倍体）的细胞被认为是肿瘤细胞，而基质正常细胞和免疫细胞通常具有2N二倍体或接近二倍体的拷贝数分布。通过单细胞转录组数据来推断细胞的染色体倍数，进而推断是正常细胞（）还是肿瘤细胞（）。它还可以进一步对肿瘤细胞进行聚类，找出不同的亚群。

运行

ngene.chr参数是过滤细胞的一个标准，它要求被用来做CNV预测的细胞，一个染色体上至少有5个基因。

sam.name定义样本名称 ( name)，会给出来的文件加前缀

scRNA<-seurat_object
counts<-as.matrix(scRNA@assays$RNA$counts)
table(scRNA$celltype)
if(T){cnv<-copykat(rawmat=counts,ngene.chr=5,sam.name="test",n.cores=8)
saveRDS(cnv,"cnv.rds")}

添加结果到对象meta.data信息中：

cnv=readRDS("cnv.rds")
table(rownames(cnv$CNAmat))
a=cnv$prediction$copykat.pred
table(a)
scRNA$CopyKAT=a

结果可视化：正常细胞（，蓝色）还是肿瘤细胞（，红色）

p1<-DimPlot(scRNA,group.by="celltype",label=T,reduction='tsne')
p2<-DimPlot(scRNA,group.by="CopyKAT",reduction='tsne')+scale_color_manual(values=c("#F8766D",'#02BFC4',"gray"))
pc<-p1+p2
pc

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

可视化maker基因'TPPP3','KRT17'的表达情况，检查结果准确性：

cols=c("gray","coral2")
plot<-FeaturePlot(scRNA,features=c('TPPP3','KRT17'),cols=cols,pt.size=1,reduction='tsne')+
theme(panel.border=element_rect(fill=NA,color="black",size=1,linetype="solid"))#加边框
plot_grid(p2,plot)

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

结果主要有两个：

1）预测的结果正常细胞（）还是肿瘤细胞（）；

2）每个CNV 在每个细胞的表达量。这里看出和的不同来了，是基于而不是gene level的表达量。

绘制热图

copykat.test=cnv
pred.test<-data.frame(copykat.test$prediction)
CNA.test<-data.frame(copykat.test$CNAmat)

head(pred.test)
head(CNA.test[,1:5])
my_palette<-colorRampPalette(rev(RColorBrewer::brewer.pal(n=3,name="RdBu")))(n=999)
chr<-as.numeric(CNA.test$chrom)%%2+1
rbPal1<-colorRampPalette(c('black','grey'))
CHR<-rbPal1(2)[as.numeric(chr)]
chr1<-cbind(CHR,CHR)
rbPal5<-colorRampPalette(RColorBrewer::brewer.pal(n=8,name="Dark2")[2:1])
com.preN<-pred.test$copykat.pred
pred<-rbPal5(2)[as.numeric(factor(com.preN))]
cells<-rbind(pred,pred)
col_breaks=c(seq(-1,-0.4,length=50),seq(-0.4,-0.2,length=150),seq(-0.2,0.2,length=600),seq(0.2,0.4,length=150),seq(0.4,1,length=50))
heatmap.3(t(CNA.test[,4:ncol(CNA.test)]),dendrogram="r",distfun=function(x)parallelDist::parDist(x,threads=4,method="euclidean"),
hclustfun=function(x)hclust(x,method="ward.D2"),
ColSideColors=chr1,Colv=NA,Rowv=TRUE,
notecol="black",col=my_palette,breaks=col_breaks,key=TRUE,
keysize=1,density.info="none",trace="none",
cexRow=0.1,cexCol=0.1,cex.main=1,cex.lab=0.1,
symm=F,symkey=F,symbreaks=T,cex=1,cex.main=4,margins=c(10,10))

legend("topright",paste("pred.",names(table(com.preN)),sep=""),pch=15,col=RColorBrewer::brewer.pal(n=8,name="Dark2")[2:1],cex=0.6,bty="n")

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

再对肿瘤细胞再聚类并画热图，又能分成两群。

table(pred.test$copykat.pred)
tumor.cells<-pred.test$cell.names[which(pred.test$copykat.pred=="aneuploid")]
colnames(CNA.test)<-gsub(".1$","-1",colnames(CNA.test))
tumor.mat<-CNA.test[,colnames(CNA.test)%in%tumor.cells]
hcc<-hclust(parallelDist::parDist(t(tumor.mat),threads=4,method="euclidean"),method="ward.D2")
hc.umap<-cutree(hcc,2)

rbPal6<-colorRampPalette(RColorBrewer::brewer.pal(n=8,name="Dark2")[3:4])
subpop<-rbPal6(2)[as.numeric(factor(hc.umap))]
cells<-rbind(subpop,subpop)

heatmap.3(t(tumor.mat),dendrogram="r",distfun=function(x)parallelDist::parDist(x,threads=4,method="euclidean"),
hclustfun=function(x)hclust(x,method="ward.D2"),
ColSideColors=chr1,RowSideColors=cells,Colv=NA,Rowv=TRUE,
notecol="black",col=my_palette,breaks=col_breaks,key=TRUE,
keysize=1,density.info="none",trace="none",
cexRow=0.1,cexCol=0.1,cex.main=1,cex.lab=0.1,
symm=F,symkey=F,symbreaks=T,cex=1,cex.main=4,margins=c(10,10))

legend("topright",c("c1","c2"),pch=15,col=RColorBrewer::brewer.pal(n=8,name="Dark2")[3:4],cex=0.9,bty='n')

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

最后把CNV的结果投射到单细胞聚类结果上看一看是否合理，标准流程走一遍，聚类结果和分群结果投射到TSNE上。

standard10X=function(dat,nPCs=50,res=1.0,verbose=FALSE){
srat=CreateSeuratObject(dat)
srat=NormalizeData(srat,verbose=verbose)
srat=ScaleData(srat,verbose=verbose)
srat=FindVariableFeatures(srat,verbose=verbose)
srat=RunPCA(srat,verbose=verbose)
srat=RunTSNE(srat,dims=seq(nPCs),verbose=verbose)
srat=FindNeighbors(srat,dims=seq(nPCs),verbose=verbose)
srat=FindClusters(srat,res=res,verbose=verbose)
return(srat)
}

GC1<-standard10X(counts,nPCs=30,res=0.8)
GC1$copykat.pred<-pred.test$copykat.pred
GC1$copykat.tumor.pred<-rep("normal",nrow(GC1@meta.data))
table(hc.umap)
GC1$copykat.tumor.pred[rownames(GC1@meta.data)%in%names(hc.umap[hc.umap==1])]<-"tumorcluster1"
GC1$copykat.tumor.pred[rownames(GC1@meta.data)%in%names(hc.umap[hc.umap==2])]<-"tumorcluster2"

p1<-DimPlot(GC1,label=T)
p2<-DimPlot(GC1,group.by="copykat.pred")
p3<-DimPlot(GC1,group.by="copykat.tumor.pred")
p1+p2+p3

可以看到：2,4,8群是肿瘤细胞亚克隆

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

从免疫细胞和肿瘤细胞的标记基因表达来看，可以正确找出正常细胞和肿瘤细胞。

FeaturePlot(GC1,features=c("PTPRC","EPCAM"),order=T)

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

结语

本期，我们使用分析评估上皮细胞良恶性。下一期，我们将对T细胞亚群进行细分。顺便提前预告一下，胃癌系列推文完成后，将开启肺腺癌单细胞数据集复现系列，相关视频已经在B站上线：

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

文献推文详见（单细胞测序+空间转录组描绘从癌前病变到浸润性肺腺癌的动态演变）。此外，关于推文内容的提升和优化，欢迎大家提宝贵意见。谢谢！

你可能想看：

SEER数据库系列|SEER数据库基本介绍

美国国家癌症研究所（National Cancer Institute）的SEER数据库收集了大约30％的美国人口的癌症诊断。从简单地按人群中器官部位枚举癌症的发展到包括通过组织病理学和分子亚型（由驱...

Cell Reseach：caspase11切割gasderminD引发“细胞焦亡” - 基因编辑专区 - 生物谷

这些炎性caspase的激活能够促进细胞焦亡事件的发生，炎性caspase究竟是如何调节这些细胞事件至今仍然有待解决。该蛋白的切割能够引发细胞焦亡事件的发生。他们发现这一突变体小鼠不能够正常发生细胞焦...

python中使用argparse.add_argument_group() 对命令行参数进行概念性分组

parser.add_argument('name':parser.add_argument('--bar_that')，parser.add_argument('--foo_that')。parse...

拖后腿学徒居然也完成作业，理解RNA-seq数据分析结果

https;###一些常规的设置rm(list=ls())#清空环境变量options(stringsAsFactors=F)##字符不作为因子读入###读取数据。-read.table('GSE10...

2016版GSP全部条款

在1992版GSP的基础上重新修订了《药品经营质量管理规范》，2013版《药品经营质量管理规范》于2012年11月6日经卫生部部务会审议通过，2016版《药品经营质量管理规范》根据2016年6月30日...

circbase数据库环状RNA序列获取方法 | 环状RNA社区

小编邀请技术部的刘建宁老师继续为大家实例讲解circRNA的引物设计。我们以环状RNA数据库circbase（http:为小伙伴详细介绍从circRNA序列获取到引物设计的全过程。在Search上方的...

你的数据到底有多重要？这些惊艳的数据可视化案例告诉你 | TED演讲

在本文中他分享了数据背后所蕴含的令人意想不到的重量，今天我想跟大家聊聊两件非常振奋人心的内容，但对苹果公司我不想说太多。没有事物可以像电脑那样改变我们的生活，但我其实也不想聊电脑的事儿。我想聊聊电脑上...

甲状腺乳头状癌63例细胞学分析

对甲状腺结节FNAB标本采集技术和作为细胞学诊断标准的假包涵体、乳头状片断的鉴别诊断进行探讨。细胞学诊断的63例甲状腺乳头状癌，结论FNAB诊断甲状腺乳头状癌正确性较高，掌握甲状腺乳头状癌的细胞学形态...

python的基本语法和脚本格式

我们在上一篇文章中已经学会了如何简单的运行python命令和脚本，当Python解释器读取源代码时，第二行注释是为了告诉Python解释器:Python在语义中存在着包、模块、类（当然还有函数）这几个...

对比Excel，轻松学习Python报表自动化实战，这篇教程有点肝!

轻松学习Python报表自动化》中关于报表自动化实战的内容。并教你用Python实现工作中的一个报表自动化实战，1.Excel的基本组成2.一份报表自动化的流程3.报表自动化实战 -当日各项指标同环...

python 知识点大全，建议收藏留用！

经常有读者问我 Java、C++、Python 这些语言怎么选择，这两门语言想要学好、学透都不容易，一些开发非常便捷、库非常丰富的语言也可以掌握一下，从后台开发 Flask、AI、数据分析、爬虫......

整理python爬虫过程中会遇到的问题，以及如何解决这些问题的方法

在使用python爬虫的过程中，现在我们就来探讨下这些在python爬虫的过程中可能遇到的问题，一般网页的开发者为了不让自己的js代码轻易被别人拷贝，我们可以通过debug来找到js加密解密的代码，爬...

(2条消息)cv2.findContours()返回函数详解， findContours()

但是该函数返回的三个参数具体表示的是什么呢？其实与输入参数的thresh原图没啥区别,print(np.size(cnts)) # 得到该图中总的轮廓数量,print(cnts[0]) # 打印出第一...

胃底腺型胃癌的诊断

由于胃底腺多有明确的DL;白色调隆起型无树枝状的扩张血管;其扩大的IP内缺乏异型微血管;发红隆起型，所以树枝状扩张血管明显.鉴别诊断，未分化型胃癌等;清晰的边界以及不规则的MS/...

徐景藩运用足疗方治疗脾胃病，溃疡性结肠炎、胰腺疾病、胃癌

在脾胃病的治疗中有着独特的学术观点和诊治方法。徐老治疗脾胃病常采用外治疗法,灌肠主要用于大肠疾病,而中药泡脚则运用非常广泛,中药足疗的沿革与作用机理,足疗方的配伍原则与使用方法,中药足疗方不仅可以与...

『中华秘方』肿瘤：治癌症方（对胃癌、肠癌、肝癌疗效更佳）

半支莲60g，铁甲松叶60g，上药煎法，熬2个小时，再熬2个小时，当茶饮，服药期间。服后大便有脓血，小便带血，是佳兆。每月再服1--3剂：（注）铁甲松叶，系指铁树叶。中名铁叶，苏铁科植物苏铁的叶，性甘...

白鹅血（或白鸭血）治疗食道癌胃癌

白鹅血（或白鸭血）治疗食道癌胃癌，【说明】本方是湖北医家张梦侬先生治疗噎嗝（含食道癌胃癌等）的验方。应用其方药对一例胃癌获效，浙江医家何任也在其著作中讲到饮用白鹅血治疗噎嗝，张梦侬先生在其著作中还介绍...

柳叶刀：幽门螺杆菌是中国胃癌最大的祸根

因为张先生的碳14呼气试验查出幽门螺杆菌呈阳性。没想到刘女士也感染了幽门螺杆菌。但是导致胃癌的凶手——幽门螺杆菌会在人和人之间传播，其中约有34万胃癌新发和幽门螺杆菌感染相关。非贲门胃癌患者的幽门螺杆...

胃癌克星就是这4种！再挑食也不能不吃它们！

要预防胃癌必须从吃的东西入手。1、大蒜可以有效帮助预防胃癌！大蒜的防癌功效相信大家都有所耳闻，主要是因为大蒜可以显著减少胃中的亚硝酸盐，2、洋葱也是预防胃癌的好帮手，吃洋葱一方面可以降低体内亚硝酸盐的...

1.肝癌验方.食管癌验方3.胃癌验方

参三七、丹参、白英、龙葵、山豆根各250克，　　【用法】上药共同研成极细末，　　【用法】研成极细末，黄酒、温水各半冲服，　　【功效】软坚、化淤、消痰、散结，而苔腻、舌质衬紫、边有淤斑。　　 3.胃...

这个经方被埋没1800年不被重视！我却用它治一切肝癌胃癌肠癌证属肝风脾寒者！

这个方子是《金匮要略·中风历节病篇》的侯氏黑散，心中恶寒不足者，四肢烦重，脾阳不达于四肢，心中恶寒不足为气血伤于里，血分虚而热度不充内藏。我认为应该是外风直侵肌肉脏腑，风邪入里与湿邪相合，从而出现寒热...

炙僵蚕治疗胃癌：

在《本草纲目》附方"僵蚕、白马溺"治"痞块心痛"的启示下，朱子青医师曾以该方配合逍遥散加减，治愈一例肝癌；作者也曾以僵蚕、蜈蚣等治疗肿瘤，呕吐涎沫与食物；（仅能进稀软食物），大便秘结，经某医院检查确诊...

数据 | 两大航天集团上市公司运营状况及资本运作分析（下）

向航天科工集团非公开锁价发行股份进行配套融资，航天科工集团成为上市公司控股股东和实际控制人。航天发展收购南京长峰交易情况，航天发展收购南京长峰募集资金情况汇总。王建国等六位自然人股东发行股份购买其持有...

学生成绩的数据分析方法

学生成绩的数据分析方法，分析考试成绩是教师必做的工作之一，分析成绩是掌握学情的主要方式之一，还要分析学生各门学科成绩，一、班级整体的成绩分析。每次考试的分数就是绝对成绩。绝对成绩与试卷难易、学生的基础...

基于数据统计的儿童腺样体肥大中医辨证及用药规律分析

中医辨证论治儿童腺样体肥大具有不可替代的优势，但目前临床对腺样体肥大中医证型的分型方法、分型依据等尚无统一论述。按上述标准共筛选出36篇中医治疗腺样体肥大临床文献，清热、解表、化痰止咳平喘、补虚、活血...

电化学测试技术在锂离子电池中的原理、方法步骤、数据分析（CV、EIS、充放电、微分电压/电容、倍率、...

电极材料的比容量和放电平台决定电池的能量密度，而材料或者电池的阻抗决定离子的扩散过程及电池的功率密度。一般通过循环伏安、交流阻抗、充放电等电化学测试技术来研究锂离子电池等电化学储能器件中的电化学反应过...

2021年全国高职高专院校满意度分地区排行榜TOP10

可以从在校生或毕业生对母校的评价入手。教育部的阳光高考信息平台目前已有超过405万学生对自己就读的学校进行了实名评价，聚焦职教对各个地区职业院校的评价情况进行了统计，得出2021年全国高职高专院校满意...

上一篇
慢性气管炎并肿气肿特效秘方

下一篇
天符同天符

胃癌单细胞数据集GSE163558复现(十)：CopyKAT分析

最新文章

626969cm精准资料手机版

626969cm资料查询工具

626969手机资料网

最准626969资料查询

研读一本好书丨读《习近平讲党史故事》之“沂蒙六姐妹”故事有感

626969实时资料网

爱你，看不到你时胡思乱想；想你，想你时眼在流泪，心也跟着碎

626969cm精准资料网站

热门文章

欣赏丨世界著名的60幅女人体油画，裸露但不低俗~

小六壬完整解释

小六壬神断口诀大全，掐指一算直断生死！

荨麻疹图片和症状：手脸脖子荨麻疹初期症状图片大全

亲戚关系图（关于中国亲戚称谓）家庭称谓大全，再也不用担心叫错了称呼

珍贵舌诊：脾肾阳虚、虚寒泄泻、胃阴虚的舌苔照，看完记得存！

倪海厦经典配方全集（六）——桂枝汤、大小青龙汤、五苓散等

“四川泸州油纸伞” 的第七代传承人余万伦古法制伞一辈子