當前位置：首頁 > 教育 > 正文

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化

啟示号
教育
2小時前
15

是發表于2018年的文章（ of T cells in ）中的分析方法，可以應用于單細胞免疫組庫數據來揭示T細胞動态變化的分析。原理假設認為克隆型一緻的細胞來源一緻，可以定量刻畫T細胞的組織分布、克隆擴增、組織遷移和狀态變化等。

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5'/>

上圖中不同顔色的圓球代表不同的T細胞類型，圓球上不同顔色的“Y”代表了不同的TCR克隆型，右邊給出了簡單的算法。

其中指不同T細胞在某個細胞分群中的克隆程度；指相同克隆型的T細胞在不同組織間的擴散程度；指相同克隆型的T細胞在不同細胞類型之間的共享程度。

簡單的了解一下原理以及指标的含義，實現的話就相對比較簡單了。

一準備R包，數據

首先上加載R包和示例數據，然後将我們自己的數據整理成示例數據的格式，然後運行的話隻需要一行代碼即可。

#install.packages("devtools")#devtools::install_github("Japrin/STARTRAC")
library("Startrac")library("tictoc")library("tidyverse")library("Seurat")library("data.table")library("ggpubr")library("ComplexHeatmap")library("RColorBrewer")library("circlize")
dat.file <- system.file("extdata/example.cloneDat.Zhang2018.txt",package = "Startrac")in.dat <- read.table(dat.file,stringsAsFactors = F,head=T)#run the STARTRAC pipelineout <- Startrac.run(in.dat, proj="CRC", cores=NULL,verbose=F)#查看示例數據head(in.dat,2)#Cell_Name            clone.id clone.status patient sampleType stype majorCluster loc#1  TTH36-20180123 CRC.P0123_C000002:9       Clonal   P0123        TTH   CD4 CD4_C07-GZMK   T#2 TP7170-20180123 CRC.P0123_C000002:9       Clonal   P0123        TP7   CD4 CD4_C07-GZMK   T

可以看到包含樣本的基本信息（名稱，類型，位置），clone相關信息（ ID，clone ID，clone 狀态（是否是clone）等），以及單細胞細胞類型注釋的信息（CD4,CD8 ，亞型）。

下面就需要将我們自己的VDJ數據 + 單細胞數據整理成這樣的格式，其中樣本信息（已知），細胞注釋信息（單細胞免疫組庫VDJ| 從零開始分析，解決真實場景中可能的問題）有，現在需要解決clone的ID 和狀态即可。

二 VDJ數據處理

2.1 VDJ數據合并

首先将上篇推文單細胞免疫組庫VDJ| 從零開始分析，解決真實場景中可能的問題中提到的所有VDJ文件合并在一起，可以linux中cat ，可以excel 中複制粘貼，可以R中一個個讀入然後rbind ，也可以循環合并（注意保留樣本名），最終效果如下

#添加file 标簽read_tcr <- function(tcrfile){  p3_n <- read.csv(tcrfile)  p3_n$file <- sub('.filtered_contig_annotations.csv','',sub('^.*/','',tcrfile))  return(p3_n)}
tcrfiles <- list.files('./','.filtered_contig_annotations.csv',full.names = T)tcrfiles
if (all(file.exists(tcrfiles))){  tcr_list = list()  for (i in 1:length(tcrfiles)){    print(i)    tcr_list[[i]] = read_tcr(tcrfile = tcrfiles[i])  }}lapply(tcr_list,  dim)
vdj <- do.call(rbind, tcr_list) ; dim(vdj)head(vdj,2)table(vdj$file)

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5__細胞免疫測定'/>

2.2 VDJ數據過濾

使用為true，且為true的TRA TRB的序列，通過合并樣本名+構建唯一

vdj <- vdj %>%   dplyr::filter(high_confidence =="true" &                   chain %in% c("TRA","TRB") &                  productive =="true")vdj$Cell_name <- paste0(vdj$file,'_',vdj$barcode)head(vdj,2)

注：true這裡可能是True 也可能是TRUE，注意進行對應的修改

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5_細胞免疫測定_'/>

2.3 拆分/合并 TRA ，TRB

前面也提到了clone一般是結合TRA 和 TRB的cdr3序列，因此這裡先拆分TRA 和 TRB ，以備後面合并使用

vdj_a <- vdj %>% filter(chain =="TRA") %>% dplyr::arrange(desc(umis), desc(reads)) vdj_b<-vdj%>%filter(chain=="TRB")%>%dplyr::arrange(desc(umis),desc(reads))#### Get the best TRA or TRB test <- vdj_a %>%   dplyr::group_by(Cell_name) %>%   dplyr::summarise(reads=max(reads), umis=max(umis)) head(test)vdj_a <- data.frame(inner_join(vdj_a, test)) #Joining, by = c("reads", "umis", "Cell.name") 按照3列 join ，所以是最大的dim(vdj_a)
test <- vdj_b %>% group_by(Cell_name) %>%  dplyr::summarise(reads = max(reads), umis=max(umis) )vdj_b <- data.frame(inner_join(vdj_b, test))dim(vdj_b)

按照合并TRA 和 TRB

### merge TRA or TRB  final_vdj = dplyr::full_join(x = vdj_a, y=vdj_b, by = c("Cell_name"), suffix = c(".TRA",".TRB"))dim(final_vdj)head(final_vdj,2)save(final_vdj,file = 'final_vdj.rda')

三結合單細胞轉錄組數據

3.1 合并單細胞數據

單細胞數據同樣需要構建與VDJ結果一緻的唯一列，然後進行合并。

subT <- get(load("E:/bioinformation/scTCR_BCR/seurat_T.RData") )subT@meta.data <- subT@meta.data %>%   mutate(Cell_name = rownames(subT@meta.data)) %>%   inner_join(final_vdj, by = "Cell_name")
head(subT@meta.data)

3.2 計算Clone信息

結合TRA 和TRB的cdr3序列構建clone ，并統計每種clone的個數

subT@meta.data$Clone_AA = paste(subT@meta.data$cdr3.TRA, subT@meta.data$cdr3.TRB, sep="_")
subT@meta.data = subset(subT@meta.data, productive.TRA == "true" & productive.TRB == "true"  ) ; dim(subT@meta.data)subT@meta.data = subT@meta.data %>% arrange(., Clone_AA)
### calculate clone number and clone IDtmp = subT@meta.data %>%   group_by(Clone_AA) %>%  summarize(Clone_NUM = n()) %>%  mutate(Clone_ID = paste0("Clone_",rownames(.)))head(tmp)
# A tibble: 6 × 3#  Clone_AA                       Clone_NUM Clone_ID#                                    #1 CAAAAAGKSTF_CASSQGDSSYEQYF             1 Clone_1 #2 CAAAAAGRRALTF_CSARGGWGGITGELFF         1 Clone_2 #3 CAAAANYGGATNKLIF_CASSLEYNEQFF          2 Clone_3 #4 CAAADGQKLLF_CASSYNSNQPQHF              1 Clone_4 #5 CAAADNYGQNFVF_CASSESSPEQFF             1 Clone_5 #6 CAAADSGGSEKLVF_CASSGLMNTGELFF          1 Clone_6

subT@meta.data = merge.data.frame(subT@meta.data, tmp) head(subT@meta.data,2)

3.3 根據示例數據篩選列

subT@meta.data中有很多信息，根據示例數據篩選出來對應的信息，并修改列名字。

（1）根據拆分出CD4和CD8；

（2）大于1，即為

subT.meta <- subT@meta.data %>%   select(Cell_name,Clone_ID,Clone_NUM,orig.ident,Sample,type,cluster,cluster_name,pos)head(subT.meta)
subT.meta$stype <- ifelse(subT.meta$cluster_name %in% c("CD4+ Activated IEG","CD4+ Effector","CD4+ Naive","CD4+ Proliferating","CD4+ Treg"),"CD4","CD8")subT.meta$clone.status <- ifelse(subT.meta$Clone_NUM >1 ,"Clonal","NoClonal")
subT.meta <- subT.meta %>%   select(Cell_name, Clone_ID ,clone.status, orig.ident ,Sample   ,stype , cluster_name , pos )names(subT.meta) <- names(in.dat)save(subT.meta,file = "subT.meta.Rdata")

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5_細胞免疫測定'/>

保存結果，後台回複即可獲取.rda 和 subT.meta.Rdata文件。

四分析

準備好了subT.meta文件，分析就是一行代碼的事情

tic("Startrac.run")out2 <- Startrac.run(subT.meta, proj="CRC",verbose=F)#plot(out2,index.type="cluster.all",byPatient=T)

可以輸出結果，但是在按照官網文檔使用plot的相關函數時候會報錯。影響不大，可以自己提取數據繪制或者直接參考官網的函數。可以先str(out2) 看一下數據結構，，和的結果可以對應的進行提取。

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5_'/>

4. level

ggboxplot(as.data.table(out2@cluster.sig.data)[,][order(majorCluster),],          x="majorCluster",y="value",palette = "npg",          color = "index", add = "point", outlier.colour=NULL) +  facet_wrap(~index,ncol=1,scales = "free_y") +  theme(axis.text.x=element_text(angle = 60,hjust = 1))

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5_細胞免疫測定_'/>

4. level index ofall data

dat.plot <- as.data.table(out2@cluster.sig.data)[aid==out2@proj,]ggbarplot(dat.plot[order(majorCluster),],               x="majorCluster",y="value",palette = "npg",fill = "index") +  facet_wrap(~index,ncol=1,scales = "free_y") +  coord_cartesian(clip="off") +theme(axis.text.x=element_text(angle=60,hjust=1),strip.background=element_blank())

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5'/>

4.3 index two major

dat.plot <- as.matrix(subset(out2@pIndex.tran,aid==out2@proj)[,c(-1,-2,-3)])rownames(dat.plot) <- subset(out2@pIndex.tran,aid==out2@proj)[,3]dat.plot[is.na(dat.plot)] <- 0yrange <- pretty(dat.plot)col.heat <- colorRamp2(seq(0,max(yrange),length=15),                       colorRampPalette(rev(brewer.pal(n=7,name="RdBu")))(15),                       space = "LAB")Heatmap(dat.plot,name="pIndex.tran",col = col.heat)

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5_細胞免疫測定_'/>

當時使用的還比較少，而TCR的定量刻畫又很有意義，你确定不在文章中試試？

後面會分享一下發表在2021年的Pan- -cell of tumor- T cells文章中使用的相關指數與 “目标指數”之間的相關分析内容。

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化 5'/>

參考資料

://///blob///.html

◆◆◆ ◆◆

精心整理（含圖PLUS版）|R語言生信分析，可視化（R統計，繪圖，生信圖形可視化彙總）

你可能想看：

水果flstudio20中文漢化包含pj和漢化補丁方法

全能音樂制作環境或數字音頻工作站（DAW），FL Studio 20是一個完整的軟件音樂制作環境或數字音頻工作站（DAW）！功能介紹矢量界面FL Studio 100% 矢量化。外加 3個用戶自定義面...

Nature頭條：中外科學家揭開中國“神秘木乃伊”血統之謎

中國塔裡木盆地出土的幾百具自然保存的神秘木乃伊引起了國際考古學領域的關注。來自吉林大學生命科學學院崔銀秋教授聯合中國科學院古脊椎動物與古人類研究所、韓國首爾國立大學、美國哈佛大學和德國馬克斯普朗克研究...

第5講 Vision Pro視覺工具 CogFixture

是為了在我們找到的圖像特征上建立一個固定的坐标系，如果沒有這個工具我們的圖像識别還能找到想找到的位置嗎？固定工具用來在您已經計算了一個坐标轉換時創建一個固定坐标系統-在我們所舉的範例中,我們已經找到了...

『免疫集』女人如何增強免疫力提高免疫力的食物

有什麼食物可以提高免疫力呢?因為優質蛋白質可以幫助人體合成抗體。多吃有助合成抗體，能夠增強人體的免疫功能和新陳代謝，因為睡眠不足會影響身體自我修複，　　所以說想要提高免疫力，提高免疫力可以吃以下食物，...

『免疫集』免疫力差容易生病增強人體免疫力怎麼做好

　　我們都知道容易生病的人是因為他們的免疫力差，免疫力差的人特别容易發燒，我們應該增強免疫力。增強人體免疫力怎麼做好，有助于我們免疫力的提高，　　吸煙和喝酒對人體的影響非常大，會擾亂我們人體的神經免疫...

(2條消息)cv2.findContours()返回函數詳解， findContours()

但是該函數返回的三個參數具體表示的是什麼呢？其實與輸入參數的thresh原圖沒啥區别,print(np.size(cnts)) # 得到該圖中總的輪廓數量,print(cnts[0]) # 打印出第一...

如何做一篇合格的類案分析報告 | iCourt

最高人民法院發布關于統一法律适用加強類案檢索的指導意見（試行）。最高院明确提出了人民法院在辦理案件應當進行類案檢索的情形。類案檢索的初衷在于統一司法裁判的尺度。因此最高院在 2017 年 8 月發布的...

組織架構圖，你還在手動畫線麼，直接套用Excel的SmartArt

可以快速的完成組織機構圖的繪制，我們需要準備我們所有的文本數據，我們插入選項卡下，選擇SmartArt，然後選擇一個層次結構，點擊右邊的組織架構圖，會彈出一個文本輸入框，數據因為沒有層次結構，來進行層...

詳解RTK,RTD,SBAS,WAAS,PPP,PPK,廣域差分等技術之間的關系與區别

工作方法是基準站将僞距（或者坐标）修正值（差分值）發給用戶接收機，用戶接收機根據差分值與本身的觀測值算出精确位置的方法。RTD（Real Time Differential）與RTK（Real Tim...

水彩之光：美國水彩藝術家 Iain Stewart 繪畫作品

來自美國水彩藝術家 Iain Stewart，是一位擅長捕捉光的水彩畫家，從第一筆開始，對光感的表達就一直存在，這種表達方式并不是那種如實的表現，而是一種視覺的記憶感悟...美國水彩藝術家 Iain ...

成人still病的臨床特點是什麼介紹成人still氏病的主要症狀

成人still氏病的發生與免疫紊亂、感染、遺傳、精神因素、變态反應等有關，成人still氏病的症狀主要有發熱、皮疹、關節腫痛，該病是介于風濕熱和類風濕性關節炎之間的一種變應性疾病，成人Still病最早...

互助問答第5期：Stata中系統GMM模型的穩健性檢驗和Stata命令等

Stata中系統GMM模型的穩健性檢驗和Stata命令答：一種是計量數據的穩健性檢驗。前者通常适用于所使用的計量方法比較新穎的研究，可用GMM進行穩健性檢驗（因為GMM不需要滿足經典計量假設）。生成...

圖解蒸氣噴射式制冷原理（Steam Jet System）

1、蒸氣噴射器原理，蒸氣噴射式制冷是以噴射器代替壓縮機，利用工質在低壓下氣化吸熱實現制冷，2、蒸氣噴射式制冷，蒸氣噴射式制冷的工質可以是水，目前在空調工程中多采用以水為工質的蒸汽噴射式制冷裝置，簡稱為...

LPA（Limited Partnership Agreement),私募基金設立的核心文件

是用來約束全體合夥人的核心法律文件，這個文件裡約束了LP和GP的權利與義務，對于有限合夥來說LPA是最核心和最基礎的文件,GP充當的是私募基金管理人的角色。一般來說GP會去尋找投資機會然後去進行服務管...

SpringBoot報錯 Error parsing HTTP request header

Note:Note:at org.apache.coyote.http11.AbstractNioInputBuffer.parseRequestLine(AbstractNioInputBuffer...

E學機械通氣 / 常用公式的應用（一）

在《呼吸生理那點事兒（一）、（五）》中介紹了幾個機械通氣的常用公式，比如計算機械通氣時患者的吸氣時間、吸氣流速，有時需要用公式計算患者的生理指标，比如PB840有潮氣量和吸氣流速的參數設置：需要強調的...

『免疫集』提高免疫力、常年用蜂蜜！

我有一個可以增強人體抵抗力、可預防大人小孩體弱多病、容易的好方子，因為我本人遺傳了母親的體質，從小就體弱多病好感冒，為了治感冒花了不少冤枉錢。就在今年我從我的一個朋友那裡得來了一個良方，效果真的是太好...

如何做出一個被老闆欣賞的IVD産品規劃！

從研發都注冊整個完整的周期可能需要3-5年的時間，我們在做産品規劃時的思路是一樣。針對性的開發有市場價值的産品，需要做産品規劃。都有可能成為一個産品規劃的目的。沒有十全十美、能夠滿足所有檢驗、臨床客戶...

邏輯闆上的電壓參數VDD,VGH ,VGL

邏輯闆驅動電路的供電系統；主要産生四路驅動電路所需的電壓：屏TFT薄膜開關MOS管的關斷電壓，屏數據驅動電壓，由伽馬校正電路産生灰階電壓，灰階電壓約有14路不同的階梯電壓。屏公共電極電壓（伽馬校正電壓...

Cell Reseach：caspase11切割gasderminD引發“細胞焦亡” - 基因編輯專區 - 生物谷

這些炎性caspase的激活能夠促進細胞焦亡事件的發生，炎性caspase究竟是如何調節這些細胞事件至今仍然有待解決。該蛋白的切割能夠引發細胞焦亡事件的發生。他們發現這一突變體小鼠不能夠正常發生細胞焦...

癌症真那麼可怕嗎？人體免疫系統那麼強大，為何不能發現癌細胞？

癌症的另一個極其恐怖的技能是這些失控的增生細胞會通過體内循環系統或淋巴系統轉移到身體其他部分，簡單地說就是全身多處髒器都出現了癌細胞，有的細胞增生并不會導緻嚴重後果。但異常增生的細胞就會打破這個規律，...

已知AD=BC，紅色角度數=？

求∠BDC的度數。∠A=20°，∠C=80°，可得∠ABC=80°（三角形的内角和為180°）。∠C=∠ABC=80°，所以∠AED=∠BAC=20°，∠DAE=∠CBA=∠ADE=∠BCA=80°，...

主題：pbc，基友，心酸，我想開一個幹貨貼，教文案

往往是三種東西）我習慣性用視覺侵略性比較強的文名。基友的文名類似于《穿書女配xxxx氣運》（打碼了）之類的，其實【穿書女配】這樣的詞就太常見了，隻能說我這個風格的文名（我一直覺得我收訂比不好的一個很大...

已知AC=EC，DE∥CA，求∠AED的度數（經典好題）

已知AC=EC，求∠AED的度數（經典好題）:求∠AED的度數。AC是正方形ABCD的對角線，所以∠CAD=∠ACD=45°。所以∠ADE=∠CAD=45°，題目條件還告訴我們AC=EC，線段AC是正...

網頁視頻下載工具終極解決方案：CR TubeGet

關于網頁視頻下載，其原理是利用IDM的嗅探功能找到網頁視頻的真實地址然後下載。使用IDM下載一段時間後速度就成0了，看來是服務器端對下載工具進行了限制。的視頻下載問題，可以輕松下載各大視頻網站中的視頻...

玩轉YouTube，讓海外客戶“不請自來”

YouTube是Google旗下一個美國的在線視頻分享和社交媒體平台。而Karim無法輕易在網上找到該事件和2004年印度洋海嘯的視頻剪輯，産生了視頻共享網站的想法。YouTube用戶每天觀看超過10...

真實故事||我被兩個男人侵犯過，結婚前，定時炸彈終于還是爆了

他是那種站在人群裡會發光的男孩子，曾經也無比肯定自己會嫁給他，我在信裡寫了無數違心話，我會去鄉下的奶奶那住一個月。叔叔姑姑家的小孩也會回去，不過有個孩子是一直住在奶奶家裡。據說他小時候爬櫃子摔壞了腦子...

文本 R 包數據識别程序

上一篇
七殺＋偏印，絕非一般的性格特質！

下一篇
三大“喇叭口”形态把握個股漲跌

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化

有話要說...取消回複

最新文章

唐.李白《清平調.其二》

殺兩碼的小竅門

奇門斷陽宅内局法

拔毒膏、生肌散治療慢性化膿性骨髓炎

三思而後行，掌握做事的度

三大“喇叭口”形态把握個股漲跌

單細胞免疫組庫VDJ|和Nature學STARTRAC，定量T細胞動态變化

七殺＋偏印，絕非一般的性格特質！

熱門文章

威士忌高階關于 OB 與 IB，一次給你說透！

老張老李侃門球之140篇

為什麼五點鐘要起床答案讓人吃驚！（現在知道還不晚）

美麗中國-2870：中國最大的内陸河，塔裡木河

這個穴位可以治療多種胃痛腹痛，還可以減肥

診餘雜記（師傳經驗）

二十四山開門放水作竈真訣開門放水作竈直訣——子山

門球技巧隻需五個字讓你打好門球