当前位置：首页 > 教育 > 正文

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化

启示号
教育
1周前
113

是发表于2018年的文章（ of T cells in ）中的分析方法，可以应用于单细胞免疫组库数据来揭示T细胞动态变化的分析。原理假设认为克隆型一致的细胞来源一致，可以定量刻画T细胞的组织分布、克隆扩增、组织迁移和状态变化等。

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5'/>

上图中不同颜色的圆球代表不同的T细胞类型，圆球上不同颜色的“Y”代表了不同的TCR克隆型，右边给出了简单的算法。

其中指不同T细胞在某个细胞分群中的克隆程度；指相同克隆型的T细胞在不同组织间的扩散程度；指相同克隆型的T细胞在不同细胞类型之间的共享程度。

简单的了解一下原理以及指标的含义，实现的话就相对比较简单了。

一准备R包，数据

首先上加载R包和示例数据，然后将我们自己的数据整理成示例数据的格式，然后运行的话只需要一行代码即可。

#install.packages("devtools")#devtools::install_github("Japrin/STARTRAC")
library("Startrac")library("tictoc")library("tidyverse")library("Seurat")library("data.table")library("ggpubr")library("ComplexHeatmap")library("RColorBrewer")library("circlize")
dat.file <- system.file("extdata/example.cloneDat.Zhang2018.txt",package = "Startrac")in.dat <- read.table(dat.file,stringsAsFactors = F,head=T)#run the STARTRAC pipelineout <- Startrac.run(in.dat, proj="CRC", cores=NULL,verbose=F)#查看示例数据head(in.dat,2)#Cell_Name            clone.id clone.status patient sampleType stype majorCluster loc#1  TTH36-20180123 CRC.P0123_C000002:9       Clonal   P0123        TTH   CD4 CD4_C07-GZMK   T#2 TP7170-20180123 CRC.P0123_C000002:9       Clonal   P0123        TP7   CD4 CD4_C07-GZMK   T

可以看到包含样本的基本信息（名称，类型，位置），clone相关信息（ ID，clone ID，clone 状态（是否是clone）等），以及单细胞细胞类型注释的信息（CD4,CD8 ，亚型）。

下面就需要将我们自己的VDJ数据 + 单细胞数据整理成这样的格式，其中样本信息（已知），细胞注释信息（单细胞免疫组库VDJ| 从零开始分析，解决真实场景中可能的问题）有，现在需要解决clone的ID 和状态即可。

二 VDJ数据处理

2.1 VDJ数据合并

首先将上篇推文单细胞免疫组库VDJ| 从零开始分析，解决真实场景中可能的问题中提到的所有VDJ文件合并在一起，可以linux中cat ，可以excel 中复制粘贴，可以R中一个个读入然后rbind ，也可以循环合并（注意保留样本名），最终效果如下

#添加file 标签read_tcr <- function(tcrfile){  p3_n <- read.csv(tcrfile)  p3_n$file <- sub('.filtered_contig_annotations.csv','',sub('^.*/','',tcrfile))  return(p3_n)}
tcrfiles <- list.files('./','.filtered_contig_annotations.csv',full.names = T)tcrfiles
if (all(file.exists(tcrfiles))){  tcr_list = list()  for (i in 1:length(tcrfiles)){    print(i)    tcr_list[[i]] = read_tcr(tcrfile = tcrfiles[i])  }}lapply(tcr_list,  dim)
vdj <- do.call(rbind, tcr_list) ; dim(vdj)head(vdj,2)table(vdj$file)

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5__细胞免疫测定'/>

2.2 VDJ数据过滤

使用为true，且为true的TRA TRB的序列，通过合并样本名+构建唯一

vdj <- vdj %>%   dplyr::filter(high_confidence =="true" &                   chain %in% c("TRA","TRB") &                  productive =="true")vdj$Cell_name <- paste0(vdj$file,'_',vdj$barcode)head(vdj,2)

注：true这里可能是True 也可能是TRUE，注意进行对应的修改

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5_细胞免疫测定_'/>

2.3 拆分/合并 TRA ，TRB

前面也提到了clone一般是结合TRA 和 TRB的cdr3序列，因此这里先拆分TRA 和 TRB ，以备后面合并使用

vdj_a <- vdj %>% filter(chain =="TRA") %>% dplyr::arrange(desc(umis), desc(reads)) vdj_b<-vdj%>%filter(chain=="TRB")%>%dplyr::arrange(desc(umis),desc(reads))#### Get the best TRA or TRB test <- vdj_a %>%   dplyr::group_by(Cell_name) %>%   dplyr::summarise(reads=max(reads), umis=max(umis)) head(test)vdj_a <- data.frame(inner_join(vdj_a, test)) #Joining, by = c("reads", "umis", "Cell.name") 按照3列 join ，所以是最大的dim(vdj_a)
test <- vdj_b %>% group_by(Cell_name) %>%  dplyr::summarise(reads = max(reads), umis=max(umis) )vdj_b <- data.frame(inner_join(vdj_b, test))dim(vdj_b)

按照合并TRA 和 TRB

### merge TRA or TRB  final_vdj = dplyr::full_join(x = vdj_a, y=vdj_b, by = c("Cell_name"), suffix = c(".TRA",".TRB"))dim(final_vdj)head(final_vdj,2)save(final_vdj,file = 'final_vdj.rda')

三结合单细胞转录组数据

3.1 合并单细胞数据

单细胞数据同样需要构建与VDJ结果一致的唯一列，然后进行合并。

subT <- get(load("E:/bioinformation/scTCR_BCR/seurat_T.RData") )subT@meta.data <- subT@meta.data %>%   mutate(Cell_name = rownames(subT@meta.data)) %>%   inner_join(final_vdj, by = "Cell_name")
head(subT@meta.data)

3.2 计算Clone信息

结合TRA 和TRB的cdr3序列构建clone ，并统计每种clone的个数

subT@meta.data$Clone_AA = paste(subT@meta.data$cdr3.TRA, subT@meta.data$cdr3.TRB, sep="_")
subT@meta.data = subset(subT@meta.data, productive.TRA == "true" & productive.TRB == "true"  ) ; dim(subT@meta.data)subT@meta.data = subT@meta.data %>% arrange(., Clone_AA)
### calculate clone number and clone IDtmp = subT@meta.data %>%   group_by(Clone_AA) %>%  summarize(Clone_NUM = n()) %>%  mutate(Clone_ID = paste0("Clone_",rownames(.)))head(tmp)
# A tibble: 6 × 3#  Clone_AA                       Clone_NUM Clone_ID#                                    #1 CAAAAAGKSTF_CASSQGDSSYEQYF             1 Clone_1 #2 CAAAAAGRRALTF_CSARGGWGGITGELFF         1 Clone_2 #3 CAAAANYGGATNKLIF_CASSLEYNEQFF          2 Clone_3 #4 CAAADGQKLLF_CASSYNSNQPQHF              1 Clone_4 #5 CAAADNYGQNFVF_CASSESSPEQFF             1 Clone_5 #6 CAAADSGGSEKLVF_CASSGLMNTGELFF          1 Clone_6

subT@meta.data = merge.data.frame(subT@meta.data, tmp) head(subT@meta.data,2)

3.3 根据示例数据筛选列

subT@meta.data中有很多信息，根据示例数据筛选出来对应的信息，并修改列名字。

（1）根据拆分出CD4和CD8；

（2）大于1，即为

subT.meta <- subT@meta.data %>%   select(Cell_name,Clone_ID,Clone_NUM,orig.ident,Sample,type,cluster,cluster_name,pos)head(subT.meta)
subT.meta$stype <- ifelse(subT.meta$cluster_name %in% c("CD4+ Activated IEG","CD4+ Effector","CD4+ Naive","CD4+ Proliferating","CD4+ Treg"),"CD4","CD8")subT.meta$clone.status <- ifelse(subT.meta$Clone_NUM >1 ,"Clonal","NoClonal")
subT.meta <- subT.meta %>%   select(Cell_name, Clone_ID ,clone.status, orig.ident ,Sample   ,stype , cluster_name , pos )names(subT.meta) <- names(in.dat)save(subT.meta,file = "subT.meta.Rdata")

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5_细胞免疫测定'/>

保存结果，后台回复即可获取.rda 和 subT.meta.Rdata文件。

四分析

准备好了subT.meta文件，分析就是一行代码的事情

tic("Startrac.run")out2 <- Startrac.run(subT.meta, proj="CRC",verbose=F)#plot(out2,index.type="cluster.all",byPatient=T)

可以输出结果，但是在按照官网文档使用plot的相关函数时候会报错。影响不大，可以自己提取数据绘制或者直接参考官网的函数。可以先str(out2) 看一下数据结构，，和的结果可以对应的进行提取。

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5_'/>

4. level

ggboxplot(as.data.table(out2@cluster.sig.data)[,][order(majorCluster),],          x="majorCluster",y="value",palette = "npg",          color = "index", add = "point", outlier.colour=NULL) +  facet_wrap(~index,ncol=1,scales = "free_y") +  theme(axis.text.x=element_text(angle = 60,hjust = 1))

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5_细胞免疫测定_'/>

4. level index ofall data

dat.plot <- as.data.table(out2@cluster.sig.data)[aid==out2@proj,]ggbarplot(dat.plot[order(majorCluster),],               x="majorCluster",y="value",palette = "npg",fill = "index") +  facet_wrap(~index,ncol=1,scales = "free_y") +  coord_cartesian(clip="off") +theme(axis.text.x=element_text(angle=60,hjust=1),strip.background=element_blank())

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5'/>

4.3 index two major

dat.plot <- as.matrix(subset(out2@pIndex.tran,aid==out2@proj)[,c(-1,-2,-3)])rownames(dat.plot) <- subset(out2@pIndex.tran,aid==out2@proj)[,3]dat.plot[is.na(dat.plot)] <- 0yrange <- pretty(dat.plot)col.heat <- colorRamp2(seq(0,max(yrange),length=15),                       colorRampPalette(rev(brewer.pal(n=7,name="RdBu")))(15),                       space = "LAB")Heatmap(dat.plot,name="pIndex.tran",col = col.heat)

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5_细胞免疫测定_'/>

当时使用的还比较少，而TCR的定量刻画又很有意义，你确定不在文章中试试？

后面会分享一下发表在2021年的Pan- -cell of tumor- T cells文章中使用的相关指数与 “目标指数”之间的相关分析内容。

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化 5'/>

参考资料

://///blob///.html

◆◆◆ ◆◆

精心整理（含图PLUS版）|R语言生信分析，可视化（R统计，绘图，生信图形可视化汇总）

你可能想看：

水果flstudio20中文汉化包含pj和汉化补丁方法

全能音乐制作环境或数字音频工作站（DAW），FL Studio 20是一个完整的软件音乐制作环境或数字音频工作站（DAW）！功能介绍矢量界面FL Studio 100% 矢量化。外加 3个用户自定义面...

Nature头条：中外科学家揭开中国“神秘木乃伊”血统之谜

中国塔里木盆地出土的几百具自然保存的神秘木乃伊引起了国际考古学领域的关注。来自吉林大学生命科学学院崔银秋教授联合中国科学院古脊椎动物与古人类研究所、韩国首尔国立大学、美国哈佛大学和德国马克斯普朗克研究...

第5讲 Vision Pro视觉工具 CogFixture

是为了在我们找到的图像特征上建立一个固定的坐标系，如果没有这个工具我们的图像识别还能找到想找到的位置吗？固定工具用来在您已经计算了一个坐标转换时创建一个固定坐标系统-在我们所举的范例中,我们已经找到了...

『免疫集』女人如何增强免疫力提高免疫力的食物

有什么食物可以提高免疫力呢?因为优质蛋白质可以帮助人体合成抗体。多吃有助合成抗体，能够增强人体的免疫功能和新陈代谢，因为睡眠不足会影响身体自我修复，　　所以说想要提高免疫力，提高免疫力可以吃以下食物，...

『免疫集』免疫力差容易生病增强人体免疫力怎么做好

　　我们都知道容易生病的人是因为他们的免疫力差，免疫力差的人特别容易发烧，我们应该增强免疫力。增强人体免疫力怎么做好，有助于我们免疫力的提高，　　吸烟和喝酒对人体的影响非常大，会扰乱我们人体的神经免疫...

(2条消息)cv2.findContours()返回函数详解， findContours()

但是该函数返回的三个参数具体表示的是什么呢？其实与输入参数的thresh原图没啥区别,print(np.size(cnts)) # 得到该图中总的轮廓数量,print(cnts[0]) # 打印出第一...

如何做一篇合格的类案分析报告 | iCourt

最高人民法院发布关于统一法律适用加强类案检索的指导意见（试行）。最高院明确提出了人民法院在办理案件应当进行类案检索的情形。类案检索的初衷在于统一司法裁判的尺度。因此最高院在 2017 年 8 月发布的...

组织架构图，你还在手动画线么，直接套用Excel的SmartArt

可以快速的完成组织机构图的绘制，我们需要准备我们所有的文本数据，我们插入选项卡下，选择SmartArt，然后选择一个层次结构，点击右边的组织架构图，会弹出一个文本输入框，数据因为没有层次结构，来进行层...

详解RTK,RTD,SBAS,WAAS,PPP,PPK,广域差分等技术之间的关系与区别

工作方法是基准站将伪距（或者坐标）修正值（差分值）发给用户接收机，用户接收机根据差分值与本身的观测值算出精确位置的方法。RTD（Real Time Differential）与RTK（Real Tim...

水彩之光：美国水彩艺术家 Iain Stewart 绘画作品

来自美国水彩艺术家 Iain Stewart，是一位擅长捕捉光的水彩画家，从第一笔开始，对光感的表达就一直存在，这种表达方式并不是那种如实的表现，而是一种视觉的记忆感悟...美国水彩艺术家 Iain ...

LPA（Limited Partnership Agreement),私募基金设立的核心文件

是用来约束全体合伙人的核心法律文件，这个文件里约束了LP和GP的权利与义务，对于有限合伙来说LPA是最核心和最基础的文件,GP充当的是私募基金管理人的角色。一般来说GP会去寻找投资机会然后去进行服务管...

成人still病的临床特点是什么介绍成人still氏病的主要症状

成人still氏病的发生与免疫紊乱、感染、遗传、精神因素、变态反应等有关，成人still氏病的症状主要有发热、皮疹、关节肿痛，该病是介于风湿热和类风湿性关节炎之间的一种变应性疾病，成人Still病最早...

互助问答第5期：Stata中系统GMM模型的稳健性检验和Stata命令等

Stata中系统GMM模型的稳健性检验和Stata命令答：一种是计量数据的稳健性检验。前者通常适用于所使用的计量方法比较新颖的研究，可用GMM进行稳健性检验（因为GMM不需要满足经典计量假设）。生成...

图解蒸气喷射式制冷原理（Steam Jet System）

1、蒸气喷射器原理，蒸气喷射式制冷是以喷射器代替压缩机，利用工质在低压下气化吸热实现制冷，2、蒸气喷射式制冷，蒸气喷射式制冷的工质可以是水，目前在空调工程中多采用以水为工质的蒸汽喷射式制冷装置，简称为...

E学机械通气 / 常用公式的应用（一）

在《呼吸生理那点事儿（一）、（五）》中介绍了几个机械通气的常用公式，比如计算机械通气时患者的吸气时间、吸气流速，有时需要用公式计算患者的生理指标，比如PB840有潮气量和吸气流速的参数设置：需要强调的...

SpringBoot报错 Error parsing HTTP request header

Note:Note:at org.apache.coyote.http11.AbstractNioInputBuffer.parseRequestLine(AbstractNioInputBuffer...

『免疫集』提高免疫力、常年用蜂蜜！

我有一个可以增强人体抵抗力、可预防大人小孩体弱多病、容易的好方子，因为我本人遗传了母亲的体质，从小就体弱多病好感冒，为了治感冒花了不少冤枉钱。就在今年我从我的一个朋友那里得来了一个良方，效果真的是太好...

Cell Reseach：caspase11切割gasderminD引发“细胞焦亡” - 基因编辑专区 - 生物谷

这些炎性caspase的激活能够促进细胞焦亡事件的发生，炎性caspase究竟是如何调节这些细胞事件至今仍然有待解决。该蛋白的切割能够引发细胞焦亡事件的发生。他们发现这一突变体小鼠不能够正常发生细胞焦...

癌症真那么可怕吗？人体免疫系统那么强大，为何不能发现癌细胞？

癌症的另一个极其恐怖的技能是这些失控的增生细胞会通过体内循环系统或淋巴系统转移到身体其他部分，简单地说就是全身多处脏器都出现了癌细胞，有的细胞增生并不会导致严重后果。但异常增生的细胞就会打破这个规律，...

如何做出一个被老板欣赏的IVD产品规划！

从研发都注册整个完整的周期可能需要3-5年的时间，我们在做产品规划时的思路是一样。针对性的开发有市场价值的产品，需要做产品规划。都有可能成为一个产品规划的目的。没有十全十美、能够满足所有检验、临床客户...

逻辑板上的电压参数VDD,VGH ,VGL

逻辑板驱动电路的供电系统；主要产生四路驱动电路所需的电压：屏TFT薄膜开关MOS管的关断电压，屏数据驱动电压，由伽马校正电路产生灰阶电压，灰阶电压约有14路不同的阶梯电压。屏公共电极电压（伽马校正电压...

已知AD=BC，红色角度数=？

求∠BDC的度数。∠A=20°，∠C=80°，可得∠ABC=80°（三角形的内角和为180°）。∠C=∠ABC=80°，所以∠AED=∠BAC=20°，∠DAE=∠CBA=∠ADE=∠BCA=80°，...

主题：pbc，基友，心酸，我想开一个干货贴，教文案

往往是三种东西）我习惯性用视觉侵略性比较强的文名。基友的文名类似于《穿书女配xxxx气运》（打码了）之类的，其实【穿书女配】这样的词就太常见了，只能说我这个风格的文名（我一直觉得我收订比不好的一个很大...

已知AC=EC，DE∥CA，求∠AED的度数（经典好题）

已知AC=EC，求∠AED的度数（经典好题）:求∠AED的度数。AC是正方形ABCD的对角线，所以∠CAD=∠ACD=45°。所以∠ADE=∠CAD=45°，题目条件还告诉我们AC=EC，线段AC是正...

网页视频下载工具终极解决方案：CR TubeGet

关于网页视频下载，其原理是利用IDM的嗅探功能找到网页视频的真实地址然后下载。使用IDM下载一段时间后速度就成0了，看来是服务器端对下载工具进行了限制。的视频下载问题，可以轻松下载各大视频网站中的视频...

玩转YouTube，让海外客户“不请自来”

YouTube是Google旗下一个美国的在线视频分享和社交媒体平台。而Karim无法轻易在网上找到该事件和2004年印度洋海啸的视频剪辑，产生了视频共享网站的想法。YouTube用户每天观看超过10...

真实故事||我被两个男人侵犯过，结婚前，定时炸弹终于还是爆了

他是那种站在人群里会发光的男孩子，曾经也无比肯定自己会嫁给他，我在信里写了无数违心话，我会去乡下的奶奶那住一个月。叔叔姑姑家的小孩也会回去，不过有个孩子是一直住在奶奶家里。据说他小时候爬柜子摔坏了脑子...

文本数据识别程序

上一篇
花艺中的黄金比例，附带实例讲解，不要错过！

下一篇
中国经典山水画一百幅

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化

最新文章

626969cm精准资料手机版

626969cm资料查询工具

626969手机资料网

最准626969资料查询

研读一本好书丨读《习近平讲党史故事》之“沂蒙六姐妹”故事有感

626969实时资料网

爱你，看不到你时胡思乱想；想你，想你时眼在流泪，心也跟着碎

626969cm精准资料网站

热门文章

欣赏丨世界著名的60幅女人体油画，裸露但不低俗~

小六壬完整解释

小六壬神断口诀大全，掐指一算直断生死！

荨麻疹图片和症状：手脸脖子荨麻疹初期症状图片大全

亲戚关系图（关于中国亲戚称谓）家庭称谓大全，再也不用担心叫错了称呼

珍贵舌诊：脾肾阳虚、虚寒泄泻、胃阴虚的舌苔照，看完记得存！

倪海厦经典配方全集（六）——桂枝汤、大小青龙汤、五苓散等

“四川泸州油纸伞” 的第七代传承人余万伦古法制伞一辈子