控制数值协变量:利马变焦的差异基因表达
1
0.
输入编辑模式
@ Onyi-Ukay-17718
最后在15个月前看到

这是一个快照data.frame,df.

主题|cell_type |条件|Viral_load -------- | ----------- | ----------- | ------------ 1 |a |正常10 1 |B |正常180 2 | A | diseased | 500 2 | B | diseased | 90 3 | A | normal | 720 3 | B | normal | 63

我想在以下比较中找到差异表达的基因:
一世。A.Normal VS A.Diseased
II。B.Normal VS B.Diseased
III。a.normal vs b.normal.
IV。A.Diseased VS B.Diseased

融入我的分析中的正确方法是一个交互式设计公式cell_type.状况,同时阻止了主题并控制viral_load.协变量?


我的想法是为补充栏添加补充栏DF.团体

主题|cell_type |条件|viral_load |组-------- | ----------- | ----------- | ------------ | ------- 1 |a |正常10 |A.Normal 1 |B | normal | 180 | B.normal 2 | A | diseased | 500 | A.diseased 2 | B | diseased | 90 | B.diseased 3 | A | normal | 720 | A.normal 3 | B | normal | 63 | B.normal

然后运行以下分析:

设计< -  Model.matrix(〜0 +组+ Viral_load,Data = DF)Colnames(设计)< -  C(级别(DF $组),“Viral_load”)V < - 变量(TMM,Design = Design)Dupcor <- 复制品(V,Design = V $ Design,Block = DF $主题)适合< -  lmfit(v,block = df $主题,correlation = dupcor $ conclensus.cm < -  makecontrasts(a.normal_vs_diseased = a.normal-  a.diseased,b.normal_vs_diseased = b.normal-b.diseased,promal.a_vs_b = a.normal  -  b.normal,disease。a_vs_b = a.diseased  -  b.diseased,clock = v $ design)fit < -对比度.Fit(适合,CM)适合< -  eBayes(适合)

我准确控制了viral_load.作为一个协变量,被封锁主题并提取适当的对比?

林马变焦差异基因表达rnaseq.R.•705次观看
添加评论
0.
输入编辑模式

嗨,如果你觉得你有用的话,我真的很感激,如果你觉得有用:)

3.
输入编辑模式
@ mikhaelmanurung-17423
最后4个月前看到
荷兰

嗨onii,

您的设计和对比度矩阵是正确的。

我不确定您的变量命名约定,但请确保TMM输入变量到Voom命令是表达式集。

最后但并非最不重要的是,现在建议做到这一点重复性化每次计算两次。还要记住包括包括的堵塞对你的变焦称呼!这是一个例子:

V < - 变焦(TMM,Design = Design,Block = DF $主题)Dupcor < -  DuplicateCorlation(V,Design = V $ Design,Block = DF $主题)V < - 变量,设计=设计,相关= Dupcor$达成达成达成共识,块= DF $主题)Dupcor < -  DuplicateCorlation(V,Design = V $ Design,Block = DF $主题)V < - 变量(TMM,Design = Design,Correlitation = Dupcor $ Conclensus.Correlation,Block= DF $主题)

可以看到关于这的进一步讨论使用与Limma-SEQ数据的DuplicAtrelation + VOOM

我希望这回答了你的问题。

最佳米哈尔

0.
输入编辑模式

谢谢你的答案mikhael。可以是雷玛开发人员,或者声誉更高的人请肯定米哈尔的答案?

0.
输入编辑模式

我没有技术上是一个林马开发人员,但我希望我的声誉足够高。

正如麦克哈尔说,你的设计矩阵和对比是正确的。我会注意到edger.使用Log-Link Glms,这意味着您的模型假定对数表达式与病毒载荷线性缩放(即,原始表达与病毒载荷指数增加)。也许对于大多数基因的更合理的关系将是以对数病毒负载线性线性的记录表达式。或者您可能更通用并在(log-)病毒负载上使用样条曲线,允许您阻止与病毒负载的任何平滑关系。当然,所有这一切都假定病毒载荷与您的感兴趣条件没有混淆,这将导致上述不同阻塞策略的不同水平的问题。

我应该指出的另一件事是TMM.通常应该是一个Dgelist.这已经经历了calcnormfactors.。如果你给变焦默认情况下,默认情况下,它不会执行任何归一化(除了计算日志CPM时,除了库尺寸标准之外)。你可以设置正常化..但是,可用的选择往往是不必要的侵略性,旨在处理微阵列的恐怖。

添加回复
0.
输入编辑模式

谢谢你肯定迈克尔的答案亚伦。

tmm确实是一个dgelist,定义为:

dge < -  dgelist(counts = counts)保持< -  filterbyexpr(dge,design,min.count = 5)dge < -  dge [保留,,Keep.Lib.Sizes = False] TMM < -  CalcnormFactors(DGE)

感谢您还指出了我可以拥有的不同问题。在建议更多的概述情况下,你究竟是什么意思是“在”中使用样条曲线log-viral_load.?“使用样条曲线确实会照顾不明之间的关系log-cpm.价值观和log-viral_load.,或者只是“阻止与病毒载荷的任何平滑关系”[我认为你的意思是线性关系]?


                    
0.
输入编辑模式

不,我的意思是任何平滑关系(取决于D.f的数量)。见第9.6.2节林马用户手册。

添加回复

登录在添加答案之前。

交通:189名用户访问了最后一小时
使用权 rss.
API.
统计

使用本网站构成了我们的接受用户协议和隐私政策

由我们提供动力版本2.3.6