你好,
我一直在搜索它的废气,如果我错过了一个解决方案,请道歉。
我正在尝试在Deseq2进行配对分析,意思是具有配对样本设计。
我有一个具有两组(即我的批处理)的数据集,每个组都有不均匀的主题数量,每个主题只能在其中一个组中并且具有一个或两个样本(所以一个或两个条件)。请注意,我的数量估计了Kallisto。只是一个玩具例子,我的冷酷看起来像如何:
样品批量调节主题1样品1 1 A S1 2样品2 1 B S1 3样品3 1 A S2 4样品4 1 B S2 5样品5 1 A S3 6样品6 1 B S3 7样品7 1 A S4 8 SAMPT8 1 B S4 9 SAMPRE9 1 A S5 10样品10 1b S5 11样品11 2 A S6 12样品12 2 B S6 13 13 Sample13 2 A S7 14 Sample14 2 B S7 15 Sample15 2 A S8
在该示例中,批量== 1具有每个受试者的5个受试者,而Batch == 2具有3个受试者,其中一个受试者只有一个条件。我简化了保持相对于条件的平衡配对样本,因此我过滤了样品15。
我的目标是在控制受试者效果的同时测试条件效果。
所以最初我认为我的模型将是〜批量+主题+条件。结果名称我将查看要查看条件效果(对批处理控制而受试者效果的同时)是“条件_B_VS_A”。该模型设计导致“模型矩阵不是完全等级”错误。
dds = deseqdatasetfrommatrix(countdata = counts.mat,coldata = sample.summary.balanced,design =〜批量+主题+条件)dds < - deseq(dds)错误在checkullrank中(modelmatrix):模型矩阵不是全排名,所以模型不能按照指定合适。设计公式中的一个或多个变量或交互术语是其他的线性组合,必须删除。
问题是批量和主题的线性。Vignette中线性的例子与我的理解没有完全匹配。
虽然我尝试了一些思想的思想,这里有一些谈话(如我的最后一个手段首先应用批量校正,转换为正整数,然后使用〜主题+条件运行Deseq2,这给了零点),我没有尝试过工作。
顺便说一句,如果我不做配对的设计并且只有〜批处理+条件,模型很好地工作。但我想利用每个受试者的条件的事实。
任何洞察力都会非常感谢!
谢谢michael为您的回复。
虽然我已经看到推荐利马具有重复性的讨论,但我想知道我是否可以用DESEQ2进行。
我的混乱正好在小插图的一部分“群体特定条件效应,个人嵌套在群体中”,因为我认为主题是有点分组两个不同的科目 - 但我现在已经意识到它究竟是什么所做的那么好。但我不是在寻找特定于群体的(或批量特定于我的案例)条件效果,而只是条件效应,同时调整组/批处理和对象差异。所以我在添加主题时尝试了以下模型:
但是,请让我走一步,在那里我在简单模型中获得了一个融合问题,我尝试了两件事没有解决问题的事情。首先将DESEQ函数分成步骤并增加MAXIT,第二个以过滤更低的表达基因。
如何解决汇聚问题?我甚至重复了单独的步骤并添加了UseOptim选项:
另外,为了让条件效应纠正批量和科目的差异,是res1或res2?
跳转到顶部,如果您不想要组特定的条件效果,那么只需使用〜Sample +条件。您没有(并且不能)控制比样本更高的分辨率。
如果通过组特定于组,我们的意思是特定于批量(在这种情况下),那么我肯定不会。我只需要纠正批次。
当你说“你没有(并且不能)控制比样本更高的分辨率”,你的意思是在Deseq2或一般?如果我的模型是〜sample +条件,那么我如何考虑样本1和样本2来自同一主题?或者该样本1和样本14来自不同的批次?
对不起,上面你有
主题
。用〜主题+条件
。您不需要另外控制任何嵌套主题的任何内容。嗯,我也有这个想法,但不是科目之间的想法?所以对于部分之间,我不需要批量批量吗?当你说“在其中嵌套在哪个主题内”时,你的意思是什么?它现在嵌套了
批处理:主题
不是这个模型?也是,仍然存在
〜主题+条件
(这是我以上开始的模型)有没有收敛的基因。主题在批处理范围内 - 也许与统计学家讨论这种情况。
RE:收敛,我建议如下:
对于选择的X来避免你有很多零的基因,也许是7。
谢谢Michael,一切都很清楚。
实际上,通过提升来解决汇编
x =我样本的2/3
。非常感谢!如果我可能会问一件事,为什么虽然我达到了融合,但我发现没有参数?
我唯一的方法是我是我通过单独通过p值过滤。甚至没有fc。以下是log2fc,padj和p值的范围,以及带有p值和log2fc发行版的火山。
您的数据集没有大的更改。您无法拒绝这些基因的空。
您可能希望与统计学家讨论有关推动未来数据集的统计学家。
我完全同意。但是当我不进行配对分析时,我使用简单〜批量+条件模型,电源非常好。我通过FDR和4FC过滤并获得数百只DEG。我想知道为什么配对是如此贫穷。