导出数值数据(96孔)
|
||
在本节教程中,我们将学习:
• | 如何从一个96孔板CellProfiler管道文件中仅仅导出数值数据。 |
在这一节中我们要用到的向FCS Express中导出数据的CellProfiler模块包括: LoadImages(导入图片)模块以及ExportToSpreadsheet(导出到电子表格)模块。通过本例设置好的管道文件可以在教程样本数据库中找到,其名称是Section3pipelineCOMPLETED.cp。这个完整的、作为模板的管道文件可以用来和用户的管道文件进行比较。
我们要用到的样本数据集可以从Cell Profiler样本网站下载,它被标记为"Human cytoplasm-nucleus transloction assay (SBS Bioimage)(人类细胞质-核易位实验(Bioimage))"。
CellProfiler Example Link (CellProfiler样本链接)
我们根据Section3pipeline.cp文件把从CellProfiler导出数据的步骤进行了模块化分解。导入Section3pipeline.cp后,请遵循以下步骤来修改管道,以便为向FCS Express导出做准备。
选择默认的输入和输出文件夹
为使FCS Express可以正确地导入你的数据,首先请保证在CellProfiler中设置的默认输入(存储你的图片的文件夹)以及输出文件夹是同一个文件夹(在Input/Output Folder(输入/输出文件夹)窗口中进行设置)。
注意: DefaultOUT.mat文件也将被导出到Output Folder(输出文件夹)。这个文件可在MATLAB中使用。如果你不想要这个文件,我们建议你将其删除,以节省硬盘空间。
设置LoadImages Module(导入图片模块)
要想让FCS Express通过管道读出你的数据,图片文件名中的元数据必须被提取出来。我们必须定义一个Regular Expression(一般表达式),以便在下面步骤中使用到的文件名或数据路径中找到元数据:
1. | 请点击Extract metadata from where?(从哪里提取元数据?)下拉列表。 |
2. | 请选择你想要使用的元数据。对本例来说,请选择File name(文件名称)。 |
3. | 请在Regular expression that finds metadata in the file name.(在文件名中寻找元数据的一般表达式。)字段中输入你想要使用的"Regular Expression(一般表达式)"。 在本例中,我们将使用"Channel2-[0-9]{2}-(?P<Row>[A-H])-(?P<Column>[0-9]{2}).tif",该表达式根据图片名中的行字母以及列数字定义了图片在细胞板上的位置。 |
ExportToSpreadsheet Module (导出到电子表格模块)
既然所有的"图片"以及"对象图片模板"都已经定义并保存好了,用户现在即可让CellProfiler导出用户想要在FCS Express查看的测量数据。在本例中,我们将导出所有的测量数据。
4. | 请选中ExportToSpreadsheet(导出到电子表格)模块。 |
5. | 请从下拉列表中选择Comma(逗号)(",")作为列分隔符。 |
6. | 请取消对Prepend the output file name to the data file names?(在数据文件名称前追加输出文件名?)复选框的勾选。 |
7. | 请从Output file location(输出文件位置)下拉列表中选择Default Output Folder(默认输出文件夹)。 |
8. | 请取消对Export all measurements?(导出所有测量数据?)的点选。 |
9. | 请从第一个Data to export(要导出的数据)下拉列表中选择Image(图片)。 |
10. | 请取消对Use the object name for the file name?(使用对象名作为文件名?)的勾选。 |
11. | 请把文件名设置为Image.cptoc。 |
12. | 请选择Add another data set(添加另外一组数据集)。 |
13. | 请从第二个Data to export(要导出的数据)下拉列表中选择Nuclei(细胞核)。 |
14. | 请取消对Use the object name for the file name(使用对象名作为文件名)的勾选。 |
15. | 请把文件名设置为nuclei.cpout。 |
16. | 请为"Cells(细胞)"重复第12-15步,把文件名设置为cells.cpout。 |
这些都做完后,ExportToSpreadsheet(导出到电子表格)模块应该看起来如图T24.25所示。
注意: 文件后缀".cptoc"代表CellProfiler Table of Contents(CellProfiler内容表格), 而".cpout"代表CellProfiler Output(CellProfiler输出)。"Image.cptoc"文件中保存着在管道中处理的所有对象的位置以及图片数目的信息, 而"Nuclei.cpout"和"Cells.cpout"分别存储与单个对象以及分析相关的实际列表模式数据。每个在CellProfiler中定义的对象模板都应该有一个独立的".cpout"文件。但我们只需要一个"Image.cptoc"文件。
图T24.25 ExportToSpreadsheet Module (导出到电子表格模块)
17. | 请选择Analyze images(分析图片)来运行管道。你图片所在的文件夹将包括cells.cpout、nuclei.cpout以及Image.cptoc文件(图T24.26)。 |
注意: DefaultOUT.mat文件也将被导出到Output Folder(输出文件夹)。该文件是为了在MATLAB中使用。如果你不想用这个文件, 我们建议你将其删除, 以节省硬盘空间。
图T24.26 Data Only Output Files (只有数据输出文件)
接下来,我们将导入和分析数值数据。