海洋研究人员使丰富的深海数据更容易获得发表时间:2022-12-23 20:02 来自深海的数千张图像存储在世界各地海洋研究机构的服务器上。 到目前为止,这些视频和照片很难通过互联网找到,因为它们没有被一致地编目和描述。在GEOMAR的领导下,亥姆霍兹德国研究中心协会的一个团队开发了一种通用数据标准,以促进全球图像的使用。新的元数据格式现在发表在《自然科学数据》杂志上。 深海中的生命越来越多地被安装在遥控或自主水下航行器上的高分辨率相机记录下来。专家对这些图像进行科学分析,以获取有关开阔水域和海底以及地质结构中的生命信息。大量此类照片和视频数据存储在全球海洋研究机构的服务器上,但编目方式却大不相同。为了使这些丰富的数据在国际上可用,重要的搜索词和信息,如潜水机器人在记录过程中的位置、使用的相机技术以及探险队和参与的科学家的姓名,必须以普遍可读的格式存储在图像文件中。 为了确保这一点,亥姆霍兹德国研究中心协会的一个工作组,包括基尔的GEOMAR Helmholtz海洋研究中心,阿尔弗雷德·韦格纳研究所,亥姆霍兹极地和海洋研究中心(AWI)和亥姆霍兹中心,为水下图像开发了国际标准的元数据格式。来自亥姆霍兹研究领域地球与环境的数据倡议DataHub和亥姆霍兹元数据协作组织(HMC)的专家也参与其中。该提案发表在当前一期的《自然科学数据》杂志上。 Timm Schoening博士,文章的主要作者和数据科学家乔马尔,他说:“几年来,全世界一直在努力使数据普遍可用。凭借我们一贯的元数据标准,我们为深海的科学照片和视频创造了条件,以便根据这一倡议在国际上访问。我们正在提供软件以使该标准可用。 新格式建立在国际公认的可持续研究数据管理的“FAIR”原则之上。首字母缩略词代表“可查找、可访问、可互操作和可重用”。其他研究人员可以根据其元数据获得的文件称为FAIR数字对象(FDO)。现在展示的水下图像的FAIR数据格式被命名为“图像FAIR数字对象”(iFDO)。在某种程度上,它是一个信息索引卡,清楚地总结了对图像很重要的所有方面。它不仅包含有关图像数据本身的描述性信息,还包含指向图像数据的固定Web链接。 亥姆霍兹团队已经多次在国际上提出iFDO概念。“我们的方法引起了极大的兴趣,”Schoening博士报告说。“因此,我们相信它将成为水下图像新国际标准的模板。 作为对iFDO元数据格式的补充,该小组开发了几种软件工具,使采用iFDO格式进行各种生物或地质解释成为可能。另一个想法是在未来配备相机系统,以便在拍摄图像时自动生成iFDO格式的元数据。GEOMAR研究人员在大西洋的M182探险期间与研究船METEOR进行了测试。自主水下航行器ANTON,LUISE和ABYSS上的相机,以及拖曳仪器和固定系泊设备上的相机,在操作过程中直接存储iFDO元数据。“这次经历非常积极,仍然导致文档和软件工具的一些补充 - iFDO本身在这次探险中工作得很好,”Timm Schoening说。 图像和视频记录的一个特殊挑战是计算机无法轻易评估它们。这与温度或深度测量不同:数值可以很容易地存储并显示在图表中。另一方面,视频只是计算机的像素数据流。因此,必须首先标记和定义图像材料中的每个对象 - 例如,细长对象如海参。专家将其称为注释,并为此目的使用专门的软件,例如BIIGLE(生物图像索引和图形标签环境),这是比勒费尔德大学开发的,也在GEOMAR中使用。 “我们在开发iFDO时直接将注释步骤包含在数据格式中。我们将该功能内置到BIIGLE软件中,因此这个广泛使用的工具现在已经支持iFDO格式,“Schoening博士说。“这是在我们的演示中已经引起广泛关注的两大优势:iFDOS不仅可以用作元数据的标准,还可以用作注释的标准,并且有可用的软件支持该格式。 这就是FAIR原则的好处得到回报的地方,因为它允许有效地重用数据:因此,图像数据和注释也可用于训练机器学习(ML)算法。由于它们已经以FAIR数据格式在iFDO中提供,因此ML算法的开发要简单得多。 |