虎克的博客

Enthusiasm Biogeography-Biodiversity Informatics-Data Sciences

如何利用UBio的FindIT服务从文本和Word文档中提取拉丁学名

| Comments

   下面两个图是我们经常在Word或文本文档中见到的物种名录最基本的格式

2009-04-28_103612 2009-04-28_103633

将上面这些文件中的名录数据Copy到一个单独的文本文件,然后上传到UBio的名录网络服务网站: http://www.ubio.org/tools/recognize.php

2009-04-28_105013

点击上图中的浏览按钮将文本文件上传,选中文件类型:File Type为Plain Text;然后下面有几个Parsing Algorithm的选项:TaxonFinder(忽略名录中的学名的作者字符串,仅仅通过名称来匹配和检查);Resolve Authors(包括拉丁学名中的作者来检查)。最后点击Submit按钮,返回的结果如下图:

2009-04-28_104041

2009-04-28_104107

2009-04-28_104212

2009-04-28_104234

如上图所示,系统服务通过给拉丁学名标记不同的颜色和积分值来说明这些拉丁学名检查的正确程度。

Comments