在多個真實和模擬數(shù)據(jù)集上的測試結(jié)果表明:Taxometer 填補了注釋空白并刪除了不正確的標簽。此外,Taxometer 被設(shè)計為一種輕量級工具,其計算密集程度低于分類注釋本身。例如,使用 MMSeqs2 注釋 CAMI2 和長讀數(shù)據(jù)集需要 2-4 小時,而使用單個 GPU 訓練 Taxometer 對所有數(shù)據(jù)集只需不到 30 分鐘。
基于五個CAMI2短讀數(shù)據(jù)集,Taxometer將MMSeqs2工具正確注釋物種水平片段比例從66.6%提高到86.2%,且在CAMI2根際土壤數(shù)據(jù)集中,對于Metabuli、Centrifuge和Kraken2,將錯誤的物種水平注釋份額降低兩倍。