Data from: A new family of dissimilarity metrics for discrete character matrices that include inapplicable characters and its importance for disparity studies

Hopkins, Melanie J.1; St. John, Katherine1; St John, Katherine1 2 3

Published Nov 01, 2018 on Dryad. https://doi.org/10.5061/dryad.r3k7m3c

Data files

Nov 01, 2018 version files 512.34 KB

Abstract

The use of discrete character data for disparity analyses has become more popular, partially due to the recognition that character data describe variation at large taxonomic scales, as well as the increasing availability of both character matrices co-opted from phylogenetic analysis and software tools. As taxonomic scope increases, the need to describe variation leads to some characters that may describe traits not found across all the taxa. In such situations, it is common practice to treat inapplicable characters as missing data when calculating dissimilarity matrices for disparity studies. For commonly used dissimilarity metrics like Will’s GED and Gower’s coefficient, this can lead to the re-ranking of pairwise dissimilarities, resulting in taxa that share more primary character states being assigned larger dissimilarity values than taxa that share fewer. We introduce a family of metrics that proportionally weight primary characters according to the secondary characters that describe them, effectively eliminating this problem, and compare their performance to common dissimilarity metrics and previously-proposed weighting schemes. When applied to empirical datasets, we confirm that choice of dissimilarity metric frequently affects the rank order of pairwise distances, differentially influencing downstream macroevolutionary inferences.

Data from: A new family of dissimilarity metrics for discrete character matrices that include inapplicable characters and its importance for disparity studies

Data files

Abstract

ESM_appendices

dissimilarity_functions

myriapods_final_final

myriapods_type_205

Data from: A new family of dissimilarity metrics for discrete character matrices that include inapplicable characters and its importance for disparity studies

Data files

Abstract

Usage notes

ESM_appendices

dissimilarity_functions

myriapods_final_final

myriapods_type_205

Works referencing this dataset